目录
深度学习
条目:239
2026年四月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[JUEJIN] | 1min | sticky_note_2
程序员到AI工程师:转型学习路径 04-15
AI工程师
转型学习
学习路线图 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建轻量级LLM:以代码直观展示语言模型工作原理 04-06
轻量级LLM
语言模型原理
代码示例 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布Gemma 4开源模型 04-03
谷歌
Gemma
开源模型 |
2026年三月
108 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[GITHUB_TRENDING] | 7min | hub
d2l-zh:被500余所大学采用的交互式深度学习教材 03-20
深度学习
教材
开源 |
[自动]
[GITHUB_TRENDING] | 8min | hub
d2l-zh:70多国500所高校选用的深度学习教材 03-19
深度学习
教材
开源 |
[自动]
[HACKER_NEWS] | 2min | newspaper
为何AI系统难以自主学习:基于认知科学的视角 03-18
自主学习
认知科学
AI系统 |
[自动]
[HACKER_NEWS] | 1min | newspaper
为何AI系统难以自主学习:认知科学视角的解析 03-18
自主学习
认知科学
AI系统 |
[自动]
[ARXIV] | 4min | school
Mixture-of-Depths 动态分配计算资源的注意力机制 03-18
MoDA
注意力机制
深度学习 |
[自动]
[ARXIV] | 4min | school
Mixture-of-Depths 动态分配计算资源的注意力机制 03-17
MoDA
注意力机制
模型架构 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛开发深度学习模型可提前一年预测心衰恶化 03-17
深度学习
医疗AI
心衰预测 |
[自动]
[ARXIV] | 3min | school
基于脉冲神经网络的层级自适应幅度剪枝 03-17
脉冲神经网络
剪枝
模型压缩 |
[自动]
[ARXIV] | 4min | school
LLM作为图核:文本丰富图的消息传递重思考 03-17
LLM
Text-Rich Graphs
RAMP |
[自动]
[BLOGS_PODCASTS] | 1min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-17
深度学习
医疗AI
心衰预测 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型,可提前一年预测心衰恶化风险 03-16
深度学习
医疗AI
心衰预测 |
[自动]
[ARXIV] | 5min | school
MXNorm:复用MXFP块缩放实现高效张量归一化 03-16
MXNorm
MXFP
低精度计算 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型 提前一年预测心衰预后 03-16
深度学习
心衰预测
医疗AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-16
深度学习
心衰预测
医疗AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 架构画廊:主流大语言模型结构概览 03-16
LLM
Transformer
模型架构 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型可提前一年预测心衰恶化 03-16
深度学习
医疗AI
心衰预测 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-15
深度学习
心衰预测
医疗AI |
[自动]
[JUEJIN] | 2min | sticky_note_2
使用 torch.nn 构建模型并基于 PyTorch 进行训练 03-15
PyTorch
深度学习
模型训练 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-14
深度学习
医疗AI
疾病预测 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-14
深度学习
医疗AI
心衰预测 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-14
深度学习
心衰预测
医疗AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛团队开发深度学习模型可提前一年预测心衰恶化 03-13
深度学习
医疗AI
心衰预测 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-13
深度学习
心衰预测
医疗AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法优化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型 提前一年预测心衰恶化 03-13
深度学习
心衰预测
MIT |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法创新 |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法创新 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Can AI help predict which heart-failure patients will w 03-13
深度学习
医疗AI
心力衰竭 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型 提前一年预测心衰恶化 03-13
深度学习
医疗AI
心衰预测 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-12
深度学习
心衰预测
医疗AI |
[自动]
[ARXIV] | 3min | school
神经优化器宽度缩放研究:行列归一化与超参数迁移 03-12
优化器
宽度缩放
AdamW |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于文本提示的卫星影像目标检测 03-11
目标检测
卫星影像
多模态 |
[自动]
[HACKER_NEWS] | 2min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[HACKER_NEWS] | 1min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[HACKER_NEWS] | 1min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强关键领域可信度 03-10
可解释性
黑箱问题
反事实解释 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AlphaGo十年:加速科学发现并铺就AGI之路 03-10
AlphaGo
AGI
科学发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强安全关键应用的可信度 03-10
可解释性
XAI
安全关键应用 |
[自动]
[ARXIV] | 3min | school
基于贡献分解的神经网络计算因果解释 03-10
神经网络
可解释性
因果推断 |
[自动]
[ARXIV] | 4min | school
利用逻辑选项预训练提升深度强化学习 03-10
强化学习
RL
H²RL |
[自动]
[BLOGS_PODCASTS] | 2min | mic
提升AI模型解释能力以增强安全关键应用可信度 03-09
可解释性
XAI
安全关键应用 |
[自动]
[ARXIV] | 3min | school
利用逻辑选项预训练提升深度强化学习 03-09
强化学习
H^2RL
逻辑选项 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
谷歌技术专家解析:AI如何理解视觉搜索 03-09
视觉搜索
计算机视觉
CNN |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI技术解析:视觉搜索如何理解图像内容 03-09
计算机视觉
图像识别
视觉搜索 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI 视觉搜索技术解析:如何理解图像内容 03-09
计算机视觉
深度学习
神经网络 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI如何理解视觉搜索:技术原理解析 03-09
计算机视觉
多模态
深度学习 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材 03-09
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI技术解析:计算机视觉如何理解图像搜索 03-09
计算机视觉
图像搜索
多模态 |
[自动]
[GITHUB_TRENDING] | 3min | hub
动手学深度学习:面向中文读者的可运行教材 03-08
深度学习
D2L
PyTorch |
[自动]
[ARXIV] | 4min | school
POET-X:通过正交变换扩展实现LLM高效训练 03-08
LLM
POET-X
模型训练 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材 03-08
深度学习
D2L
PyTorch |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教程,全球500多所高校采用 03-07
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI视觉搜索技术解析:如何理解图像内容 03-07
计算机视觉
图像识别
视觉搜索 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI视觉搜索技术解析:如何理解图像内容 03-06
计算机视觉
多模态AI
CNN |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI如何理解视觉搜索:Ask a Techspert解析 03-06
视觉搜索
多模态
计算机视觉 |
[自动]
[GITHUB_TRENDING] | 9min | hub
动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用 03-06
深度学习
D2L
PyTorch |
[自动]
[HACKER_NEWS] | 1min | newspaper
GLiNER2:基于统一架构的通用信息抽取模型 03-06
GLiNER2
信息抽取
NER |
[自动]
[HACKER_NEWS] | 1min | newspaper
GLiNER2:基于统一Schema的信息抽取模型 03-06
GLiNER2
信息抽取
NER |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Ask a Techspert:AI如何理解视觉搜索 03-06
计算机视觉
视觉搜索
深度学习 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从脑部数据重建视觉感知的数据集 03-06
脑机接口
视觉重建
fMRI |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材 03-05
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI技术解析:计算机视觉如何理解图像搜索 03-05
计算机视觉
图像搜索
AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用脑数据重建视觉感知的数据集 03-05
脑机接口
视觉重建
神经科学 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从脑数据重建视觉感知的数据集 03-05
脑机接口
视觉重建
fMRI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-05
Stable Diffusion
扩散模型
模型训练 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM中的L代表撒谎:大语言模型幻觉现象分析 03-05
LLM
幻觉
模型评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
PRX Part 3:24小时训练文本生成图像模型 03-05
Stable Diffusion
扩散模型
文本生成图像 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM中的L代表谎言:大语言模型的幻觉问题分析 03-05
LLM
幻觉
AI安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力的语言建模 03-05
NanoGPT
语言建模
算力 |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力下的语言建模 03-05
NanoGPT
语言建模
算力优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-05
Stable Diffusion
扩散模型
模型训练 |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力的语言建模 03-05
NanoGPT
语言建模
算力 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-05
Stable Diffusion
扩散模型
文本生成图像 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
文本生成图像
模型训练
Stable Diffusion |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力的语言建模 03-04
NanoGPT
语言建模
算力 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
Stable Diffusion
扩散模型
文本生成图像 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
Stable Diffusion
文本生成图像
模型训练 |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力的语言建模 03-04
NanoGPT
语言建模
算力优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
Stable Diffusion
扩散模型
文本生成图像 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
Stable Diffusion
PRX
文本生成图像 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用 03-04
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 3min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
文本生成图像
模型训练
Stable Diffusion |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-04
Stable Diffusion
扩散模型
模型训练 |
[自动]
[HACKER_NEWS] | 1min | newspaper
TorchLean:基于 Lean 形式化验证的神经网络框架 03-04
TorchLean
形式化验证
Lean |
[自动]
[HACKER_NEWS] | 1min | newspaper
Talos:深度卷积神经网络硬件加速器 03-04
硬件加速
CNN
深度学习 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材,全球500余所高校采用 03-03
深度学习
D2L
PyTorch |
[自动]
[HACKER_NEWS] | 4min | newspaper
TorchLean:基于 Lean 形式化验证的神经网络框架 03-03
TorchLean
形式化验证
Lean |
[自动]
[BLOGS_PODCASTS] | 2min | mic
PRX Part 3:24小时训练文本生成图像模型 03-03
Stable Diffusion
扩散模型
文本生成图像 |
[自动]
[HACKER_NEWS] | 1min | newspaper
TorchLean:基于 Lean 形式化验证的神经网络框架 03-03
TorchLean
形式化验证
Lean |
[自动]
[HACKER_NEWS] | 1min | newspaper
TorchLean:基于 Lean 形式化验证的神经网络框架 03-03
TorchLean
形式化验证
Lean |
[自动]
[ARXIV] | 3min | school
评估学习表征可识别性的挑战与难点 03-02
表征学习
可辨识性
因果推断 |
[自动]
[HACKER_NEWS] | 1min | newspaper
MicroGPT:基于微型Transformer的轻量级语言模型 03-02
MicroGPT
Transformer
轻量级模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
MicroGPT 交互式原理解析 03-02
MicroGPT
LLM
Transformer |
[自动]
[HACKER_NEWS] | 1min | newspaper
MicroGPT:基于微型架构的轻量级大语言模型 03-02
MicroGPT
轻量级模型
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
MicroGPT 原理交互式解析 03-01
MicroGPT
LLM
Transformer |
[自动]
[HACKER_NEWS] | 5min | newspaper
MicroGPT 交互式原理解析 03-01
MicroGPT
LLM
Transformer |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 课程:现代人工智能导论 03-01
CMU
课程
现代AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 现代人工智能导论课程资源 03-01
CMU
课程资源
现代人工智能 |
[自动]
[HACKER_NEWS] | 1min | newspaper
MicroGPT:基于微型架构的轻量级大语言模型 03-01
MicroGPT
轻量级模型
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 现代人工智能导论课程 03-01
CMU
课程
AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 课程:现代人工智能导论 03-01
CMU
现代人工智能
课程 |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 现代人工智能导论课程资源 03-01
CMU
课程资源
现代AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM生成文本检测:原理、方法与技术挑战 03-01
LLM
文本检测
AI安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
算法实现
算术推理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer实现十位数加法运算 03-01
Transformer
LLM
算法实现 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
模型构建
算术运算 |
2026年二月
116 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[JUEJIN] | 1min | sticky_note_2
深度学习通用逼近定理:神经网络的理论基础与核心原理 02-28
深度学习
神经网络
通用逼近定理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer模型实现十位数加法运算 02-28
Transformer
算法实现
算术运算 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-28
多模态
视觉语言模型
最优传输 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从噪声到图像:扩散模型交互指南 02-28
扩散模型
Diffusion
生成式AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
从噪声到图像:扩散模型交互式指南 02-28
扩散模型
生成式AI
图像生成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
最小Transformer模型实现两位数加法运算 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法运算的最小 Transformer 模型 02-28
Transformer
算法可解释性
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法运算的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能计算两个10位数加法的最小Transformer模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能计算两位十进制数相加的最小 Transformer 模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 2min | newspaper
能计算两个10位数加法的最小Transformer模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法运算的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[JUEJIN] | 2min | sticky_note_2
深度学习激活函数原理:非线性能力与模型性能解析 02-28
深度学习
激活函数
神经网络 |
[自动]
[JUEJIN] | 2min | sticky_note_2
深度学习激活函数原理与非线性机制解析 02-27
深度学习
激活函数
非线性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
使用 Nano Banana 2 构建图像生成与编辑应用 02-27
Nano Banana 2
图像生成
图像编辑 |
[自动]
[ARXIV] | 3min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-27
多模态
视觉语言模型
最优传输 |
[自动]
[HACKER_NEWS] | 1min | newspaper
逆向工程挑战:解析该神经网络架构 02-27
神经网络
逆向工程
模型架构 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer中的混合专家模型架构解析 02-27
Transformer
MoE
混合专家 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材 02-27
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-27
Transformer
MoE
混合专家模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教程,获500余所高校采用 02-26
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer 架构中的混合专家模型原理与优势 02-26
MoE
Transformer
混合专家 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Nano Banana 2:最新 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer中的混合专家模型:架构原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
谷歌发布 Nano Banana 2:最新 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
Transformer
MoE
混合专家模型 |
[自动]
[JUEJIN] | 2min | sticky_note_2
空洞卷积原理:如何解决计算机视觉的精度与视野矛盾 02-26
空洞卷积
计算机视觉
深度学习 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型非线性变换解析:从MLP到MoE的架构演进 02-26
非线性变换
MLP
MoE |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Meta 开源 RCCLX:优化 AMD GPU 通信并集成 Torchcomms 02-26
Meta
RCCLX
AMD GPU |
[自动]
[ARXIV] | 4min | school
用于Wasserstein测地线与最优传输动力学的神经求解器 02-26
最优传输
Wasserstein
神经网络 |
[自动]
[HACKER_NEWS] | 1min | newspaper
四个月图像视频VAE实验的经验总结 02-25
VAE
视频生成
图像生成 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[GITHUB_TRENDING] | 1min | hub
动手学深度学习:可运行中文教程,被500多所高校采用 02-25
深度学习
PyTorch
MXNet |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 02-25
SageMaker
HyperPod
AWS |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的最快推理 LLM 02-25
Mercury 2
扩散模型
推理模型 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材 02-24
深度学习
D2L
PyTorch |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用 02-24
深度学习
D2L
PyTorch |
[自动]
[ARXIV] | 3min | school
RetinaVision:基于XAI增强调控的深度学习视网膜疾病分类 02-24
计算机视觉
医疗AI
深度学习 |
[自动]
[ARXIV] | 3min | school
统一图神经网络均匀表达能力的通用方法 02-23
GNN
图神经网络
表达能力 |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材,全球500余所高校采用 02-23
深度学习
D2L
PyTorch |
[自动]
[HACKER_NEWS] | 1min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
时间序列
前向传播 |
[自动]
[HACKER_NEWS] | 1min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
前向传播
时间序列 |
[自动]
[HACKER_NEWS] | 2min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
时间序列
神经网络 |
[自动]
[ARXIV] | 3min | school
A.R.I.S.:基于深度学习的电子废弃物自动分类系统 02-21
深度学习
计算机视觉
YOLOx |
[自动]
[ARXIV] | 3min | school
以对象为中心的表征在组合泛化任务中的表现评估 02-19
组合泛化
以对象为中心
视觉问答 |
[自动]
[ARXIV] | 3min | school
利用强化学习解决未知可行性的参数鲁棒避障问题 02-18
强化学习
鲁棒性
避障 |
[自动]
[HACKER_NEWS] | 5min | newspaper
PyTorch 可视化入门教程 02-17
PyTorch
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 7min | newspaper
PyTorch 可视化入门教程 02-17
PyTorch
深度学习
可视化 |
[自动]
[HACKER_NEWS] | 5min | newspaper
PyTorch 可视化教程:通过图解理解核心概念 02-17
PyTorch
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 8min | newspaper
PyTorch 可视化入门教程 02-17
PyTorch
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
PyTorch 可视化教程:核心概念与实现机制解析 02-17
PyTorch
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Andrej Karpathy 将 micrograd 移植至 C99,性能提升 4600 倍 02-17
Andrej Karpathy
micrograd
C99 |
[自动]
[HACKER_NEWS] | 5min | newspaper
PyTorch 可视化入门教程 02-17
PyTorch
深度学习
可视化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
数学、计算机科学与人工智能综合资源指南 02-16
资源指南
数学
计算机科学 |
[自动]
[HACKER_NEWS] | 7min | newspaper
PyTorch 可视化入门教程 02-16
PyTorch
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
RynnBrain:基于神经网络的脑机接口解码系统 02-15
脑机接口
神经网络
解码系统 |
[自动]
[HACKER_NEWS] | 5min | newspaper
两种加速大模型推理的技术方法 02-15
LLM
推理加速
KV Cache |
[自动]
[HACKER_NEWS] | 5min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 7min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 5min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
AI for Science |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经渲染技术探索:从原理到应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[ARXIV] | 5min | school
SCRAPL:基于随机路径散射变换的机器学习框架 02-12
SCRAPL
Scattering Transform
Wavelet |
[自动]
[HACKER_NEWS] | 3min | newspaper
大语言模型面临的幻觉与逻辑推理局限 02-12
LLM
幻觉
逻辑推理 |
[自动]
[HACKER_NEWS] | 4min | newspaper
大语言模型在逻辑推理与事实准确性上的局限 02-12
LLM
逻辑推理
事实准确性 |
[自动]
[ARXIV] | 1min | school
Learning on the Manifold: Unlocking Standard Diffusion 02-12
Diffusion Transformer
DiT
表征学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GLM-OCR:面向复杂文档理解的多模态OCR模型 02-12
GLM-OCR
多模态
OCR |
[自动]
[HACKER_NEWS] | 4min | newspaper
The Little Learner:通往深度学习的直线路径 02-11
深度学习
机器学习
神经网络 |
[自动]
[HACKER_NEWS] | 1min | newspaper
The Little Learner: A Straight Line to Deep Learning 02-11
深度学习
机器学习
神经网络 |
[自动]
[ARXIV] | 2min | school
ANCRe: Adaptive Neural Connection Reassignment for Effi 02-11
ANCRe
深度学习
残差连接 |
[自动]
[HACKER_NEWS] | 4min | newspaper
The Little Learner: A Straight Line to Deep Learning 02-11
深度学习
Deep Learning
机器学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-09
世界模型
词模型
LLM |
[自动]
[ARXIV] | 5min | school
AP-OOD:基于注意力池化的分布外检测方法 02-09
OOD检测
注意力机制
NLP |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-08
LLM
世界模型
词模型 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理的可视化解析 02-07
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更难 02-07
LLM
ICL
上下文学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习的难度超出预期 02-07
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络可视化:直观理解深度学习原理 02-07
神经网络
深度学习
可视化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
从上下文学习的难度超出预期 02-07
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更具挑战性 02-06
LLM
ICL
上下文学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更难 02-06
LLM
上下文学习
ICL |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习的难度超出原有认知 02-06
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理的可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[GITHUB_TRENDING] | 11min | hub
动手学深度学习:面向中文读者的可运行教材 02-06
深度学习
D2L
PyTorch |
[自动]
[HACKER_NEWS] | 3min | newspaper
超网络:用于处理层级数据的神经网络架构 02-06
超网络
层级数据
神经网络架构 |
[自动]
[HACKER_NEWS] | 6min | newspaper
超网络:面向层级数据的神经网络架构 02-06
超网络
Hypernetworks
层级数据 |
[自动]
[GITHUB_TRENDING] | 11min | hub
动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用 02-05
深度学习
D2L
PyTorch |
[自动]
[HACKER_NEWS] | 4min | newspaper
超网络:面向层级数据的神经网络架构 02-05
超网络
层级数据
神经网络架构 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-05
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-05
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-05
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-04
文本生成图像
模型训练
消融实验 |
[自动]
[HACKER_NEWS] | 5min | newspaper
从零编写优化张量编译器的技术实践 02-04
编译器
张量
LLVM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-04
文本生成图像
模型训练
消融实验 |
[自动]
[HACKER_NEWS] | 5min | newspaper
FlashAttention-T:张量化注意力机制实现方案 02-04
FlashAttention
张量化
注意力机制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-03
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-03
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2026年AI展望:LLM、智能体、算力与AGI发展路径 02-03
LLM
AGI
智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos 策略模型提升机器人控制精度 02-02
NVIDIA
Cosmos
机器人 |
[自动]
[ARXIV] | 4min | school
RN-D:基于正则化网络的离散分类演员与同策强化学习 02-02
强化学习
RL
连续控制 |
[自动]
[ARXIV] | 3min | school
Routing the Lottery: 面向异构数据的自适应子网络路由 02-02
模型剪枝
彩票假设
异构数据 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
推出世界首个科学领域AI播客及工程师关注理由 02-01
AI for Science
播客
职业发展 |
2026年一月
12 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 4min | mic
为何现在推出全球首个科学AI播客及其对工程师的意义 01-30
AI for Science
AlphaFold
播客 |
[自动]
[ARXIV] | 6min | school
为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理 01-30
Adam优化器
梯度尺度不变性
深度学习 |
[自动]
[ARXIV] | 4min | school
FISMO:基于Fisher结构的动量正交化优化器 01-30
FISMO
优化器
深度学习 |
[自动]
[HACKER_NEWS] | 5min | newspaper
在8位摩托罗拉6809上运行深度卷积神经网络玩桌游 01-29
复古计算
深度学习
卷积神经网络 |
[自动]
[HACKER_NEWS] | 5min | newspaper
在8位摩托罗拉6809上运行深度卷积神经网络玩棋盘游戏 01-29
复古计算
摩托罗拉6809
边缘计算 |
[自动]
[ARXIV] | 3min | school
基于相机-IMU融合的鲁棒路面分类数据集与框架 01-29
计算机视觉
多模态融合
IMU |
[自动]
[ARXIV] | 4min | school
🧠RHSIA!非理想颅内动脉瘤实时血流替代技术,精准高效! 01-28
RHSIA
血流动力学
颅内动脉瘤 |
[自动]
[ARXIV] | 6min | school
🔥Post-LayerNorm强势回归!稳定、高效、深度训练的新神器! 01-28
Transformer
Post-LayerNorm
Keel |
[自动]
[ARXIV] | 6min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量! 01-27
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 6min | school
⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成!🔥 01-27
分子生成
SE(3)
等变模型 |
[自动]
[ARXIV] | 5min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀 01-26
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 3min | school
超越预测不确定性!🚀结构约束下的可靠表征学习!🔥 01-25
表征学习
不确定性
结构约束 |
无匹配条目