目录
深度学习
条目:133
2026年三月
5 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM生成文本检测:原理、方法与技术挑战 03-01
LLM
文本检测
AI安全 |
[自动]
[HACKER_NEWS] | 5min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
算法实现
算术推理 |
[自动]
[HACKER_NEWS] | 5min | newspaper
构建极简Transformer实现十位数加法运算 03-01
Transformer
LLM
算法实现 |
[自动]
[HACKER_NEWS] | 4min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 4min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
模型构建
算术运算 |
2026年二月
116 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[JUEJIN] | 1min | sticky_note_2
深度学习通用逼近定理:神经网络的理论基础与核心原理 02-28
深度学习
神经网络
通用逼近定理 |
[自动]
[HACKER_NEWS] | 4min | newspaper
构建极简Transformer模型实现十位数加法运算 02-28
Transformer
算法实现
算术运算 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-28
多模态
视觉语言模型
最优传输 |
[自动]
[HACKER_NEWS] | 4min | newspaper
从噪声到图像:扩散模型交互指南 02-28
扩散模型
Diffusion
生成式AI |
[自动]
[HACKER_NEWS] | 4min | newspaper
从噪声到图像:扩散模型交互式指南 02-28
扩散模型
生成式AI
图像生成 |
[自动]
[HACKER_NEWS] | 4min | newspaper
最小Transformer模型实现两位数加法运算 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 7min | newspaper
能对齐十位数加法运算的最小 Transformer 模型 02-28
Transformer
算法可解释性
算术运算 |
[自动]
[HACKER_NEWS] | 6min | newspaper
能对齐十位数加法运算的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 5min | newspaper
能计算两个10位数加法的最小Transformer模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 4min | newspaper
能计算两位十进制数相加的最小 Transformer 模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 6min | newspaper
能对齐十位数加法的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 6min | newspaper
能计算两个10位数加法的最小Transformer模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 6min | newspaper
能对齐十位数加法运算的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[JUEJIN] | 2min | sticky_note_2
深度学习激活函数原理:非线性能力与模型性能解析 02-28
深度学习
激活函数
神经网络 |
[自动]
[JUEJIN] | 2min | sticky_note_2
深度学习激活函数原理与非线性机制解析 02-27
深度学习
激活函数
非线性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
使用 Nano Banana 2 构建图像生成与编辑应用 02-27
Nano Banana 2
图像生成
图像编辑 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-27
多模态
视觉语言模型
最优传输 |
[自动]
[HACKER_NEWS] | 4min | newspaper
逆向工程挑战:解析该神经网络架构 02-27
神经网络
逆向工程
模型架构 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer中的混合专家模型架构解析 02-27
Transformer
MoE
混合专家 |
[自动]
[GITHUB_TRENDING] | 12min | hub
动手学深度学习:面向中文读者的可运行教材 02-27
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Transformer架构中的混合专家模型原理与应用 02-27
Transformer
MoE
混合专家模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[GITHUB_TRENDING] | 11min | hub
动手学深度学习:面向中文读者的可运行教程,获500余所高校采用 02-26
深度学习
D2L
PyTorch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer 架构中的混合专家模型原理与优势 02-26
MoE
Transformer
混合专家 |
[自动]
[HACKER_NEWS] | 4min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[HACKER_NEWS] | 5min | newspaper
谷歌发布 Nano Banana 2:最新 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家 |
[自动]
[HACKER_NEWS] | 5min | newspaper
谷歌发布 Nano Banana 2 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer中的混合专家模型:架构原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
谷歌发布 Nano Banana 2:最新 AI 图像生成模型 02-26
Google
Nano Banana 2
图像生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
Transformer
MoE
混合专家模型 |
[自动]
[JUEJIN] | 2min | sticky_note_2
空洞卷积原理:如何解决计算机视觉的精度与视野矛盾 02-26
空洞卷积
计算机视觉
深度学习 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型非线性变换解析:从MLP到MoE的架构演进 02-26
非线性变换
MLP
MoE |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Meta 开源 RCCLX:优化 AMD GPU 通信并集成 Torchcomms 02-26
Meta
RCCLX
AMD GPU |
[自动]
[ARXIV] | 5min | school
用于Wasserstein测地线与最优传输动力学的神经求解器 02-26
最优传输
Wasserstein
神经网络 |
[自动]
[HACKER_NEWS] | 5min | newspaper
四个月图像视频VAE实验的经验总结 02-25
VAE
视频生成
图像生成 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[GITHUB_TRENDING] | 11min | hub
动手学深度学习:可运行中文教程,被500多所高校采用 02-25
深度学习
PyTorch
MXNet |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 02-25
SageMaker
HyperPod
AWS |
[自动]
[HACKER_NEWS] | 4min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Mercury 2:基于扩散模型的最快推理 LLM 02-25
Mercury 2
扩散模型
推理模型 |
[自动]
[GITHUB_TRENDING] | 10min | hub
动手学深度学习:面向中文读者的可运行教材 02-24
深度学习
D2L
PyTorch |
[自动]
[GITHUB_TRENDING] | 11min | hub
动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用 02-24
深度学习
D2L
PyTorch |
[自动]
[ARXIV] | 4min | school
RetinaVision:基于XAI增强调控的深度学习视网膜疾病分类 02-24
计算机视觉
医疗AI
深度学习 |
[自动]
[ARXIV] | 3min | school
统一图神经网络均匀表达能力的通用方法 02-23
GNN
图神经网络
表达能力 |
[自动]
[GITHUB_TRENDING] | 11min | hub
动手学深度学习:面向中文读者的可运行教材,全球500余所高校采用 02-23
深度学习
D2L
PyTorch |
[自动]
[HACKER_NEWS] | 6min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
时间序列
前向传播 |
[自动]
[HACKER_NEWS] | 4min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
前向传播
时间序列 |
[自动]
[HACKER_NEWS] | 6min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
时间序列
神经网络 |
[自动]
[ARXIV] | 4min | school
A.R.I.S.:基于深度学习的电子废弃物自动分类系统 02-21
深度学习
计算机视觉
YOLOx |
[自动]
[ARXIV] | 4min | school
以对象为中心的表征在组合泛化任务中的表现评估 02-19
组合泛化
以对象为中心
视觉问答 |
[自动]
[ARXIV] | 3min | school
利用强化学习解决未知可行性的参数鲁棒避障问题 02-18
强化学习
鲁棒性
避障 |
[自动]
[HACKER_NEWS] | 6min | newspaper
PyTorch 可视化入门教程 02-17
PyTorch
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 7min | newspaper
PyTorch 可视化入门教程 02-17
PyTorch
深度学习
可视化 |
[自动]
[HACKER_NEWS] | 5min | newspaper
PyTorch 可视化教程:通过图解理解核心概念 02-17
PyTorch
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 8min | newspaper
PyTorch 可视化入门教程 02-17
PyTorch
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
PyTorch 可视化教程:核心概念与实现机制解析 02-17
PyTorch
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Andrej Karpathy 将 micrograd 移植至 C99,性能提升 4600 倍 02-17
Andrej Karpathy
micrograd
C99 |
[自动]
[HACKER_NEWS] | 5min | newspaper
PyTorch 可视化入门教程 02-17
PyTorch
深度学习
可视化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
数学、计算机科学与人工智能综合资源指南 02-16
资源指南
数学
计算机科学 |
[自动]
[HACKER_NEWS] | 7min | newspaper
PyTorch 可视化入门教程 02-16
PyTorch
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
RynnBrain:基于神经网络的脑机接口解码系统 02-15
脑机接口
神经网络
解码系统 |
[自动]
[HACKER_NEWS] | 5min | newspaper
两种加速大模型推理的技术方法 02-15
LLM
推理加速
KV Cache |
[自动]
[HACKER_NEWS] | 5min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 7min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 5min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
AI for Science |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经渲染技术探索:从原理到应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[ARXIV] | 5min | school
SCRAPL:基于随机路径散射变换的机器学习框架 02-12
SCRAPL
Scattering Transform
Wavelet |
[自动]
[HACKER_NEWS] | 3min | newspaper
大语言模型面临的幻觉与逻辑推理局限 02-12
LLM
幻觉
逻辑推理 |
[自动]
[HACKER_NEWS] | 4min | newspaper
大语言模型在逻辑推理与事实准确性上的局限 02-12
LLM
逻辑推理
事实准确性 |
[自动]
[ARXIV] | 1min | school
Learning on the Manifold: Unlocking Standard Diffusion 02-12
Diffusion Transformer
DiT
表征学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GLM-OCR:面向复杂文档理解的多模态OCR模型 02-12
GLM-OCR
多模态
OCR |
[自动]
[HACKER_NEWS] | 4min | newspaper
The Little Learner:通往深度学习的直线路径 02-11
深度学习
机器学习
神经网络 |
[自动]
[HACKER_NEWS] | 1min | newspaper
The Little Learner: A Straight Line to Deep Learning 02-11
深度学习
机器学习
神经网络 |
[自动]
[ARXIV] | 2min | school
ANCRe: Adaptive Neural Connection Reassignment for Effi 02-11
ANCRe
深度学习
残差连接 |
[自动]
[HACKER_NEWS] | 4min | newspaper
The Little Learner: A Straight Line to Deep Learning 02-11
深度学习
Deep Learning
机器学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-09
世界模型
词模型
LLM |
[自动]
[ARXIV] | 5min | school
AP-OOD:基于注意力池化的分布外检测方法 02-09
OOD检测
注意力机制
NLP |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-08
LLM
世界模型
词模型 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理的可视化解析 02-07
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更难 02-07
LLM
ICL
上下文学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习的难度超出预期 02-07
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络可视化:直观理解深度学习原理 02-07
神经网络
深度学习
可视化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
从上下文学习的难度超出预期 02-07
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更具挑战性 02-06
LLM
ICL
上下文学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更难 02-06
LLM
上下文学习
ICL |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习的难度超出原有认知 02-06
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理的可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[GITHUB_TRENDING] | 11min | hub
动手学深度学习:面向中文读者的可运行教材 02-06
深度学习
D2L
PyTorch |
[自动]
[HACKER_NEWS] | 3min | newspaper
超网络:用于处理层级数据的神经网络架构 02-06
超网络
层级数据
神经网络架构 |
[自动]
[HACKER_NEWS] | 6min | newspaper
超网络:面向层级数据的神经网络架构 02-06
超网络
Hypernetworks
层级数据 |
[自动]
[GITHUB_TRENDING] | 11min | hub
动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用 02-05
深度学习
D2L
PyTorch |
[自动]
[HACKER_NEWS] | 4min | newspaper
超网络:面向层级数据的神经网络架构 02-05
超网络
层级数据
神经网络架构 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-05
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-05
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-05
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-04
文本生成图像
模型训练
消融实验 |
[自动]
[HACKER_NEWS] | 5min | newspaper
从零编写优化张量编译器的技术实践 02-04
编译器
张量
LLVM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-04
文本生成图像
模型训练
消融实验 |
[自动]
[HACKER_NEWS] | 5min | newspaper
FlashAttention-T:张量化注意力机制实现方案 02-04
FlashAttention
张量化
注意力机制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-03
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
文本生成图像模型训练设计:消融实验的经验总结 02-03
文本生成图像
模型训练
消融实验 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
2026年AI展望:LLM、智能体、算力与AGI发展路径 02-03
LLM
AGI
智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
NVIDIA Cosmos 策略模型提升机器人控制精度 02-02
NVIDIA
Cosmos
机器人 |
[自动]
[ARXIV] | 4min | school
RN-D:基于正则化网络的离散分类演员与同策强化学习 02-02
强化学习
RL
连续控制 |
[自动]
[ARXIV] | 3min | school
Routing the Lottery: 面向异构数据的自适应子网络路由 02-02
模型剪枝
彩票假设
异构数据 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
推出世界首个科学领域AI播客及工程师关注理由 02-01
AI for Science
播客
职业发展 |
2026年一月
12 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 4min | mic
为何现在推出全球首个科学AI播客及其对工程师的意义 01-30
AI for Science
AlphaFold
播客 |
[自动]
[ARXIV] | 6min | school
为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理 01-30
Adam优化器
梯度尺度不变性
深度学习 |
[自动]
[ARXIV] | 4min | school
FISMO:基于Fisher结构的动量正交化优化器 01-30
FISMO
优化器
深度学习 |
[自动]
[HACKER_NEWS] | 5min | newspaper
在8位摩托罗拉6809上运行深度卷积神经网络玩桌游 01-29
复古计算
深度学习
卷积神经网络 |
[自动]
[HACKER_NEWS] | 5min | newspaper
在8位摩托罗拉6809上运行深度卷积神经网络玩棋盘游戏 01-29
复古计算
摩托罗拉6809
边缘计算 |
[自动]
[ARXIV] | 3min | school
基于相机-IMU融合的鲁棒路面分类数据集与框架 01-29
计算机视觉
多模态融合
IMU |
[自动]
[ARXIV] | 4min | school
🧠RHSIA!非理想颅内动脉瘤实时血流替代技术,精准高效! 01-28
RHSIA
血流动力学
颅内动脉瘤 |
[自动]
[ARXIV] | 6min | school
🔥Post-LayerNorm强势回归!稳定、高效、深度训练的新神器! 01-28
Transformer
Post-LayerNorm
Keel |
[自动]
[ARXIV] | 6min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量! 01-27
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 6min | school
⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成!🔥 01-27
分子生成
SE(3)
等变模型 |
[自动]
[ARXIV] | 5min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀 01-26
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 3min | school
超越预测不确定性!🚀结构约束下的可靠表征学习!🔥 01-25
表征学习
不确定性
结构约束 |
无匹配条目