深度学习

条目：133

2026年三月 5 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	4min	newspaper LLM生成文本检测：原理、方法与技术挑战 03-01 LLM 文本检测 AI安全
[自动] [HACKER_NEWS]	5min	newspaper 构建极简Transformer模型实现十位数加法运算 03-01 Transformer 算法实现算术推理
[自动] [HACKER_NEWS]	5min	newspaper 构建极简Transformer实现十位数加法运算 03-01 Transformer LLM 算法实现
[自动] [HACKER_NEWS]	4min	newspaper 构建极简Transformer模型实现十位数加法运算 03-01 Transformer 算法推理算术运算
[自动] [HACKER_NEWS]	4min	newspaper 构建极简Transformer模型实现十位数加法运算 03-01 Transformer 模型构建算术运算

2026年二月 116 篇

类型	阅读	条目
[自动] [JUEJIN]	1min	sticky_note_2 深度学习通用逼近定理：神经网络的理论基础与核心原理 02-28 深度学习神经网络通用逼近定理
[自动] [HACKER_NEWS]	4min	newspaper 构建极简Transformer模型实现十位数加法运算 02-28 Transformer 算法实现算术运算
[自动] [ARXIV]	4min	school SOTAlign：基于最优传输的单模态视觉与语言模型半监督对齐 02-28 多模态视觉语言模型最优传输
[自动] [HACKER_NEWS]	4min	newspaper 从噪声到图像：扩散模型交互指南 02-28 扩散模型 Diffusion 生成式AI
[自动] [HACKER_NEWS]	4min	newspaper 从噪声到图像：扩散模型交互式指南 02-28 扩散模型生成式AI 图像生成
[自动] [HACKER_NEWS]	4min	newspaper 最小Transformer模型实现两位数加法运算 02-28 Transformer 算法算术
[自动] [HACKER_NEWS]	7min	newspaper 能对齐十位数加法运算的最小 Transformer 模型 02-28 Transformer 算法可解释性算术运算
[自动] [HACKER_NEWS]	6min	newspaper 能对齐十位数加法运算的最小Transformer模型 02-28 Transformer 算法算术
[自动] [HACKER_NEWS]	5min	newspaper 能计算两个10位数加法的最小Transformer模型 02-28 Transformer 算法推理算术运算
[自动] [HACKER_NEWS]	4min	newspaper 能计算两位十进制数相加的最小 Transformer 模型 02-28 Transformer 算法推理算术运算
[自动] [HACKER_NEWS]	6min	newspaper 能对齐十位数加法的最小Transformer模型 02-28 Transformer 算法算术
[自动] [HACKER_NEWS]	6min	newspaper 能计算两个10位数加法的最小Transformer模型 02-28 Transformer 算法推理算术运算
[自动] [HACKER_NEWS]	6min	newspaper 能对齐十位数加法运算的最小Transformer模型 02-28 Transformer 算法算术
[自动] [JUEJIN]	2min	sticky_note_2 深度学习激活函数原理：非线性能力与模型性能解析 02-28 深度学习激活函数神经网络
[自动] [JUEJIN]	2min	sticky_note_2 深度学习激活函数原理与非线性机制解析 02-27 深度学习激活函数非线性
[自动] [BLOGS_PODCASTS]	2min	mic 使用 Nano Banana 2 构建图像生成与编辑应用 02-27 Nano Banana 2 图像生成图像编辑
[自动] [ARXIV]	4min	school SOTAlign：基于最优传输的单模态视觉与语言模型半监督对齐 02-27 多模态视觉语言模型最优传输
[自动] [HACKER_NEWS]	4min	newspaper 逆向工程挑战：解析该神经网络架构 02-27 神经网络逆向工程模型架构
[自动] [BLOGS_PODCASTS]	2min	mic Transformer中的混合专家模型架构解析 02-27 Transformer MoE 混合专家
[自动] [GITHUB_TRENDING]	12min	hub 动手学深度学习：面向中文读者的可运行教材 02-27 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]	3min	mic Transformer架构中的混合专家模型原理与应用 02-27 Transformer MoE 混合专家模型
[自动] [HACKER_NEWS]	4min	newspaper 谷歌发布 Nano Banana 2 AI 图像生成模型 02-26 Google Nano Banana 2 图像生成
[自动] [GITHUB_TRENDING]	11min	hub 动手学深度学习：面向中文读者的可运行教程，获500余所高校采用 02-26 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]	2min	mic Transformer 架构中的混合专家模型原理与优势 02-26 MoE Transformer 混合专家
[自动] [HACKER_NEWS]	4min	newspaper 谷歌发布 Nano Banana 2 AI 图像生成模型 02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]	5min	newspaper 谷歌发布 Nano Banana 2：最新 AI 图像生成模型 02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家
[自动] [HACKER_NEWS]	5min	newspaper 谷歌发布 Nano Banana 2 AI 图像生成模型 02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]	2min	mic Transformer中的混合专家模型：架构原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [HACKER_NEWS]	4min	newspaper 谷歌发布 Nano Banana 2：最新 AI 图像生成模型 02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 Transformer MoE 混合专家模型
[自动] [JUEJIN]	2min	sticky_note_2 空洞卷积原理：如何解决计算机视觉的精度与视野矛盾 02-26 空洞卷积计算机视觉深度学习
[自动] [JUEJIN]	2min	sticky_note_2 大模型非线性变换解析：从MLP到MoE的架构演进 02-26 非线性变换 MLP MoE
[自动] [BLOGS_PODCASTS]	3min	mic Meta 开源 RCCLX：优化 AMD GPU 通信并集成 Torchcomms 02-26 Meta RCCLX AMD GPU
[自动] [ARXIV]	5min	school 用于Wasserstein测地线与最优传输动力学的神经求解器 02-26 最优传输 Wasserstein 神经网络
[自动] [HACKER_NEWS]	5min	newspaper 四个月图像视频VAE实验的经验总结 02-25 VAE 视频生成图像生成
[自动] [HACKER_NEWS]	5min	newspaper Mercury 2：基于扩散模型的快速推理大语言模型 02-25 Mercury 2 扩散模型推理加速
[自动] [GITHUB_TRENDING]	11min	hub 动手学深度学习：可运行中文教程，被500多所高校采用 02-25 深度学习 PyTorch MXNet
[自动] [BLOGS_PODCASTS]	4min	mic Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 02-25 SageMaker HyperPod AWS
[自动] [HACKER_NEWS]	4min	newspaper Mercury 2：基于扩散模型的快速推理大语言模型 02-25 Mercury 2 扩散模型推理加速
[自动] [HACKER_NEWS]	4min	newspaper Mercury 2：基于扩散模型的最快推理 LLM 02-25 Mercury 2 扩散模型推理模型
[自动] [GITHUB_TRENDING]	10min	hub 动手学深度学习：面向中文读者的可运行教材 02-24 深度学习 D2L PyTorch
[自动] [GITHUB_TRENDING]	11min	hub 动手学深度学习：面向中文读者的可运行教材，获全球500余所高校采用 02-24 深度学习 D2L PyTorch
[自动] [ARXIV]	4min	school RetinaVision：基于XAI增强调控的深度学习视网膜疾病分类 02-24 计算机视觉医疗AI 深度学习
[自动] [ARXIV]	3min	school 统一图神经网络均匀表达能力的通用方法 02-23 GNN 图神经网络表达能力
[自动] [GITHUB_TRENDING]	11min	hub 动手学深度学习：面向中文读者的可运行教材，全球500余所高校采用 02-23 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]	6min	newspaper 误差随时间前向传播机制解析 02-22 误差传播时间序列前向传播
[自动] [HACKER_NEWS]	4min	newspaper 误差随时间前向传播机制解析 02-22 误差传播前向传播时间序列
[自动] [HACKER_NEWS]	6min	newspaper 误差随时间前向传播机制解析 02-22 误差传播时间序列神经网络
[自动] [ARXIV]	4min	school A.R.I.S.：基于深度学习的电子废弃物自动分类系统 02-21 深度学习计算机视觉 YOLOx
[自动] [ARXIV]	4min	school 以对象为中心的表征在组合泛化任务中的表现评估 02-19 组合泛化以对象为中心视觉问答
[自动] [ARXIV]	3min	school 利用强化学习解决未知可行性的参数鲁棒避障问题 02-18 强化学习鲁棒性避障
[自动] [HACKER_NEWS]	6min	newspaper PyTorch 可视化入门教程 02-17 PyTorch 可视化深度学习
[自动] [HACKER_NEWS]	7min	newspaper PyTorch 可视化入门教程 02-17 PyTorch 深度学习可视化
[自动] [HACKER_NEWS]	5min	newspaper PyTorch 可视化教程：通过图解理解核心概念 02-17 PyTorch 可视化深度学习
[自动] [HACKER_NEWS]	8min	newspaper PyTorch 可视化入门教程 02-17 PyTorch 可视化深度学习
[自动] [HACKER_NEWS]	6min	newspaper PyTorch 可视化教程：核心概念与实现机制解析 02-17 PyTorch 可视化深度学习
[自动] [HACKER_NEWS]	5min	newspaper Andrej Karpathy 将 micrograd 移植至 C99，性能提升 4600 倍 02-17 Andrej Karpathy micrograd C99
[自动] [HACKER_NEWS]	5min	newspaper PyTorch 可视化入门教程 02-17 PyTorch 深度学习可视化
[自动] [HACKER_NEWS]	4min	newspaper 数学、计算机科学与人工智能综合资源指南 02-16 资源指南数学计算机科学
[自动] [HACKER_NEWS]	7min	newspaper PyTorch 可视化入门教程 02-16 PyTorch 可视化深度学习
[自动] [HACKER_NEWS]	3min	newspaper RynnBrain：基于神经网络的脑机接口解码系统 02-15 脑机接口神经网络解码系统
[自动] [HACKER_NEWS]	5min	newspaper 两种加速大模型推理的技术方法 02-15 LLM 推理加速 KV Cache
[自动] [HACKER_NEWS]	5min	newspaper 神经渲染技术探索与应用实践 02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]	7min	newspaper 神经渲染技术探索与应用实践 02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]	6min	newspaper 神经渲染技术探索与应用实践 02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]	5min	newspaper GPT-5.2 推导出理论物理新结果 02-14 GPT-5.2 理论物理 AI for Science
[自动] [HACKER_NEWS]	6min	newspaper 神经渲染技术探索：从原理到应用实践 02-14 神经渲染 NeRF 3D重建
[自动] [ARXIV]	5min	school SCRAPL：基于随机路径散射变换的机器学习框架 02-12 SCRAPL Scattering Transform Wavelet
[自动] [HACKER_NEWS]	3min	newspaper 大语言模型面临的幻觉与逻辑推理局限 02-12 LLM 幻觉逻辑推理
[自动] [HACKER_NEWS]	4min	newspaper 大语言模型在逻辑推理与事实准确性上的局限 02-12 LLM 逻辑推理事实准确性
[自动] [ARXIV]	1min	school Learning on the Manifold: Unlocking Standard Diffusion 02-12 Diffusion Transformer DiT 表征学习
[自动] [HACKER_NEWS]	4min	newspaper GLM-OCR：面向复杂文档理解的多模态OCR模型 02-12 GLM-OCR 多模态 OCR
[自动] [HACKER_NEWS]	4min	newspaper The Little Learner：通往深度学习的直线路径 02-11 深度学习机器学习神经网络
[自动] [HACKER_NEWS]	1min	newspaper The Little Learner: A Straight Line to Deep Learning 02-11 深度学习机器学习神经网络
[自动] [ARXIV]	2min	school ANCRe: Adaptive Neural Connection Reassignment for Effi 02-11 ANCRe 深度学习残差连接
[自动] [HACKER_NEWS]	4min	newspaper The Little Learner: A Straight Line to Deep Learning 02-11 深度学习 Deep Learning 机器学习
[自动] [HACKER_NEWS]	4min	newspaper 专家具备世界模型，大语言模型仅有词模型 02-09 世界模型词模型 LLM
[自动] [ARXIV]	5min	school AP-OOD：基于注意力池化的分布外检测方法 02-09 OOD检测注意力机制 NLP
[自动] [HACKER_NEWS]	4min	newspaper 专家具备世界模型，大语言模型仅有词模型 02-08 LLM 世界模型词模型
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理的可视化解析 02-07 神经网络可视化深度学习
[自动] [HACKER_NEWS]	3min	newspaper 从上下文学习比预期更难 02-07 LLM ICL 上下文学习
[自动] [HACKER_NEWS]	3min	newspaper 从上下文学习的难度超出预期 02-07 上下文学习 ICL LLM
[自动] [HACKER_NEWS]	6min	newspaper 神经网络可视化：直观理解深度学习原理 02-07 神经网络深度学习可视化
[自动] [HACKER_NEWS]	4min	newspaper 从上下文学习的难度超出预期 02-07 上下文学习 ICL LLM
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	3min	newspaper 从上下文学习比预期更具挑战性 02-06 LLM ICL 上下文学习
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	4min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	3min	newspaper 从上下文学习比预期更难 02-06 LLM 上下文学习 ICL
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	3min	newspaper 从上下文学习的难度超出原有认知 02-06 上下文学习 ICL LLM
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理的可视化解析 02-06 神经网络可视化深度学习
[自动] [GITHUB_TRENDING]	11min	hub 动手学深度学习：面向中文读者的可运行教材 02-06 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]	3min	newspaper 超网络：用于处理层级数据的神经网络架构 02-06 超网络层级数据神经网络架构
[自动] [HACKER_NEWS]	6min	newspaper 超网络：面向层级数据的神经网络架构 02-06 超网络 Hypernetworks 层级数据
[自动] [GITHUB_TRENDING]	11min	hub 动手学深度学习：面向中文读者的可运行教材，获全球500余所高校采用 02-05 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]	4min	newspaper 超网络：面向层级数据的神经网络架构 02-05 超网络层级数据神经网络架构
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-05 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-05 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-05 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-04 文本生成图像模型训练消融实验
[自动] [HACKER_NEWS]	5min	newspaper 从零编写优化张量编译器的技术实践 02-04 编译器张量 LLVM
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-04 文本生成图像模型训练消融实验
[自动] [HACKER_NEWS]	5min	newspaper FlashAttention-T：张量化注意力机制实现方案 02-04 FlashAttention 张量化注意力机制
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-03 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	2min	mic 文本生成图像模型训练设计：消融实验的经验总结 02-03 文本生成图像模型训练消融实验
[自动] [BLOGS_PODCASTS]	4min	mic 2026年AI展望：LLM、智能体、算力与AGI发展路径 02-03 LLM AGI 智能体
[自动] [BLOGS_PODCASTS]	2min	mic NVIDIA Cosmos 策略模型提升机器人控制精度 02-02 NVIDIA Cosmos 机器人
[自动] [ARXIV]	4min	school RN-D：基于正则化网络的离散分类演员与同策强化学习 02-02 强化学习 RL 连续控制
[自动] [ARXIV]	3min	school Routing the Lottery: 面向异构数据的自适应子网络路由 02-02 模型剪枝彩票假设异构数据
[自动] [BLOGS_PODCASTS]	2min	mic 推出世界首个科学领域AI播客及工程师关注理由 02-01 AI for Science 播客职业发展

2026年一月 12 篇

类型	阅读	条目
[自动] [BLOGS_PODCASTS]	4min	mic 为何现在推出全球首个科学AI播客及其对工程师的意义 01-30 AI for Science AlphaFold 播客
[自动] [ARXIV]	6min	school 为何Adam在$β_1=β_2$时更优：缺失的梯度尺度不变性原理 01-30 Adam优化器梯度尺度不变性深度学习
[自动] [ARXIV]	4min	school FISMO：基于Fisher结构的动量正交化优化器 01-30 FISMO 优化器深度学习
[自动] [HACKER_NEWS]	5min	newspaper 在8位摩托罗拉6809上运行深度卷积神经网络玩桌游 01-29 复古计算深度学习卷积神经网络
[自动] [HACKER_NEWS]	5min	newspaper 在8位摩托罗拉6809上运行深度卷积神经网络玩棋盘游戏 01-29 复古计算摩托罗拉6809 边缘计算
[自动] [ARXIV]	3min	school 基于相机-IMU融合的鲁棒路面分类数据集与框架 01-29 计算机视觉多模态融合 IMU
[自动] [ARXIV]	4min	school 🧠RHSIA！非理想颅内动脉瘤实时血流替代技术，精准高效！ 01-28 RHSIA 血流动力学颅内动脉瘤
[自动] [ARXIV]	6min	school 🔥Post-LayerNorm强势回归！稳定、高效、深度训练的新神器！ 01-28 Transformer Post-LayerNorm Keel
[自动] [ARXIV]	6min	school 🔥LLM训练动力学新突破！可扩展损失景观曲率度量！ 01-27 LLM 训练动力学损失景观
[自动] [ARXIV]	6min	school ⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成！🔥 01-27 分子生成 SE(3) 等变模型
[自动] [ARXIV]	5min	school 🔥LLM训练动力学新突破！可扩展损失景观曲率度量🚀 01-26 LLM 训练动力学损失景观
[自动] [ARXIV]	3min	school 超越预测不确定性！🚀结构约束下的可靠表征学习！🔥 01-25 表征学习不确定性结构约束