terminal

AI Stack

rss_feed
SYS_STABLE
目录

深度学习

条目:239
2026年四月 3 篇
类型阅读条目
[自动] [JUEJIN]
1minsticky_note_2 程序员到AI工程师:转型学习路径
04-15 AI工程师 转型学习 学习路线图
[自动] [HACKER_NEWS]
1minnewspaper 构建轻量级LLM:以代码直观展示语言模型工作原理
04-06 轻量级LLM 语言模型原理 代码示例
[自动] [HACKER_NEWS]
1minnewspaper 谷歌发布Gemma 4开源模型
04-03 谷歌 Gemma 开源模型
2026年三月 108 篇
类型阅读条目
[自动] [GITHUB_TRENDING]
7minhub d2l-zh:被500余所大学采用的交互式深度学习教材
03-20 深度学习 教材 开源
[自动] [GITHUB_TRENDING]
8minhub d2l-zh:70多国500所高校选用的深度学习教材
03-19 深度学习 教材 开源
[自动] [HACKER_NEWS]
2minnewspaper 为何AI系统难以自主学习:基于认知科学的视角
03-18 自主学习 认知科学 AI系统
[自动] [HACKER_NEWS]
1minnewspaper 为何AI系统难以自主学习:认知科学视角的解析
03-18 自主学习 认知科学 AI系统
[自动] [ARXIV]
4minschool Mixture-of-Depths 动态分配计算资源的注意力机制
03-18 MoDA 注意力机制 深度学习
[自动] [ARXIV]
4minschool Mixture-of-Depths 动态分配计算资源的注意力机制
03-17 MoDA 注意力机制 模型架构
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛开发深度学习模型可提前一年预测心衰恶化
03-17 深度学习 医疗AI 心衰预测
[自动] [ARXIV]
3minschool 基于脉冲神经网络的层级自适应幅度剪枝
03-17 脉冲神经网络 剪枝 模型压缩
[自动] [ARXIV]
4minschool LLM作为图核:文本丰富图的消息传递重思考
03-17 LLM Text-Rich Graphs RAMP
[自动] [BLOGS_PODCASTS]
1minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-17 深度学习 医疗AI 心衰预测
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作开发深度学习模型,可提前一年预测心衰恶化风险
03-16 深度学习 医疗AI 心衰预测
[自动] [ARXIV]
5minschool MXNorm:复用MXFP块缩放实现高效张量归一化
03-16 MXNorm MXFP 低精度计算
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作开发深度学习模型 提前一年预测心衰预后
03-16 深度学习 心衰预测 医疗AI
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-16 深度学习 心衰预测 医疗AI
[自动] [HACKER_NEWS]
1minnewspaper LLM 架构画廊:主流大语言模型结构概览
03-16 LLM Transformer 模型架构
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作开发深度学习模型可提前一年预测心衰恶化
03-16 深度学习 医疗AI 心衰预测
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-15 深度学习 心衰预测 医疗AI
[自动] [JUEJIN]
2minsticky_note_2 使用 torch.nn 构建模型并基于 PyTorch 进行训练
03-15 PyTorch 深度学习 模型训练
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-14 深度学习 医疗AI 疾病预测
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-14 深度学习 医疗AI 心衰预测
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-14 深度学习 心衰预测 医疗AI
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛团队开发深度学习模型可提前一年预测心衰恶化
03-13 深度学习 医疗AI 心衰预测
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-13 深度学习 心衰预测 医疗AI
[自动] [HACKER_NEWS]
1minnewspaper 在Transformer内部执行程序以实现指数级推理加速
03-13 Transformer 推理加速 算法优化
[自动] [HACKER_NEWS]
1minnewspaper 在Transformer内部执行程序以实现指数级推理加速
03-13 Transformer 推理加速 算法优化
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作开发深度学习模型 提前一年预测心衰恶化
03-13 深度学习 心衰预测 MIT
[自动] [HACKER_NEWS]
1minnewspaper 在Transformer内部执行程序以实现指数级推理加速
03-13 Transformer 推理加速 算法创新
[自动] [HACKER_NEWS]
1minnewspaper 在Transformer内部执行程序以实现指数级推理加速
03-13 Transformer 推理加速 算法创新
[自动] [BLOGS_PODCASTS]
2minmic Can AI help predict which heart-failure patients will w
03-13 深度学习 医疗AI 心力衰竭
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作开发深度学习模型 提前一年预测心衰恶化
03-13 深度学习 医疗AI 心衰预测
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-12 深度学习 心衰预测 医疗AI
[自动] [ARXIV]
3minschool 神经优化器宽度缩放研究:行列归一化与超参数迁移
03-12 优化器 宽度缩放 AdamW
[自动] [HACKER_NEWS]
1minnewspaper 基于文本提示的卫星影像目标检测
03-11 目标检测 卫星影像 多模态
[自动] [HACKER_NEWS]
2minnewspaper TADA:通过文本-声学同步实现快速可靠的语音生成
03-11 TADA 语音生成 TTS
[自动] [HACKER_NEWS]
1minnewspaper TADA:通过文本-声学同步实现快速可靠的语音生成
03-11 TADA 语音生成 TTS
[自动] [HACKER_NEWS]
1minnewspaper TADA:通过文本-声学同步实现快速可靠的语音生成
03-11 TADA 语音生成 TTS
[自动] [BLOGS_PODCASTS]
2minmic 提升AI模型解释能力以增强关键领域可信度
03-10 可解释性 黑箱问题 反事实解释
[自动] [BLOGS_PODCASTS]
2minmic AlphaGo十年:加速科学发现并铺就AGI之路
03-10 AlphaGo AGI 科学发现
[自动] [BLOGS_PODCASTS]
2minmic 提升AI模型解释能力以增强安全关键应用的可信度
03-10 可解释性 XAI 安全关键应用
[自动] [ARXIV]
3minschool 基于贡献分解的神经网络计算因果解释
03-10 神经网络 可解释性 因果推断
[自动] [ARXIV]
4minschool 利用逻辑选项预训练提升深度强化学习
03-10 强化学习 RL H²RL
[自动] [BLOGS_PODCASTS]
2minmic 提升AI模型解释能力以增强安全关键应用可信度
03-09 可解释性 XAI 安全关键应用
[自动] [ARXIV]
3minschool 利用逻辑选项预训练提升深度强化学习
03-09 强化学习 H^2RL 逻辑选项
[自动] [BLOGS_PODCASTS]
2minmic 谷歌技术专家解析:AI如何理解视觉搜索
03-09 视觉搜索 计算机视觉 CNN
[自动] [BLOGS_PODCASTS]
2minmic AI技术解析:视觉搜索如何理解图像内容
03-09 计算机视觉 图像识别 视觉搜索
[自动] [BLOGS_PODCASTS]
2minmic AI 视觉搜索技术解析:如何理解图像内容
03-09 计算机视觉 深度学习 神经网络
[自动] [BLOGS_PODCASTS]
2minmic AI如何理解视觉搜索:技术原理解析
03-09 计算机视觉 多模态 深度学习
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教材
03-09 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
2minmic AI技术解析:计算机视觉如何理解图像搜索
03-09 计算机视觉 图像搜索 多模态
[自动] [GITHUB_TRENDING]
3minhub 动手学深度学习:面向中文读者的可运行教材
03-08 深度学习 D2L PyTorch
[自动] [ARXIV]
4minschool POET-X:通过正交变换扩展实现LLM高效训练
03-08 LLM POET-X 模型训练
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教材
03-08 深度学习 D2L PyTorch
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教程,全球500多所高校采用
03-07 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
2minmic AI视觉搜索技术解析:如何理解图像内容
03-07 计算机视觉 图像识别 视觉搜索
[自动] [BLOGS_PODCASTS]
3minmic AI视觉搜索技术解析:如何理解图像内容
03-06 计算机视觉 多模态AI CNN
[自动] [BLOGS_PODCASTS]
3minmic AI如何理解视觉搜索:Ask a Techspert解析
03-06 视觉搜索 多模态 计算机视觉
[自动] [GITHUB_TRENDING]
9minhub 动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用
03-06 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]
1minnewspaper GLiNER2:基于统一架构的通用信息抽取模型
03-06 GLiNER2 信息抽取 NER
[自动] [HACKER_NEWS]
1minnewspaper GLiNER2:基于统一Schema的信息抽取模型
03-06 GLiNER2 信息抽取 NER
[自动] [BLOGS_PODCASTS]
2minmic Ask a Techspert:AI如何理解视觉搜索
03-06 计算机视觉 视觉搜索 深度学习
[自动] [HACKER_NEWS]
1minnewspaper 从脑部数据重建视觉感知的数据集
03-06 脑机接口 视觉重建 fMRI
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教材
03-05 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
2minmic AI技术解析:计算机视觉如何理解图像搜索
03-05 计算机视觉 图像搜索 AI
[自动] [HACKER_NEWS]
1minnewspaper 利用脑数据重建视觉感知的数据集
03-05 脑机接口 视觉重建 神经科学
[自动] [HACKER_NEWS]
1minnewspaper 从脑数据重建视觉感知的数据集
03-05 脑机接口 视觉重建 fMRI
[自动] [BLOGS_PODCASTS]
2minmic PRX Part 3:24小时训练文本生成图像模型
03-05 Stable Diffusion 扩散模型 模型训练
[自动] [HACKER_NEWS]
1minnewspaper LLM中的L代表撒谎:大语言模型幻觉现象分析
03-05 LLM 幻觉 模型评估
[自动] [BLOGS_PODCASTS]
3minmic PRX Part 3:24小时训练文本生成图像模型
03-05 Stable Diffusion 扩散模型 文本生成图像
[自动] [HACKER_NEWS]
1minnewspaper LLM中的L代表谎言:大语言模型的幻觉问题分析
03-05 LLM 幻觉 AI安全
[自动] [HACKER_NEWS]
1minnewspaper NanoGPT Slowrun:有限数据与无限算力的语言建模
03-05 NanoGPT 语言建模 算力
[自动] [HACKER_NEWS]
1minnewspaper NanoGPT Slowrun:有限数据与无限算力下的语言建模
03-05 NanoGPT 语言建模 算力优化
[自动] [BLOGS_PODCASTS]
2minmic PRX Part 3:24小时训练文本生成图像模型
03-05 Stable Diffusion 扩散模型 模型训练
[自动] [HACKER_NEWS]
1minnewspaper NanoGPT Slowrun:有限数据与无限算力的语言建模
03-05 NanoGPT 语言建模 算力
[自动] [BLOGS_PODCASTS]
2minmic PRX Part 3:24小时训练文本生成图像模型
03-05 Stable Diffusion 扩散模型 文本生成图像
[自动] [BLOGS_PODCASTS]
2minmic PRX Part 3:24小时训练文本生成图像模型
03-04 文本生成图像 模型训练 Stable Diffusion
[自动] [HACKER_NEWS]
1minnewspaper NanoGPT Slowrun:有限数据与无限算力的语言建模
03-04 NanoGPT 语言建模 算力
[自动] [BLOGS_PODCASTS]
2minmic PRX Part 3:24小时训练文本生成图像模型
03-04 Stable Diffusion 扩散模型 文本生成图像
[自动] [BLOGS_PODCASTS]
2minmic PRX Part 3:24小时训练文本生成图像模型
03-04 Stable Diffusion 文本生成图像 模型训练
[自动] [HACKER_NEWS]
1minnewspaper NanoGPT Slowrun:有限数据与无限算力的语言建模
03-04 NanoGPT 语言建模 算力优化
[自动] [BLOGS_PODCASTS]
2minmic PRX Part 3:24小时训练文本生成图像模型
03-04 Stable Diffusion 扩散模型 文本生成图像
[自动] [BLOGS_PODCASTS]
2minmic PRX Part 3:24小时训练文本生成图像模型
03-04 Stable Diffusion PRX 文本生成图像
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用
03-04 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
3minmic PRX Part 3:24小时训练文本生成图像模型
03-04 文本生成图像 模型训练 Stable Diffusion
[自动] [BLOGS_PODCASTS]
2minmic PRX Part 3:24小时训练文本生成图像模型
03-04 Stable Diffusion 扩散模型 模型训练
[自动] [HACKER_NEWS]
1minnewspaper TorchLean:基于 Lean 形式化验证的神经网络框架
03-04 TorchLean 形式化验证 Lean
[自动] [HACKER_NEWS]
1minnewspaper Talos:深度卷积神经网络硬件加速器
03-04 硬件加速 CNN 深度学习
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教材,全球500余所高校采用
03-03 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]
4minnewspaper TorchLean:基于 Lean 形式化验证的神经网络框架
03-03 TorchLean 形式化验证 Lean
[自动] [BLOGS_PODCASTS]
2minmic PRX Part 3:24小时训练文本生成图像模型
03-03 Stable Diffusion 扩散模型 文本生成图像
[自动] [HACKER_NEWS]
1minnewspaper TorchLean:基于 Lean 形式化验证的神经网络框架
03-03 TorchLean 形式化验证 Lean
[自动] [HACKER_NEWS]
1minnewspaper TorchLean:基于 Lean 形式化验证的神经网络框架
03-03 TorchLean 形式化验证 Lean
[自动] [ARXIV]
3minschool 评估学习表征可识别性的挑战与难点
03-02 表征学习 可辨识性 因果推断
[自动] [HACKER_NEWS]
1minnewspaper MicroGPT:基于微型Transformer的轻量级语言模型
03-02 MicroGPT Transformer 轻量级模型
[自动] [HACKER_NEWS]
1minnewspaper MicroGPT 交互式原理解析
03-02 MicroGPT LLM Transformer
[自动] [HACKER_NEWS]
1minnewspaper MicroGPT:基于微型架构的轻量级大语言模型
03-02 MicroGPT 轻量级模型 LLM
[自动] [HACKER_NEWS]
1minnewspaper MicroGPT 原理交互式解析
03-01 MicroGPT LLM Transformer
[自动] [HACKER_NEWS]
5minnewspaper MicroGPT 交互式原理解析
03-01 MicroGPT LLM Transformer
[自动] [HACKER_NEWS]
1minnewspaper CMU 10-202 课程:现代人工智能导论
03-01 CMU 课程 现代AI
[自动] [HACKER_NEWS]
1minnewspaper CMU 10-202 现代人工智能导论课程资源
03-01 CMU 课程资源 现代人工智能
[自动] [HACKER_NEWS]
1minnewspaper MicroGPT:基于微型架构的轻量级大语言模型
03-01 MicroGPT 轻量级模型 LLM
[自动] [HACKER_NEWS]
1minnewspaper CMU 10-202 现代人工智能导论课程
03-01 CMU 课程 AI
[自动] [HACKER_NEWS]
1minnewspaper CMU 10-202 课程:现代人工智能导论
03-01 CMU 现代人工智能 课程
[自动] [HACKER_NEWS]
1minnewspaper CMU 10-202 现代人工智能导论课程资源
03-01 CMU 课程资源 现代AI
[自动] [HACKER_NEWS]
1minnewspaper LLM生成文本检测:原理、方法与技术挑战
03-01 LLM 文本检测 AI安全
[自动] [HACKER_NEWS]
1minnewspaper 构建极简Transformer模型实现十位数加法运算
03-01 Transformer 算法实现 算术推理
[自动] [HACKER_NEWS]
1minnewspaper 构建极简Transformer实现十位数加法运算
03-01 Transformer LLM 算法实现
[自动] [HACKER_NEWS]
1minnewspaper 构建极简Transformer模型实现十位数加法运算
03-01 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
1minnewspaper 构建极简Transformer模型实现十位数加法运算
03-01 Transformer 模型构建 算术运算
2026年二月 116 篇
类型阅读条目
[自动] [JUEJIN]
1minsticky_note_2 深度学习通用逼近定理:神经网络的理论基础与核心原理
02-28 深度学习 神经网络 通用逼近定理
[自动] [HACKER_NEWS]
1minnewspaper 构建极简Transformer模型实现十位数加法运算
02-28 Transformer 算法实现 算术运算
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-28 多模态 视觉语言模型 最优传输
[自动] [HACKER_NEWS]
1minnewspaper 从噪声到图像:扩散模型交互指南
02-28 扩散模型 Diffusion 生成式AI
[自动] [HACKER_NEWS]
1minnewspaper 从噪声到图像:扩散模型交互式指南
02-28 扩散模型 生成式AI 图像生成
[自动] [HACKER_NEWS]
1minnewspaper 最小Transformer模型实现两位数加法运算
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
1minnewspaper 能对齐十位数加法运算的最小 Transformer 模型
02-28 Transformer 算法可解释性 算术运算
[自动] [HACKER_NEWS]
1minnewspaper 能对齐十位数加法运算的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
1minnewspaper 能计算两个10位数加法的最小Transformer模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
1minnewspaper 能计算两位十进制数相加的最小 Transformer 模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
1minnewspaper 能对齐十位数加法的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
2minnewspaper 能计算两个10位数加法的最小Transformer模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
1minnewspaper 能对齐十位数加法运算的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [JUEJIN]
2minsticky_note_2 深度学习激活函数原理:非线性能力与模型性能解析
02-28 深度学习 激活函数 神经网络
[自动] [JUEJIN]
2minsticky_note_2 深度学习激活函数原理与非线性机制解析
02-27 深度学习 激活函数 非线性
[自动] [BLOGS_PODCASTS]
2minmic 使用 Nano Banana 2 构建图像生成与编辑应用
02-27 Nano Banana 2 图像生成 图像编辑
[自动] [ARXIV]
3minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-27 多模态 视觉语言模型 最优传输
[自动] [HACKER_NEWS]
1minnewspaper 逆向工程挑战:解析该神经网络架构
02-27 神经网络 逆向工程 模型架构
[自动] [BLOGS_PODCASTS]
2minmic Transformer中的混合专家模型架构解析
02-27 Transformer MoE 混合专家
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教材
02-27 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-27 Transformer MoE 混合专家模型
[自动] [HACKER_NEWS]
1minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教程,获500余所高校采用
02-26 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
2minmic Transformer 架构中的混合专家模型原理与优势
02-26 MoE Transformer 混合专家
[自动] [HACKER_NEWS]
1minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]
1minnewspaper 谷歌发布 Nano Banana 2:最新 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家
[自动] [HACKER_NEWS]
1minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]
2minmic Transformer中的混合专家模型:架构原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [HACKER_NEWS]
1minnewspaper 谷歌发布 Nano Banana 2:最新 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 Transformer MoE 混合专家模型
[自动] [JUEJIN]
2minsticky_note_2 空洞卷积原理:如何解决计算机视觉的精度与视野矛盾
02-26 空洞卷积 计算机视觉 深度学习
[自动] [JUEJIN]
2minsticky_note_2 大模型非线性变换解析:从MLP到MoE的架构演进
02-26 非线性变换 MLP MoE
[自动] [BLOGS_PODCASTS]
3minmic Meta 开源 RCCLX:优化 AMD GPU 通信并集成 Torchcomms
02-26 Meta RCCLX AMD GPU
[自动] [ARXIV]
4minschool 用于Wasserstein测地线与最优传输动力学的神经求解器
02-26 最优传输 Wasserstein 神经网络
[自动] [HACKER_NEWS]
1minnewspaper 四个月图像视频VAE实验的经验总结
02-25 VAE 视频生成 图像生成
[自动] [HACKER_NEWS]
1minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [GITHUB_TRENDING]
1minhub 动手学深度学习:可运行中文教程,被500多所高校采用
02-25 深度学习 PyTorch MXNet
[自动] [BLOGS_PODCASTS]
4minmic Hexagon 利用 SageMaker HyperPod 加速分割模型预训练
02-25 SageMaker HyperPod AWS
[自动] [HACKER_NEWS]
1minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [HACKER_NEWS]
1minnewspaper Mercury 2:基于扩散模型的最快推理 LLM
02-25 Mercury 2 扩散模型 推理模型
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教材
02-24 深度学习 D2L PyTorch
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用
02-24 深度学习 D2L PyTorch
[自动] [ARXIV]
3minschool RetinaVision:基于XAI增强调控的深度学习视网膜疾病分类
02-24 计算机视觉 医疗AI 深度学习
[自动] [ARXIV]
3minschool 统一图神经网络均匀表达能力的通用方法
02-23 GNN 图神经网络 表达能力
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教材,全球500余所高校采用
02-23 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]
1minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 时间序列 前向传播
[自动] [HACKER_NEWS]
1minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 前向传播 时间序列
[自动] [HACKER_NEWS]
2minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 时间序列 神经网络
[自动] [ARXIV]
3minschool A.R.I.S.:基于深度学习的电子废弃物自动分类系统
02-21 深度学习 计算机视觉 YOLOx
[自动] [ARXIV]
3minschool 以对象为中心的表征在组合泛化任务中的表现评估
02-19 组合泛化 以对象为中心 视觉问答
[自动] [ARXIV]
3minschool 利用强化学习解决未知可行性的参数鲁棒避障问题
02-18 强化学习 鲁棒性 避障
[自动] [HACKER_NEWS]
5minnewspaper PyTorch 可视化入门教程
02-17 PyTorch 可视化 深度学习
[自动] [HACKER_NEWS]
7minnewspaper PyTorch 可视化入门教程
02-17 PyTorch 深度学习 可视化
[自动] [HACKER_NEWS]
5minnewspaper PyTorch 可视化教程:通过图解理解核心概念
02-17 PyTorch 可视化 深度学习
[自动] [HACKER_NEWS]
8minnewspaper PyTorch 可视化入门教程
02-17 PyTorch 可视化 深度学习
[自动] [HACKER_NEWS]
6minnewspaper PyTorch 可视化教程:核心概念与实现机制解析
02-17 PyTorch 可视化 深度学习
[自动] [HACKER_NEWS]
5minnewspaper Andrej Karpathy 将 micrograd 移植至 C99,性能提升 4600 倍
02-17 Andrej Karpathy micrograd C99
[自动] [HACKER_NEWS]
5minnewspaper PyTorch 可视化入门教程
02-17 PyTorch 深度学习 可视化
[自动] [HACKER_NEWS]
4minnewspaper 数学、计算机科学与人工智能综合资源指南
02-16 资源指南 数学 计算机科学
[自动] [HACKER_NEWS]
7minnewspaper PyTorch 可视化入门教程
02-16 PyTorch 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper RynnBrain:基于神经网络的脑机接口解码系统
02-15 脑机接口 神经网络 解码系统
[自动] [HACKER_NEWS]
5minnewspaper 两种加速大模型推理的技术方法
02-15 LLM 推理加速 KV Cache
[自动] [HACKER_NEWS]
5minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
7minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
6minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
5minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 AI for Science
[自动] [HACKER_NEWS]
6minnewspaper 神经渲染技术探索:从原理到应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [ARXIV]
5minschool SCRAPL:基于随机路径散射变换的机器学习框架
02-12 SCRAPL Scattering Transform Wavelet
[自动] [HACKER_NEWS]
3minnewspaper 大语言模型面临的幻觉与逻辑推理局限
02-12 LLM 幻觉 逻辑推理
[自动] [HACKER_NEWS]
4minnewspaper 大语言模型在逻辑推理与事实准确性上的局限
02-12 LLM 逻辑推理 事实准确性
[自动] [ARXIV]
1minschool Learning on the Manifold: Unlocking Standard Diffusion
02-12 Diffusion Transformer DiT 表征学习
[自动] [HACKER_NEWS]
4minnewspaper GLM-OCR:面向复杂文档理解的多模态OCR模型
02-12 GLM-OCR 多模态 OCR
[自动] [HACKER_NEWS]
4minnewspaper The Little Learner:通往深度学习的直线路径
02-11 深度学习 机器学习 神经网络
[自动] [HACKER_NEWS]
1minnewspaper The Little Learner: A Straight Line to Deep Learning
02-11 深度学习 机器学习 神经网络
[自动] [ARXIV]
2minschool ANCRe: Adaptive Neural Connection Reassignment for Effi
02-11 ANCRe 深度学习 残差连接
[自动] [HACKER_NEWS]
4minnewspaper The Little Learner: A Straight Line to Deep Learning
02-11 深度学习 Deep Learning 机器学习
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-09 世界模型 词模型 LLM
[自动] [ARXIV]
5minschool AP-OOD:基于注意力池化的分布外检测方法
02-09 OOD检测 注意力机制 NLP
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-08 LLM 世界模型 词模型
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理的可视化解析
02-07 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更难
02-07 LLM ICL 上下文学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习的难度超出预期
02-07 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
6minnewspaper 神经网络可视化:直观理解深度学习原理
02-07 神经网络 深度学习 可视化
[自动] [HACKER_NEWS]
4minnewspaper 从上下文学习的难度超出预期
02-07 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更具挑战性
02-06 LLM ICL 上下文学习
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
4minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更难
02-06 LLM 上下文学习 ICL
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习的难度超出原有认知
02-06 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理的可视化解析
02-06 神经网络 可视化 深度学习
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教材
02-06 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]
3minnewspaper 超网络:用于处理层级数据的神经网络架构
02-06 超网络 层级数据 神经网络架构
[自动] [HACKER_NEWS]
6minnewspaper 超网络:面向层级数据的神经网络架构
02-06 超网络 Hypernetworks 层级数据
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用
02-05 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]
4minnewspaper 超网络:面向层级数据的神经网络架构
02-05 超网络 层级数据 神经网络架构
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-05 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-05 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-05 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-04 文本生成图像 模型训练 消融实验
[自动] [HACKER_NEWS]
5minnewspaper 从零编写优化张量编译器的技术实践
02-04 编译器 张量 LLVM
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-04 文本生成图像 模型训练 消融实验
[自动] [HACKER_NEWS]
5minnewspaper FlashAttention-T:张量化注意力机制实现方案
02-04 FlashAttention 张量化 注意力机制
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-03 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-03 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
4minmic 2026年AI展望:LLM、智能体、算力与AGI发展路径
02-03 LLM AGI 智能体
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos 策略模型提升机器人控制精度
02-02 NVIDIA Cosmos 机器人
[自动] [ARXIV]
4minschool RN-D:基于正则化网络的离散分类演员与同策强化学习
02-02 强化学习 RL 连续控制
[自动] [ARXIV]
3minschool Routing the Lottery: 面向异构数据的自适应子网络路由
02-02 模型剪枝 彩票假设 异构数据
[自动] [BLOGS_PODCASTS]
2minmic 推出世界首个科学领域AI播客及工程师关注理由
02-01 AI for Science 播客 职业发展
2026年一月 12 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
4minmic 为何现在推出全球首个科学AI播客及其对工程师的意义
01-30 AI for Science AlphaFold 播客
[自动] [ARXIV]
6minschool 为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理
01-30 Adam优化器 梯度尺度不变性 深度学习
[自动] [ARXIV]
4minschool FISMO:基于Fisher结构的动量正交化优化器
01-30 FISMO 优化器 深度学习
[自动] [HACKER_NEWS]
5minnewspaper 在8位摩托罗拉6809上运行深度卷积神经网络玩桌游
01-29 复古计算 深度学习 卷积神经网络
[自动] [HACKER_NEWS]
5minnewspaper 在8位摩托罗拉6809上运行深度卷积神经网络玩棋盘游戏
01-29 复古计算 摩托罗拉6809 边缘计算
[自动] [ARXIV]
3minschool 基于相机-IMU融合的鲁棒路面分类数据集与框架
01-29 计算机视觉 多模态融合 IMU
[自动] [ARXIV]
4minschool 🧠RHSIA!非理想颅内动脉瘤实时血流替代技术,精准高效!
01-28 RHSIA 血流动力学 颅内动脉瘤
[自动] [ARXIV]
6minschool 🔥Post-LayerNorm强势回归!稳定、高效、深度训练的新神器!
01-28 Transformer Post-LayerNorm Keel
[自动] [ARXIV]
6minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量!
01-27 LLM 训练动力学 损失景观
[自动] [ARXIV]
6minschool ⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成!🔥
01-27 分子生成 SE(3) 等变模型
[自动] [ARXIV]
5minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀
01-26 LLM 训练动力学 损失景观
[自动] [ARXIV]
3minschool 超越预测不确定性!🚀结构约束下的可靠表征学习!🔥
01-25 表征学习 不确定性 结构约束