terminal

AI Stack

rss_feed
SYS_STABLE
目录

深度学习

条目:133
2026年三月 5 篇
类型阅读条目
[自动] [HACKER_NEWS]
4minnewspaper LLM生成文本检测:原理、方法与技术挑战
03-01 LLM 文本检测 AI安全
[自动] [HACKER_NEWS]
5minnewspaper 构建极简Transformer模型实现十位数加法运算
03-01 Transformer 算法实现 算术推理
[自动] [HACKER_NEWS]
5minnewspaper 构建极简Transformer实现十位数加法运算
03-01 Transformer LLM 算法实现
[自动] [HACKER_NEWS]
4minnewspaper 构建极简Transformer模型实现十位数加法运算
03-01 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
4minnewspaper 构建极简Transformer模型实现十位数加法运算
03-01 Transformer 模型构建 算术运算
2026年二月 116 篇
类型阅读条目
[自动] [JUEJIN]
1minsticky_note_2 深度学习通用逼近定理:神经网络的理论基础与核心原理
02-28 深度学习 神经网络 通用逼近定理
[自动] [HACKER_NEWS]
4minnewspaper 构建极简Transformer模型实现十位数加法运算
02-28 Transformer 算法实现 算术运算
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-28 多模态 视觉语言模型 最优传输
[自动] [HACKER_NEWS]
4minnewspaper 从噪声到图像:扩散模型交互指南
02-28 扩散模型 Diffusion 生成式AI
[自动] [HACKER_NEWS]
4minnewspaper 从噪声到图像:扩散模型交互式指南
02-28 扩散模型 生成式AI 图像生成
[自动] [HACKER_NEWS]
4minnewspaper 最小Transformer模型实现两位数加法运算
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
7minnewspaper 能对齐十位数加法运算的最小 Transformer 模型
02-28 Transformer 算法可解释性 算术运算
[自动] [HACKER_NEWS]
6minnewspaper 能对齐十位数加法运算的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
5minnewspaper 能计算两个10位数加法的最小Transformer模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
4minnewspaper 能计算两位十进制数相加的最小 Transformer 模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
6minnewspaper 能对齐十位数加法的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
6minnewspaper 能计算两个10位数加法的最小Transformer模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
6minnewspaper 能对齐十位数加法运算的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [JUEJIN]
2minsticky_note_2 深度学习激活函数原理:非线性能力与模型性能解析
02-28 深度学习 激活函数 神经网络
[自动] [JUEJIN]
2minsticky_note_2 深度学习激活函数原理与非线性机制解析
02-27 深度学习 激活函数 非线性
[自动] [BLOGS_PODCASTS]
2minmic 使用 Nano Banana 2 构建图像生成与编辑应用
02-27 Nano Banana 2 图像生成 图像编辑
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-27 多模态 视觉语言模型 最优传输
[自动] [HACKER_NEWS]
4minnewspaper 逆向工程挑战:解析该神经网络架构
02-27 神经网络 逆向工程 模型架构
[自动] [BLOGS_PODCASTS]
2minmic Transformer中的混合专家模型架构解析
02-27 Transformer MoE 混合专家
[自动] [GITHUB_TRENDING]
12minhub 动手学深度学习:面向中文读者的可运行教材
02-27 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
3minmic Transformer架构中的混合专家模型原理与应用
02-27 Transformer MoE 混合专家模型
[自动] [HACKER_NEWS]
4minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教程,获500余所高校采用
02-26 深度学习 D2L PyTorch
[自动] [BLOGS_PODCASTS]
2minmic Transformer 架构中的混合专家模型原理与优势
02-26 MoE Transformer 混合专家
[自动] [HACKER_NEWS]
4minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [HACKER_NEWS]
5minnewspaper 谷歌发布 Nano Banana 2:最新 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家
[自动] [HACKER_NEWS]
5minnewspaper 谷歌发布 Nano Banana 2 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]
2minmic Transformer中的混合专家模型:架构原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [HACKER_NEWS]
4minnewspaper 谷歌发布 Nano Banana 2:最新 AI 图像生成模型
02-26 Google Nano Banana 2 图像生成
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 Transformer MoE 混合专家模型
[自动] [JUEJIN]
2minsticky_note_2 空洞卷积原理:如何解决计算机视觉的精度与视野矛盾
02-26 空洞卷积 计算机视觉 深度学习
[自动] [JUEJIN]
2minsticky_note_2 大模型非线性变换解析:从MLP到MoE的架构演进
02-26 非线性变换 MLP MoE
[自动] [BLOGS_PODCASTS]
3minmic Meta 开源 RCCLX:优化 AMD GPU 通信并集成 Torchcomms
02-26 Meta RCCLX AMD GPU
[自动] [ARXIV]
5minschool 用于Wasserstein测地线与最优传输动力学的神经求解器
02-26 最优传输 Wasserstein 神经网络
[自动] [HACKER_NEWS]
5minnewspaper 四个月图像视频VAE实验的经验总结
02-25 VAE 视频生成 图像生成
[自动] [HACKER_NEWS]
5minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:可运行中文教程,被500多所高校采用
02-25 深度学习 PyTorch MXNet
[自动] [BLOGS_PODCASTS]
4minmic Hexagon 利用 SageMaker HyperPod 加速分割模型预训练
02-25 SageMaker HyperPod AWS
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的最快推理 LLM
02-25 Mercury 2 扩散模型 推理模型
[自动] [GITHUB_TRENDING]
10minhub 动手学深度学习:面向中文读者的可运行教材
02-24 深度学习 D2L PyTorch
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用
02-24 深度学习 D2L PyTorch
[自动] [ARXIV]
4minschool RetinaVision:基于XAI增强调控的深度学习视网膜疾病分类
02-24 计算机视觉 医疗AI 深度学习
[自动] [ARXIV]
3minschool 统一图神经网络均匀表达能力的通用方法
02-23 GNN 图神经网络 表达能力
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教材,全球500余所高校采用
02-23 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]
6minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 时间序列 前向传播
[自动] [HACKER_NEWS]
4minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 前向传播 时间序列
[自动] [HACKER_NEWS]
6minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 时间序列 神经网络
[自动] [ARXIV]
4minschool A.R.I.S.:基于深度学习的电子废弃物自动分类系统
02-21 深度学习 计算机视觉 YOLOx
[自动] [ARXIV]
4minschool 以对象为中心的表征在组合泛化任务中的表现评估
02-19 组合泛化 以对象为中心 视觉问答
[自动] [ARXIV]
3minschool 利用强化学习解决未知可行性的参数鲁棒避障问题
02-18 强化学习 鲁棒性 避障
[自动] [HACKER_NEWS]
6minnewspaper PyTorch 可视化入门教程
02-17 PyTorch 可视化 深度学习
[自动] [HACKER_NEWS]
7minnewspaper PyTorch 可视化入门教程
02-17 PyTorch 深度学习 可视化
[自动] [HACKER_NEWS]
5minnewspaper PyTorch 可视化教程:通过图解理解核心概念
02-17 PyTorch 可视化 深度学习
[自动] [HACKER_NEWS]
8minnewspaper PyTorch 可视化入门教程
02-17 PyTorch 可视化 深度学习
[自动] [HACKER_NEWS]
6minnewspaper PyTorch 可视化教程:核心概念与实现机制解析
02-17 PyTorch 可视化 深度学习
[自动] [HACKER_NEWS]
5minnewspaper Andrej Karpathy 将 micrograd 移植至 C99,性能提升 4600 倍
02-17 Andrej Karpathy micrograd C99
[自动] [HACKER_NEWS]
5minnewspaper PyTorch 可视化入门教程
02-17 PyTorch 深度学习 可视化
[自动] [HACKER_NEWS]
4minnewspaper 数学、计算机科学与人工智能综合资源指南
02-16 资源指南 数学 计算机科学
[自动] [HACKER_NEWS]
7minnewspaper PyTorch 可视化入门教程
02-16 PyTorch 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper RynnBrain:基于神经网络的脑机接口解码系统
02-15 脑机接口 神经网络 解码系统
[自动] [HACKER_NEWS]
5minnewspaper 两种加速大模型推理的技术方法
02-15 LLM 推理加速 KV Cache
[自动] [HACKER_NEWS]
5minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
7minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
6minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
5minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 AI for Science
[自动] [HACKER_NEWS]
6minnewspaper 神经渲染技术探索:从原理到应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [ARXIV]
5minschool SCRAPL:基于随机路径散射变换的机器学习框架
02-12 SCRAPL Scattering Transform Wavelet
[自动] [HACKER_NEWS]
3minnewspaper 大语言模型面临的幻觉与逻辑推理局限
02-12 LLM 幻觉 逻辑推理
[自动] [HACKER_NEWS]
4minnewspaper 大语言模型在逻辑推理与事实准确性上的局限
02-12 LLM 逻辑推理 事实准确性
[自动] [ARXIV]
1minschool Learning on the Manifold: Unlocking Standard Diffusion
02-12 Diffusion Transformer DiT 表征学习
[自动] [HACKER_NEWS]
4minnewspaper GLM-OCR:面向复杂文档理解的多模态OCR模型
02-12 GLM-OCR 多模态 OCR
[自动] [HACKER_NEWS]
4minnewspaper The Little Learner:通往深度学习的直线路径
02-11 深度学习 机器学习 神经网络
[自动] [HACKER_NEWS]
1minnewspaper The Little Learner: A Straight Line to Deep Learning
02-11 深度学习 机器学习 神经网络
[自动] [ARXIV]
2minschool ANCRe: Adaptive Neural Connection Reassignment for Effi
02-11 ANCRe 深度学习 残差连接
[自动] [HACKER_NEWS]
4minnewspaper The Little Learner: A Straight Line to Deep Learning
02-11 深度学习 Deep Learning 机器学习
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-09 世界模型 词模型 LLM
[自动] [ARXIV]
5minschool AP-OOD:基于注意力池化的分布外检测方法
02-09 OOD检测 注意力机制 NLP
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-08 LLM 世界模型 词模型
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理的可视化解析
02-07 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更难
02-07 LLM ICL 上下文学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习的难度超出预期
02-07 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
6minnewspaper 神经网络可视化:直观理解深度学习原理
02-07 神经网络 深度学习 可视化
[自动] [HACKER_NEWS]
4minnewspaper 从上下文学习的难度超出预期
02-07 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更具挑战性
02-06 LLM ICL 上下文学习
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
4minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更难
02-06 LLM 上下文学习 ICL
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习的难度超出原有认知
02-06 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理的可视化解析
02-06 神经网络 可视化 深度学习
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教材
02-06 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]
3minnewspaper 超网络:用于处理层级数据的神经网络架构
02-06 超网络 层级数据 神经网络架构
[自动] [HACKER_NEWS]
6minnewspaper 超网络:面向层级数据的神经网络架构
02-06 超网络 Hypernetworks 层级数据
[自动] [GITHUB_TRENDING]
11minhub 动手学深度学习:面向中文读者的可运行教材,获全球500余所高校采用
02-05 深度学习 D2L PyTorch
[自动] [HACKER_NEWS]
4minnewspaper 超网络:面向层级数据的神经网络架构
02-05 超网络 层级数据 神经网络架构
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-05 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-05 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-05 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-04 文本生成图像 模型训练 消融实验
[自动] [HACKER_NEWS]
5minnewspaper 从零编写优化张量编译器的技术实践
02-04 编译器 张量 LLVM
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-04 文本生成图像 模型训练 消融实验
[自动] [HACKER_NEWS]
5minnewspaper FlashAttention-T:张量化注意力机制实现方案
02-04 FlashAttention 张量化 注意力机制
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-03 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
2minmic 文本生成图像模型训练设计:消融实验的经验总结
02-03 文本生成图像 模型训练 消融实验
[自动] [BLOGS_PODCASTS]
4minmic 2026年AI展望:LLM、智能体、算力与AGI发展路径
02-03 LLM AGI 智能体
[自动] [BLOGS_PODCASTS]
2minmic NVIDIA Cosmos 策略模型提升机器人控制精度
02-02 NVIDIA Cosmos 机器人
[自动] [ARXIV]
4minschool RN-D:基于正则化网络的离散分类演员与同策强化学习
02-02 强化学习 RL 连续控制
[自动] [ARXIV]
3minschool Routing the Lottery: 面向异构数据的自适应子网络路由
02-02 模型剪枝 彩票假设 异构数据
[自动] [BLOGS_PODCASTS]
2minmic 推出世界首个科学领域AI播客及工程师关注理由
02-01 AI for Science 播客 职业发展
2026年一月 12 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
4minmic 为何现在推出全球首个科学AI播客及其对工程师的意义
01-30 AI for Science AlphaFold 播客
[自动] [ARXIV]
6minschool 为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理
01-30 Adam优化器 梯度尺度不变性 深度学习
[自动] [ARXIV]
4minschool FISMO:基于Fisher结构的动量正交化优化器
01-30 FISMO 优化器 深度学习
[自动] [HACKER_NEWS]
5minnewspaper 在8位摩托罗拉6809上运行深度卷积神经网络玩桌游
01-29 复古计算 深度学习 卷积神经网络
[自动] [HACKER_NEWS]
5minnewspaper 在8位摩托罗拉6809上运行深度卷积神经网络玩棋盘游戏
01-29 复古计算 摩托罗拉6809 边缘计算
[自动] [ARXIV]
3minschool 基于相机-IMU融合的鲁棒路面分类数据集与框架
01-29 计算机视觉 多模态融合 IMU
[自动] [ARXIV]
4minschool 🧠RHSIA!非理想颅内动脉瘤实时血流替代技术,精准高效!
01-28 RHSIA 血流动力学 颅内动脉瘤
[自动] [ARXIV]
6minschool 🔥Post-LayerNorm强势回归!稳定、高效、深度训练的新神器!
01-28 Transformer Post-LayerNorm Keel
[自动] [ARXIV]
6minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量!
01-27 LLM 训练动力学 损失景观
[自动] [ARXIV]
6minschool ⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成!🔥
01-27 分子生成 SE(3) 等变模型
[自动] [ARXIV]
5minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀
01-26 LLM 训练动力学 损失景观
[自动] [ARXIV]
3minschool 超越预测不确定性!🚀结构约束下的可靠表征学习!🔥
01-25 表征学习 不确定性 结构约束