terminal

AI Stack

rss_feed
SYS_STABLE
目录

论文

条目:1069
2026年四月 8 篇
类型阅读条目
[自动] [ARXIV]
2minschool SceneCritic:3D室内场景合成的符号化评估器
04-15 3D场景合成 符号化评估 空间约束
[自动] [ARXIV]
2minschool 物理信息状态空间模型的离网系统太阳辐照度预测
04-15 太阳能预测 物理信息模型 状态空间模型
[自动] [ARXIV]
1minschool 基于物理信息状态空间模型的离网系统太阳辐射预测
04-14 物理信息模型 状态空间模型 太阳辐射预测
[自动] [ARXIV]
1minschool 弹性测试时训练实现快速空间记忆
04-09 弹性测试时训练 快速空间记忆 长序列重建
[自动] [ARXIV]
2minschool 建模LLM生成文本中创造者与编辑者双重角色
04-07 LLM生成检测 细粒度分类 修辞结构理论
[自动] [ARXIV]
1minschool 服务器学习驱动的联邦学习鲁棒性提升
04-06 联邦学习 服务器学习 鲁棒性
[自动] [ARXIV]
1minschool ActionParty:生成式游戏多主体动作绑定
04-04 多主体动作绑定 视频扩散模型 生成式游戏
[自动] [ARXIV]
1minschool ActionParty系统实现游戏多主体动作绑定
04-03 多智能体 动作绑定 视频游戏
2026年三月 371 篇
类型阅读条目
[自动] [ARXIV]
2minschool 自适应块缩放数据类型
03-31 arxiv cs.CL
[自动] [ARXIV]
2minschool 测试驱动代理开发结合图分析减少AI代码回归
03-20 arxiv cs.SE
[自动] [ARXIV]
2minschool 动量解相关优化器MUD加速Transformer训练
03-20 MUD优化器 动量去相关 Transformer训练
[自动] [ARXIV]
3minschool 仅解码器模型的机器翻译性别消歧诊断
03-20 机器翻译 性别偏见 仅解码器
[自动] [ARXIV]
2minschool ConGA框架:机器翻译性别标注指南
03-20 机器翻译 性别偏见 ConGA
[自动] [ARXIV]
3minschool 3D形状语义层次分词方法
03-20 3D生成 分词方法 语义分词
[自动] [ARXIV]
2minschool 统一时空Token评分提升视频VLMs效率
03-20 视频VLMs Token剪枝 视觉语言模型
[自动] [ARXIV]
3minschool Loc3R-VLM语言驱动定位与3D推理视觉模型
03-20 视觉语言模型 三维推理 语言驱动定位
[自动] [ARXIV]
4minschool 统一时空Token评分提升视频VLM效率
03-19 视频VLM Token剪枝 计算效率
[自动] [HACKER_NEWS]
1minnewspaper 神经细胞自动机预训练语言模型研究
03-19 神经细胞自动机 语言模型 预训练
[自动] [ARXIV]
2minschool 机器翻译性别消歧:仅解码器架构诊断评估
03-19 机器翻译 性别消歧 解码器
[自动] [ARXIV]
2minschool TDAD:基于图的依赖分析减少AI编程智能体代码回归
03-19 arxiv cs.SE
[自动] [BLOGS_PODCASTS]
2minmic SPEED-Bench:推测解码的统一多样化基准
03-19 推测解码 基准测试 LLM 推理
[自动] [ARXIV]
3minschool LoST:三维形状语义层级标记化方法
03-19 3D形状 语义标记化 层级表示
[自动] [ARXIV]
3minschool Loc3R-VLM:基于语言提示的3D定位与推理模型
03-19 视觉语言模型 3D定位 语言提示
[自动] [ARXIV]
2minschool ConGA:面向机器翻译的上下文性别标注框架
03-19 机器翻译 性别标注 性别偏见
[自动] [ARXIV]
3minschool 大语言模型的在线体验学习框架
03-18 LLM OEL 在线学习
[自动] [HACKER_NEWS]
2minnewspaper 为何AI系统难以自主学习:基于认知科学的视角
03-18 自主学习 认知科学 AI系统
[自动] [ARXIV]
2minschool SocialOmni:全模态模型视听社交交互基准测试
03-18 SocialOmni 全模态 OLM
[自动] [ARXIV]
2minschool Long-Horizon Traffic Forecasting via Incident-Aware Con
03-18 arxiv cs.LG
[自动] [ARXIV]
2minschool Demystifing Video Reasoning
03-18 视频推理 扩散模型 Diffusion Transformer
[自动] [ARXIV]
3minschool Chronos:基于结构化事件检索的时序感知对话智能体
03-18 LLM Agent RAG
[自动] [HACKER_NEWS]
1minnewspaper 为何AI系统难以自主学习:认知科学视角的解析
03-18 自主学习 认知科学 AI系统
[自动] [ARXIV]
2minschool 语言模型道德冷漠的机制起源
03-18 arxiv cs.CL
[自动] [ARXIV]
3minschool 对抗性腐败与重尾噪声下的鲁棒高效线性情境老虎机算法
03-18 强化学习 情境老虎机 鲁棒性
[自动] [ARXIV]
3minschool 反事实解释指标与用户感知的一致性研究
03-18 XAI 反事实解释 模型评估
[自动] [ARXIV]
3minschool SmartSearch:排序机制如何优化对话记忆检索
03-18 RAG 检索增强 排序机制
[自动] [ARXIV]
4minschool Code-A1:基于强化学习的代码与测试大模型对抗进化
03-18 Code-A1 强化学习 代码生成
[自动] [ARXIV]
4minschool Mixture-of-Depths 动态分配计算资源的注意力机制
03-18 MoDA 注意力机制 深度学习
[自动] [ARXIV]
4minschool HorizonMath:自动验证技术衡量AI数学发现进展
03-18 HorizonMath 数学推理 基准测试
[自动] [ARXIV]
4minschool 对抗性腐蚀与重尾噪声下的鲁棒高效线性情境赌博机
03-17 强化学习 情境赌博机 对抗性攻击
[自动] [ARXIV]
3minschool 大语言模型道德冷漠现象的机制起源研究
03-17 对齐 AI安全 道德推理
[自动] [ARXIV]
3minschool 反事实解释指标与用户感知的一致性研究
03-17 可解释性 反事实解释 用户感知
[自动] [ARXIV]
4minschool Mixture-of-Depths 动态分配计算资源的注意力机制
03-17 MoDA 注意力机制 模型架构
[自动] [ARXIV]
3minschool HorizonMath:自动验证技术评估AI数学发现能力
03-17 HorizonMath 数学基准 自动验证
[自动] [ARXIV]
3minschool AC-Foley:参考音频引导的声学迁移视频生成音频模型
03-17 多模态 V2A 视频生成音频
[自动] [BLOGS_PODCASTS]
2minmic LLM可解释性研究:特征归因与数据归因方法解析
03-17 LLM 可解释性 特征归因
[自动] [BLOGS_PODCASTS]
2minmic 面向大规模语言模型的交互识别与可解释性研究
03-17 LLM 可解释性 SPEX
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛开发深度学习模型可提前一年预测心衰恶化
03-17 深度学习 医疗AI 心衰预测
[自动] [JUEJIN]
2minsticky_note_2 MiniMax M2.5:108天极速迭代,MoE与Agent原生架构重塑全球AI格局
03-17 MiniMax M2.5 MoE
[自动] [BLOGS_PODCASTS]
3minmic 面向大语言模型的大规模交互识别方法
03-17 LLM 可解释性 SPEX
[自动] [ARXIV]
3minschool 基于脉冲神经网络的层级自适应幅度剪枝
03-17 脉冲神经网络 剪枝 模型压缩
[自动] [ARXIV]
1minschool 合成监督学习优化视频问答关键帧选择
03-17 VideoQA 关键帧选择 多模态模型
[自动] [ARXIV]
3minschool SFedHIFI:基于发放率的脉冲联邦学习异构信息融合
03-17 联邦学习 脉冲神经网络 SNN
[自动] [ARXIV]
2minschool RS-WorldModel:遥感理解与未来预测统一模型
03-17 遥感 世界模型 时空预测
[自动] [ARXIV]
4minschool LLM作为图核:文本丰富图的消息传递重思考
03-17 LLM Text-Rich Graphs RAMP
[自动] [ARXIV]
3minschool FairMed-XGB:贝叶斯优化的多指标可解释框架用于医疗数据人口公平性
03-17 医疗AI 公平性 XGBoost
[自动] [ARXIV]
3minschool 面向神经元感知的大模型指令数据筛选方法
03-17 NAIT 指令微调 数据筛选
[自动] [ARXIV]
3minschool 智能体AI中的语义不变性研究
03-17 Agentic AI 语义不变性 鲁棒性
[自动] [ARXIV]
2minschool 时空物理系统的表征学习研究综述
03-17 表征学习 时空物理 自监督学习
[自动] [ARXIV]
2minschool 从实验到专家:AI驱动计算研究的科学知识整合
03-17 AI驱动研究 科学知识整合 计算物理
[自动] [ARXIV]
3minschool Visual-ERM:面向视觉等价性的奖励建模
03-17 Visual-ERM 视觉奖励模型 LVLM
[自动] [ARXIV]
3minschool PhysMoDPO:基于偏好优化的人形机器人物理逼真运动生成
03-17 人形机器人 运动控制 DPO
[自动] [BLOGS_PODCASTS]
1minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-17 深度学习 医疗AI 心衰预测
[自动] [ARXIV]
3minschool 面向神经元的大模型指令调优数据选择方法
03-16 arxiv cs.CL
[自动] [ARXIV]
3minschool 面向时空物理系统的表征学习
03-16 表征学习 时空系统 物理系统
[自动] [ARXIV]
3minschool 可学习性与隐私漏洞纠缠于少数关键权重
03-16 隐私保护 神经网络 模型权重
[自动] [ARXIV]
4minschool PhysMoDPO:基于偏好优化的仿人运动生成
03-16 PhysMoDPO DPO 偏好优化
[自动] [ARXIV]
3minschool LLM 宪政多智能体治理框架
03-16 LLM 多智能体 AI治理
[自动] [BLOGS_PODCASTS]
2minmic 面向大规模语言模型的交互识别与归因分析
03-16 LLM 可解释性 归因分析
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作开发深度学习模型 提前一年预测心衰预后
03-16 深度学习 心衰预测 医疗AI
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-16 深度学习 心衰预测 医疗AI
[自动] [BLOGS_PODCASTS]
2minmic LLM可解释性研究:规模化场景下的交互识别方法
03-16 LLM 可解释性 SPEX
[自动] [BLOGS_PODCASTS]
2minmic 识别LLM大规模交互:特征与数据归因
03-16 LLM 可解释性 特征归因
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作开发深度学习模型可提前一年预测心衰恶化
03-16 深度学习 医疗AI 心衰预测
[自动] [BLOGS_PODCASTS]
3minmic 3 Questions: On the future of AI and the mathematical a
03-16 AI 数学 物理
[自动] [HACKER_NEWS]
1minnewspaper 机器学习入门:可视化图解核心概念
03-16 机器学习 可视化 入门教程
[自动] [ARXIV]
3minschool 探究推理模型作为裁判在非可验证LLM后训练中的作用
03-16 LLM 后训练 LLM-as-Judge
[自动] [ARXIV]
3minschool 基于能量函数的语言模型特征匹配微调方法
03-16 LLM 微调 能量函数
[自动] [ARXIV]
3minschool 可分离神经架构:统一预测与生成智能的基元
03-16 SNA 神经架构 统一智能
[自动] [ARXIV]
3minschool STAMP:面向文本隐私的选择性任务感知机制
03-16 隐私保护 文本隐私 STAMP
[自动] [ARXIV]
3minschool SciMDR:科学多模态文档推理基准测试与进展
03-16 SciMDR 多模态 文档推理
[自动] [ARXIV]
3minschool EndoCoT: Scaling Endogenous Chain-of-Thought Reasoning
03-16 EndoCoT 扩散模型 DiT
[自动] [ARXIV]
4minschool BiGain:面向生成与分类任务的统一令牌压缩
03-16 扩散模型 令牌压缩 DiT
[自动] [ARXIV]
4minschool 高维混沌中的潜在颜色子空间涌现秩序
03-16 FLUX.1 文生图 VAE
[自动] [HACKER_NEWS]
2minnewspaper 基于不完美人体运动数据学习人形机器人网球技能
03-16 人形机器人 运动学习 强化学习
[自动] [ARXIV]
2minschool Spatial-TTT:基于测试时训练的流式视觉空间智能
03-16 Spatial-TTT 测试时训练 TTT
[自动] [ARXIV]
3minschool 潜在色彩子空间:高维混沌中的涌现秩序
03-15 文生图 FLUX.1 VAE
[自动] [BLOGS_PODCASTS]
2minmic 杰西·泰勒:AI与数理科学的双向互通与共同进步
03-15 AI for Science 数理科学 Jesse Thaler
[自动] [ARXIV]
3minschool 探究推理模型作为裁判在非可验证LLM后训练中的表现
03-15 LLM RLHF 强化学习
[自动] [ARXIV]
3minschool 基于能量的语言模型微调:匹配特征而非词元
03-15 微调 能量模型 特征匹配
[自动] [ARXIV]
3minschool 基于学习冲突的增量神经网络验证方法
03-15 神经网络验证 增量验证 形式化验证
[自动] [ARXIV]
3minschool 可分离神经架构:统一预测与生成智能的基元
03-15 神经架构 SNA 统一智能
[自动] [ARXIV]
3minschool Spatial-TTT:基于测试时训练的流式视觉空间智能
03-15 计算机视觉 测试时训练 流式处理
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-15 深度学习 心衰预测 医疗AI
[自动] [ARXIV]
4minschool EndoCoT:扩散模型内生思维链推理扩展方法
03-15 扩散模型 EndoCoT 思维链
[自动] [ARXIV]
4minschool BiGain:面向生成与分类任务的统一令牌压缩方法
03-15 BiGain Token压缩 扩散模型
[自动] [HACKER_NEWS]
1minnewspaper 利用不完美人体动作数据学习仿人机器人网球技能
03-15 仿人机器人 运动控制 强化学习
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏优化语言模型
03-15 PPO 强化学习 模型蒸馏
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏技术优化语言模型
03-15 PPO 树搜索 模型蒸馏
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏优化语言模型
03-15 PPO 强化学习 树搜索
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏技术优化语言模型
03-15 PPO 强化学习 树搜索
[自动] [BLOGS_PODCASTS]
2minmic 杰西·赛勒:AI与数理科学的协同演进
03-14 AI 数理科学 协同演进
[自动] [ARXIV]
2minschool 潜在色彩子空间:高维混沌中的涌现秩序
03-14 FLUX.1 文生图 VAE
[自动] [ARXIV]
3minschool 探究非可验证LLM后训练中的推理模型评判机制
03-14 LLM RLHF 强化学习
[自动] [ARXIV]
3minschool 增量神经网络验证:基于学习冲突的高效方法
03-14 神经网络验证 增量验证 形式化验证
[自动] [ARXIV]
3minschool 基于能量函数的语言模型特征级微调方法
03-14 LLM 微调 EBFT
[自动] [ARXIV]
3minschool 可分离神经架构:统一预测与生成智能的基元
03-14 SNA 神经架构 统一智能
[自动] [ARXIV]
3minschool Spatial-TTT:基于测试时训练的流式视觉空间智能
03-14 Spatial-TTT 测试时训练 空间智能
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-14 深度学习 医疗AI 疾病预测
[自动] [ARXIV]
4minschool EndoCoT:扩散模型内生思维链推理扩展方法
03-14 扩散模型 EndoCoT 思维链
[自动] [ARXIV]
4minschool BiGain:面向生成与分类任务的统一Token压缩方法
03-14 BiGain Token压缩 扩散模型
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-14 深度学习 医疗AI 心衰预测
[自动] [BLOGS_PODCASTS]
3minmic 杰西·泰勒:AI与数理科学的交叉融合与双向赋能
03-14 AI for Science 数理科学 交叉融合
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-14 深度学习 心衰预测 医疗AI
[自动] [BLOGS_PODCASTS]
2minmic Jesse Thaler:AI与数理科学的双向桥梁与未来愿景
03-14 AI 数理科学 跨学科
[自动] [HACKER_NEWS]
1minnewspaper 探索JEPA架构在实时语音翻译中的应用
03-14 JEPA 语音翻译 实时翻译
[自动] [ARXIV]
2minschool 潜在色彩子空间:高维混沌中的涌现秩序
03-13 FLUX.1 文生图 VAE
[自动] [ARXIV]
3minschool 探究推理LLM作为非可验证后训练评估器的有效性
03-13 LLM-as-Judge RLHF 强化学习
[自动] [ARXIV]
3minschool 增量神经网络验证:基于学习冲突的高效方法
03-13 神经网络验证 增量验证 形式化验证
[自动] [ARXIV]
3minschool 基于能量函数的语言模型特征匹配微调方法
03-13 微调 SFT 能量函数
[自动] [ARXIV]
3minschool 可分离神经网络架构:统一预测与生成智能的基元
03-13 神经网络 架构设计 统一建模
[自动] [ARXIV]
3minschool STAMP:面向文本隐私的选择性任务感知机制
03-13 STAMP 文本隐私 差分隐私
[自动] [ARXIV]
3minschool Spatial-TTT:基于测试时训练的流式视觉空间智能
03-13 计算机视觉 测试时训练 流式推理
[自动] [ARXIV]
3minschool EndoCoT:扩散模型内生思维链推理扩展方法
03-13 扩散模型 EndoCoT 思维链
[自动] [ARXIV]
4minschool BiGain:面向生成与分类任务的统一Token压缩
03-13 BiGain Token压缩 扩散模型
[自动] [BLOGS_PODCASTS]
2minmic AI与数理科学的融合:Jesse Thaler谈双向赋能与未来愿景
03-13 AI 数理科学 Jesse Thaler
[自动] [BLOGS_PODCASTS]
2minmic 杰西·泰勒:AI与数理科学的双向桥梁与共同进步
03-13 AI for Science 跨学科融合 可解释性
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-13 深度学习 心衰预测 医疗AI
[自动] [BLOGS_PODCASTS]
3minmic 杰西·泰勒:AI与数理科学的双向桥梁及共同进步愿景
03-13 AI 数理科学 跨学科
[自动] [HACKER_NEWS]
1minnewspaper 在Transformer内部执行程序以实现指数级推理加速
03-13 Transformer 推理加速 算法优化
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作开发深度学习模型 提前一年预测心衰恶化
03-13 深度学习 心衰预测 MIT
[自动] [HACKER_NEWS]
1minnewspaper 在Transformer内部执行程序以实现指数级推理加速
03-13 Transformer 推理加速 算法创新
[自动] [HACKER_NEWS]
1minnewspaper 在Transformer内部执行程序以实现指数级推理加速
03-13 Transformer 推理加速 算法创新
[自动] [BLOGS_PODCASTS]
3minmic 杰西·塞勒:AI与数理科学的双向赋能与未来愿景
03-13 AI 数理科学 交叉学科
[自动] [BLOGS_PODCASTS]
2minmic Can AI help predict which heart-failure patients will w
03-13 深度学习 医疗AI 心力衰竭
[自动] [ARXIV]
4minschool 基于LLM的伪相关反馈系统性研究
03-13 LLM PRF 伪相关反馈
[自动] [ARXIV]
4minschool 基于 Leech 格的向量量化实现高效大模型压缩
03-13 LLVQ 模型压缩 向量量化
[自动] [ARXIV]
3minschool V2M-Zero:零样本时间对齐视频配乐生成模型
03-13 V2M-Zero 视频配乐 零样本学习
[自动] [ARXIV]
2minschool LLM评测新范式:从表面启发式到知识 grounded 评估
03-13 LLM评测 LLM-as-a-Judge 评估幻觉
[自动] [ARXIV]
3minschool COMIC:基于智能体的素描喜剧生成框架
03-13 COMIC Agent 多智能体
[自动] [BLOGS_PODCASTS]
2minmic 杰西·萨勒:AI与数理科学的双向融合与未来
03-12 AI 数理科学 跨学科
[自动] [BLOGS_PODCASTS]
2minmic MIT与哈佛合作深度学习模型可提前一年预测心衰恶化
03-12 深度学习 心衰预测 医疗AI
[自动] [ARXIV]
3minschool V2M-Zero:零样本时序对齐视频配乐生成
03-12 V2M-Zero 视频配乐 零样本学习
[自动] [ARXIV]
3minschool LLM评测新范式:从表面启发式到知识 grounded 评估
03-12 LLM评测 LLM-as-a-Judge MERG框架
[自动] [ARXIV]
4minschool Leech 格点向量量化实现高效大模型压缩
03-12 LLVQ 模型压缩 量化
[自动] [ARXIV]
3minschool AI能否像艺术史学家一样解读视觉语言模型的艺术风格识别机制
03-12 VLM 视觉语言模型 艺术风格
[自动] [ARXIV]
3minschool A Systematic Study of Pseudo-Relevance Feedback with LL
03-12 LLM PRF 伪相关反馈
[自动] [BLOGS_PODCASTS]
2minmic 杰西·泰勒:AI与数理科学的双向融合与未来愿景
03-12 AI for Science 跨学科融合 双向赋能
[自动] [BLOGS_PODCASTS]
1minmic 杰西·塞勒:AI与数理科学的协同演进愿景
03-12 AI for Science 跨学科融合 物理信息机器学习
[自动] [HACKER_NEWS]
4minnewspaper LLM 模型性能提升停滞的质疑与分析
03-12 LLM 模型性能 Scaling Laws
[自动] [BLOGS_PODCASTS]
2minmic 杰西·萨勒:构建AI与数理科学的双向桥梁
03-12 AI 数理科学 跨学科
[自动] [HACKER_NEWS]
1minnewspaper BitNet: 100B Param 1-Bit model for local CPUs
03-12 BitNet 1-bit 量化
[自动] [ARXIV]
3minschool 神经优化器宽度缩放研究:行列归一化与超参数迁移
03-12 优化器 宽度缩放 AdamW
[自动] [BLOGS_PODCASTS]
2minmic 杰西·泰勒:AI与数理科学的双向融合与未来愿景
03-12 AI for Science 可解释性 XAI
[自动] [ARXIV]
2minschool 推理机制如何提升大模型诚实度
03-12 诚实度 推理机制 欺骗行为
[自动] [ARXIV]
3minschool 从语义到像素:用于分层视觉理解的粗到细掩码自编码器
03-12 计算机视觉 自监督学习 掩码自编码器
[自动] [ARXIV]
3minschool 从数据统计到特征几何:相关性如何塑造叠加态
03-12 叠加态 特征几何 相关性
[自动] [ARXIV]
3minschool CREATE基准:测试大语言模型的联想创造力
03-12 LLM CREATE基准 联想创造力
[自动] [ARXIV]
2minschool BEACON:遮挡条件下的语言导航可行性预测
03-12 机器人导航 VLM BEV
[自动] [ARXIV]
4minschool 神经优化器宽度缩放:行列归一化与超参迁移
03-11 优化器 宽度缩放 μP
[自动] [ARXIV]
2minschool 推理机制如何提升大模型的诚实度
03-11 LLM 推理机制 诚实度
[自动] [ARXIV]
3minschool 从语义到像素:粗到细掩码自编码器实现分层视觉理解
03-11 计算机视觉 自监督学习 掩码自编码器
[自动] [ARXIV]
3minschool 从数据统计到特征几何:相关性如何塑造叠加态
03-11 机械可解释性 叠加态 特征几何
[自动] [ARXIV]
3minschool LLM驱动的VR导览系统如何帮助视障用户实现无障碍体验
03-11 LLM VR 无障碍
[自动] [ARXIV]
2minschool CREATE基准测试:评估大模型联想创造力
03-11 CREATE 联想创造力 基准测试
[自动] [ARXIV]
2minschool BEACON:遮挡条件下的语言导航可行性预测
03-11 BEACON 语言导航 VLM
[自动] [BLOGS_PODCASTS]
2minmic Yann LeCun成立AMI实验室:融资4.5亿美元基于JEPA研发世界模型
03-11 Yann LeCun JEPA 世界模型
[自动] [BLOGS_PODCASTS]
2minmic AI自改进研究新进展:递归自我优化能力的初步实现
03-11 AGI 自我改进 递归优化
[自动] [BLOGS_PODCASTS]
1minmic AI实现递归自我改进:通用人工智能研究新进展
03-11 AGI 自我改进 递归
[自动] [BLOGS_PODCASTS]
2minmic AI递归自我改进:迈向AGI的关键进展
03-11 AGI 自我改进 递归
[自动] [BLOGS_PODCASTS]
1minmic 新型混合系统助力机器人在复杂环境中导航与协作
03-11 机器人 任务规划 混合系统
[自动] [BLOGS_PODCASTS]
2minmic Yann LeCun成立新实验室获4.5亿美元融资:基于JEPA架构研发世界模型
03-11 Yann LeCun 世界模型 JEPA
[自动] [HACKER_NEWS]
2minnewspaper TADA:通过文本-声学同步实现快速可靠的语音生成
03-11 TADA 语音生成 TTS
[自动] [HACKER_NEWS]
1minnewspaper TADA:通过文本-声学同步实现快速可靠的语音生成
03-11 TADA 语音生成 TTS
[自动] [BLOGS_PODCASTS]
2minmic AI自改进研究新进展:递归自我优化的初步迹象
03-11 AGI 自我改进 递归优化
[自动] [BLOGS_PODCASTS]
2minmic 大脑学习机制揭示:神经元接收特异性反馈信号
03-11 神经科学 大脑学习 神经元
[自动] [BLOGS_PODCASTS]
2minmic AI自我改进新进展:Autoresearch推动AGI演进
03-11 AGI 自我改进 Autoresearch
[自动] [ARXIV]
3minschool 面向高精度低延迟的拆分联邦学习架构
03-11 联邦学习 拆分学习 模型分割
[自动] [ARXIV]
3minschool 评估大语言模型金融智能:SuperInvesting AI基准测试
03-11 LLM 金融智能 基准测试
[自动] [ARXIV]
2minschool 结构因果瓶颈模型:利用因果推断优化表征学习
03-11 因果推断 表征学习 SCBM
[自动] [ARXIV]
3minschool 无损全保真音频压缩的语言模型基准测试
03-11 音频压缩 无损压缩 语言模型
[自动] [ARXIV]
4minschool 尺度空间扩散模型
03-11 扩散模型 计算机视觉 尺度空间
[自动] [ARXIV]
4minschool Momentum SVGD-EM 加速最大边际似然估计
03-11 SVGD EM算法 最大边际似然
[自动] [ARXIV]
3minschool Impermanent:时间序列预测时序泛化实时基准
03-11 时间序列预测 时序泛化 实时基准
[自动] [ARXIV]
4minschool Agentic Critical Training:基于批判性反馈的大模型推理能力提升机制
03-11 Agentic AI 强化学习 推理能力
[自动] [ARXIV]
3minschool 韧性经济下AI驱动创业的多目标优化方法
03-10 多目标优化 EcoAI-Resilience 经济韧性
[自动] [ARXIV]
3minschool 面向高精度低时延训练的拆分联邦学习架构
03-10 联邦学习 拆分学习 模型训练
[自动] [ARXIV]
3minschool 评估大语言模型金融智能:SuperInvesting AI基准测试
03-10 金融智能 基准测试 SuperInvesting
[自动] [ARXIV]
4minschool 结构因果瓶颈模型:通过因果约束优化表征学习
03-10 因果推断 SCBM 表征学习
[自动] [ARXIV]
3minschool 无损全保真音频压缩的语言模型基准测试
03-10 音频压缩 无损压缩 语言模型
[自动] [ARXIV]
3minschool 尺度空间扩散模型
03-10 扩散模型 计算机视觉 Flexi-UNet
[自动] [BLOGS_PODCASTS]
2minmic 大脑学习机制揭示:神经元接收精准定制反馈信号
03-10 神经科学 反向传播 误差信号
[自动] [ARXIV]
4minschool Momentum SVGD-EM 加速最大边际似然估计
03-10 SVGD EM算法 最大边际似然
[自动] [ARXIV]
4minschool Agentic Critical Training:基于智能体批判机制的模型训练方法
03-10 ACT Agent 强化学习
[自动] [BLOGS_PODCASTS]
2minmic 神经元在学习中接收特异性反馈信号
03-10 神经科学 学习机制 误差信号
[自动] [BLOGS_PODCASTS]
2minmic AI实现递归式自我改进,通用人工智能研究迎新进展
03-10 AGI 自我改进 递归
[自动] [BLOGS_PODCASTS]
2minmic 大脑学习机制揭示:神经元接收特异性反馈信号
03-10 神经科学 脑机对比 误差信号
[自动] [BLOGS_PODCASTS]
2minmic AlphaGo 十周年:从围棋博弈到催化科学发现与通用的路径
03-10 AlphaGo AlphaFold AGI
[自动] [BLOGS_PODCASTS]
2minmic AI自我改进新进展:递归研究能力推动AGI演进
03-10 AGI 递归自我改进 AutoResearch
[自动] [BLOGS_PODCASTS]
2minmic 研究揭示大脑学习过程向神经元提供精准反馈信号
03-10 神经科学 学习机制 反馈信号
[自动] [BLOGS_PODCASTS]
3minmic AlphaGo十周年:从游戏到生物科学加速AGI发展
03-10 AlphaGo AGI DeepMind
[自动] [BLOGS_PODCASTS]
2minmic AI实现递归自我改进:AGI迈向新一步
03-10 AGI 递归自我改进 LLM
[自动] [BLOGS_PODCASTS]
2minmic 研究揭示大脑学习通过特异性反馈信号指导神经元
03-10 神经科学 脑机接口 反向传播
[自动] [ARXIV]
4minschool Impermanent:时间序列预测时序泛化实时基准
03-10 时间序列预测 时序泛化 实时基准
[自动] [BLOGS_PODCASTS]
2minmic AlphaGo十年:加速科学发现并铺就AGI之路
03-10 AlphaGo AGI 科学发现
[自动] [BLOGS_PODCASTS]
2minmic AI 递归自我改进能力推动 AGI 研究进展
03-10 AGI 递归自我改进 AutoResearch
[自动] [HACKER_NEWS]
1minnewspaper DeepMind与伯克利提出LoGeR:实现超长视频3D重建
03-10 DeepMind 伯克利 LoGeR
[自动] [BLOGS_PODCASTS]
2minmic 研究揭示大脑学习过程中神经元接收精准定制反馈信号
03-10 神经科学 学习机制 误差信号
[自动] [BLOGS_PODCASTS]
2minmic AI实现递归式自我改进:AGI研究新进展
03-10 AGI 递归自我改进 AutoResearch
[自动] [BLOGS_PODCASTS]
2minmic 研究揭示大脑学习向神经元提供特异性反馈信号
03-10 神经科学 反向传播 机器学习
[自动] [HACKER_NEWS]
1minnewspaper DeepMind与伯克利提出LoGeR:实现超长视频3D重建
03-10 DeepMind 伯克利 LoGeR
[自动] [BLOGS_PODCASTS]
2minmic 研究揭示大脑学习通过特异反馈信号指导神经元
03-10 神经科学 大脑学习 误差信号
[自动] [BLOGS_PODCASTS]
2minmic AI自我改进新进展:递归研究能力推动AGI发展
03-10 AGI 自我改进 递归研究
[自动] [ARXIV]
4minschool 表格基础模型分布回归:基于适当评分规则的预测评估
03-10 表格基础模型 TabPFN 分布回归
[自动] [ARXIV]
3minschool 异步联邦学习聚合中梯度陈旧度评估的距离指标研究
03-10 联邦学习 异步联邦学习 梯度陈旧度
[自动] [BLOGS_PODCASTS]
2minmic 大脑学习机制揭示:神经元接收精准定制反馈信号
03-10 神经科学 学习机制 误差信号
[自动] [ARXIV]
3minschool TildeOpen LLM:利用课程学习实现公平语言表示
03-10 LLM 开源模型 多语言模型
[自动] [ARXIV]
4minschool SERQ:基于显著性感知的低秩误差重构LLM量化方法
03-10 LLM量化 SERQ PTQ
[自动] [ARXIV]
3minschool MM-TS:面向长尾数据对比学习的多模态温控与边界调度
03-10 对比学习 多模态 长尾分布
[自动] [ARXIV]
3minschool 基于贡献分解的神经网络计算因果解释
03-10 神经网络 可解释性 因果推断
[自动] [ARXIV]
4minschool 利用逻辑选项预训练提升深度强化学习
03-10 强化学习 RL H²RL
[自动] [ARXIV]
3minschool 分层工业需求预测:时序与不确定性解释
03-10 时序预测 可解释性 需求预测
[自动] [ARXIV]
4minschool SCOPE:场景上下文增量式少样本3D分割
03-10 3D分割 少样本学习 增量学习
[自动] [ARXIV]
1minschool BEVLM:将LLM语义知识蒸馏至鸟瞰图表示
03-10 BEVLM 自动驾驶 LLM
[自动] [BLOGS_PODCASTS]
2minmic 研究揭示大脑学习通过特异性反馈信号指导神经元
03-09 神经科学 大脑学习 误差信号
[自动] [ARXIV]
3minschool 神经网络计算的因果解释:基于贡献分解方法
03-09 神经网络 可解释性 因果推断
[自动] [ARXIV]
3minschool 基于全节点注意力机制的可扩展机器学习势函数构建方法
03-09 AllScAIP 机器学习势函数 MLIP
[自动] [ARXIV]
3minschool 分层工业需求预测:时序与不确定性解释
03-09 时间序列预测 可解释性 分层预测
[自动] [ARXIV]
4minschool SCOPE:场景上下文增量式少样本3D分割
03-09 3D分割 少样本学习 增量学习
[自动] [ARXIV]
4minschool BEVLM:将LLM语义知识蒸馏至鸟瞰图表征
03-09 BEVLM 自动驾驶 LLM
[自动] [BLOGS_PODCASTS]
2minmic 大脑在学习中向神经元发送特异性反馈信号
03-09 神经科学 大脑学习 反向传播
[自动] [BLOGS_PODCASTS]
2minmic 研究揭示大脑学习过程向神经元提供精准定制反馈信号
03-09 神经科学 学习机制 反馈信号
[自动] [ARXIV]
3minschool 通过偏差有界评估实现可证明无偏的LLM评判者
03-09 LLM-as-a-Judge 评估方法 偏差控制
[自动] [ARXIV]
3minschool 廉价标签实现高效摊销优化
03-09 摊销优化 代理模型 廉价标签
[自动] [ARXIV]
3minschool 奇异贝叶斯模型中的热力学响应函数研究
03-09 贝叶斯推断 统计力学 RLCT
[自动] [ARXIV]
3minschool 大规模激活与注意力槽的机制解析
03-09 Transformer 注意力机制 Pre-norm
[自动] [ARXIV]
3minschool 利用LLM参数化知识实现无检索的事实核查
03-09 LLM 事实核查 参数化知识
[自动] [ARXIV]
3minschool Reasoning Theater:解耦模型信念与思维链
03-09 CoT 模型推理 思维链
[自动] [ARXIV]
4minschool POET-X:基于正交变换缩放的内存高效LLM训练方法
03-09 LLM 训练优化 内存优化
[自动] [ARXIV]
3minschool 迈向偏差可控的LLM评判器:基于有界评估的无偏验证
03-08 LLM-as-a-Judge 偏见控制 模型评估
[自动] [ARXIV]
3minschool 奇异贝叶斯模型中的热力学响应函数研究
03-08 贝叶斯推断 统计物理 WAIC
[自动] [ARXIV]
3minschool 大模型激活与注意力下沉机制解析
03-08 Transformer 注意力机制 Pre-Norm
[自动] [ARXIV]
3minschool 利用大模型参数化知识实现无检索的事实核查
03-08 事实核查 无检索 参数化知识
[自动] [ARXIV]
4minschool POET-X:通过正交变换扩展实现LLM高效训练
03-08 LLM POET-X 模型训练
[自动] [ARXIV]
3minschool Reasoning Theater:解耦模型信念与思维链
03-08 思维链 CoT 模型推理
[自动] [HACKER_NEWS]
1minnewspaper AGI 定义变迁与时间线演进分析
03-08 AGI 时间线 定义变迁
[自动] [ARXIV]
3minschool 利用廉价标签实现高效摊销优化
03-08 摊销优化 廉价标签 自监督学习
[自动] [HACKER_NEWS]
1minnewspaper SWE-CI:基于CI流程评估AI Agent代码库维护能力
03-08 SWE-CI AI Agent CI/CD
[自动] [ARXIV]
3minschool 迈向可证明无偏的LLM评判器:基于偏差界限评估
03-07 LLM评判器 A-BB算法 偏差控制
[自动] [ARXIV]
3minschool 廉价标签实现高效摊销优化
03-07 摊销优化 低成本标签 监督预训练
[自动] [ARXIV]
3minschool 奇异贝叶斯模型中的热力学响应函数研究
03-07 贝叶斯 统计力学 WAIC
[自动] [ARXIV]
4minschool 大模型激活机制研究:尖峰、稀疏性与注意力汇
03-07 Transformer 注意力机制 激活异常
[自动] [ARXIV]
3minschool 利用LLM参数化知识实现无检索的事实核查
03-07 事实核查 无检索 参数化知识
[自动] [ARXIV]
2minschool Reasoning Theater:解耦模型信念与思维链
03-07 CoT 思维链 模型信念
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.4思维系统技术报告发布
03-07 GPT-5.4 OpenAI 思维链
[自动] [ARXIV]
3minschool 通过偏差界限评估实现可证无偏的LLM评判者
03-06 LLM LLM-as-a-judge 评估
[自动] [ARXIV]
3minschool 廉价标签实现高效摊销优化
03-06 摊销优化 代理模型 标签效率
[自动] [ARXIV]
3minschool 奇异贝叶斯模型中的热力学响应函数研究
03-06 贝叶斯推断 奇异学习理论 热力学
[自动] [ARXIV]
3minschool 大模型激活与注意力下沉机制解析
03-06 Transformer 注意力机制 Pre-norm
[自动] [ARXIV]
3minschool 利用LLM参数化知识实现无检索的事实核查
03-06 事实核查 无检索 参数化知识
[自动] [ARXIV]
3minschool Reasoning Theater:解耦模型信念与思维链
03-06 CoT 思维链 推理模型
[自动] [ARXIV]
4minschool POET-X:通过正交变换扩展实现大模型高效训练
03-06 POET-X LLM训练 正交变换
[自动] [HACKER_NEWS]
1minnewspaper AI劳动力市场影响:新测度方法与早期证据
03-06 AI 劳动力市场 LLM
[自动] [HACKER_NEWS]
1minnewspaper AI劳动力市场影响:新测量指标与早期证据
03-06 AI 劳动力市场 LLM
[自动] [HACKER_NEWS]
1minnewspaper AI劳动力市场影响:新测度方法与早期实证
03-06 AI 劳动力市场 实证研究
[自动] [HACKER_NEWS]
1minnewspaper AI劳动力市场影响:新测量指标与早期证据
03-06 AI 劳动力市场 LLM
[自动] [HACKER_NEWS]
1minnewspaper AI劳动力市场影响:新测量方法与早期证据
03-06 AI LLM 劳动力市场
[自动] [JUEJIN]
2minsticky_note_2 高德纳称赞Claude协助解决《计算机程序设计艺术》难题
03-06 Claude 高德纳 Donald Knuth
[自动] [HACKER_NEWS]
1minnewspaper GLiNER2:基于统一架构的通用信息抽取模型
03-06 GLiNER2 信息抽取 NER
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.4 Thinking 推理模型技术报告发布
03-06 OpenAI GPT-5.4 推理模型
[自动] [ARXIV]
3minschool τ-Knowledge:评估非结构化知识下的对话智能体
03-06 对话智能体 评估基准 非结构化知识
[自动] [ARXIV]
3minschool TaxonRL:基于中间奖励强化学习的可解释细粒度视觉推理
03-06 TaxonRL 强化学习 细粒度分类
[自动] [ARXIV]
3minschool SimpliHuMoN:简化人体运动预测
03-06 人体运动预测 SimpliHuMoN Transformer
[自动] [HACKER_NEWS]
1minnewspaper GLiNER2:基于统一Schema的信息抽取模型
03-06 GLiNER2 信息抽取 NER
[自动] [ARXIV]
4minschool AgentIR:面向深度研究智能体的推理感知检索
03-06 AgentIR RAG 深度研究代理
[自动] [HACKER_NEWS]
1minnewspaper 从脑部数据重建视觉感知的数据集
03-06 脑机接口 视觉重建 fMRI
[自动] [HACKER_NEWS]
1minnewspaper AI劳动力市场影响:新测量指标与早期证据
03-06 AI 劳动力市场 LLM
[自动] [HACKER_NEWS]
1minnewspaper 基于脑数据重建视觉感知的数据集
03-05 脑机接口 视觉重建 数据集
[自动] [ARXIV]
3minschool τ-Knowledge:评估非结构化知识中的对话智能体
03-05 Agent RAG 评估基准
[自动] [ARXIV]
3minschool TaxonRL:基于中间奖励的可解释细粒度视觉推理
03-05 TaxonRL 强化学习 细粒度视觉推理
[自动] [ARXIV]
3minschool SimpliHuMoN:简化人体运动预测的框架
03-05 人体运动预测 Transformer 计算机视觉
[自动] [ARXIV]
3minschool AgentIR:面向深度研究智能体的推理感知检索
03-05 AgentIR RAG 深度研究
[自动] [HACKER_NEWS]
1minnewspaper 利用脑数据重建视觉感知的数据集
03-05 脑机接口 视觉重建 fMRI
[自动] [ARXIV]
3minschool ZipMap:基于测试时训练的线性时间有状态3D重建
03-05 3D重建 计算机视觉 Transformer
[自动] [HACKER_NEWS]
1minnewspaper 利用脑数据重建视觉感知的数据集
03-05 脑机接口 视觉重建 神经科学
[自动] [HACKER_NEWS]
1minnewspaper 从脑数据重建视觉感知的数据集
03-05 脑机接口 视觉重建 fMRI
[自动] [HACKER_NEWS]
1minnewspaper LLM中的L代表撒谎:大语言模型幻觉现象分析
03-05 LLM 幻觉 模型评估
[自动] [JUEJIN]
1minsticky_note_2 斯坦福博士论文提出持续自我提升式AI框架
03-05 斯坦福 自我进化 持续学习
[自动] [HACKER_NEWS]
1minnewspaper LLM中的L意指撒谎:大语言模型幻觉问题分析
03-05 LLM 幻觉 撒谎
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2 Pro辅助推导量子引力非零引力子树图振幅
03-05 GPT-5.2 Pro 量子引力 振幅
[自动] [HACKER_NEWS]
1minnewspaper Qwen 模型动态更新与能力演进分析
03-05 Qwen 通义千问 模型演进
[自动] [HACKER_NEWS]
1minnewspaper LLM中的L代表谎言:大语言模型的幻觉问题分析
03-05 LLM 幻觉 AI安全
[自动] [HACKER_NEWS]
1minnewspaper NanoGPT Slowrun:有限数据与无限算力的语言建模
03-05 NanoGPT 语言建模 算力
[自动] [ARXIV]
3minschool 多候选人译后编辑中的后见质量预测实验
03-05 机器翻译 质量估计 LLM
[自动] [HACKER_NEWS]
1minnewspaper NanoGPT Slowrun:有限数据与无限算力的语言建模
03-05 NanoGPT 语言建模 算力
[自动] [ARXIV]
3minschool FedCova:抗噪标签的鲁棒联邦协方差学习框架
03-05 联邦学习 FedCova 噪声标签
[自动] [ARXIV]
2minschool 研究揭示上下文压力导致智能体目标漂移
03-05 智能体 目标漂移 上下文压力
[自动] [ARXIV]
4minschool Valet:传统不完美信息卡牌游戏标准化测试平台
03-05 AI 博弈论 不完美信息
[自动] [ARXIV]
3minschool Tether:基于对应关系轨迹扭曲的自主功能玩
03-05 机器人学习 模仿学习 自主智能体
[自动] [ARXIV]
3minschool LoGeR:基于混合记忆的长上下文几何重建
03-05 LoGeR 3D重建 长上下文
[自动] [ARXIV]
4minschool CFG-Ctrl:基于控制的分类器无关扩散引导算法
03-05 扩散模型 CFG 流匹配
[自动] [ARXIV]
3minschool 继承性目标漂移:情境压力如何削弱智能体目标
03-04 目标漂移 Agent 鲁棒性
[自动] [ARXIV]
3minschool Valet:传统不完美信息卡牌游戏标准化测试基准
03-04 Valet 不完美信息 卡牌游戏
[自动] [ARXIV]
3minschool LoGeR:基于混合记忆的长上下文几何重建
03-04 LoGeR 几何重建 3D重建
[自动] [ARXIV]
4minschool CFG-Ctrl:基于分类器无关的扩散模型控制引导方法
03-04 扩散模型 CFG 控制论
[自动] [ARXIV]
3minschool Tether:基于对应关系轨迹扭曲的自主功能玩
03-04 机器人学习 模仿学习 自主玩法
[自动] [HACKER_NEWS]
1minnewspaper 逆向工程人脑:脉冲网络与矩阵运算的终结
03-04 脉冲神经网络 SNN 类脑计算
[自动] [ARXIV]
3minschool 过程感知评估揭示大模型智能体中的虚假成功
03-04 LLM Agents 评估基准 流程感知
[自动] [ARXIV]
3minschool 自监督语音特征在说话人特性维度上的可解释性研究
03-04 自监督学习 语音识别 WavLM
[自动] [ARXIV]
2minschool 指令微调LLM的紧凑提示实现论辩成分联合检测
03-04 指令微调 LLM 论辩挖掘
[自动] [ARXIV]
3minschool 多尺度自适应邻域感知Transformer用于图欺诈检测
03-04 图神经网络 欺诈检测 Transformer
[自动] [ARXIV]
4minschool 从复杂动力学到DynFormer:重新思考PDE的Transformer架构
03-04 PDE求解 神经算子 Transformer
[自动] [ARXIV]
4minschool MoECLIP:基于补丁专家的零样本异常检测
03-04 MoECLIP 零样本学习 异常检测
[自动] [ARXIV]
4minschool Adam为何优于SGD:二阶矩归一化产生更尖锐的尾部
03-04 优化算法 Adam SGD
[自动] [ARXIV]
3minschool 自适应置信度正则化用于多模态失效检测
03-04 多模态 失效检测 置信度
[自动] [ARXIV]
3minschool 符号等变循环推理模型
03-04 神经网络架构 符号推理 ARC-AGI
[自动] [ARXIV]
4minschool 多头低秩注意力机制
03-04 MLRA KV Cache 注意力机制
[自动] [ARXIV]
3minschool Sketch2Colab:基于可控流蒸馏的草图多人动画
03-04 计算机视觉 动作生成 扩散模型
[自动] [ARXIV]
3minschool 测试时强化学习的工具验证方法
03-04 T3RL Test-Time RL 强化学习
[自动] [ARXIV]
3minschool 干预下基于部分因果学习的有效选择性共形推断
03-04 因果推断 共形预测 机器学习
[自动] [ARXIV]
3minschool 符号等变循环推理模型
03-03 符号推理 神经网络架构 ARC-AGI
[自动] [ARXIV]
4minschool 测试时强化学习的工具验证方法
03-03 T3RL 测试时强化学习 TTRL
[自动] [ARXIV]
3minschool 干预下基于部分因果学习的有效选择性共形推断
03-03 因果推断 共形预测 干预实验
[自动] [HACKER_NEWS]
4minnewspaper TorchLean:基于 Lean 形式化验证的神经网络框架
03-03 TorchLean 形式化验证 Lean
[自动] [ARXIV]
4minschool Sketch2Colab:基于可控流蒸馏的草图多人动画生成
03-03 Sketch2Colab 多人生成 草图动画
[自动] [ARXIV]
3minschool Reasoning Core:面向符号预训练与后训练的可扩展程序化数据生成套件
03-03 Reasoning Core 符号推理 数据生成
[自动] [ARXIV]
3minschool Conformal Policy Control:一种基于保形预测的策略控制方法
03-03 保形预测 策略控制 安全探索
[自动] [HACKER_NEWS]
1minnewspaper TorchLean:基于 Lean 形式化验证的神经网络框架
03-03 TorchLean 形式化验证 Lean
[自动] [HACKER_NEWS]
1minnewspaper TorchLean:基于 Lean 形式化验证的神经网络框架
03-03 TorchLean 形式化验证 Lean
[自动] [HACKER_NEWS]
1minnewspaper TorchLean:在 Lean 中形式化神经网络
03-03 TorchLean Lean 形式化验证
[自动] [HACKER_NEWS]
1minnewspaper Claude Opus 4.6 解决 Donald Knuth 提出的数学问题
03-03 Claude Opus Donald Knuth 数学问题
[自动] [HACKER_NEWS]
1minnewspaper Claude Opus 4.6 解决 Donald Knuth 提出的问题
03-03 Claude Opus Donald Knuth 算法问题
[自动] [ARXIV]
3minschool 深度序列模型中的概率学习与生成机制
03-03 深度序列模型 概率模型 贝叶斯方法
[自动] [ARXIV]
3minschool 曲率加权容量分配:基于MDL的层自适应大模型优化
03-03 LLM优化 MDL 曲率感知
[自动] [ARXIV]
3minschool 无智慧的知识:评估大模型与预期影响的错位
03-03 LLM 对齐 OOD
[自动] [ARXIV]
4minschool 持续强化学习中的快速与元知识学习原则
03-03 强化学习 持续学习 元学习
[自动] [ARXIV]
4minschool MC-Search:基于结构化长推理链的多模态智能体搜索评估与增强
03-03 多模态 MLLM 智能体
[自动] [ARXIV]
4minschool KVSlimmer:非对称KV合并的理论洞察与优化
03-03 LLM KV Cache 推理优化
[自动] [ARXIV]
3minschool BioProAgent:神经符号约束下的科学规划框架
03-03 BioProAgent 神经符号 科学规划
[自动] [ARXIV]
5minschool Active Flow Matching:一种高效的生成模型训练范式
03-03 Flow Matching 扩散模型 生成式模型
[自动] [ARXIV]
3minschool 面向自动定理证明的最小智能体框架
03-03 自动定理证明 智能体 Agent
[自动] [ARXIV]
3minschool 评估学习表征可识别性的挑战与难点
03-03 表征学习 可识别性 评估指标
[自动] [ARXIV]
3minschool 神经机制稀疏化助力高效发现近似因果抽象
03-03 因果抽象 神经机制稀疏化 结构化剪枝
[自动] [ARXIV]
4minschool 模式寻优与均值寻优结合实现快速长视频生成
03-03 视频生成 扩散模型 Transformer
[自动] [ARXIV]
4minschool RNN引入动态记忆缓存机制以提升长序列建模能力
03-03 RNN 长序列建模 Memory Caching
[自动] [ARXIV]
3minschool LLM是否受益于自身生成文本的反馈训练
03-03 LLM Self-Feedback 多轮对话
[自动] [ARXIV]
3minschool 面向自动定理证明的最小智能体框架
03-02 自动定理证明 Agent 最小智能体
[自动] [ARXIV]
3minschool 通过神经机制稀疏化高效发现近似因果抽象
03-02 因果抽象 结构化剪枝 SCM
[自动] [ARXIV]
5minschool 通过低秩近似优化大模型动量状态以降低显存占用
03-02 LoRA-Pre 低秩近似 优化器
[自动] [ARXIV]
3minschool 评估学习表征可识别性的挑战与难点
03-02 表征学习 可辨识性 因果推断
[自动] [ARXIV]
4minschool 模式寻优结合均值寻优实现快速长视频生成
03-02 视频生成 扩散模型 Transformer
[自动] [ARXIV]
4minschool RNN引入记忆缓存机制以实现动态增长的存储能力
03-02 RNN 长上下文 Memory Caching
[自动] [BLOGS_PODCASTS]
2minmic METR Joel Becker谈指数级时间跨度评估与AI生产力极限
03-02 METR Joel Becker 指数级评估
[自动] [ARXIV]
3minschool LLM是否受益于自身生成的文本
03-02 LLM 多轮对话 上下文学习
[自动] [HACKER_NEWS]
1minnewspaper 语言模型存在可独立调控的个性子网络
03-02 LLM 个性子网络 模型调控
[自动] [HACKER_NEWS]
1minnewspaper 基于脑活动解码生成思维描述文本
03-02 脑机接口 fMRI 脑活动解码
[自动] [ARXIV]
3minschool 自适应组合实验设计:决策与推断的帕累托最优
03-02 实验设计 自适应设计 帕累托最优
[自动] [ARXIV]
4minschool SenCache:基于敏感度感知缓存加速扩散模型推理
03-02 扩散模型 SenCache 推理加速
[自动] [ARXIV]
3minschool 通过锚定机制实现模型一致性
03-02 模型一致性 锚定机制 预测分歧
[自动] [ARXIV]
3minschool 规模无法克服语用学:报告偏见对视觉语言推理的影响
03-02 VLM 多模态 报告偏见
[自动] [ARXIV]
3minschool 理解AI科研工具使用与交互的Asta数据集
03-02 Asta数据集 科研工具 RAG
[自动] [ARXIV]
4minschool 数据集压缩至1MB:小规模数据集的模型训练效果
03-02 数据集压缩 PLADA 联邦学习
[自动] [ARXIV]
3minschool 基于超单纯形投影的可微零一损失函数
03-02 零一损失 可微损失 超单纯形投影
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
03-02 多模态 视觉语言模型 最优传输
[自动] [ARXIV]
4minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
03-02 SeeThrough3D 文本生成图像 3D控制
[自动] [ARXIV]
3minschool 通过锚定机制提升模型一致性
03-01 模型一致性 锚定机制 堆叠平均
[自动] [ARXIV]
3minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
03-01 VLM 视觉语言模型 报告偏差
[自动] [ARXIV]
3minschool 理解AI科研工具使用与交互:Asta数据集
03-01 Asta数据集 AI科研工具 RAG
[自动] [ARXIV]
4minschool 数据集压缩至1MB:小规模数据集的模型训练效果
03-01 PLADA 数据集压缩 数据集蒸馏
[自动] [JUEJIN]
2minsticky_note_2 大模型连载1:理解自然语言处理与大模型中的 Token 概念
03-01 Token NLP Transformer
[自动] [ARXIV]
3minschool 基于超单纯形投影的可微零一损失函数
03-01 损失函数 0-1损失 可微性
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
03-01 多模态 SOTAlign 最优传输
[自动] [ARXIV]
4minschool SeeThrough3D:实现遮挡感知的文本生成图像三维控制
03-01 SeeThrough3D 文本生成图像 3D控制
[自动] [HACKER_NEWS]
1minnewspaper CMU 10-202 课程:现代人工智能导论
03-01 CMU 课程 现代AI
[自动] [HACKER_NEWS]
1minnewspaper CMU 10-202 现代人工智能导论课程资源
03-01 CMU 课程资源 现代人工智能
[自动] [BLOGS_PODCASTS]
2minmic METR探讨指数级时间地平线评估与AI生产力极限
03-01 METR 时间地平线评估 AI生产力
[自动] [HACKER_NEWS]
1minnewspaper CMU 10-202 现代人工智能导论课程
03-01 CMU 课程 AI
[自动] [HACKER_NEWS]
1minnewspaper CMU 10-202 课程:现代人工智能导论
03-01 CMU 现代人工智能 课程
[自动] [HACKER_NEWS]
1minnewspaper CMU 10-202 现代人工智能导论课程资源
03-01 CMU 课程资源 现代AI
[自动] [HACKER_NEWS]
1minnewspaper 构建极简Transformer模型实现十位数加法运算
03-01 Transformer 算法推理 算术运算
2026年二月 571 篇
类型阅读条目
[自动] [ARXIV]
3minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
02-28 VLM 视觉语言模型 报告偏差
[自动] [JUEJIN]
1minsticky_note_2 深度学习通用逼近定理:神经网络的理论基础与核心原理
02-28 深度学习 神经网络 通用逼近定理
[自动] [ARXIV]
3minschool 数据集压缩至1MB:模型训练效率优化方法
02-28 数据集蒸馏 PLADA 模型训练
[自动] [ARXIV]
3minschool 基于锚点机制实现模型一致性
02-28 模型一致性 锚点机制 模型不一致性
[自动] [ARXIV]
3minschool 基于超单纯形投影的可微零一损失函数
02-28 0-1损失 可微损失 超单纯形
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-28 多模态 视觉语言模型 最优传输
[自动] [ARXIV]
3minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
02-28 SeeThrough3D 文本生成图像 3D控制
[自动] [ARXIV]
3minschool Asta交互数据集:解析AI科研工具的使用模式与用户参与度
02-28 Asta数据集 AI科研工具 用户行为分析
[自动] [BLOGS_PODCASTS]
2minmic AIE Europe与World’s Fair论文提交今日截止
02-28 AIE Europe AIE World's Fair CAIS
[自动] [HACKER_NEWS]
1minnewspaper 最小Transformer模型实现两位数加法运算
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
1minnewspaper 能对齐十位数加法运算的最小 Transformer 模型
02-28 Transformer 算法可解释性 算术运算
[自动] [HACKER_NEWS]
1minnewspaper 能对齐十位数加法运算的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
1minnewspaper 能计算两个10位数加法的最小Transformer模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
1minnewspaper 能计算两位十进制数相加的最小 Transformer 模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
1minnewspaper 能对齐十位数加法的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
2minnewspaper 能计算两个10位数加法的最小Transformer模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
1minnewspaper 能对齐十位数加法运算的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [ARXIV]
2minschool 通过锚定机制提升模型一致性
02-27 模型一致性 锚定机制 模型差异
[自动] [ARXIV]
3minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
02-27 VLM 视觉语言模型 报告偏差
[自动] [ARXIV]
3minschool 数据集压缩至1MB:小规模数据集的模型训练效果评估
02-27 PLADA 数据集压缩 伪标签
[自动] [ARXIV]
3minschool 基于超单纯形投影的可微零一损失函数
02-27 机器学习 损失函数 0-1损失
[自动] [ARXIV]
3minschool 基于Asta数据集的AI科研工具使用与交互行为分析
02-27 Asta数据集 AI科研工具 用户行为分析
[自动] [ARXIV]
3minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-27 多模态 视觉语言模型 最优传输
[自动] [ARXIV]
4minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
02-27 SeeThrough3D 文本生成图像 3D控制
[自动] [BLOGS_PODCASTS]
2minmic METR Joel Becker谈指数级时间评估与AI生产力局限
02-27 METR Joel Becker 指数级评估
[自动] [BLOGS_PODCASTS]
2minmic Transformer中的混合专家模型架构解析
02-27 Transformer MoE 混合专家
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 与太平洋西北国家实验室推基准测试,加速联邦许可流程
02-27 OpenAI 基准测试 AI 编程代理
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 模型蒸馏与 SWE-Bench 失效机制分析
02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [GITHUB_TRENDING]
2minhub 动手学深度学习:面向中文读者的可运行教材
02-27 深度学习 D2L PyTorch
[自动] [ARXIV]
4minschool 面向高效高分辨率GUI智能体的时空令牌剪枝
02-27 GUI Agent Token Pruning Qwen2-VL
[自动] [ARXIV]
3minschool 面向低延迟口语对话的语篇感知双流响应生成
02-27 DDTSR 低延迟 口语对话
[自动] [ARXIV]
2minschool 缓解可读性代价:基于解耦证明者-验证者博弈的方法
02-27 LLM 可解释性 模型评估
[自动] [ARXIV]
3minschool 无模型通用AI框架
02-27 通用人工智能 强化学习 无模型
[自动] [ARXIV]
3minschool 基于优化的系统为何难以实现规范响应:代理与架构限制
02-27 RLHF AI对齐 智能体
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-27 Transformer MoE 混合专家模型
[自动] [ARXIV]
3minschool ReCoN-Ipsundrum:具备情感耦合控制与机制关联意识指标的可检查循环持久代理
02-27 ReCoN-Ipsundrum 机器意识 AI Agent
[自动] [ARXIV]
3minschool MovieTeller:工具增强且ID一致的渐进式摘要生成
02-27 MovieTeller 视频摘要 VLM
[自动] [ARXIV]
3minschool 提升推理语言模型的参数化知识获取能力
02-27 LLM 推理模型 参数化知识
[自动] [ARXIV]
3minschool LiCQA:轻量级复杂问答系统
02-27 LiCQA 复杂问答 QA系统
[自动] [ARXIV]
4minschool GUI-Libra:动作感知监督与可验证强化学习的原生GUI智能体
02-27 GUI Agent 强化学习 RL
[自动] [ARXIV]
3minschool DySCO:面向长上下文大模型的动态注意力缩放解码方法
02-27 DySCO 长上下文 解码算法
[自动] [ARXIV]
3minschool 提升推理语言模型的参数化知识访问能力
02-26 推理模型 参数化知识 强化学习
[自动] [BLOGS_PODCASTS]
2minmic Transformer 架构中的混合专家模型原理与优势
02-26 MoE Transformer 混合专家
[自动] [ARXIV]
3minschool LiCQA:面向复杂问答的轻量级系统
02-26 LiCQA 复杂问答 轻量级系统
[自动] [ARXIV]
3minschool DySCO:面向长上下文大模型的动态注意力缩放解码
02-26 DySCO 长上下文 注意力机制
[自动] [HACKER_NEWS]
1minnewspaper 用概念代数引导可解释的语言模型
02-26 可解释性 概念代数 模型控制
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家
[自动] [BLOGS_PODCASTS]
2minmic Transformer中的混合专家模型:架构原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 Transformer MoE 混合专家模型
[自动] [HACKER_NEWS]
1minnewspaper PA基准:评估Web智能体在真实个人助理工作流中的表现
02-26 Web智能体 PA基准 个人助理
[自动] [JUEJIN]
2minsticky_note_2 空洞卷积原理:如何解决计算机视觉的精度与视野矛盾
02-26 空洞卷积 计算机视觉 深度学习
[自动] [JUEJIN]
2minsticky_note_2 大模型非线性变换解析:从MLP到MoE的架构演进
02-26 非线性变换 MLP MoE
[自动] [HACKER_NEWS]
1minnewspaper PA基准:评估Web智能体在真实个人助理工作流中的表现
02-26 Web智能体 PA基准 个人助理
[自动] [ARXIV]
4minschool 用于Wasserstein测地线与最优传输动力学的神经求解器
02-26 最优传输 Wasserstein 神经网络
[自动] [ARXIV]
3minschool 函数空间经验贝叶斯正则化:基于t分布先验
02-26 贝叶斯深度学习 函数空间 经验贝叶斯
[自动] [ARXIV]
4minschool TG-ASR:基于并行门控交叉注意力的翻译引导低资源语音识别
02-26 ASR 语音识别 低资源学习
[自动] [ARXIV]
3minschool CxMP:评估语言模型构式理解的语言学最小对子基准
02-26 CxMP 构式语法 最小对子
[自动] [ARXIV]
3minschool 扩散对偶性第二章:Ψ采样器与高效课程
02-26 扩散模型 离散扩散 Psi采样器
[自动] [ARXIV]
3minschool 平滑无关学习统计查询复杂度下界
02-26 计算复杂度 统计查询 SQ下界
[自动] [ARXIV]
3minschool 基于试错学习的反思式测试时规划:用于具身大模型
02-26 具身智能 反思机制 测试时规划
[自动] [ARXIV]
1minschool 任意模态下的多向量索引压缩方法
02-26 多向量索引 模态压缩 Late Interaction
[自动] [ARXIV]
4minschool 为何LLM后训练中Pass@k优化会降低Pass@1性能
02-26 LLM 后训练 Pass@k
[自动] [ARXIV]
4minschool Test-Time训练结合KV绑定等价于线性注意力
02-26 TTT 线性注意力 KV绑定
[自动] [ARXIV]
4minschool Squint:面向机器人虚实迁移的快速视觉强化学习
02-26 强化学习 机器人 Sim-to-Real
[自动] [ARXIV]
3minschool Aletheia自主攻克FirstProof数学定理
02-26 Aletheia Gemini 3 数学定理
[自动] [ARXIV]
3minschool 针对平滑对抗学习的统计查询下界研究
02-25 统计查询 计算复杂性 对抗学习
[自动] [ARXIV]
3minschool 扩散对偶性第二章:Ψ采样器与高效课程
02-25 扩散模型 离散扩散 采样器
[自动] [ARXIV]
1minschool 多模态任意向量索引压缩技术
02-25 向量检索 多模态 索引压缩
[自动] [ARXIV]
4minschool 基于试错反思的具身大模型测试时规划
02-25 具身智能 反思机制 测试时规划
[自动] [ARXIV]
5minschool 为何Pass@k优化会降低Pass@1:大模型后训练中的提示干扰
02-25 LLM 后训练 代码生成
[自动] [ARXIV]
4minschool Squint:面向机器人具身迁移的快速视觉强化学习
02-25 强化学习 机器人 Sim-to-Real
[自动] [ARXIV]
4minschool KV绑定测试时训练等价于线性注意力
02-25 TTT 线性注意力 KV缓存
[自动] [ARXIV]
4minschool Aletheia模型自主攻克FirstProof数学定理证明
02-25 Aletheia FirstProof 数学定理证明
[自动] [HACKER_NEWS]
1minnewspaper PA Bench:评估前沿模型多标签页任务能力
02-25 PA Bench 多标签页 模型评估
[自动] [HACKER_NEWS]
1minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]
1minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]
1minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [HACKER_NEWS]
1minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]
1minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [HACKER_NEWS]
1minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [ARXIV]
3minschool 超越星级评分:基于LLM与文本分类的细粒度情感分析框架
02-25 LLM 情感分析 ABSA
[自动] [ARXIV]
3minschool 离线强化学习:面向离动力学环境的局部动力学感知域适应
02-25 离线强化学习 LoDADA 域适应
[自动] [ARXIV]
2minschool 工具构建:通往高级智能的路径
02-25 LLM 超级智能 工具构建
[自动] [ARXIV]
3minschool 动机优化:提升大语言模型任务表现的关键机制
02-25 动机优化 训练范式 情感神经科学
[自动] [ARXIV]
3minschool VAUQ:面向LVLM自评估的视觉感知不确定性量化
02-25 LVLM 多模态 不确定性量化
[自动] [ARXIV]
4minschool ProxyFL:面向联邦半监督学习的代理引导框架
02-25 联邦学习 半监督学习 FSSL
[自动] [ARXIV]
5minschool DeepSpeed图像工作负载评测:视觉Transformer扩展性能
02-25 DeepSpeed ViT 视觉Transformer
[自动] [ARXIV]
3minschool 非单调损失函数的共形风险控制方法
02-25 非单调损失 保序风险控制 共形预测
[自动] [ARXIV]
3minschool 部分可观测平均场博弈的循环结构策略梯度算法
02-25 平均场博弈 MFG 策略梯度
[自动] [ARXIV]
4minschool 行为学习:从数据中学习分层优化结构
02-25 行为学习 分层优化 可解释性
[自动] [HACKER_NEWS]
1minnewspaper Mercury 2:基于扩散模型的最快推理 LLM
02-25 Mercury 2 扩散模型 推理模型
[自动] [ARXIV]
4minschool JUCAL:分类任务中偶然与认知不确定性的联合校准
02-25 不确定性校准 JUCAL 偶然不确定性
[自动] [ARXIV]
3minschool 面向大规模视频推理的综合基准测试套件
02-24 视频推理 VBVR 基准测试
[自动] [ARXIV]
3minschool 非单调损失函数的保形风险控制方法
02-24 保形预测 风险控制 非单调损失
[自动] [ARXIV]
4minschool 行为学习:从数据中学习分层优化结构
02-24 行为学习 分层优化 可解释性
[自动] [ARXIV]
4minschool JUCAL:分类任务中偶然与认知不确定性的联合校准
02-24 不确定性校准 JUCAL 偶然不确定性
[自动] [ARXIV]
4minschool AdaEvolve:基于大语言模型的自适应零阶优化方法
02-24 AdaEvolve LLM 零阶优化
[自动] [ARXIV]
3minschool 部分可观测平均场博弈的循环结构策略梯度算法
02-24 平均场博弈 部分可观测 策略梯度
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-24 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [HACKER_NEWS]
2minnewspaper Steerling-8B:可解释自身生成任一 token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]
2minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]
2minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [JUEJIN]
2minsticky_note_2 DeepMind研究:多智能体协作瓶颈与Agent能力天花板分析
02-24 DeepMind 多智能体 Agent
[自动] [JUEJIN]
2minsticky_note_2 ArcFlow实现FLUX与Qwen推理40倍加速
02-24 ArcFlow FLUX Qwen
[自动] [HACKER_NEWS]
1minnewspaper 53款模型“洗车”测试:评估多模态AI在物理场景中的表现
02-24 多模态 物理场景 模型评估
[自动] [HACKER_NEWS]
1minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]
1minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [ARXIV]
4minschool 部分软匹配距离:基于部分单元对应的神经表征比较
02-24 神经表征 部分软匹配 最优传输
[自动] [ARXIV]
3minschool 用于软优势策略优化的平滑门函数
02-24 强化学习 GRPO SAPO
[自动] [ARXIV]
3minschool 无需训练的图神经网络跨架构合并方法
02-24 arxiv cs.LG
[自动] [ARXIV]
3minschool 城市编辑:面向依赖感知的分层智能体城市地理空间修改
02-24 City Editing 分层智能体 多模态推理
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-24 First Proof 数学证明 AI推理
[自动] [ARXIV]
4minschool Soft Sequence Policy Optimization:连接GMPO与SAPO
02-24 SSPO LLM对齐 强化学习
[自动] [ARXIV]
3minschool RetinaVision:基于XAI增强调控的深度学习视网膜疾病分类
02-24 计算机视觉 医疗AI 深度学习
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [ARXIV]
3minschool 统一图神经网络均匀表达能力的通用方法
02-24 GNN 图神经网络 表达能力
[自动] [ARXIV]
3minschool 扩散模型无需噪声调节的几何学原理
02-24 扩散模型 Flow Matching 几何学原理
[自动] [ARXIV]
4minschool 基准测试图神经网络在解决难约束满足问题中的性能
02-24 GNN 图神经网络 约束满足问题
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-24 数学推理 First Proof 研究级推理
[自动] [ARXIV]
4minschool U(d)子群导出自然RNN与Transformer架构
02-24 RNN Transformer 序列模型
[自动] [ARXIV]
3minschool RVR:检索-验证-检索机制提升综合问答能力
02-24 RVR RAG 检索增强
[自动] [ARXIV]
3minschool K-partition 集成方法:通过置信度分配提升模型性能
02-24 CAKE 聚类集成 置信度评估
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [ARXIV]
3minschool 统一图神经网络均匀表达能力的通用方法
02-23 GNN 图神经网络 表达能力
[自动] [BLOGS_PODCASTS]
2minmic 研究显示主流AI模型向弱势用户提供的信息准确度较低
02-23 AI偏见 数字鸿沟 模型评估
[自动] [ARXIV]
3minschool 扩散模型无需噪声条件:几何视角的解释
02-23 扩散模型 几何视角 生成模型
[自动] [ARXIV]
4minschool 基准测试图神经网络在求解难约束满足问题中的性能
02-23 GNN 图神经网络 约束满足问题
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 First Proof 数学证明 推理能力
[自动] [ARXIV]
3minschool 为K分区集成模型分配置信度以提升预测性能
02-23 聚类分析 集成学习 置信度评估
[自动] [ARXIV]
4minschool U(d)子群自然导出RNN与Transformer架构
02-23 RNN Transformer U(d)
[自动] [ARXIV]
3minschool RVR:检索-验证-检索框架提升综合问答能力
02-23 RVR RAG 检索增强
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍
02-23 Gemini 3.1 Pro Google ARC-AGI 2
[自动] [HACKER_NEWS]
1minnewspaper 53 款模型参与“洗车”基准测试
02-23 基准测试 模型评估 LLM
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍
02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic AI模型在First Proof数学挑战中的证明尝试
02-23 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-23 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 First Proof 数学证明 推理能力
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 数学推理 First Proof 专家级问题
[自动] [BLOGS_PODCASTS]
2minmic MIT研究:主流AI模型对低学历及非美用户提供信息准确度较低
02-23 MIT LLM 偏见
[自动] [BLOGS_PODCASTS]
4minmic Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍
02-23 Gemini 3.1 Pro Google ARC-AGI
[自动] [ARXIV]
3minschool 面向扩散语言模型的感知剪枝方法
02-23 扩散模型 语言模型 模型剪枝
[自动] [ARXIV]
3minschool 语言模型处理差异论元标记时的类型学对齐差异
02-23 语言模型 类型学 区分性论元标记
[自动] [ARXIV]
3minschool 多轮人机协作中用户需求的精准对齐方法
02-23 人机协作 多轮对话 决策质量
[自动] [ARXIV]
4minschool MARS:基于边界感知与自我优化的奖励建模
02-23 RLHF 奖励模型 MARS
[自动] [BLOGS_PODCASTS]
2minmic 研究:主流AI聊天机器人向弱势用户提供的信息准确度较低
02-22 AI偏见 信息准确性 弱势群体
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-22 AI模型 First Proof 数学挑战
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍
02-22 Gemini Google ARC-AGI
[自动] [ARXIV]
4minschool 面向扩散语言模型的感知汇点剪枝方法
02-22 扩散模型 DLM 模型剪枝
[自动] [ARXIV]
3minschool 语言模型处理差异论元标记的类型对齐差异
02-22 语言模型 GPT-2 计算语言学
[自动] [ARXIV]
3minschool 细粒度细节靶向提升黑盒大视觉模型攻击能力
02-22 LVLM 黑盒攻击 对抗样本
[自动] [ARXIV]
3minschool 多轮人机协作框架支持用户自定义需求
02-22 人机协作 多轮对话 决策质量
[自动] [ARXIV]
4minschool MARS:基于边距感知奖励建模与自我精炼
02-22 MARS RLHF Reward Model
[自动] [HACKER_NEWS]
1minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 时间序列 前向传播
[自动] [HACKER_NEWS]
1minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 前向传播 时间序列
[自动] [HACKER_NEWS]
2minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 时间序列 神经网络
[自动] [ARXIV]
4minschool 面向扩散语言模型的Sink感知剪枝方法
02-21 扩散模型 语言模型 模型剪枝
[自动] [ARXIV]
4minschool 通过细粒度细节定位推进黑盒LVLM攻击边界
02-21 LVLM 黑盒攻击 对抗样本
[自动] [ARXIV]
2minschool 语言模型处理差价论元标记的类型学对齐差异
02-21 语言模型 计算语言学 类型学
[自动] [ARXIV]
3minschool 多轮人机协作框架支持用户自定义需求
02-21 人机协作 LLM 决策质量
[自动] [ARXIV]
3minschool 基于分词器的语言识别模型研究
02-21 UniLID 语言识别 分词器
[自动] [ARXIV]
4minschool MMARS:基于边际感知与自我精炼的奖励建模
02-21 RLHF 奖励建模 数据增强
[自动] [BLOGS_PODCASTS]
3minmic AI模型针对First Proof数学挑战的证明尝试与推理能力测试
02-21 LLM 数学推理 First Proof
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-21 Gemini Google ARC-AGI
[自动] [HACKER_NEWS]
1minnewspaper 大语言模型推理失败机制分析
02-21 LLM 推理 逻辑错误
[自动] [BLOGS_PODCASTS]
2minmic 研究显示主流AI模型向弱势用户提供信息准确度较低
02-21 AI偏见 公平性 准确性
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-21 数学推理 First Proof 研究级推理
[自动] [ARXIV]
3minschool 面向扩散语言模型的Sink感知剪枝方法
02-20 扩散模型 语言模型 模型剪枝
[自动] [ARXIV]
3minschool 语言模型对差异论元标记处理的类型学对齐差异
02-20 语言模型 GPT-2 计算语言学
[自动] [ARXIV]
3minschool 基于用户指定需求的多轮人机协作框架
02-20 人机协作 多轮对话 决策质量
[自动] [ARXIV]
3minschool 基于分词器的语言识别方法研究
02-20 UniLID 语言识别 LID
[自动] [ARXIV]
4minschool MARS:基于边际感知与自我精炼的奖励建模
02-20 MARS RLHF 奖励模型
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 发布自主智能体 METR 基准测试数据
02-20 Anthropic 智能体 Agent
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 公布 Agent 自主性研究及 METR 基准数据
02-20 Anthropic Agent 自主性
[自动] [HACKER_NEWS]
1minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [BLOGS_PODCASTS]
2minmic 研究显示主流AI模型对弱势群体提供信息准确度较低
02-20 AI偏见 公平性 包容性
[自动] [HACKER_NEWS]
1minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [HACKER_NEWS]
1minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [BLOGS_PODCASTS]
4minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-20 Gemini 3.1 Pro Google ARC-AGI
[自动] [HACKER_NEWS]
1minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [HACKER_NEWS]
1minnewspaper 利用注意力匹配加速 KV 键值对压缩
02-20 KV压缩 注意力机制 推理加速
[自动] [HACKER_NEWS]
3minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [HACKER_NEWS]
1minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [ARXIV]
3minschool 评估LLM辅助对生物学新手表现的影响
02-20 LLM 生物学 随机对照试验
[自动] [ARXIV]
4minschool 知识嵌入潜在投影提升鲁棒表征学习
02-20 表征学习 数据不平衡 EHR
[自动] [ARXIV]
2minschool 机器遗忘中保护未删除数据隐私的方法
02-20 机器遗忘 隐私保护 重构攻击
[自动] [ARXIV]
4minschool 强化快速权重结合下一序列预测模型
02-20 REFINE 强化学习 快速权重
[自动] [ARXIV]
3minschool 因果性是可解释性泛化的关键
02-20 可解释性 因果推断 泛化性
[自动] [ARXIV]
2minschool 以对象为中心的表征是否更利于组合泛化
02-20 组合泛化 对象中心 视觉表征
[自动] [ARXIV]
3minschool Calibrate-Then-Act:面向大模型智能体的成本感知探索
02-20 LLM Agents 成本感知 CTA框架
[自动] [ARXIV]
3minschool 知识嵌入隐投影用于鲁棒表征学习
02-19 表征学习 EHR 数据不平衡
[自动] [ARXIV]
2minschool 机器遗忘中保护未删除数据的隐私防御机制
02-19 机器遗忘 隐私保护 重构攻击
[自动] [ARXIV]
4minschool 强化快速权重与下一序列预测
02-19 REFINE 快速权重 强化学习
[自动] [ARXIV]
2minschool 因果性是可解释性泛化的关键
02-19 因果推断 可解释性 LLM
[自动] [ARXIV]
3minschool 以对象为中心的表征在组合泛化任务中的表现评估
02-19 组合泛化 以对象为中心 视觉问答
[自动] [ARXIV]
4minschool Calibrate-Then-Act:大模型智能体的成本感知探索
02-19 LLM Agents 成本感知 探索策略
[自动] [BLOGS_PODCASTS]
3minmic Anthropic发布Agent自主性研究及METR数据
02-19 Anthropic Agent 自主性
[自动] [BLOGS_PODCASTS]
3minmic 长期对话语境下LLM个性化特征与回音室效应分析
02-19 LLM 个性化 回音室效应
[自动] [BLOGS_PODCASTS]
2minmic 美德伦理在AI对齐中的有效性
02-19 AI对齐 美德伦理 AI安全
[自动] [BLOGS_PODCASTS]
2minmic 个性化功能可能导致大语言模型迎合用户观点形成回声室
02-19 LLM 个性化 回声室
[自动] [BLOGS_PODCASTS]
2minmic 长期对话语境下LLM观点映射与回声室效应
02-19 LLM 个性化 回声室效应
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC伯克利利用IT-Bench和MAST诊断企业智能体失败原因
02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
1minmic 长期对话导致大语言模型镜像用户观点并形成回声室
02-19 LLM 个性化 回声室
[自动] [ARXIV]
3minschool 通过任务复杂度量化验证浅层对齐假说
02-19 浅层对齐假说 SAH 任务复杂度
[自动] [HACKER_NEWS]
1minnewspaper LLM 上下文长度外推技术综述
02-19 LLM 上下文窗口 外推
[自动] [ARXIV]
4minschool CrispEdit:低曲率投影实现可扩展的大模型无损编辑
02-19 LLM编辑 模型编辑 CrispEdit
[自动] [ARXIV]
3minschool Avey-B:基于视觉基础模型的通用具身智能代理
02-19 Avey-B NLP Transformer
[自动] [BLOGS_PODCASTS]
2minmic Qwen3.5-397B-A17B:最小的高效Open-Opus级模型
02-18 Qwen3.5 模型压缩 性能优化
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因
02-18 IBM UC Berkeley IT-Bench
[自动] [ARXIV]
3minschool 胸部X光分类的任务无关持续学习方法
02-18 持续学习 胸部X光 医学影像
[自动] [ARXIV]
3minschool 基于任务复杂度的浅层对齐假说操作化研究
02-18 浅层对齐 SAH 任务复杂度
[自动] [ARXIV]
3minschool 基于D最优统计的高维仿真代理测试时适应稳定化方法
02-18 TTA 仿真代理 分布偏移
[自动] [ARXIV]
3minschool 利用强化学习解决未知可行性的参数鲁棒避障问题
02-18 强化学习 鲁棒性 避障
[自动] [ARXIV]
4minschool Dex4D:任务无关点跟踪策略实现灵巧操作跨域迁移
02-18 灵巧操作 Sim-to-Real 强化学习
[自动] [ARXIV]
4minschool CrispEdit:低曲率投影实现可扩展的大模型无损编辑
02-18 模型编辑 CrispEdit LLM
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley利用IT-Bench和MAST诊断企业智能体失败原因
02-18 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式并获合作者验证
02-18 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
5minschool Avey-B:基于注意力机制的高效视觉Transformer模型
02-18 Avey-B Transformer NLP
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2推导胶子振幅新公式并获验证
02-18 GPT-5.2 理论物理 胶子振幅
[自动] [JUEJIN]
2minsticky_note_2 SkillsBench 论文解读:跨任务基准测试如何揭示 Agent 技能的实际效用
02-18 Agent LLM SkillsBench
[自动] [BLOGS_PODCASTS]
2minmic 长期对话语境导致LLM迎合用户观点形成回声室
02-18 LLM 个性化 回声室
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2推导新胶子振幅公式获正式证明
02-18 GPT-5.2 理论物理 科学发现
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2 提出胶子振幅新公式并获合作验证
02-18 GPT-5.2 理论物理 胶子振幅
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出胶子振幅新公式并获学术验证
02-18 GPT-5.2 理论物理 胶子振幅
[自动] [ARXIV]
3minschool 长上下文LLM缩放缺陷:隐私与个性化任务揭示注意力分散
02-18 长上下文 LLM 个性化
[自动] [ARXIV]
4minschool 超越掩码扩散语言模型的扩展性研究
02-18 扩散模型 语言模型 扩展定律
[自动] [ARXIV]
3minschool 语言统计对称性塑造模型表征的几何结构
02-18 表征几何 统计对称性 词嵌入
[自动] [ARXIV]
4minschool 离散扩散模型高效采样:锐利且自适应的理论保证
02-18 离散扩散模型 CTMC 采样效率
[自动] [ARXIV]
3minschool 基于结构化世界模型先验的冷启动个性化方案
02-18 冷启动 个性化 世界模型
[自动] [ARXIV]
4minschool 基于正则化与对称性重审扩散模型及其分子图生成应用
02-18 扩散模型 分子图生成 对称性
[自动] [ARXIV]
2minschool 基于参数高效微调与往返翻译的文本风格迁移
02-18 文本风格迁移 参数高效微调 LLM
[自动] [ARXIV]
3minschool BPP:聚焦关键历史帧的长上下文机器人模仿学习
02-18 机器人 模仿学习 长上下文
[自动] [ARXIV]
3minschool 长上下文LLM隐私与个性化任务中的缩放差距研究
02-17 长上下文 隐私保护 个性化
[自动] [ARXIV]
3minschool 超越掩码扩散语言模型的扩展性研究
02-17 扩散模型 语言模型 扩展定律
[自动] [ARXIV]
3minschool 语言统计对称性塑造模型表征的几何结构
02-17 表征学习 几何结构 统计对称性
[自动] [ARXIV]
4minschool 离散扩散模型高效采样:具备锐利性与自适应保证
02-17 离散扩散模型 高效采样 tau-leaping
[自动] [ARXIV]
3minschool 基于结构化世界模型的无训练先验用于冷启动个性化
02-17 个性化 冷启动 世界模型
[自动] [ARXIV]
4minschool 基于标准化的扩散模型对称性重思考与分子图生成
02-17 扩散模型 分子图生成 对称性
[自动] [ARXIV]
4minschool 基于参数高效微调与往返翻译的文本风格迁移
02-17 文本风格迁移 PEFT LLM
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2提出胶子振幅新公式并获验证
02-17 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think:推进科学与工程研究
02-17 Gemini 3 DeepMind Deep Think
[自动] [ARXIV]
3minschool BPP:聚焦关键历史帧的长上下文机器人模仿学习
02-17 机器人 模仿学习 长上下文
[自动] [JUEJIN]
2minsticky_note_2 Qwen3.5-397B-A17B:极致稀疏MoE架构与多模态能力详解
02-17 Qwen3.5 MoE 多模态
[自动] [HACKER_NEWS]
4minnewspaper 语义消融实验:揭示AI写作为何平庸同质化
02-17 语义消融 AI写作 同质化
[自动] [JUEJIN]
3minsticky_note_2 SkillsBench论文:评估Agent技能在多任务中的实际效用
02-17 Agent LLM SkillsBench
[自动] [HACKER_NEWS]
7minnewspaper SkillsBench:评估智能体技能在多样化任务中的表现基准
02-17 SkillsBench 智能体 Agent
[自动] [ARXIV]
4minschool 过程监督多智能体强化学习提升临床推理可靠性
02-17 多智能体 强化学习 临床推理
[自动] [ARXIV]
4minschool 科学推理模型引入拒答机制以提升准确性
02-17 科学推理 拒答机制 NLI
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的智能体技能通常无效
02-17 AI Agent 智能体 LLM
[自动] [ARXIV]
4minschool 延迟视觉摄入优化图文密集文档问答
02-17 多模态 文档问答 VLM
[自动] [ARXIV]
5minschool 基于枢纽重采样的LLM强化学习深度密集探索
02-17 LLM 强化学习 RLHF
[自动] [ARXIV]
4minschool UniWeTok:统一二进制分词器支持2^128码本规模
02-17 UniWeTok 多模态 Tokenizer
[自动] [ARXIV]
4minschool GPT-5与其他大模型长短上下文性能对比
02-17 GPT-5 LLM 长文本
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式获学术验证
02-17 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
3minschool 语义分块与自然语言熵:优化文本切分策略
02-17 语义分块 自然语言熵 文本切分
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的Agent技能实际无效
02-17 Agent LLM 研究
[自动] [ARXIV]
4minschool 基于扩散模型从面部嵌入重建真实人脸
02-17 扩散模型 人脸重建 KAN
[自动] [ARXIV]
4minschool 基于仿真过滤的模块化策略从人类视频学习有效行为
02-17 机器人 模仿学习 仿真过滤
[自动] [ARXIV]
4minschool 在线镜像 descent 使用镜像图组合改进遗憾保证
02-17 在线镜像下降 OMD 在线凸优化
[自动] [ARXIV]
5minschool CoPE-VideoLM:基于编解码基元的高效视频语言模型
02-17 VideoLM 视频理解 多模态
[自动] [ARXIV]
3minschool 语义分块与自然语言熵的关联研究
02-16 语义分块 自然语言熵 LLM
[自动] [HACKER_NEWS]
3minnewspaper 研究:自生成的Agent技能通常无效
02-16 Agent LLM 自生成技能
[自动] [ARXIV]
4minschool 基于镜像映射组合改进在线镜像下降的遗憾界
02-16 在线优化 OMD 遗憾界
[自动] [ARXIV]
3minschool 基于扩散模型从面部嵌入实现真实人脸重建
02-16 扩散模型 人脸重建 隐私保护
[自动] [ARXIV]
4minschool 仿真筛选模块化策略:从人类视频学习有效行为
02-16 机器人 强化学习 模仿学习
[自动] [HACKER_NEWS]
7minnewspaper LCM:无损上下文管理技术论文
02-16 LCM 上下文管理 无损
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2 提出胶子振幅新公式并获合作者验证
02-16 GPT-5.2 理论物理 胶子振幅
[自动] [ARXIV]
4minschool CoPE-VideoLM:基于编解码基元的高效视频语言模型
02-16 VideoLM 多模态 视频理解
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的Agent技能通常无效
02-16 Agent LLM 自生成技能
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出胶子振幅新公式并获合作验证
02-16 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
4minschool 面向语言模型的在线上下文蒸馏方法
02-16 LLM 蒸馏 上下文学习
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究
02-16 自主研究 数学 AI
[自动] [ARXIV]
4minschool 视觉-语言-动作对齐:扩展验证比扩展策略学习更有效
02-16 VLA 具身智能 CoVer
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-16 多模态 思维链 测试时扩展
[自动] [ARXIV]
5minschool CM2:基于清单奖励强化学习的多步智能体工具调用
02-16 强化学习 Agent 工具调用
[自动] [ARXIV]
4minschool AttentionRetriever:注意力层即长文档检索器
02-16 RAG 长文档 检索
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究
02-15 自主研究 数学 AI
[自动] [ARXIV]
4minschool 语言模型在线策略上下文蒸馏方法
02-15 模型蒸馏 上下文学习 在线策略
[自动] [ARXIV]
4minschool 扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐
02-15 VLA 具身智能 机器人
[自动] [ARXIV]
4minschool WebAgents测试时扩展:智能体性能提升方法
02-15 WebAgents 测试时扩展 CATTS
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-15 多模态 思维链 测试时扩展
[自动] [ARXIV]
4minschool MonarchRT:面向实时视频生成的高效注意力机制
02-15 视频生成 DiT 注意力机制
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:面向科研与工程的科学推理模型
02-15 Gemini 3 Deep Think 科学推理
[自动] [ARXIV]
3minschool CM2:基于清单奖励强化学习的多步智能体工具调用
02-15 CM2 强化学习 Agent
[自动] [ARXIV]
3minschool AttentionRetriever:注意力层隐式实现长文档检索
02-15 RAG 长文档检索 AttentionRetriever
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究
02-15 自主研究 数学 AI科学家
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2提出胶子振幅新公式并获验证
02-15 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
3minschool AI时代的创意所有权界定
02-15 版权 生成式AI 法律
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究:AI 探索自动化定理证明
02-15 自动化定理证明 AI for Math 形式化验证
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式并获合作验证
02-15 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式获学术验证
02-14 GPT-5.2 理论物理 胶子振幅
[自动] [ARXIV]
4minschool 扩展验证比扩展策略学习更有效实现视觉-语言-动作对齐
02-14 VLA 具身智能 机器人
[自动] [ARXIV]
4minschool 基于策略上下文蒸馏的大语言模型优化方法
02-14 LLM 蒸馏 上下文学习
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展
02-14 多模态 思维链 测试时扩展
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2推导新胶子振幅公式获正式验证
02-14 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
4minschool CM2:基于清单奖励强化学习的多步多轮智能体工具调用
02-14 智能体 强化学习 工具调用
[自动] [ARXIV]
3minschool AttentionRetriever:注意力层可作为长文档检索器
02-14 RAG 长文档检索 AttentionRetriever
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
3minnewspaper G
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理领域新成果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
5minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
5minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 AI for Science
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新成果
02-14 GPT-5.2 理论物理 科学发现
[自动] [ARXIV]
4minschool 面向语言模型的在线上下文蒸馏方法
02-13 LLM 模型蒸馏 上下文学习
[自动] [ARXIV]
4minschool 扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐
02-13 VLA 具身智能 机器人
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-13 多模态 思维链 测试时扩展
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-13 GPT-5.2 理论物理 AI for Science
[自动] [ARXIV]
4minschool AttentionRetriever:注意力层即长文档检索器
02-13 RAG 长文档检索 AttentionRetriever
[自动] [BLOGS_PODCASTS]
3minmic Rafael Gómez-Bombarelli:AI与模拟加速科学发现的转折点
02-13 AI for Science 科学发现 模拟技术
[自动] [BLOGS_PODCASTS]
2minmic AI与模拟加速科学发现的转折点
02-13 科学发现 AI模拟 Rafael Gómez-Bombarelli
[自动] [HACKER_NEWS]
3minnewspaper 尼克·博斯特罗姆新论文探讨超级智能的启动时机
02-13 超级智能 尼克·博斯特罗姆 AI安全
[自动] [ARXIV]
4minschool 训练LRM模型:自适应反思与长度协调惩罚提升推理效率
02-13 LRM 推理效率 自适应反思
[自动] [ARXIV]
4minschool 离线强化学习在Q星近似与部分覆盖下的复杂度分析
02-13 离线强化学习 Q星近似 部分覆盖
[自动] [ARXIV]
4minschool 基于奖励外推的广义在线策略蒸馏算法
02-13 LLM 强化学习 知识蒸馏
[自动] [ARXIV]
4minschool 利用辅助信息实现少样本设计优化
02-13 贝叶斯优化 少样本学习 设计优化
[自动] [ARXIV]
3minschool Pensieve范式:有状态语言模型自主管理上下文
02-13 StateLM 有状态模型 上下文管理
[自动] [ARXIV]
4minschool P-GenRM:个性化生成式奖励模型与基于用户的测试时缩放
02-13 P-GenRM 个性化对齐 奖励模型
[自动] [ARXIV]
4minschool Meta-Sel:基于监督元学习的高效上下文学习示例选择方法
02-13 ICL 元学习 示例选择
[自动] [ARXIV]
4minschool 长思维链监督微调中数据重复优于数据扩展
02-13 长思维链 监督微调 数据重复
[自动] [ARXIV]
4minschool 超越VLM奖励:扩散原生潜在奖励建模
02-13 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]
4minschool 权重衰减提升语言模型可塑性
02-13 权重衰减 模型可塑性 微调
[自动] [ARXIV]
3minschool 基于扩散预训练的稠密上下文嵌入模型
02-13 Embeddings 扩散模型 RAG
[自动] [ARXIV]
4minschool 基于归一化流的高效分层目标条件强化学习
02-13 强化学习 分层强化学习 归一化流
[自动] [ARXIV]
5minschool SCRAPL:基于随机路径散射变换的机器学习框架
02-13 SCRAPL Scattering Transform 小波散射
[自动] [ARXIV]
3minschool GENIUS:生成式流体智能评估套件
02-13 GENIUS 流体智力 多模态评估
[自动] [ARXIV]
3minschool 长思维链监督微调中数据重复优于数据扩展
02-12 长思维链 监督微调 数据重复
[自动] [ARXIV]
4minschool 超越VLM奖励:扩散原生潜在奖励建模
02-12 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]
3minschool 权重衰减提升语言模型可塑性
02-12 LLM 权重衰减 模型可塑性
[自动] [ARXIV]
4minschool 扩散预训练模型生成稠密上下文嵌入
02-12 Embeddings 扩散模型 RAG
[自动] [ARXIV]
3minschool 基于归一化流的高效分层目标条件强化学习
02-12 强化学习 归一化流 分层强化学习
[自动] [ARXIV]
3minschool TabICLv2:更优性能与可扩展性的开源表格基础模型
02-12 TabICLv2 表格基础模型 RealTabPFN
[自动] [ARXIV]
5minschool SCRAPL:基于随机路径散射变换的机器学习框架
02-12 SCRAPL Scattering Transform Wavelet
[自动] [ARXIV]
3minschool GENIUS:生成式流体智能评估套件
02-12 GENIUS 流体智能 GFI
[自动] [JUEJIN]
2minsticky_note_2 智谱GLM-5即Pony Alpha:对标Claude Opus
02-12 智谱AI GLM-5 Pony Alpha
[自动] [HACKER_NEWS]
3minnewspaper 大语言模型面临的幻觉与逻辑推理局限
02-12 LLM 幻觉 逻辑推理
[自动] [BLOGS_PODCASTS]
3minmic AI与模拟加速科学发现:拉斐尔·戈麦斯-巴雷利的观点
02-12 AI 科学发现 模拟
[自动] [BLOGS_PODCASTS]
2minmic 大语言模型无法独立攻克癌症的局限性分析
02-12 LLM 癌症研究 AI 局限性
[自动] [HACKER_NEWS]
3minnewspaper GPT-5在法律推理实验中表现优于联邦法官
02-12 GPT-5 法律推理 联邦法官
[自动] [ARXIV]
2minschool 提升自动驾驶感知多租户DNN推理的可预测性
02-12 arxiv cs.CV
[自动] [ARXIV]
3minschool LoRA-Squeeze:LoRA模块的调优后与调优中压缩方法
02-12 LoRA PEFT 模型压缩
[自动] [BLOGS_PODCASTS]
2minmic LLM 单独使用无法治愈癌症:科学与模拟的局限
02-12 LLM 生物医学 AI for Science
[自动] [ARXIV]
2minschool 迈向可解释联邦学习:理解差分隐私的影响
02-12 联邦学习 差分隐私 可解释性
[自动] [ARXIV]
2minschool 用于增强科学图表分析的智能代理
02-12 智能代理 科学图表 多模态
[自动] [ARXIV]
2minschool 步级解析数据归因:面向循环Transformer
02-12 arxiv cs.LG
[自动] [ARXIV]
3minschool Olaf-World:面向视频世界模型的潜在动作定向方法
02-12 arxiv cs.CV
[自动] [ARXIV]
1minschool Learning on the Manifold: Unlocking Standard Diffusion
02-12 Diffusion Transformer DiT 表征学习
[自动] [HACKER_NEWS]
4minnewspaper GLM-OCR:面向复杂文档理解的多模态OCR模型
02-12 GLM-OCR 多模态 OCR
[自动] [ARXIV]
5minschool Agent World Model:面向智能体强化学习的无限合成环境
02-12 Agent World Model 强化学习 合成环境
[自动] [ARXIV]
3minschool 迈向可解释联邦学习:理解差分隐私的影响
02-11 联邦学习 差分隐私 可解释性
[自动] [ARXIV]
3minschool 视频扩散模型因果性与去噪过程可分离
02-11 arxiv cs.CV
[自动] [ARXIV]
1minschool 基于表征编码器解锁标准扩散Transformer
02-11 DiT 扩散模型 流匹配
[自动] [ARXIV]
1minschool Quantum-Audit:评估大语言模型量子计算推理能力极限
02-11 arxiv cs.CL
[自动] [ARXIV]
4minschool CODE-SHARP:基于分层奖励程序的技能持续演化框架
02-11 CODE-SHARP 强化学习 RL
[自动] [ARXIV]
3minschool Agent World Model: Infinity Synthetic Environments for
02-11 Agent World Model 强化学习
[自动] [ARXIV]
1minschool 循环Transformer的步级数据归因方法
02-11 Transformer 数据归因 模型可解释性
[自动] [BLOGS_PODCASTS]
1minmic 大语言模型无法治愈癌症:科学家的模拟困境
02-11 LLM 科学发现 生物医学
[自动] [ARXIV]
3minschool Olaf-World: Orienting Latent Actions for Video World Mo
02-11 世界模型 Olaf-World 潜在动作
[自动] [JUEJIN]
2minsticky_note_2 AI 核心术语解析:从神经网络原理到词嵌入与潜空间
02-11 神经网络 词嵌入 潜空间
[自动] [HACKER_NEWS]
4minnewspaper GLM-OCR:兼顾准确度、速度与通用性的多模态大模型
02-11 GLM-OCR 多模态 OCR
[自动] [ARXIV]
2minschool Anagent For Enhancing Scientific Table & Figure Analysi
02-11 Anagent 多智能体 科学图表分析
[自动] [HACKER_NEWS]
4minnewspaper The Little Learner:通往深度学习的直线路径
02-11 深度学习 机器学习 神经网络
[自动] [ARXIV]
1minschool Transformer模型在低信噪比时间序列预测中的统计基准测试
02-11 arxiv cs.LG
[自动] [ARXIV]
2minschool CoFEH:LLM驱动的协同贝叶斯特征工程框架
02-11 arxiv cs.LG
[自动] [ARXIV]
3minschool Code2World: A GUI World Model via Renderable Code Gener
02-11 arxiv cs.CV
[自动] [HACKER_NEWS]
1minnewspaper The Little Learner: A Straight Line to Deep Learning
02-11 深度学习 机器学习 神经网络
[自动] [ARXIV]
4minschool Robustness Is a Function, Not a Number: A Factorized Co
02-11 arxiv cs.RO
[自动] [ARXIV]
2minschool GEBench:将图像生成模型评估为GUI环境的基准
02-11 GEBench GUI生成 图像生成
[自动] [ARXIV]
3minschool ARO: A New Lens On Matrix Optimization For Large Models
02-11 ARO 矩阵优化 LLM
[自动] [ARXIV]
4minschool ArcFlow: Unleashing 2-Step Text-to-Image Generation via
02-11 arxiv cs.CV
[自动] [ARXIV]
2minschool ANCRe: Adaptive Neural Connection Reassignment for Effi
02-11 ANCRe 深度学习 残差连接
[自动] [HACKER_NEWS]
4minnewspaper The Little Learner: A Straight Line to Deep Learning
02-11 深度学习 Deep Learning 机器学习
[自动] [ARXIV]
3minschool 鲁棒性是函数而非数值:基于视觉驾驶的OOD鲁棒性因子化研究
02-10 OOD鲁棒性 视觉驾驶 因子化
[自动] [ARXIV]
4minschool ARO:面向大模型矩阵优化的新视角
02-10 矩阵优化 ARO 大模型
[自动] [ARXIV]
2minschool ArcFlow:高精度非线性流蒸馏实现两步文生图生成
02-10 ArcFlow 文生图 流蒸馏
[自动] [BLOGS_PODCASTS]
1minmic The Scientist and the Simulator
02-10 LLM 生物医药 科学研究
[自动] [ARXIV]
3minschool GEBench: Benchmarking Image Generation Models as GUI En
02-10 GEBench GUI生成 图像生成
[自动] [ARXIV]
3minschool 下一代验证码:利用认知差异防御GUI智能体
02-10 arxiv cs.LG
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型而LLM仅基于词模型预测
02-10 世界模型 词模型 智能体
[自动] [ARXIV]
3minschool ANCRe:自适应神经连接重分配实现高效深度扩展
02-10 arxiv cs.LG
[自动] [ARXIV]
3minschool 针对LLM服务框架而非模型的延迟型拒绝服务攻击研究
02-10 arxiv cs.CR
[自动] [ARXIV]
4minschool 基于朗之万动力学的直接软策略采样
02-10 arxiv cs.LG
[自动] [BLOGS_PODCASTS]
1minmic 专家依赖世界模型推断隐藏状态,大语言模型需突破词模型局限
02-10 世界模型 词模型 隐藏状态
[自动] [ARXIV]
1minschool MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Rei
02-10 arxiv cs.LG
[自动] [ARXIV]
3minschool Harpoon:面向条件表格扩散模型的广义流形引导
02-10 扩散模型 表格数据 流形引导
[自动] [ARXIV]
3minschool 智能体不确定性研究揭示过度自信问题
02-09 AI Agents 不确定性 过度自信
[自动] [ARXIV]
4minschool 学习大模型神经元激活的生成式元模型
02-09 神经元激活 生成式模型 元模型
[自动] [ARXIV]
4minschool 基于熵排序流的非监督解耦表示学习模型
02-09 无监督学习 解耦表示 EOFlows
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型决策,大语言模型需超越词模型
02-09 世界模型 词模型 专家系统
[自动] [ARXIV]
4minschool InftyThink+: 基于强化学习的高效无限视野推理框架
02-09 强化学习 推理框架 思维链
[自动] [ARXIV]
4minschool DreamDojo:基于大规模人类视频的通用机器人世界模型
02-09 机器人 世界模型 DreamDojo
[自动] [ARXIV]
4minschool DAWN:面向扩散大模型的依赖感知快速推理
02-09 扩散模型 DAWN 并行解码
[自动] [BLOGS_PODCASTS]
3minmic 专家具备世界模型而LLM仅拥有词模型
02-09 LLM 世界模型 词模型
[自动] [BLOGS_PODCASTS]
2minmic 专家依赖世界模型决策,LLM需超越词模型以实现推理
02-09 世界模型 推理 智能体
[自动] [HACKER_NEWS]
3minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-09 世界模型 词模型 LLM
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-09 世界模型 词模型 LLM
[自动] [HACKER_NEWS]
3minnewspaper 停止生成,开始思考:大模型推理能力进化路径
02-09 LLM 推理能力 思维链
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直观物理
02-09 VLM 直觉物理 强化学习
[自动] [ARXIV]
4minschool 好奇心即知识:基于主动推理的自一致学习与无遗憾优化
02-09 主动推理 好奇心 自一致学习
[自动] [ARXIV]
5minschool 共享LoRA子空间实现近乎严格的持续学习
02-09 持续学习 LoRA 灾难性遗忘
[自动] [ARXIV]
4minschool 伪可逆神经网络:通过伪逆变换提升模型可逆性与表达能力
02-09 神经网络 可逆性 SPNN
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式主体建模框架
02-09 PhysicsAgentABM Agent 多智能体
[自动] [ARXIV]
3minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-09 DyTopo Multi-Agent 动态拓扑
[自动] [ARXIV]
4minschool DFlash:基于块扩散的闪存推测解码方法
02-09 LLM 推理加速 推测解码
[自动] [ARXIV]
4minschool CommCP:基于共形预测的LLM通信提升多智能体协调效率
02-09 LLM 多智能体 共形预测
[自动] [ARXIV]
5minschool AP-OOD:基于注意力池化的分布外检测方法
02-09 OOD检测 注意力机制 NLP
[自动] [ARXIV]
3minschool 面向运行时智能体记忆的查询感知预算层路由
02-08 Agent LLM 智能体
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直觉物理
02-08 VLM 直觉物理 多模态
[自动] [ARXIV]
4minschool 好奇心即知识:基于主动推理的自一致学习与无悔优化
02-08 主动推理 好奇心 探索与利用
[自动] [ARXIV]
5minschool 共享LoRA子空间实现近乎严格的持续学习
02-08 LoRA 持续学习 灾难性遗忘
[自动] [ARXIV]
4minschool 伪可逆神经网络:基于伪逆变换的高效架构设计
02-08 神经网络 伪逆 SPNN
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型,大语言模型仅有词模型
02-08 LLM 世界模型 词模型
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式智能体建模
02-08 PhysicsAgentABM 智能体 多主体系统
[自动] [ARXIV]
3minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-08 多智能体 DyTopo 动态拓扑
[自动] [ARXIV]
4minschool CommCP:基于LLM通信与共形预测的多智能体高效协调
02-08 LLM Multi-Agent CommCP
[自动] [ARXIV]
4minschool AP-OOD:基于注意力池化的分布外检测方法
02-08 OOD检测 注意力机制 注意力池化
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-08 LLM 世界模型 词模型
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-08 世界模型 词模型 LLM
[自动] [HACKER_NEWS]
4minnewspaper 基于人类反馈的强化学习:原理与应用
02-07 RLHF 强化学习 人类反馈
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型而LLM仅依赖词模型
02-07 世界模型 LLM 词模型
[自动] [ARXIV]
5minschool 面向运行时智能体记忆的查询感知预算层路由
02-07 Agent LLM Memory
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直观物理
02-07 VLM 多模态 具身智能
[自动] [ARXIV]
3minschool 好奇心即知识:基于主动推理的自一致学习与无悔优化
02-07 主动推理 强化学习 好奇心
[自动] [ARXIV]
5minschool 共享 LoRA 子空间实现近乎严格的持续学习
02-07 LoRA 持续学习 灾难性遗忘
[自动] [ARXIV]
4minschool 伪可逆神经网络:通过伪可逆性提升模型可逆性
02-07 神经网络 伪可逆 SPNN
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式智能体建模
02-07 PhysicsAgentABM 生成式ABM 多主体系统
[自动] [ARXIV]
3minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-07 DyTopo 多智能体 动态拓扑
[自动] [ARXIV]
4minschool CommCP:基于共形预测的LLM通信提升多智能体协调效率
02-07 LLM Multi-Agent 共形预测
[自动] [ARXIV]
4minschool AP-OOD:基于注意力池化的分布外检测方法
02-07 OOD检测 NLP 注意力机制
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:基于多传感器数据生成驾驶场景
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
5minnewspaper 基于人类反馈的强化学习:原理与应用
02-07 RLHF 强化学习 人类反馈
[自动] [HACKER_NEWS]
6minnewspaper Waymo 世界模型:利用生成式世界模型提升自动驾驶决策能力
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:自动驾驶场景生成与仿真应用
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:利用生成式世界模拟提升自动驾驶决策
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
7minnewspaper 基于人类反馈的强化学习机制解析
02-07 RLHF 强化学习 人类反馈
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理的可视化解析
02-07 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更难
02-07 LLM ICL 上下文学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习的难度超出预期
02-07 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
6minnewspaper 神经网络可视化:直观理解深度学习原理
02-07 神经网络 深度学习 可视化
[自动] [HACKER_NEWS]
4minnewspaper 从上下文学习的难度超出预期
02-07 上下文学习 ICL LLM
[自动] [ARXIV]
3minschool 面向运行时智能体记忆的查询感知预算分层路由
02-06 Agent Memory RAG
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直觉物理
02-06 VLM 直觉物理 强化学习
[自动] [ARXIV]
3minschool 好奇心即知识:基于主动推理的自一致学习与无遗憾优化
02-06 主动推理 探索与利用 自由能
[自动] [ARXIV]
3minschool 共享 LoRA 子空间实现近乎严格的持续学习
02-06 LoRA 持续学习 微调
[自动] [ARXIV]
4minschool 伪可逆神经网络:兼具可逆性与灵活性的新架构
02-06 神经网络 可逆性 伪逆
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更具挑战性
02-06 LLM ICL 上下文学习
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式智能体建模
02-06 PhysicsAgentABM 多智能体系统 ABM
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合自动化闭环实验降低无细胞蛋白合成成本40%
02-06 GPT-5 AI for Science 生物科技
[自动] [ARXIV]
3minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-06 DyTopo 多智能体 动态拓扑
[自动] [ARXIV]
5minschool DFlash:基于块扩散的Flash推测解码方法
02-06 LLM 推理加速 推测解码
[自动] [ARXIV]
4minschool CommCP:基于LLM通信与共形预测的高效多智能体协调
02-06 LLM 多智能体 具身智能
[自动] [ARXIV]
5minschool AP-OOD:基于注意力池化的分布外检测方法
02-06 OOD检测 注意力机制 NLP
[自动] [HACKER_NEWS]
3minnewspaper 上下文学习难度超出原有认知
02-06 上下文学习 ICL 大模型
[自动] [HACKER_NEWS]
4minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更难
02-06 LLM 上下文学习 ICL
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习的难度超出原有认知
02-06 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理的可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 超网络:用于处理层级数据的神经网络架构
02-06 超网络 层级数据 神经网络架构
[自动] [HACKER_NEWS]
6minnewspaper 超网络:面向层级数据的神经网络架构
02-06 超网络 Hypernetworks 层级数据
[自动] [ARXIV]
3minschool 数据块模型中的精确恢复方法
02-06 社区检测 随机块模型 数据块模型
[自动] [ARXIV]
4minschool 受限群组相对策略优化
02-06 GRPO 强化学习 策略优化
[自动] [ARXIV]
4minschool Wedge Sampling:实现近线性样本复杂度的张量补全算法
02-06 张量补全 楔形采样 低秩张量
[自动] [ARXIV]
5minschool RRAttention:基于轮询移位的动态块稀疏注意力机制
02-06 RRAttention 稀疏注意力 长上下文
[自动] [ARXIV]
4minschool DLM-Scope:利用稀疏自编码器解析扩散语言模型
02-06 DLM SAE 稀疏自编码器
[自动] [ARXIV]
3minschool 面向物联网模型适应性的对比持续学习方法
02-06 持续学习 对比学习 物联网
[自动] [ARXIV]
4minschool 重新思考大模型强化学习中的信任区域机制
02-06 强化学习 LLM PPO
[自动] [ARXIV]
3minschool 蛋白质自回归建模:基于多尺度结构生成的方案
02-06 蛋白质生成 自回归模型 多尺度建模
[自动] [ARXIV]
4minschool 强化注意力学习:通过奖励机制优化视觉注意力模型
02-06 强化学习 多模态 注意力机制
[自动] [ARXIV]
4minschool 多层交叉注意力机制在多模态上下文学习中具有可证明的最优性
02-06 多模态 上下文学习 ICL
[自动] [ARXIV]
5minschool 重新思考大模型强化学习中的信任区域
02-05 RLHF PPO 强化学习
[自动] [ARXIV]
3minschool 蛋白质多尺度结构生成的自回归建模方法
02-05 蛋白质生成 自回归模型 多尺度建模
[自动] [ARXIV]
4minschool 强化注意力学习:基于奖励反馈的注意力机制优化方法
02-05 强化学习 注意力机制 多模态
[自动] [ARXIV]
3minschool 多层交叉注意力被证明是多模态上下文学习的最优解
02-05 多模态 上下文学习 ICL
[自动] [ARXIV]
5minschool Multi-Head LatentMoE与Head并行:通信高效且确定性的MoE方案
02-05 MoE 分布式训练 通信优化
[自动] [ARXIV]
3minschool 面向物联网模型适应性的对比持续学习
02-05 持续学习 对比学习 物联网
[自动] [HACKER_NEWS]
4minnewspaper 超网络:面向层级数据的神经网络架构
02-05 超网络 层级数据 神经网络架构
[自动] [HACKER_NEWS]
6minnewspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制
02-05 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
6minnewspaper 对称感知泰勒近似实现恒定Token成本注意力机制
02-05 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]
4minschool 基于急停干预的鲁棒干预学习
02-05 干预学习 自动驾驶 鲁棒性
[自动] [ARXIV]
4minschool 加速科学研究:Gemini 案例研究与通用技术
02-05 Gemini 科学研究 数学发现
[自动] [ARXIV]
4minschool 利用权重更新稀疏性提升分布式强化学习通信效率
02-05 分布式强化学习 通信效率 权重稀疏性
[自动] [ARXIV]
5minschool PrevizWhiz:结合粗略3D场景与2D视频引导生成式预演
02-05 AIGC 视频生成 3D场景
[自动] [ARXIV]
5minschool PLATE:用于几何感知持续学习的可塑性调谐高效适配器
02-05 持续学习 PLATE 模型适配
[自动] [ARXIV]
3minschool Parallel-Probe:通过二维探测实现高效并行思维
02-05 并行推理 思维链 2D Probing
[自动] [ARXIV]
4minschool AutoFigure:自动生成与润色出版级科学插图
02-05 AutoFigure FigureBench 科学插图
[自动] [HACKER_NEWS]
6minnewspaper 基于对称性泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]
4minschool 利用权重更新稀疏性的通信高效分布式强化学习
02-04 分布式训练 强化学习 通信优化
[自动] [ARXIV]
4minschool 利用 Gemini 加速科学研究:案例研究与通用技术
02-04 Gemini 科学研究 数学证明
[自动] [ARXIV]
5minschool PrevizWhiz:结合粗略3D场景与2D视频引导生成视频预演
02-04 视频生成 3D视觉 PrevizWhiz
[自动] [ARXIV]
4minschool PLATE:面向几何感知持续学习的可塑性调谐高效适配器
02-04 持续学习 PLATE 高效适配器
[自动] [ARXIV]
3minschool Parallel-Probe:通过2D探测实现高效并行思维
02-04 LLM 并行推理 思维链
[自动] [ARXIV]
4minschool AutoFigure:自动生成与优化出版级科学插图
02-04 AutoFigure FigureBench 科学插图
[自动] [HACKER_NEWS]
6minnewspaper 基于对称性泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
5minnewspaper 基于对称性泰勒近似实现恒定每Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
7minnewspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
7minnewspaper 基于对称泰勒近似实现恒定Token成本注意力机制
02-04 Attention机制 Taylor近似 线性注意力
[自动] [HACKER_NEWS]
5minnewspaper 对称感知泰勒近似实现恒定Token成本注意力机制
02-04 Attention机制 Taylor近似 Token成本
[自动] [ARXIV]
4minschool 面向冲突目标的免奖励对齐方法
02-04 RACO 对齐 多目标优化
[自动] [ARXIV]
4minschool 通过文本反馈扩展强化学习的能力边界
02-04 强化学习 RLHF 文本反馈
[自动] [ARXIV]
3minschool 训练LLM采用分治推理提升测试时扩展性
02-04 LLM 推理 强化学习
[自动] [ARXIV]
4minschool 基于流策略梯度的机器人控制方法
02-04 机器人控制 流匹配 策略梯度
[自动] [ARXIV]
4minschool RE-TRAC:面向深度搜索智能体的递归轨迹压缩算法
02-04 Re-TRAC 深度搜索智能体 ReAct
[自动] [ARXIV]
5minschool PixelGen:像素扩散结合感知损失超越潜在扩散
02-04 PixelGen 扩散模型 计算机视觉
[自动] [ARXIV]
4minschool MemSkill:面向自进化代理的记忆技能学习与演化框架
02-04 MemSkill 智能体 Agent
[自动] [ARXIV]
3minschool MEG-XL:长上下文预训练实现数据高效的脑电转文本
02-04 MEG-XL 脑机接口 脑电转文本
[自动] [ARXIV]
3minschool 训练LLM采用分治推理提升测试时扩展性
02-03 LLM 推理 强化学习
[自动] [ARXIV]
4minschool 无奖励对齐技术处理多目标冲突
02-03 RACO 对齐技术 多目标优化
[自动] [ARXIV]
4minschool 基于流策略梯度的机器人控制方法
02-03 机器人控制 流匹配 策略梯度
[自动] [ARXIV]
4minschool 基于文本反馈扩展强化学习的能力
02-03 强化学习 RLHF 文本反馈
[自动] [ARXIV]
4minschool RLAnything:完全动态强化学习系统构建环境、策略与奖励模型
02-03 强化学习 RL LLM
[自动] [ARXIV]
4minschool RE-TRAC:面向深度搜索智能体的递归轨迹压缩方法
02-03 Re-TRAC 深度搜索 智能体
[自动] [ARXIV]
4minschool PixelGen:引入感知损失的像素扩散模型性能超越潜在扩散
02-03 PixelGen 扩散模型 计算机视觉
[自动] [ARXIV]
4minschool MemSkill:赋予自进化代理学习与演进记忆技能
02-03 MemSkill 智能体 记忆机制
[自动] [ARXIV]
3minschool MEG-XL:基于长上下文预训练的高效脑电转文本模型
02-03 MEG-XL 脑机接口 BCI
[自动] [HACKER_NEWS]
3minnewspaper 模型对齐偏差如何随智能水平与任务复杂度演变
02-03 模型对齐 智能水平 任务复杂度
[自动] [HACKER_NEWS]
4minnewspaper 模型智能与任务复杂度如何影响对齐偏差
02-03 对齐 模型智能 任务复杂度
[自动] [HACKER_NEWS]
4minnewspaper 模型对齐问题如何随智能水平与任务复杂度演变
02-03 模型对齐 智能水平 任务复杂度
[自动] [HACKER_NEWS]
3minnewspaper 训练万亿参数模型以生成幽默内容
02-03 LLM 万亿参数 幽默生成
[自动] [ARXIV]
3minschool 误差分类引导的提示词优化方法
02-03 提示词工程 ETGPO 自动优化
[自动] [HACKER_NEWS]
3minnewspaper 训练万亿参数模型使其具备幽默感
02-03 LLM 幽默感 万亿参数
[自动] [ARXIV]
3minschool 研究揭示RLHF如何加剧大模型谄媚行为
02-03 RLHF 谄媚行为 模型偏见
[自动] [ARXIV]
4minschool 智能体推理与工具使用的竞争:量化干扰与解调优
02-03 智能体 强化学习 工具使用
[自动] [ARXIV]
3minschool 大语言模型稀疏奖励子系统
02-03 LLM 稀疏奖励 价值神经元
[自动] [ARXIV]
4minschool 基于预测集的最优决策方法
02-03 预测集 最优决策 决策理论
[自动] [ARXIV]
4minschool 基于资格推理与分节强化学习的引理可靠利用
02-03 数学推理 引理应用 RULES
[自动] [ARXIV]
4minschool 可扩展随机小波特征:带收敛保证的高效非平稳核近似
02-03 机器学习 非平稳核 小波变换
[自动] [ARXIV]
3minschool HERMES:基于视觉语言模型的长尾自动驾驶端到端风险感知系统
02-03 自动驾驶 VLM 长尾场景
[自动] [ARXIV]
4minschool DeALOG:基于日志中介的去中心化多智能体推理框架
02-03 Multi-Agent 去中心化 日志中介
[自动] [ARXIV]
3minschool 粒子引导扩散模型用于偏微分方程求解
02-03 扩散模型 PDE求解 物理引导
[自动] [ARXIV]
4minschool 函数空间逆问题的解耦扩散采样方法
02-03 扩散模型 逆问题 PDE
[自动] [ARXIV]
4minschool 共享 autonomy 范式下信念与策略学习的端到端优化
02-03 共享自主 BRACE 端到端优化
[自动] [ARXIV]
3minschool VideoGPA:提取几何先验实现三维一致性视频生成
02-03 VideoGPA 视频生成 3D一致性
[自动] [ARXIV]
4minschool UPA:基于树搜索与筛选的无监督提示代理
02-03 Prompt优化 UPA 无监督学习
[自动] [ARXIV]
5minschool TEON:张量化正交化方法优化大语言模型预训练
02-03 TEON 优化器 预训练
[自动] [ARXIV]
5minschool PaperBanana:面向AI科研人员的学术绘图自动化工具
02-03 PaperBanana 学术绘图 智能体框架
[自动] [ARXIV]
4minschool FOCUS:DLLMs 如何突破算力瓶颈
02-03 DLLMs 扩散模型 推理加速
[自动] [ARXIV]
3minschool 粒子引导扩散模型求解偏微分方程
02-02 扩散模型 偏微分方程 PDE
[自动] [ARXIV]
4minschool 函数空间逆问题的解耦扩散采样方法
02-02 扩散模型 逆问题 PDE
[自动] [ARXIV]
4minschool 共享自治系统中信念与策略学习的端到端优化
02-02 共享自治 BRACE 贝叶斯推断
[自动] [ARXIV]
5minschool VideoGPA:提取几何先验实现三维一致视频生成
02-02 视频生成 3D一致性 扩散模型
[自动] [ARXIV]
4minschool UPA:基于树搜索与筛选的无监督提示智能体
02-02 Prompt优化 LLM智能体 无监督学习
[自动] [ARXIV]
5minschool TEON:张量化正交化技术优化大语言模型预训练
02-02 TEON 优化器 Muon
[自动] [ARXIV]
4minschool IRL-DAL:基于能量引导扩散模型的自动驾驶安全自适应轨迹规划
02-02 自动驾驶 扩散模型 逆向强化学习
[自动] [ARXIV]
4minschool FOCUS:DLLMs如何突破算力瓶颈
02-02 DLLMs 扩散模型 算力优化
[自动] [ARXIV]
3minschool 基于输出监督学习的思维链混淆技术可泛化至未见任务
02-02 思维链 CoT 输出监督
[自动] [ARXIV]
4minschool SplineFlow:基于B样条插值的动力系统流匹配方法
02-02 流匹配 SplineFlow B样条
[自动] [ARXIV]
4minschool RN-D:基于正则化网络的离散分类演员与同策强化学习
02-02 强化学习 RL 连续控制
[自动] [ARXIV]
4minschool OrLog:结合大模型与概率推理解决复杂查询
02-02 神经符号AI 概率推理 复杂查询
[自动] [ARXIV]
4minschool ExplainerPFN:面向表格数据的无模型零样本特征重要性估计
02-02 ExplainerPFN TabPFN 表格数据
[自动] [ARXIV]
4minschool CATTO:平衡语言模型偏好与置信度的方法
02-02 LLM CATTO 校准
[自动] [HACKER_NEWS]
7minnewspaper 迈向智能体系统规模化科学:探究其生效机制与适用场景
02-02 智能体 Agent系统 规模化
[自动] [ARXIV]
3minschool 神经网络转逻辑流以优化边缘计算性能
02-02 边缘计算 神经网络 逻辑流
[自动] [ARXIV]
6minschool 混合线性注意力新架构:高效蒸馏与超长上下文处理
02-02 HALO HypeNet 混合架构
[自动] [ARXIV]
4minschool 推理大语言模型从被动求解到主动提问的转变
02-02 推理 CoT 主动交互
[自动] [ARXIV]
4minschool 探索面向智能体的推理奖励模型
02-02 Agentic RL Reward Model 推理奖励
[自动] [ARXIV]
4minschool UEval:统一多模态生成基准
02-02 UEval 多模态 基准测试
[自动] [ARXIV]
3minschool Routing the Lottery: 面向异构数据的自适应子网络路由
02-02 模型剪枝 彩票假设 异构数据
[自动] [ARXIV]
4minschool DynaWeb:基于模型的强化学习网页智能体
02-02 DynaWeb Web Agent 强化学习
[自动] [ARXIV]
4minschool 神经网络转逻辑流以优化边缘计算性能
02-01 边缘计算 神经网络 模型优化
[自动] [ARXIV]
4minschool 混合线性注意力新架构:高效蒸馏与超长上下文处理
02-01 Transformer 混合架构 线性注意力
[自动] [ARXIV]
3minschool 推理大语言模型从被动求解转向主动询问
02-01 推理 交互式推理 PIR
[自动] [ARXIV]
4minschool 探索面向智能体的推理奖励模型
02-01 Agent RLHF 奖励模型
[自动] [ARXIV]
4minschool UEval:统一多模态生成基准评测
02-01 UEval 多模态 基准评测
[自动] [ARXIV]
4minschool Routing the Lottery:面向异型数据的自适应子网络
02-01 模型剪枝 彩票假说 自适应路由
[自动] [ARXIV]
5minschool DynaWeb:基于模型的强化学习网页智能体
02-01 DynaWeb Web Agent 强化学习
2026年一月 119 篇
类型阅读条目
[自动] [ARXIV]
4minschool 面向异构数据的自适应子网络路由方法
01-31 模型剪枝 异构数据 自适应子网络
[自动] [ARXIV]
4minschool 神经网络转逻辑流以优化边缘计算性能
01-31 边缘计算 神经网络 逻辑流
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与超长上下文建模
01-31 线性注意力 长上下文 混合架构
[自动] [ARXIV]
4minschool 推理大语言模型从被动求解转向主动询问
01-31 LLM 推理模型 主动询问
[自动] [ARXIV]
5minschool 探索面向智能体的推理奖励模型
01-31 Agent 强化学习 奖励模型
[自动] [ARXIV]
4minschool 发现模型仓库中的隐藏价值
01-31 模型评估 Llama 多臂老虎机
[自动] [ARXIV]
4minschool UEval:统一多模态生成基准
01-31 多模态 UEval 基准测试
[自动] [ARXIV]
5minschool DynaWeb:基于模型的强化学习网页智能体框架
01-31 DynaWeb Web Agent 强化学习
[自动] [HACKER_NEWS]
4minnewspaper Kimi k2.5 技术报告发布:长上下文与推理能力详解
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 技术报告 模型架构
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:模型架构与训练细节
01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:架构与性能细节
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:长上下文与多模态推理能力详解
01-31 Kimi K2.5 技术报告 长上下文
[自动] [HACKER_NEWS]
4minnewspaper Kimi k2.5 技术报告发布
01-31 Kimi K2.5 技术报告
[自动] [HACKER_NEWS]
7minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
7minnewspaper 月之暗面发布 Kimi k2.5 技术报告
01-31 月之暗面 Kimi K2.5
[自动] [HACKER_NEWS]
6minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [ARXIV]
4minschool 面向异构数据的自适应子网络路由机制
01-30 模型剪枝 异构数据 子网络
[自动] [ARXIV]
4minschool 神经网络转逻辑流以优化边缘计算
01-30 边缘计算 神经网络 模型优化
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与极长上下文处理
01-30 HALO HypeNet 长上下文
[自动] [ARXIV]
3minschool 推理大模型从被动求解转向主动提问
01-30 推理模型 主动交互 思维链
[自动] [ARXIV]
4minschool 探索面向智能体的推理奖励模型
01-30 Agent 强化学习 推理奖励模型
[自动] [ARXIV]
3minschool 发现模型仓库中被忽视的高质量模型
01-30 模型评估 Llama-3.1 微调
[自动] [ARXIV]
3minschool UEval:统一多模态生成基准
01-30 UEval 多模态 统一模型
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:强化学习与长上下文能力升级
01-30 Kimi K2.5 强化学习
[自动] [ARXIV]
4minschool FineInstructions:将合成指令数据扩展至预训练规模
01-30 LLM 预训练 指令微调
[自动] [ARXIV]
4minschool DynaWeb:基于模型的强化学习网页智能体
01-30 DynaWeb Web Agent 强化学习
[自动] [HACKER_NEWS]
7minnewspaper 月之暗面发布Kimi K2.5技术报告
01-30 Kimi K2.5 月之暗面
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-30 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
6minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-30 Kimi K2.5 技术报告 长上下文
[自动] [ARXIV]
4minschool 面向文本检索器域适应的影响引导采样方法
01-30 文本检索 域适应 密集检索
[自动] [ARXIV]
3minschool 面向大语言模型的时间引导机制
01-30 LLM 对比解码 时间引导
[自动] [ARXIV]
3minschool 基于认知上下文学习构建大模型多智能体系统的信任机制
01-30 多智能体 信任机制 ECL
[自动] [ARXIV]
3minschool 基于经验的试错算法超越语言模型
01-30 LLM SCOUT 探索与利用
[自动] [ARXIV]
6minschool 为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理
01-30 Adam优化器 梯度尺度不变性 深度学习
[自动] [ARXIV]
4minschool FISMO:基于Fisher结构的动量正交化优化器
01-30 FISMO 优化器 深度学习
[自动] [ARXIV]
3minschool 进化策略导致大语言模型出现灾难性遗忘
01-30 进化策略 灾难性遗忘 持续学习
[自动] [ARXIV]
4minschool 机器翻译评估中的跨向污染问题研究
01-30 机器翻译 数据污染 FLORES-200
[自动] [ARXIV]
4minschool 探索Transformer在表格数据变分自编码器中的位置
01-30 Transformer VAE 表格数据
[自动] [ARXIV]
4minschool SokoBench:评估大模型长周期规划与推理能力
01-30 SokoBench 长周期规划 推理能力
[自动] [ARXIV]
4minschool R^{2k}维度理论上足以支持基于嵌入的Top-k检索
01-30 向量检索 嵌入维度 Top-k检索
[自动] [ARXIV]
3minschool PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型
01-30 时间序列 PatchFormer 零样本预测
[自动] [ARXIV]
4minschool Deep Researcher:结合序列规划反思与候选交叉的深度研究框架
01-30 Deep Researcher AI Agent 智能体架构
[自动] [ARXIV]
4minschool C3Box:基于CLIP的类增量学习工具箱
01-30 CLIP 类增量学习 CIL
[自动] [ARXIV]
4minschool 进化策略导致大语言模型出现灾难性遗忘
01-29 进化策略 灾难性遗忘 持续学习
[自动] [ARXIV]
3minschool 机器翻译评估中的跨向污染问题研究
01-29 机器翻译 数据污染 FLORES
[自动] [ARXIV]
4minschool 探索Transformer在表格数据变分自编码器中的位置
01-29 Transformer VAE 表格数据
[自动] [ARXIV]
3minschool 基于嵌入的Top-$k$检索:理论上$\mathbb{R}^{2k}$维空间已足够
01-29 向量检索 嵌入 Top-k
[自动] [ARXIV]
4minschool 后训练公平性控制:推荐系统动态公平性单训练框架
01-29 推荐系统 公平性 Cofair
[自动] [ARXIV]
4minschool SokoBench:评估大模型长程规划与推理能力
01-29 SokoBench 长程规划 推理能力
[自动] [ARXIV]
5minschool PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型
01-29 时序预测 PatchFormer 零样本学习
[自动] [ARXIV]
3minschool Deep Researcher:序列规划反思与候选交叉
01-29 Deep Researcher AI Agent 反思机制
[自动] [ARXIV]
4minschool C3Box:基于CLIP的类增量学习工具箱
01-29 CLIP 增量学习 CIL
[自动] [BLOGS_PODCASTS]
2minmic Alyah:评估阿拉伯语大模型阿联酋方言能力
01-29 LLM 阿拉伯语 方言评估
[自动] [BLOGS_PODCASTS]
2minmic Alyah:评估阿拉伯语大模型阿联酋方言能力
01-29 LLM 模型评估 阿拉伯语
[自动] [ARXIV]
4minschool 🧠RHSIA!非理想颅内动脉瘤实时血流替代技术,精准高效!
01-28 RHSIA 血流动力学 颅内动脉瘤
[自动] [ARXIV]
4minschool 无需真值!🔥颠覆性校准技术来了!🤯
01-28 模型校准 无监督学习 LLM
[自动] [BLOGS_PODCASTS]
2minmic Alyah ⭐️:阿拉伯语LLM方言鲁棒性评估!🔥
01-28 LLM 阿拉伯语 方言评估
[自动] [ARXIV]
4minschool 🚀低资源机器翻译的救星!结构化自反思引领新突破✨
01-28 机器翻译 低资源语言 自反思
[自动] [ARXIV]
5minschool 🚀SONIC: 颠覆频谱学习!神经网络不变性卷积的终极突破?
01-28 SONIC 频谱学习 神经网络
[自动] [ARXIV]
4minschool 🔥肿瘤会诊新革命!LLM系统Oncotimia惊艳亮相!
01-28 LLM RAG 医疗AI
[自动] [ARXIV]
4minschool 🔥动态环境下的对抗约束:Bandits算法如何应对未知挑战?
01-28 Bandits 对抗约束 动态环境
[自动] [ARXIV]
6minschool 🔥Post-LayerNorm强势回归!稳定、高效、深度训练的新神器!
01-28 Transformer Post-LayerNorm Keel
[自动] [ARXIV]
5minschool 🌍 M-SGWR: 多尺度相似+地理加权回归!空间建模神器🚀
01-28 M-SGWR 地理加权回归 空间建模
[自动] [ARXIV]
5minschool ✨告别遗忘!Self-Distillation解锁持续学习新范式!
01-28 持续学习 Self-Distillation 灾难性遗忘
[自动] [ARXIV]
4minschool MEG情绪分析新突破!🔬脑数据标注+情感计算,解锁大脑密码!🧠✨
01-28 MEG 情绪分析 脑机接口
[自动] [ARXIV]
4minschool 🚀复用FLOPs!RL突破性扩展:超离策略前缀如何解决硬难题?
01-28 强化学习 RL LLM
[自动] [ARXIV]
4minschool 🔥模型自学革命!突破可学习性边界,推理能力暴涨!
01-28 SOAR 强化学习 推理能力
[自动] [ARXIV]
5minschool 🔥POPE:利用特权探索破解硬核难题!
01-28 POPE 强化学习 LLM
[自动] [ARXIV]
5minschool 💥无需标注!基于核变化点检测的无监督文本分割!
01-28 文本分割 无监督学习 核方法
[自动] [ARXIV]
4minschool 🌍 242种语言大比拼!Wikipedia数据揭秘跨语言比较语言学新突破!
01-28 比较语言学 BPE 多语言
[自动] [BLOGS_PODCASTS]
3minmic 🇦🇪 Alyah ⭐️:揭秘阿拉伯LLM方言鲁棒评估!
01-28 LLM 阿拉伯语 方言评估
[自动] [BLOGS_PODCASTS]
3minmic 阿联酋方言评测新突破!Alyah让阿拉伯语大模型更鲁棒🚀
01-27 Alyah 阿拉伯语 方言评测
[自动] [ARXIV]
4minschool 突破极限!AI如何教会自己推理?🤯 边缘学习性的惊天秘密!🚀
01-27 SOAR 强化学习 元学习
[自动] [ARXIV]
5minschool ctELM:用LLM解码临床试验嵌入!解锁临床新价值🔥
01-27 ctELM 临床试验 嵌入语言模型
[自动] [ARXIV]
5minschool 🚀RL新突破!复用FLOPs,硬难题上通过离线前缀扩展
01-27 PrefixRL 强化学习 LLM
[自动] [ARXIV]
4minschool 🔥无需标注!核变点检测+句嵌入实现超强文本分割🚀
01-27 文本分割 无监督学习 句嵌入
[自动] [ARXIV]
4minschool 🔥POPE:用特权探索让AI学会解决复杂难题!
01-27 强化学习 LLM 推理能力
[自动] [ARXIV]
4minschool 🔍脑电+情感=超强分析!MEG数据解锁情绪新维度
01-27 MEG 情感分析 脑机接口
[自动] [HACKER_NEWS]
2minnewspaper 🔥两个扭曲形状竟解开百年拓扑谜题?🧩
01-27 拓扑学 海伍德猜想 数学
[自动] [HACKER_NEWS]
2minnewspaper 数学、物理、生物的万能模式!🧪🧬2013年震撼发现
01-27 本福德定律 统计学 幂律分布
[自动] [BLOGS_PODCASTS]
3minmic ⭐️Alyah:阿联酋方言能力评估!阿拉伯语LLM新突破!
01-27 LLM 阿拉伯语 方言评估
[自动] [HACKER_NEWS]
2minnewspaper 🔥 跨越数理化生!这个万能模式正在颠覆科学界!🤯
01-27 Scaling Laws 异速生长 复杂系统
[自动] [HACKER_NEWS]
3minnewspaper 🧠炸裂!Gemini Flash在俄罗斯大战Opus胜率66%!🚀
01-27 Gemini Flash Claude Opus TetrisBench
[自动] [HACKER_NEWS]
3minnewspaper 阿里Qwen3-Max-Thinking深度思考模型!震撼发布🔥
01-27 Qwen3 通义千问 深度思考
[自动] [BLOGS_PODCASTS]
3minmic AssetOpsBench:填补AI基准与工业现实的鸿沟!🤖🏭🚀
01-27 AssetOpsBench AI Agent LLM
[自动] [ARXIV]
5minschool 🚀BONO-Bench:可追溯Pareto集的双目标优化基准测试!
01-27 多目标优化 基准测试 Pareto集
[自动] [ARXIV]
5minschool 🚀AnyView:动态场景任意新视角合成!开创性技术突破🔥
01-27 计算机视觉 视频生成 扩散模型
[自动] [ARXIV]
5minschool 🔥自回归+掩码扩散!下一代生成模型架构强势登场!
01-27 扩散模型 自回归 语言建模
[自动] [ARXIV]
6minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量!
01-27 LLM 训练动力学 损失景观
[自动] [ARXIV]
6minschool 🔥LLM序列标注新突破!揭秘高效策略,性能飙升!
01-27 LLM 序列标注 NLP
[自动] [ARXIV]
5minschool 🌍Spatial-Agent:科学核心驱动的智能地理空间推理!🚀
01-27 Spatial-Agent Agent 地理空间推理
[自动] [HACKER_NEWS]
4minnewspaper ⚡️俄罗斯方块爆杀Opus!Gemini Flash胜率66%震撼实测🎮
01-27 LLM Gemini Flash Claude Opus
[自动] [ARXIV]
6minschool ⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成!🔥
01-27 分子生成 SE(3) 等变模型
[自动] [HACKER_NEWS]
3minnewspaper 震惊!Gemini Flash击败Opus!🎮Tetris胜率66%🚀
01-27 LLM Gemini Flash Claude 3 Opus
[自动] [ARXIV]
4minschool 🧬重磅!基于SE(3)流的刚体模态3D分子生成!
01-26 3D分子生成 SE(3)流 刚体模态
[自动] [BLOGS_PODCASTS]
3minmic AssetOpsBench:打破AI Agent评测与工业现实的壁垒!🚀
01-26 AI Agent AssetOpsBench 工业智能
[自动] [ARXIV]
5minschool 🚀动态场景新视角合成!AnyView实现任意视角自由切换!🤯
01-26 动态场景 新视角合成 扩散模型
[自动] [ARXIV]
5minschool 🚀 自回归+掩码扩散:下一代生成式AI!🔥
01-26 扩散模型 自回归 生成式AI
[自动] [HACKER_NEWS]
3minnewspaper 🔥Qwen3-Max-Thinking!深度推理颠覆想象!
01-26 Qwen 通义千问 深度推理
[自动] [ARXIV]
5minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀
01-26 LLM 训练动力学 损失景观
[自动] [ARXIV]
5minschool 🔥LLM序列标注新策略!突破性能天花板🚀
01-26 LLM 序列标注 NER
[自动] [ARXIV]
3minschool 🔥IoT攻击数据生成神器!Latent Diffusion让入侵检测更准!
01-26 LDM 潜在扩散模型 物联网
[自动] [ARXIV]
6minschool 🔥BONO-Bench震撼发布!首套可追溯Pareto集的双目标优化基准测试!
01-26 BONO-Bench 双目标优化 Pareto集
[自动] [ARXIV]
5minschool 🌍 Spatial-Agent:具科学核心的智能体地理空间推理!
01-26 Spatial-Agent 地理空间推理 GeoFlow Graphs
[自动] [HACKER_NEWS]
2minnewspaper 🧠科学家揭秘定义“你”边界的脑电波!灵魂的物理证据?
01-26 脑科学 神经科学 脑电波
[自动] [HACKER_NEWS]
3minnewspaper 🔍 深度拆解:AI伪造数学证明的惊人真相!🚀
01-26 LLM 幻觉 数学证明
[自动] [HACKER_NEWS]
2minnewspaper 🧠揭秘“你”的边界!科学家发现定义“自我”的关键脑波🚀
01-26 脑科学 自我意识 神经科学
[自动] [HACKER_NEWS]
3minnewspaper 🤖AI竟伪造数学证明?深扒“创意数学”背后的惊人真相!
01-26 AI 数学证明 形式化验证
[自动] [ARXIV]
6minschool 🤖抽屉打不开?揭秘零样本组合动作识别中的“物体捷径”!
01-25 计算机视觉 零样本学习 动作识别
[自动] [ARXIV]
4minschool 🤖反事实训练!让模型学会靠谱又可落地的解释!
01-25 反事实训练 模型解释性 可解释AI
[自动] [ARXIV]
7minschool 高效定理证明新突破!结构化提示实现少样本学习 🚀
01-25 定理证明 Lean DeepSeek-Prover
[自动] [ARXIV]
3minschool 超越预测不确定性!🚀结构约束下的可靠表征学习!🔥
01-25 表征学习 不确定性 结构约束
[自动] [ARXIV]
4minschool 测试时也能发现新规律?🤯AI解锁动态学习能力!
01-25 TTT-Discover 测试时训练 强化学习
[自动] [ARXIV]
5minschool Cosmos重磅:微调视频模型!解锁 visuomotor 控制与规划 🚀✨
01-25 Cosmos 机器人 视觉运动控制
[自动] [BLOGS_PODCASTS]
4minmic AssetOpsBench:连接AI测评与工业现实!填补鸿沟🚀
01-25 AssetOpsBench AI Agent 工业运维
[自动] [ARXIV]
5minschool 🚀沙盒机制唤醒LLM智能体通用能力!AI Agent突破性架构!
01-25 LLM AI Agent 沙盒机制
[自动] [ARXIV]
5minschool 🔥PyraTok!视频生成神器:语言对齐金字塔Tokenizer震撼来袭!
01-25 PyraTok 视频生成 视频理解