目录
论文
条目:1069
2026年四月
8 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 2min | school
SceneCritic:3D室内场景合成的符号化评估器 04-15
3D场景合成
符号化评估
空间约束 |
[自动]
[ARXIV] | 2min | school
物理信息状态空间模型的离网系统太阳辐照度预测 04-15
太阳能预测
物理信息模型
状态空间模型 |
[自动]
[ARXIV] | 1min | school
基于物理信息状态空间模型的离网系统太阳辐射预测 04-14
物理信息模型
状态空间模型
太阳辐射预测 |
[自动]
[ARXIV] | 1min | school
弹性测试时训练实现快速空间记忆 04-09
弹性测试时训练
快速空间记忆
长序列重建 |
[自动]
[ARXIV] | 2min | school
建模LLM生成文本中创造者与编辑者双重角色 04-07
LLM生成检测
细粒度分类
修辞结构理论 |
[自动]
[ARXIV] | 1min | school
服务器学习驱动的联邦学习鲁棒性提升 04-06
联邦学习
服务器学习
鲁棒性 |
[自动]
[ARXIV] | 1min | school
ActionParty:生成式游戏多主体动作绑定 04-04
多主体动作绑定
视频扩散模型
生成式游戏 |
[自动]
[ARXIV] | 1min | school
ActionParty系统实现游戏多主体动作绑定 04-03
多智能体
动作绑定
视频游戏 |
2026年三月
371 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 2min | school
自适应块缩放数据类型 03-31
arxiv
cs.CL |
[自动]
[ARXIV] | 2min | school
测试驱动代理开发结合图分析减少AI代码回归 03-20
arxiv
cs.SE |
[自动]
[ARXIV] | 2min | school
动量解相关优化器MUD加速Transformer训练 03-20
MUD优化器
动量去相关
Transformer训练 |
[自动]
[ARXIV] | 3min | school
仅解码器模型的机器翻译性别消歧诊断 03-20
机器翻译
性别偏见
仅解码器 |
[自动]
[ARXIV] | 2min | school
ConGA框架:机器翻译性别标注指南 03-20
机器翻译
性别偏见
ConGA |
[自动]
[ARXIV] | 3min | school
3D形状语义层次分词方法 03-20
3D生成
分词方法
语义分词 |
[自动]
[ARXIV] | 2min | school
统一时空Token评分提升视频VLMs效率 03-20
视频VLMs
Token剪枝
视觉语言模型 |
[自动]
[ARXIV] | 3min | school
Loc3R-VLM语言驱动定位与3D推理视觉模型 03-20
视觉语言模型
三维推理
语言驱动定位 |
[自动]
[ARXIV] | 4min | school
统一时空Token评分提升视频VLM效率 03-19
视频VLM
Token剪枝
计算效率 |
[自动]
[HACKER_NEWS] | 1min | newspaper
神经细胞自动机预训练语言模型研究 03-19
神经细胞自动机
语言模型
预训练 |
[自动]
[ARXIV] | 2min | school
机器翻译性别消歧:仅解码器架构诊断评估 03-19
机器翻译
性别消歧
解码器 |
[自动]
[ARXIV] | 2min | school
TDAD:基于图的依赖分析减少AI编程智能体代码回归 03-19
arxiv
cs.SE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
SPEED-Bench:推测解码的统一多样化基准 03-19
推测解码
基准测试
LLM 推理 |
[自动]
[ARXIV] | 3min | school
LoST:三维形状语义层级标记化方法 03-19
3D形状
语义标记化
层级表示 |
[自动]
[ARXIV] | 3min | school
Loc3R-VLM:基于语言提示的3D定位与推理模型 03-19
视觉语言模型
3D定位
语言提示 |
[自动]
[ARXIV] | 2min | school
ConGA:面向机器翻译的上下文性别标注框架 03-19
机器翻译
性别标注
性别偏见 |
[自动]
[ARXIV] | 3min | school
大语言模型的在线体验学习框架 03-18
LLM
OEL
在线学习 |
[自动]
[HACKER_NEWS] | 2min | newspaper
为何AI系统难以自主学习:基于认知科学的视角 03-18
自主学习
认知科学
AI系统 |
[自动]
[ARXIV] | 2min | school
SocialOmni:全模态模型视听社交交互基准测试 03-18
SocialOmni
全模态
OLM |
[自动]
[ARXIV] | 2min | school
Long-Horizon Traffic Forecasting via Incident-Aware Con 03-18
arxiv
cs.LG |
[自动]
[ARXIV] | 2min | school
Demystifing Video Reasoning 03-18
视频推理
扩散模型
Diffusion Transformer |
[自动]
[ARXIV] | 3min | school
Chronos:基于结构化事件检索的时序感知对话智能体 03-18
LLM
Agent
RAG |
[自动]
[HACKER_NEWS] | 1min | newspaper
为何AI系统难以自主学习:认知科学视角的解析 03-18
自主学习
认知科学
AI系统 |
[自动]
[ARXIV] | 2min | school
语言模型道德冷漠的机制起源 03-18
arxiv
cs.CL |
[自动]
[ARXIV] | 3min | school
对抗性腐败与重尾噪声下的鲁棒高效线性情境老虎机算法 03-18
强化学习
情境老虎机
鲁棒性 |
[自动]
[ARXIV] | 3min | school
反事实解释指标与用户感知的一致性研究 03-18
XAI
反事实解释
模型评估 |
[自动]
[ARXIV] | 3min | school
SmartSearch:排序机制如何优化对话记忆检索 03-18
RAG
检索增强
排序机制 |
[自动]
[ARXIV] | 4min | school
Code-A1:基于强化学习的代码与测试大模型对抗进化 03-18
Code-A1
强化学习
代码生成 |
[自动]
[ARXIV] | 4min | school
Mixture-of-Depths 动态分配计算资源的注意力机制 03-18
MoDA
注意力机制
深度学习 |
[自动]
[ARXIV] | 4min | school
HorizonMath:自动验证技术衡量AI数学发现进展 03-18
HorizonMath
数学推理
基准测试 |
[自动]
[ARXIV] | 4min | school
对抗性腐蚀与重尾噪声下的鲁棒高效线性情境赌博机 03-17
强化学习
情境赌博机
对抗性攻击 |
[自动]
[ARXIV] | 3min | school
大语言模型道德冷漠现象的机制起源研究 03-17
对齐
AI安全
道德推理 |
[自动]
[ARXIV] | 3min | school
反事实解释指标与用户感知的一致性研究 03-17
可解释性
反事实解释
用户感知 |
[自动]
[ARXIV] | 4min | school
Mixture-of-Depths 动态分配计算资源的注意力机制 03-17
MoDA
注意力机制
模型架构 |
[自动]
[ARXIV] | 3min | school
HorizonMath:自动验证技术评估AI数学发现能力 03-17
HorizonMath
数学基准
自动验证 |
[自动]
[ARXIV] | 3min | school
AC-Foley:参考音频引导的声学迁移视频生成音频模型 03-17
多模态
V2A
视频生成音频 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LLM可解释性研究:特征归因与数据归因方法解析 03-17
LLM
可解释性
特征归因 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
面向大规模语言模型的交互识别与可解释性研究 03-17
LLM
可解释性
SPEX |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛开发深度学习模型可提前一年预测心衰恶化 03-17
深度学习
医疗AI
心衰预测 |
[自动]
[JUEJIN] | 2min | sticky_note_2
MiniMax M2.5:108天极速迭代,MoE与Agent原生架构重塑全球AI格局 03-17
MiniMax
M2.5
MoE |
[自动]
[BLOGS_PODCASTS] | 3min | mic
面向大语言模型的大规模交互识别方法 03-17
LLM
可解释性
SPEX |
[自动]
[ARXIV] | 3min | school
基于脉冲神经网络的层级自适应幅度剪枝 03-17
脉冲神经网络
剪枝
模型压缩 |
[自动]
[ARXIV] | 1min | school
合成监督学习优化视频问答关键帧选择 03-17
VideoQA
关键帧选择
多模态模型 |
[自动]
[ARXIV] | 3min | school
SFedHIFI:基于发放率的脉冲联邦学习异构信息融合 03-17
联邦学习
脉冲神经网络
SNN |
[自动]
[ARXIV] | 2min | school
RS-WorldModel:遥感理解与未来预测统一模型 03-17
遥感
世界模型
时空预测 |
[自动]
[ARXIV] | 4min | school
LLM作为图核:文本丰富图的消息传递重思考 03-17
LLM
Text-Rich Graphs
RAMP |
[自动]
[ARXIV] | 3min | school
FairMed-XGB:贝叶斯优化的多指标可解释框架用于医疗数据人口公平性 03-17
医疗AI
公平性
XGBoost |
[自动]
[ARXIV] | 3min | school
面向神经元感知的大模型指令数据筛选方法 03-17
NAIT
指令微调
数据筛选 |
[自动]
[ARXIV] | 3min | school
智能体AI中的语义不变性研究 03-17
Agentic AI
语义不变性
鲁棒性 |
[自动]
[ARXIV] | 2min | school
时空物理系统的表征学习研究综述 03-17
表征学习
时空物理
自监督学习 |
[自动]
[ARXIV] | 2min | school
从实验到专家:AI驱动计算研究的科学知识整合 03-17
AI驱动研究
科学知识整合
计算物理 |
[自动]
[ARXIV] | 3min | school
Visual-ERM:面向视觉等价性的奖励建模 03-17
Visual-ERM
视觉奖励模型
LVLM |
[自动]
[ARXIV] | 3min | school
PhysMoDPO:基于偏好优化的人形机器人物理逼真运动生成 03-17
人形机器人
运动控制
DPO |
[自动]
[BLOGS_PODCASTS] | 1min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-17
深度学习
医疗AI
心衰预测 |
[自动]
[ARXIV] | 3min | school
面向神经元的大模型指令调优数据选择方法 03-16
arxiv
cs.CL |
[自动]
[ARXIV] | 3min | school
面向时空物理系统的表征学习 03-16
表征学习
时空系统
物理系统 |
[自动]
[ARXIV] | 3min | school
可学习性与隐私漏洞纠缠于少数关键权重 03-16
隐私保护
神经网络
模型权重 |
[自动]
[ARXIV] | 4min | school
PhysMoDPO:基于偏好优化的仿人运动生成 03-16
PhysMoDPO
DPO
偏好优化 |
[自动]
[ARXIV] | 3min | school
LLM 宪政多智能体治理框架 03-16
LLM
多智能体
AI治理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
面向大规模语言模型的交互识别与归因分析 03-16
LLM
可解释性
归因分析 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型 提前一年预测心衰预后 03-16
深度学习
心衰预测
医疗AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-16
深度学习
心衰预测
医疗AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LLM可解释性研究:规模化场景下的交互识别方法 03-16
LLM
可解释性
SPEX |
[自动]
[BLOGS_PODCASTS] | 2min | mic
识别LLM大规模交互:特征与数据归因 03-16
LLM
可解释性
特征归因 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型可提前一年预测心衰恶化 03-16
深度学习
医疗AI
心衰预测 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
3 Questions: On the future of AI and the mathematical a 03-16
AI
数学
物理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
机器学习入门:可视化图解核心概念 03-16
机器学习
可视化
入门教程 |
[自动]
[ARXIV] | 3min | school
探究推理模型作为裁判在非可验证LLM后训练中的作用 03-16
LLM
后训练
LLM-as-Judge |
[自动]
[ARXIV] | 3min | school
基于能量函数的语言模型特征匹配微调方法 03-16
LLM
微调
能量函数 |
[自动]
[ARXIV] | 3min | school
可分离神经架构:统一预测与生成智能的基元 03-16
SNA
神经架构
统一智能 |
[自动]
[ARXIV] | 3min | school
STAMP:面向文本隐私的选择性任务感知机制 03-16
隐私保护
文本隐私
STAMP |
[自动]
[ARXIV] | 3min | school
SciMDR:科学多模态文档推理基准测试与进展 03-16
SciMDR
多模态
文档推理 |
[自动]
[ARXIV] | 3min | school
EndoCoT: Scaling Endogenous Chain-of-Thought Reasoning 03-16
EndoCoT
扩散模型
DiT |
[自动]
[ARXIV] | 4min | school
BiGain:面向生成与分类任务的统一令牌压缩 03-16
扩散模型
令牌压缩
DiT |
[自动]
[ARXIV] | 4min | school
高维混沌中的潜在颜色子空间涌现秩序 03-16
FLUX.1
文生图
VAE |
[自动]
[HACKER_NEWS] | 2min | newspaper
基于不完美人体运动数据学习人形机器人网球技能 03-16
人形机器人
运动学习
强化学习 |
[自动]
[ARXIV] | 2min | school
Spatial-TTT:基于测试时训练的流式视觉空间智能 03-16
Spatial-TTT
测试时训练
TTT |
[自动]
[ARXIV] | 3min | school
潜在色彩子空间:高维混沌中的涌现秩序 03-15
文生图
FLUX.1
VAE |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·泰勒:AI与数理科学的双向互通与共同进步 03-15
AI for Science
数理科学
Jesse Thaler |
[自动]
[ARXIV] | 3min | school
探究推理模型作为裁判在非可验证LLM后训练中的表现 03-15
LLM
RLHF
强化学习 |
[自动]
[ARXIV] | 3min | school
基于能量的语言模型微调:匹配特征而非词元 03-15
微调
能量模型
特征匹配 |
[自动]
[ARXIV] | 3min | school
基于学习冲突的增量神经网络验证方法 03-15
神经网络验证
增量验证
形式化验证 |
[自动]
[ARXIV] | 3min | school
可分离神经架构:统一预测与生成智能的基元 03-15
神经架构
SNA
统一智能 |
[自动]
[ARXIV] | 3min | school
Spatial-TTT:基于测试时训练的流式视觉空间智能 03-15
计算机视觉
测试时训练
流式处理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-15
深度学习
心衰预测
医疗AI |
[自动]
[ARXIV] | 4min | school
EndoCoT:扩散模型内生思维链推理扩展方法 03-15
扩散模型
EndoCoT
思维链 |
[自动]
[ARXIV] | 4min | school
BiGain:面向生成与分类任务的统一令牌压缩方法 03-15
BiGain
Token压缩
扩散模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用不完美人体动作数据学习仿人机器人网球技能 03-15
仿人机器人
运动控制
强化学习 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏优化语言模型 03-15
PPO
强化学习
模型蒸馏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏技术优化语言模型 03-15
PPO
树搜索
模型蒸馏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏优化语言模型 03-15
PPO
强化学习
树搜索 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏技术优化语言模型 03-15
PPO
强化学习
树搜索 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·赛勒:AI与数理科学的协同演进 03-14
AI
数理科学
协同演进 |
[自动]
[ARXIV] | 2min | school
潜在色彩子空间:高维混沌中的涌现秩序 03-14
FLUX.1
文生图
VAE |
[自动]
[ARXIV] | 3min | school
探究非可验证LLM后训练中的推理模型评判机制 03-14
LLM
RLHF
强化学习 |
[自动]
[ARXIV] | 3min | school
增量神经网络验证:基于学习冲突的高效方法 03-14
神经网络验证
增量验证
形式化验证 |
[自动]
[ARXIV] | 3min | school
基于能量函数的语言模型特征级微调方法 03-14
LLM
微调
EBFT |
[自动]
[ARXIV] | 3min | school
可分离神经架构:统一预测与生成智能的基元 03-14
SNA
神经架构
统一智能 |
[自动]
[ARXIV] | 3min | school
Spatial-TTT:基于测试时训练的流式视觉空间智能 03-14
Spatial-TTT
测试时训练
空间智能 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-14
深度学习
医疗AI
疾病预测 |
[自动]
[ARXIV] | 4min | school
EndoCoT:扩散模型内生思维链推理扩展方法 03-14
扩散模型
EndoCoT
思维链 |
[自动]
[ARXIV] | 4min | school
BiGain:面向生成与分类任务的统一Token压缩方法 03-14
BiGain
Token压缩
扩散模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-14
深度学习
医疗AI
心衰预测 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
杰西·泰勒:AI与数理科学的交叉融合与双向赋能 03-14
AI for Science
数理科学
交叉融合 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-14
深度学习
心衰预测
医疗AI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Jesse Thaler:AI与数理科学的双向桥梁与未来愿景 03-14
AI
数理科学
跨学科 |
[自动]
[HACKER_NEWS] | 1min | newspaper
探索JEPA架构在实时语音翻译中的应用 03-14
JEPA
语音翻译
实时翻译 |
[自动]
[ARXIV] | 2min | school
潜在色彩子空间:高维混沌中的涌现秩序 03-13
FLUX.1
文生图
VAE |
[自动]
[ARXIV] | 3min | school
探究推理LLM作为非可验证后训练评估器的有效性 03-13
LLM-as-Judge
RLHF
强化学习 |
[自动]
[ARXIV] | 3min | school
增量神经网络验证:基于学习冲突的高效方法 03-13
神经网络验证
增量验证
形式化验证 |
[自动]
[ARXIV] | 3min | school
基于能量函数的语言模型特征匹配微调方法 03-13
微调
SFT
能量函数 |
[自动]
[ARXIV] | 3min | school
可分离神经网络架构:统一预测与生成智能的基元 03-13
神经网络
架构设计
统一建模 |
[自动]
[ARXIV] | 3min | school
STAMP:面向文本隐私的选择性任务感知机制 03-13
STAMP
文本隐私
差分隐私 |
[自动]
[ARXIV] | 3min | school
Spatial-TTT:基于测试时训练的流式视觉空间智能 03-13
计算机视觉
测试时训练
流式推理 |
[自动]
[ARXIV] | 3min | school
EndoCoT:扩散模型内生思维链推理扩展方法 03-13
扩散模型
EndoCoT
思维链 |
[自动]
[ARXIV] | 4min | school
BiGain:面向生成与分类任务的统一Token压缩 03-13
BiGain
Token压缩
扩散模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI与数理科学的融合:Jesse Thaler谈双向赋能与未来愿景 03-13
AI
数理科学
Jesse Thaler |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·泰勒:AI与数理科学的双向桥梁与共同进步 03-13
AI for Science
跨学科融合
可解释性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-13
深度学习
心衰预测
医疗AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
杰西·泰勒:AI与数理科学的双向桥梁及共同进步愿景 03-13
AI
数理科学
跨学科 |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作开发深度学习模型 提前一年预测心衰恶化 03-13
深度学习
心衰预测
MIT |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法创新 |
[自动]
[HACKER_NEWS] | 1min | newspaper
在Transformer内部执行程序以实现指数级推理加速 03-13
Transformer
推理加速
算法创新 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
杰西·塞勒:AI与数理科学的双向赋能与未来愿景 03-13
AI
数理科学
交叉学科 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Can AI help predict which heart-failure patients will w 03-13
深度学习
医疗AI
心力衰竭 |
[自动]
[ARXIV] | 4min | school
基于LLM的伪相关反馈系统性研究 03-13
LLM
PRF
伪相关反馈 |
[自动]
[ARXIV] | 4min | school
基于 Leech 格的向量量化实现高效大模型压缩 03-13
LLVQ
模型压缩
向量量化 |
[自动]
[ARXIV] | 3min | school
V2M-Zero:零样本时间对齐视频配乐生成模型 03-13
V2M-Zero
视频配乐
零样本学习 |
[自动]
[ARXIV] | 2min | school
LLM评测新范式:从表面启发式到知识 grounded 评估 03-13
LLM评测
LLM-as-a-Judge
评估幻觉 |
[自动]
[ARXIV] | 3min | school
COMIC:基于智能体的素描喜剧生成框架 03-13
COMIC
Agent
多智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·萨勒:AI与数理科学的双向融合与未来 03-12
AI
数理科学
跨学科 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT与哈佛合作深度学习模型可提前一年预测心衰恶化 03-12
深度学习
心衰预测
医疗AI |
[自动]
[ARXIV] | 3min | school
V2M-Zero:零样本时序对齐视频配乐生成 03-12
V2M-Zero
视频配乐
零样本学习 |
[自动]
[ARXIV] | 3min | school
LLM评测新范式:从表面启发式到知识 grounded 评估 03-12
LLM评测
LLM-as-a-Judge
MERG框架 |
[自动]
[ARXIV] | 4min | school
Leech 格点向量量化实现高效大模型压缩 03-12
LLVQ
模型压缩
量化 |
[自动]
[ARXIV] | 3min | school
AI能否像艺术史学家一样解读视觉语言模型的艺术风格识别机制 03-12
VLM
视觉语言模型
艺术风格 |
[自动]
[ARXIV] | 3min | school
A Systematic Study of Pseudo-Relevance Feedback with LL 03-12
LLM
PRF
伪相关反馈 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·泰勒:AI与数理科学的双向融合与未来愿景 03-12
AI for Science
跨学科融合
双向赋能 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
杰西·塞勒:AI与数理科学的协同演进愿景 03-12
AI for Science
跨学科融合
物理信息机器学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM 模型性能提升停滞的质疑与分析 03-12
LLM
模型性能
Scaling Laws |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·萨勒:构建AI与数理科学的双向桥梁 03-12
AI
数理科学
跨学科 |
[自动]
[HACKER_NEWS] | 1min | newspaper
BitNet: 100B Param 1-Bit model for local CPUs 03-12
BitNet
1-bit
量化 |
[自动]
[ARXIV] | 3min | school
神经优化器宽度缩放研究:行列归一化与超参数迁移 03-12
优化器
宽度缩放
AdamW |
[自动]
[BLOGS_PODCASTS] | 2min | mic
杰西·泰勒:AI与数理科学的双向融合与未来愿景 03-12
AI for Science
可解释性
XAI |
[自动]
[ARXIV] | 2min | school
推理机制如何提升大模型诚实度 03-12
诚实度
推理机制
欺骗行为 |
[自动]
[ARXIV] | 3min | school
从语义到像素:用于分层视觉理解的粗到细掩码自编码器 03-12
计算机视觉
自监督学习
掩码自编码器 |
[自动]
[ARXIV] | 3min | school
从数据统计到特征几何:相关性如何塑造叠加态 03-12
叠加态
特征几何
相关性 |
[自动]
[ARXIV] | 3min | school
CREATE基准:测试大语言模型的联想创造力 03-12
LLM
CREATE基准
联想创造力 |
[自动]
[ARXIV] | 2min | school
BEACON:遮挡条件下的语言导航可行性预测 03-12
机器人导航
VLM
BEV |
[自动]
[ARXIV] | 4min | school
神经优化器宽度缩放:行列归一化与超参迁移 03-11
优化器
宽度缩放
μP |
[自动]
[ARXIV] | 2min | school
推理机制如何提升大模型的诚实度 03-11
LLM
推理机制
诚实度 |
[自动]
[ARXIV] | 3min | school
从语义到像素:粗到细掩码自编码器实现分层视觉理解 03-11
计算机视觉
自监督学习
掩码自编码器 |
[自动]
[ARXIV] | 3min | school
从数据统计到特征几何:相关性如何塑造叠加态 03-11
机械可解释性
叠加态
特征几何 |
[自动]
[ARXIV] | 3min | school
LLM驱动的VR导览系统如何帮助视障用户实现无障碍体验 03-11
LLM
VR
无障碍 |
[自动]
[ARXIV] | 2min | school
CREATE基准测试:评估大模型联想创造力 03-11
CREATE
联想创造力
基准测试 |
[自动]
[ARXIV] | 2min | school
BEACON:遮挡条件下的语言导航可行性预测 03-11
BEACON
语言导航
VLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Yann LeCun成立AMI实验室:融资4.5亿美元基于JEPA研发世界模型 03-11
Yann LeCun
JEPA
世界模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI自改进研究新进展:递归自我优化能力的初步实现 03-11
AGI
自我改进
递归优化 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
AI实现递归自我改进:通用人工智能研究新进展 03-11
AGI
自我改进
递归 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI递归自我改进:迈向AGI的关键进展 03-11
AGI
自我改进
递归 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
新型混合系统助力机器人在复杂环境中导航与协作 03-11
机器人
任务规划
混合系统 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Yann LeCun成立新实验室获4.5亿美元融资:基于JEPA架构研发世界模型 03-11
Yann LeCun
世界模型
JEPA |
[自动]
[HACKER_NEWS] | 2min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[HACKER_NEWS] | 1min | newspaper
TADA:通过文本-声学同步实现快速可靠的语音生成 03-11
TADA
语音生成
TTS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI自改进研究新进展:递归自我优化的初步迹象 03-11
AGI
自我改进
递归优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大脑学习机制揭示:神经元接收特异性反馈信号 03-11
神经科学
大脑学习
神经元 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI自我改进新进展:Autoresearch推动AGI演进 03-11
AGI
自我改进
Autoresearch |
[自动]
[ARXIV] | 3min | school
面向高精度低延迟的拆分联邦学习架构 03-11
联邦学习
拆分学习
模型分割 |
[自动]
[ARXIV] | 3min | school
评估大语言模型金融智能:SuperInvesting AI基准测试 03-11
LLM
金融智能
基准测试 |
[自动]
[ARXIV] | 2min | school
结构因果瓶颈模型:利用因果推断优化表征学习 03-11
因果推断
表征学习
SCBM |
[自动]
[ARXIV] | 3min | school
无损全保真音频压缩的语言模型基准测试 03-11
音频压缩
无损压缩
语言模型 |
[自动]
[ARXIV] | 4min | school
尺度空间扩散模型 03-11
扩散模型
计算机视觉
尺度空间 |
[自动]
[ARXIV] | 4min | school
Momentum SVGD-EM 加速最大边际似然估计 03-11
SVGD
EM算法
最大边际似然 |
[自动]
[ARXIV] | 3min | school
Impermanent:时间序列预测时序泛化实时基准 03-11
时间序列预测
时序泛化
实时基准 |
[自动]
[ARXIV] | 4min | school
Agentic Critical Training:基于批判性反馈的大模型推理能力提升机制 03-11
Agentic AI
强化学习
推理能力 |
[自动]
[ARXIV] | 3min | school
韧性经济下AI驱动创业的多目标优化方法 03-10
多目标优化
EcoAI-Resilience
经济韧性 |
[自动]
[ARXIV] | 3min | school
面向高精度低时延训练的拆分联邦学习架构 03-10
联邦学习
拆分学习
模型训练 |
[自动]
[ARXIV] | 3min | school
评估大语言模型金融智能:SuperInvesting AI基准测试 03-10
金融智能
基准测试
SuperInvesting |
[自动]
[ARXIV] | 4min | school
结构因果瓶颈模型:通过因果约束优化表征学习 03-10
因果推断
SCBM
表征学习 |
[自动]
[ARXIV] | 3min | school
无损全保真音频压缩的语言模型基准测试 03-10
音频压缩
无损压缩
语言模型 |
[自动]
[ARXIV] | 3min | school
尺度空间扩散模型 03-10
扩散模型
计算机视觉
Flexi-UNet |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大脑学习机制揭示:神经元接收精准定制反馈信号 03-10
神经科学
反向传播
误差信号 |
[自动]
[ARXIV] | 4min | school
Momentum SVGD-EM 加速最大边际似然估计 03-10
SVGD
EM算法
最大边际似然 |
[自动]
[ARXIV] | 4min | school
Agentic Critical Training:基于智能体批判机制的模型训练方法 03-10
ACT
Agent
强化学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
神经元在学习中接收特异性反馈信号 03-10
神经科学
学习机制
误差信号 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI实现递归式自我改进,通用人工智能研究迎新进展 03-10
AGI
自我改进
递归 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大脑学习机制揭示:神经元接收特异性反馈信号 03-10
神经科学
脑机对比
误差信号 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AlphaGo 十周年:从围棋博弈到催化科学发现与通用的路径 03-10
AlphaGo
AlphaFold
AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI自我改进新进展:递归研究能力推动AGI演进 03-10
AGI
递归自我改进
AutoResearch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习过程向神经元提供精准反馈信号 03-10
神经科学
学习机制
反馈信号 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AlphaGo十周年:从游戏到生物科学加速AGI发展 03-10
AlphaGo
AGI
DeepMind |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI实现递归自我改进:AGI迈向新一步 03-10
AGI
递归自我改进
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习通过特异性反馈信号指导神经元 03-10
神经科学
脑机接口
反向传播 |
[自动]
[ARXIV] | 4min | school
Impermanent:时间序列预测时序泛化实时基准 03-10
时间序列预测
时序泛化
实时基准 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AlphaGo十年:加速科学发现并铺就AGI之路 03-10
AlphaGo
AGI
科学发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI 递归自我改进能力推动 AGI 研究进展 03-10
AGI
递归自我改进
AutoResearch |
[自动]
[HACKER_NEWS] | 1min | newspaper
DeepMind与伯克利提出LoGeR:实现超长视频3D重建 03-10
DeepMind
伯克利
LoGeR |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习过程中神经元接收精准定制反馈信号 03-10
神经科学
学习机制
误差信号 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI实现递归式自我改进:AGI研究新进展 03-10
AGI
递归自我改进
AutoResearch |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习向神经元提供特异性反馈信号 03-10
神经科学
反向传播
机器学习 |
[自动]
[HACKER_NEWS] | 1min | newspaper
DeepMind与伯克利提出LoGeR:实现超长视频3D重建 03-10
DeepMind
伯克利
LoGeR |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习通过特异反馈信号指导神经元 03-10
神经科学
大脑学习
误差信号 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI自我改进新进展:递归研究能力推动AGI发展 03-10
AGI
自我改进
递归研究 |
[自动]
[ARXIV] | 4min | school
表格基础模型分布回归:基于适当评分规则的预测评估 03-10
表格基础模型
TabPFN
分布回归 |
[自动]
[ARXIV] | 3min | school
异步联邦学习聚合中梯度陈旧度评估的距离指标研究 03-10
联邦学习
异步联邦学习
梯度陈旧度 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大脑学习机制揭示:神经元接收精准定制反馈信号 03-10
神经科学
学习机制
误差信号 |
[自动]
[ARXIV] | 3min | school
TildeOpen LLM:利用课程学习实现公平语言表示 03-10
LLM
开源模型
多语言模型 |
[自动]
[ARXIV] | 4min | school
SERQ:基于显著性感知的低秩误差重构LLM量化方法 03-10
LLM量化
SERQ
PTQ |
[自动]
[ARXIV] | 3min | school
MM-TS:面向长尾数据对比学习的多模态温控与边界调度 03-10
对比学习
多模态
长尾分布 |
[自动]
[ARXIV] | 3min | school
基于贡献分解的神经网络计算因果解释 03-10
神经网络
可解释性
因果推断 |
[自动]
[ARXIV] | 4min | school
利用逻辑选项预训练提升深度强化学习 03-10
强化学习
RL
H²RL |
[自动]
[ARXIV] | 3min | school
分层工业需求预测:时序与不确定性解释 03-10
时序预测
可解释性
需求预测 |
[自动]
[ARXIV] | 4min | school
SCOPE:场景上下文增量式少样本3D分割 03-10
3D分割
少样本学习
增量学习 |
[自动]
[ARXIV] | 1min | school
BEVLM:将LLM语义知识蒸馏至鸟瞰图表示 03-10
BEVLM
自动驾驶
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习通过特异性反馈信号指导神经元 03-09
神经科学
大脑学习
误差信号 |
[自动]
[ARXIV] | 3min | school
神经网络计算的因果解释:基于贡献分解方法 03-09
神经网络
可解释性
因果推断 |
[自动]
[ARXIV] | 3min | school
基于全节点注意力机制的可扩展机器学习势函数构建方法 03-09
AllScAIP
机器学习势函数
MLIP |
[自动]
[ARXIV] | 3min | school
分层工业需求预测:时序与不确定性解释 03-09
时间序列预测
可解释性
分层预测 |
[自动]
[ARXIV] | 4min | school
SCOPE:场景上下文增量式少样本3D分割 03-09
3D分割
少样本学习
增量学习 |
[自动]
[ARXIV] | 4min | school
BEVLM:将LLM语义知识蒸馏至鸟瞰图表征 03-09
BEVLM
自动驾驶
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大脑在学习中向神经元发送特异性反馈信号 03-09
神经科学
大脑学习
反向传播 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究揭示大脑学习过程向神经元提供精准定制反馈信号 03-09
神经科学
学习机制
反馈信号 |
[自动]
[ARXIV] | 3min | school
通过偏差有界评估实现可证明无偏的LLM评判者 03-09
LLM-as-a-Judge
评估方法
偏差控制 |
[自动]
[ARXIV] | 3min | school
廉价标签实现高效摊销优化 03-09
摊销优化
代理模型
廉价标签 |
[自动]
[ARXIV] | 3min | school
奇异贝叶斯模型中的热力学响应函数研究 03-09
贝叶斯推断
统计力学
RLCT |
[自动]
[ARXIV] | 3min | school
大规模激活与注意力槽的机制解析 03-09
Transformer
注意力机制
Pre-norm |
[自动]
[ARXIV] | 3min | school
利用LLM参数化知识实现无检索的事实核查 03-09
LLM
事实核查
参数化知识 |
[自动]
[ARXIV] | 3min | school
Reasoning Theater:解耦模型信念与思维链 03-09
CoT
模型推理
思维链 |
[自动]
[ARXIV] | 4min | school
POET-X:基于正交变换缩放的内存高效LLM训练方法 03-09
LLM
训练优化
内存优化 |
[自动]
[ARXIV] | 3min | school
迈向偏差可控的LLM评判器:基于有界评估的无偏验证 03-08
LLM-as-a-Judge
偏见控制
模型评估 |
[自动]
[ARXIV] | 3min | school
奇异贝叶斯模型中的热力学响应函数研究 03-08
贝叶斯推断
统计物理
WAIC |
[自动]
[ARXIV] | 3min | school
大模型激活与注意力下沉机制解析 03-08
Transformer
注意力机制
Pre-Norm |
[自动]
[ARXIV] | 3min | school
利用大模型参数化知识实现无检索的事实核查 03-08
事实核查
无检索
参数化知识 |
[自动]
[ARXIV] | 4min | school
POET-X:通过正交变换扩展实现LLM高效训练 03-08
LLM
POET-X
模型训练 |
[自动]
[ARXIV] | 3min | school
Reasoning Theater:解耦模型信念与思维链 03-08
思维链
CoT
模型推理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AGI 定义变迁与时间线演进分析 03-08
AGI
时间线
定义变迁 |
[自动]
[ARXIV] | 3min | school
利用廉价标签实现高效摊销优化 03-08
摊销优化
廉价标签
自监督学习 |
[自动]
[HACKER_NEWS] | 1min | newspaper
SWE-CI:基于CI流程评估AI Agent代码库维护能力 03-08
SWE-CI
AI Agent
CI/CD |
[自动]
[ARXIV] | 3min | school
迈向可证明无偏的LLM评判器:基于偏差界限评估 03-07
LLM评判器
A-BB算法
偏差控制 |
[自动]
[ARXIV] | 3min | school
廉价标签实现高效摊销优化 03-07
摊销优化
低成本标签
监督预训练 |
[自动]
[ARXIV] | 3min | school
奇异贝叶斯模型中的热力学响应函数研究 03-07
贝叶斯
统计力学
WAIC |
[自动]
[ARXIV] | 4min | school
大模型激活机制研究:尖峰、稀疏性与注意力汇 03-07
Transformer
注意力机制
激活异常 |
[自动]
[ARXIV] | 3min | school
利用LLM参数化知识实现无检索的事实核查 03-07
事实核查
无检索
参数化知识 |
[自动]
[ARXIV] | 2min | school
Reasoning Theater:解耦模型信念与思维链 03-07
CoT
思维链
模型信念 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4思维系统技术报告发布 03-07
GPT-5.4
OpenAI
思维链 |
[自动]
[ARXIV] | 3min | school
通过偏差界限评估实现可证无偏的LLM评判者 03-06
LLM
LLM-as-a-judge
评估 |
[自动]
[ARXIV] | 3min | school
廉价标签实现高效摊销优化 03-06
摊销优化
代理模型
标签效率 |
[自动]
[ARXIV] | 3min | school
奇异贝叶斯模型中的热力学响应函数研究 03-06
贝叶斯推断
奇异学习理论
热力学 |
[自动]
[ARXIV] | 3min | school
大模型激活与注意力下沉机制解析 03-06
Transformer
注意力机制
Pre-norm |
[自动]
[ARXIV] | 3min | school
利用LLM参数化知识实现无检索的事实核查 03-06
事实核查
无检索
参数化知识 |
[自动]
[ARXIV] | 3min | school
Reasoning Theater:解耦模型信念与思维链 03-06
CoT
思维链
推理模型 |
[自动]
[ARXIV] | 4min | school
POET-X:通过正交变换扩展实现大模型高效训练 03-06
POET-X
LLM训练
正交变换 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI劳动力市场影响:新测度方法与早期证据 03-06
AI
劳动力市场
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI劳动力市场影响:新测量指标与早期证据 03-06
AI
劳动力市场
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI劳动力市场影响:新测度方法与早期实证 03-06
AI
劳动力市场
实证研究 |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI劳动力市场影响:新测量指标与早期证据 03-06
AI
劳动力市场
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI劳动力市场影响:新测量方法与早期证据 03-06
AI
LLM
劳动力市场 |
[自动]
[JUEJIN] | 2min | sticky_note_2
高德纳称赞Claude协助解决《计算机程序设计艺术》难题 03-06
Claude
高德纳
Donald Knuth |
[自动]
[HACKER_NEWS] | 1min | newspaper
GLiNER2:基于统一架构的通用信息抽取模型 03-06
GLiNER2
信息抽取
NER |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.4 Thinking 推理模型技术报告发布 03-06
OpenAI
GPT-5.4
推理模型 |
[自动]
[ARXIV] | 3min | school
τ-Knowledge:评估非结构化知识下的对话智能体 03-06
对话智能体
评估基准
非结构化知识 |
[自动]
[ARXIV] | 3min | school
TaxonRL:基于中间奖励强化学习的可解释细粒度视觉推理 03-06
TaxonRL
强化学习
细粒度分类 |
[自动]
[ARXIV] | 3min | school
SimpliHuMoN:简化人体运动预测 03-06
人体运动预测
SimpliHuMoN
Transformer |
[自动]
[HACKER_NEWS] | 1min | newspaper
GLiNER2:基于统一Schema的信息抽取模型 03-06
GLiNER2
信息抽取
NER |
[自动]
[ARXIV] | 4min | school
AgentIR:面向深度研究智能体的推理感知检索 03-06
AgentIR
RAG
深度研究代理 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从脑部数据重建视觉感知的数据集 03-06
脑机接口
视觉重建
fMRI |
[自动]
[HACKER_NEWS] | 1min | newspaper
AI劳动力市场影响:新测量指标与早期证据 03-06
AI
劳动力市场
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于脑数据重建视觉感知的数据集 03-05
脑机接口
视觉重建
数据集 |
[自动]
[ARXIV] | 3min | school
τ-Knowledge:评估非结构化知识中的对话智能体 03-05
Agent
RAG
评估基准 |
[自动]
[ARXIV] | 3min | school
TaxonRL:基于中间奖励的可解释细粒度视觉推理 03-05
TaxonRL
强化学习
细粒度视觉推理 |
[自动]
[ARXIV] | 3min | school
SimpliHuMoN:简化人体运动预测的框架 03-05
人体运动预测
Transformer
计算机视觉 |
[自动]
[ARXIV] | 3min | school
AgentIR:面向深度研究智能体的推理感知检索 03-05
AgentIR
RAG
深度研究 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用脑数据重建视觉感知的数据集 03-05
脑机接口
视觉重建
fMRI |
[自动]
[ARXIV] | 3min | school
ZipMap:基于测试时训练的线性时间有状态3D重建 03-05
3D重建
计算机视觉
Transformer |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用脑数据重建视觉感知的数据集 03-05
脑机接口
视觉重建
神经科学 |
[自动]
[HACKER_NEWS] | 1min | newspaper
从脑数据重建视觉感知的数据集 03-05
脑机接口
视觉重建
fMRI |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM中的L代表撒谎:大语言模型幻觉现象分析 03-05
LLM
幻觉
模型评估 |
[自动]
[JUEJIN] | 1min | sticky_note_2
斯坦福博士论文提出持续自我提升式AI框架 03-05
斯坦福
自我进化
持续学习 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM中的L意指撒谎:大语言模型幻觉问题分析 03-05
LLM
幻觉
撒谎 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2 Pro辅助推导量子引力非零引力子树图振幅 03-05
GPT-5.2 Pro
量子引力
振幅 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen 模型动态更新与能力演进分析 03-05
Qwen
通义千问
模型演进 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM中的L代表谎言:大语言模型的幻觉问题分析 03-05
LLM
幻觉
AI安全 |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力的语言建模 03-05
NanoGPT
语言建模
算力 |
[自动]
[ARXIV] | 3min | school
多候选人译后编辑中的后见质量预测实验 03-05
机器翻译
质量估计
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
NanoGPT Slowrun:有限数据与无限算力的语言建模 03-05
NanoGPT
语言建模
算力 |
[自动]
[ARXIV] | 3min | school
FedCova:抗噪标签的鲁棒联邦协方差学习框架 03-05
联邦学习
FedCova
噪声标签 |
[自动]
[ARXIV] | 2min | school
研究揭示上下文压力导致智能体目标漂移 03-05
智能体
目标漂移
上下文压力 |
[自动]
[ARXIV] | 4min | school
Valet:传统不完美信息卡牌游戏标准化测试平台 03-05
AI
博弈论
不完美信息 |
[自动]
[ARXIV] | 3min | school
Tether:基于对应关系轨迹扭曲的自主功能玩 03-05
机器人学习
模仿学习
自主智能体 |
[自动]
[ARXIV] | 3min | school
LoGeR:基于混合记忆的长上下文几何重建 03-05
LoGeR
3D重建
长上下文 |
[自动]
[ARXIV] | 4min | school
CFG-Ctrl:基于控制的分类器无关扩散引导算法 03-05
扩散模型
CFG
流匹配 |
[自动]
[ARXIV] | 3min | school
继承性目标漂移:情境压力如何削弱智能体目标 03-04
目标漂移
Agent
鲁棒性 |
[自动]
[ARXIV] | 3min | school
Valet:传统不完美信息卡牌游戏标准化测试基准 03-04
Valet
不完美信息
卡牌游戏 |
[自动]
[ARXIV] | 3min | school
LoGeR:基于混合记忆的长上下文几何重建 03-04
LoGeR
几何重建
3D重建 |
[自动]
[ARXIV] | 4min | school
CFG-Ctrl:基于分类器无关的扩散模型控制引导方法 03-04
扩散模型
CFG
控制论 |
[自动]
[ARXIV] | 3min | school
Tether:基于对应关系轨迹扭曲的自主功能玩 03-04
机器人学习
模仿学习
自主玩法 |
[自动]
[HACKER_NEWS] | 1min | newspaper
逆向工程人脑:脉冲网络与矩阵运算的终结 03-04
脉冲神经网络
SNN
类脑计算 |
[自动]
[ARXIV] | 3min | school
过程感知评估揭示大模型智能体中的虚假成功 03-04
LLM Agents
评估基准
流程感知 |
[自动]
[ARXIV] | 3min | school
自监督语音特征在说话人特性维度上的可解释性研究 03-04
自监督学习
语音识别
WavLM |
[自动]
[ARXIV] | 2min | school
指令微调LLM的紧凑提示实现论辩成分联合检测 03-04
指令微调
LLM
论辩挖掘 |
[自动]
[ARXIV] | 3min | school
多尺度自适应邻域感知Transformer用于图欺诈检测 03-04
图神经网络
欺诈检测
Transformer |
[自动]
[ARXIV] | 4min | school
从复杂动力学到DynFormer:重新思考PDE的Transformer架构 03-04
PDE求解
神经算子
Transformer |
[自动]
[ARXIV] | 4min | school
MoECLIP:基于补丁专家的零样本异常检测 03-04
MoECLIP
零样本学习
异常检测 |
[自动]
[ARXIV] | 4min | school
Adam为何优于SGD:二阶矩归一化产生更尖锐的尾部 03-04
优化算法
Adam
SGD |
[自动]
[ARXIV] | 3min | school
自适应置信度正则化用于多模态失效检测 03-04
多模态
失效检测
置信度 |
[自动]
[ARXIV] | 3min | school
符号等变循环推理模型 03-04
神经网络架构
符号推理
ARC-AGI |
[自动]
[ARXIV] | 4min | school
多头低秩注意力机制 03-04
MLRA
KV Cache
注意力机制 |
[自动]
[ARXIV] | 3min | school
Sketch2Colab:基于可控流蒸馏的草图多人动画 03-04
计算机视觉
动作生成
扩散模型 |
[自动]
[ARXIV] | 3min | school
测试时强化学习的工具验证方法 03-04
T3RL
Test-Time RL
强化学习 |
[自动]
[ARXIV] | 3min | school
干预下基于部分因果学习的有效选择性共形推断 03-04
因果推断
共形预测
机器学习 |
[自动]
[ARXIV] | 3min | school
符号等变循环推理模型 03-03
符号推理
神经网络架构
ARC-AGI |
[自动]
[ARXIV] | 4min | school
测试时强化学习的工具验证方法 03-03
T3RL
测试时强化学习
TTRL |
[自动]
[ARXIV] | 3min | school
干预下基于部分因果学习的有效选择性共形推断 03-03
因果推断
共形预测
干预实验 |
[自动]
[HACKER_NEWS] | 4min | newspaper
TorchLean:基于 Lean 形式化验证的神经网络框架 03-03
TorchLean
形式化验证
Lean |
[自动]
[ARXIV] | 4min | school
Sketch2Colab:基于可控流蒸馏的草图多人动画生成 03-03
Sketch2Colab
多人生成
草图动画 |
[自动]
[ARXIV] | 3min | school
Reasoning Core:面向符号预训练与后训练的可扩展程序化数据生成套件 03-03
Reasoning Core
符号推理
数据生成 |
[自动]
[ARXIV] | 3min | school
Conformal Policy Control:一种基于保形预测的策略控制方法 03-03
保形预测
策略控制
安全探索 |
[自动]
[HACKER_NEWS] | 1min | newspaper
TorchLean:基于 Lean 形式化验证的神经网络框架 03-03
TorchLean
形式化验证
Lean |
[自动]
[HACKER_NEWS] | 1min | newspaper
TorchLean:基于 Lean 形式化验证的神经网络框架 03-03
TorchLean
形式化验证
Lean |
[自动]
[HACKER_NEWS] | 1min | newspaper
TorchLean:在 Lean 中形式化神经网络 03-03
TorchLean
Lean
形式化验证 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Claude Opus 4.6 解决 Donald Knuth 提出的数学问题 03-03
Claude Opus
Donald Knuth
数学问题 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Claude Opus 4.6 解决 Donald Knuth 提出的问题 03-03
Claude Opus
Donald Knuth
算法问题 |
[自动]
[ARXIV] | 3min | school
深度序列模型中的概率学习与生成机制 03-03
深度序列模型
概率模型
贝叶斯方法 |
[自动]
[ARXIV] | 3min | school
曲率加权容量分配:基于MDL的层自适应大模型优化 03-03
LLM优化
MDL
曲率感知 |
[自动]
[ARXIV] | 3min | school
无智慧的知识:评估大模型与预期影响的错位 03-03
LLM
对齐
OOD |
[自动]
[ARXIV] | 4min | school
持续强化学习中的快速与元知识学习原则 03-03
强化学习
持续学习
元学习 |
[自动]
[ARXIV] | 4min | school
MC-Search:基于结构化长推理链的多模态智能体搜索评估与增强 03-03
多模态
MLLM
智能体 |
[自动]
[ARXIV] | 4min | school
KVSlimmer:非对称KV合并的理论洞察与优化 03-03
LLM
KV Cache
推理优化 |
[自动]
[ARXIV] | 3min | school
BioProAgent:神经符号约束下的科学规划框架 03-03
BioProAgent
神经符号
科学规划 |
[自动]
[ARXIV] | 5min | school
Active Flow Matching:一种高效的生成模型训练范式 03-03
Flow Matching
扩散模型
生成式模型 |
[自动]
[ARXIV] | 3min | school
面向自动定理证明的最小智能体框架 03-03
自动定理证明
智能体
Agent |
[自动]
[ARXIV] | 3min | school
评估学习表征可识别性的挑战与难点 03-03
表征学习
可识别性
评估指标 |
[自动]
[ARXIV] | 3min | school
神经机制稀疏化助力高效发现近似因果抽象 03-03
因果抽象
神经机制稀疏化
结构化剪枝 |
[自动]
[ARXIV] | 4min | school
模式寻优与均值寻优结合实现快速长视频生成 03-03
视频生成
扩散模型
Transformer |
[自动]
[ARXIV] | 4min | school
RNN引入动态记忆缓存机制以提升长序列建模能力 03-03
RNN
长序列建模
Memory Caching |
[自动]
[ARXIV] | 3min | school
LLM是否受益于自身生成文本的反馈训练 03-03
LLM
Self-Feedback
多轮对话 |
[自动]
[ARXIV] | 3min | school
面向自动定理证明的最小智能体框架 03-02
自动定理证明
Agent
最小智能体 |
[自动]
[ARXIV] | 3min | school
通过神经机制稀疏化高效发现近似因果抽象 03-02
因果抽象
结构化剪枝
SCM |
[自动]
[ARXIV] | 5min | school
通过低秩近似优化大模型动量状态以降低显存占用 03-02
LoRA-Pre
低秩近似
优化器 |
[自动]
[ARXIV] | 3min | school
评估学习表征可识别性的挑战与难点 03-02
表征学习
可辨识性
因果推断 |
[自动]
[ARXIV] | 4min | school
模式寻优结合均值寻优实现快速长视频生成 03-02
视频生成
扩散模型
Transformer |
[自动]
[ARXIV] | 4min | school
RNN引入记忆缓存机制以实现动态增长的存储能力 03-02
RNN
长上下文
Memory Caching |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR Joel Becker谈指数级时间跨度评估与AI生产力极限 03-02
METR
Joel Becker
指数级评估 |
[自动]
[ARXIV] | 3min | school
LLM是否受益于自身生成的文本 03-02
LLM
多轮对话
上下文学习 |
[自动]
[HACKER_NEWS] | 1min | newspaper
语言模型存在可独立调控的个性子网络 03-02
LLM
个性子网络
模型调控 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于脑活动解码生成思维描述文本 03-02
脑机接口
fMRI
脑活动解码 |
[自动]
[ARXIV] | 3min | school
自适应组合实验设计:决策与推断的帕累托最优 03-02
实验设计
自适应设计
帕累托最优 |
[自动]
[ARXIV] | 4min | school
SenCache:基于敏感度感知缓存加速扩散模型推理 03-02
扩散模型
SenCache
推理加速 |
[自动]
[ARXIV] | 3min | school
通过锚定机制实现模型一致性 03-02
模型一致性
锚定机制
预测分歧 |
[自动]
[ARXIV] | 3min | school
规模无法克服语用学:报告偏见对视觉语言推理的影响 03-02
VLM
多模态
报告偏见 |
[自动]
[ARXIV] | 3min | school
理解AI科研工具使用与交互的Asta数据集 03-02
Asta数据集
科研工具
RAG |
[自动]
[ARXIV] | 4min | school
数据集压缩至1MB:小规模数据集的模型训练效果 03-02
数据集压缩
PLADA
联邦学习 |
[自动]
[ARXIV] | 3min | school
基于超单纯形投影的可微零一损失函数 03-02
零一损失
可微损失
超单纯形投影 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 03-02
多模态
视觉语言模型
最优传输 |
[自动]
[ARXIV] | 4min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 03-02
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[ARXIV] | 3min | school
通过锚定机制提升模型一致性 03-01
模型一致性
锚定机制
堆叠平均 |
[自动]
[ARXIV] | 3min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 03-01
VLM
视觉语言模型
报告偏差 |
[自动]
[ARXIV] | 3min | school
理解AI科研工具使用与交互:Asta数据集 03-01
Asta数据集
AI科研工具
RAG |
[自动]
[ARXIV] | 4min | school
数据集压缩至1MB:小规模数据集的模型训练效果 03-01
PLADA
数据集压缩
数据集蒸馏 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型连载1:理解自然语言处理与大模型中的 Token 概念 03-01
Token
NLP
Transformer |
[自动]
[ARXIV] | 3min | school
基于超单纯形投影的可微零一损失函数 03-01
损失函数
0-1损失
可微性 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 03-01
多模态
SOTAlign
最优传输 |
[自动]
[ARXIV] | 4min | school
SeeThrough3D:实现遮挡感知的文本生成图像三维控制 03-01
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 课程:现代人工智能导论 03-01
CMU
课程
现代AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 现代人工智能导论课程资源 03-01
CMU
课程资源
现代人工智能 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR探讨指数级时间地平线评估与AI生产力极限 03-01
METR
时间地平线评估
AI生产力 |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 现代人工智能导论课程 03-01
CMU
课程
AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 课程:现代人工智能导论 03-01
CMU
现代人工智能
课程 |
[自动]
[HACKER_NEWS] | 1min | newspaper
CMU 10-202 现代人工智能导论课程资源 03-01
CMU
课程资源
现代AI |
[自动]
[HACKER_NEWS] | 1min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
算法推理
算术运算 |
2026年二月
571 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 02-28
VLM
视觉语言模型
报告偏差 |
[自动]
[JUEJIN] | 1min | sticky_note_2
深度学习通用逼近定理:神经网络的理论基础与核心原理 02-28
深度学习
神经网络
通用逼近定理 |
[自动]
[ARXIV] | 3min | school
数据集压缩至1MB:模型训练效率优化方法 02-28
数据集蒸馏
PLADA
模型训练 |
[自动]
[ARXIV] | 3min | school
基于锚点机制实现模型一致性 02-28
模型一致性
锚点机制
模型不一致性 |
[自动]
[ARXIV] | 3min | school
基于超单纯形投影的可微零一损失函数 02-28
0-1损失
可微损失
超单纯形 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-28
多模态
视觉语言模型
最优传输 |
[自动]
[ARXIV] | 3min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 02-28
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[ARXIV] | 3min | school
Asta交互数据集:解析AI科研工具的使用模式与用户参与度 02-28
Asta数据集
AI科研工具
用户行为分析 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AIE Europe与World’s Fair论文提交今日截止 02-28
AIE Europe
AIE World's Fair
CAIS |
[自动]
[HACKER_NEWS] | 1min | newspaper
最小Transformer模型实现两位数加法运算 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法运算的最小 Transformer 模型 02-28
Transformer
算法可解释性
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法运算的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能计算两个10位数加法的最小Transformer模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能计算两位十进制数相加的最小 Transformer 模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 2min | newspaper
能计算两个10位数加法的最小Transformer模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 1min | newspaper
能对齐十位数加法运算的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[ARXIV] | 2min | school
通过锚定机制提升模型一致性 02-27
模型一致性
锚定机制
模型差异 |
[自动]
[ARXIV] | 3min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 02-27
VLM
视觉语言模型
报告偏差 |
[自动]
[ARXIV] | 3min | school
数据集压缩至1MB:小规模数据集的模型训练效果评估 02-27
PLADA
数据集压缩
伪标签 |
[自动]
[ARXIV] | 3min | school
基于超单纯形投影的可微零一损失函数 02-27
机器学习
损失函数
0-1损失 |
[自动]
[ARXIV] | 3min | school
基于Asta数据集的AI科研工具使用与交互行为分析 02-27
Asta数据集
AI科研工具
用户行为分析 |
[自动]
[ARXIV] | 3min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-27
多模态
视觉语言模型
最优传输 |
[自动]
[ARXIV] | 4min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 02-27
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR Joel Becker谈指数级时间评估与AI生产力局限 02-27
METR
Joel Becker
指数级评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer中的混合专家模型架构解析 02-27
Transformer
MoE
混合专家 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 与太平洋西北国家实验室推基准测试,加速联邦许可流程 02-27
OpenAI
基准测试
AI 编程代理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 模型蒸馏与 SWE-Bench 失效机制分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[GITHUB_TRENDING] | 2min | hub
动手学深度学习:面向中文读者的可运行教材 02-27
深度学习
D2L
PyTorch |
[自动]
[ARXIV] | 4min | school
面向高效高分辨率GUI智能体的时空令牌剪枝 02-27
GUI Agent
Token Pruning
Qwen2-VL |
[自动]
[ARXIV] | 3min | school
面向低延迟口语对话的语篇感知双流响应生成 02-27
DDTSR
低延迟
口语对话 |
[自动]
[ARXIV] | 2min | school
缓解可读性代价:基于解耦证明者-验证者博弈的方法 02-27
LLM
可解释性
模型评估 |
[自动]
[ARXIV] | 3min | school
无模型通用AI框架 02-27
通用人工智能
强化学习
无模型 |
[自动]
[ARXIV] | 3min | school
基于优化的系统为何难以实现规范响应:代理与架构限制 02-27
RLHF
AI对齐
智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-27
Transformer
MoE
混合专家模型 |
[自动]
[ARXIV] | 3min | school
ReCoN-Ipsundrum:具备情感耦合控制与机制关联意识指标的可检查循环持久代理 02-27
ReCoN-Ipsundrum
机器意识
AI Agent |
[自动]
[ARXIV] | 3min | school
MovieTeller:工具增强且ID一致的渐进式摘要生成 02-27
MovieTeller
视频摘要
VLM |
[自动]
[ARXIV] | 3min | school
提升推理语言模型的参数化知识获取能力 02-27
LLM
推理模型
参数化知识 |
[自动]
[ARXIV] | 3min | school
LiCQA:轻量级复杂问答系统 02-27
LiCQA
复杂问答
QA系统 |
[自动]
[ARXIV] | 4min | school
GUI-Libra:动作感知监督与可验证强化学习的原生GUI智能体 02-27
GUI Agent
强化学习
RL |
[自动]
[ARXIV] | 3min | school
DySCO:面向长上下文大模型的动态注意力缩放解码方法 02-27
DySCO
长上下文
解码算法 |
[自动]
[ARXIV] | 3min | school
提升推理语言模型的参数化知识访问能力 02-26
推理模型
参数化知识
强化学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer 架构中的混合专家模型原理与优势 02-26
MoE
Transformer
混合专家 |
[自动]
[ARXIV] | 3min | school
LiCQA:面向复杂问答的轻量级系统 02-26
LiCQA
复杂问答
轻量级系统 |
[自动]
[ARXIV] | 3min | school
DySCO:面向长上下文大模型的动态注意力缩放解码 02-26
DySCO
长上下文
注意力机制 |
[自动]
[HACKER_NEWS] | 1min | newspaper
用概念代数引导可解释的语言模型 02-26
可解释性
概念代数
模型控制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer中的混合专家模型:架构原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
Transformer
MoE
混合专家模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
PA基准:评估Web智能体在真实个人助理工作流中的表现 02-26
Web智能体
PA基准
个人助理 |
[自动]
[JUEJIN] | 2min | sticky_note_2
空洞卷积原理:如何解决计算机视觉的精度与视野矛盾 02-26
空洞卷积
计算机视觉
深度学习 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型非线性变换解析:从MLP到MoE的架构演进 02-26
非线性变换
MLP
MoE |
[自动]
[HACKER_NEWS] | 1min | newspaper
PA基准:评估Web智能体在真实个人助理工作流中的表现 02-26
Web智能体
PA基准
个人助理 |
[自动]
[ARXIV] | 4min | school
用于Wasserstein测地线与最优传输动力学的神经求解器 02-26
最优传输
Wasserstein
神经网络 |
[自动]
[ARXIV] | 3min | school
函数空间经验贝叶斯正则化:基于t分布先验 02-26
贝叶斯深度学习
函数空间
经验贝叶斯 |
[自动]
[ARXIV] | 4min | school
TG-ASR:基于并行门控交叉注意力的翻译引导低资源语音识别 02-26
ASR
语音识别
低资源学习 |
[自动]
[ARXIV] | 3min | school
CxMP:评估语言模型构式理解的语言学最小对子基准 02-26
CxMP
构式语法
最小对子 |
[自动]
[ARXIV] | 3min | school
扩散对偶性第二章:Ψ采样器与高效课程 02-26
扩散模型
离散扩散
Psi采样器 |
[自动]
[ARXIV] | 3min | school
平滑无关学习统计查询复杂度下界 02-26
计算复杂度
统计查询
SQ下界 |
[自动]
[ARXIV] | 3min | school
基于试错学习的反思式测试时规划:用于具身大模型 02-26
具身智能
反思机制
测试时规划 |
[自动]
[ARXIV] | 1min | school
任意模态下的多向量索引压缩方法 02-26
多向量索引
模态压缩
Late Interaction |
[自动]
[ARXIV] | 4min | school
为何LLM后训练中Pass@k优化会降低Pass@1性能 02-26
LLM
后训练
Pass@k |
[自动]
[ARXIV] | 4min | school
Test-Time训练结合KV绑定等价于线性注意力 02-26
TTT
线性注意力
KV绑定 |
[自动]
[ARXIV] | 4min | school
Squint:面向机器人虚实迁移的快速视觉强化学习 02-26
强化学习
机器人
Sim-to-Real |
[自动]
[ARXIV] | 3min | school
Aletheia自主攻克FirstProof数学定理 02-26
Aletheia
Gemini 3
数学定理 |
[自动]
[ARXIV] | 3min | school
针对平滑对抗学习的统计查询下界研究 02-25
统计查询
计算复杂性
对抗学习 |
[自动]
[ARXIV] | 3min | school
扩散对偶性第二章:Ψ采样器与高效课程 02-25
扩散模型
离散扩散
采样器 |
[自动]
[ARXIV] | 1min | school
多模态任意向量索引压缩技术 02-25
向量检索
多模态
索引压缩 |
[自动]
[ARXIV] | 4min | school
基于试错反思的具身大模型测试时规划 02-25
具身智能
反思机制
测试时规划 |
[自动]
[ARXIV] | 5min | school
为何Pass@k优化会降低Pass@1:大模型后训练中的提示干扰 02-25
LLM
后训练
代码生成 |
[自动]
[ARXIV] | 4min | school
Squint:面向机器人具身迁移的快速视觉强化学习 02-25
强化学习
机器人
Sim-to-Real |
[自动]
[ARXIV] | 4min | school
KV绑定测试时训练等价于线性注意力 02-25
TTT
线性注意力
KV缓存 |
[自动]
[ARXIV] | 4min | school
Aletheia模型自主攻克FirstProof数学定理证明 02-25
Aletheia
FirstProof
数学定理证明 |
[自动]
[HACKER_NEWS] | 1min | newspaper
PA Bench:评估前沿模型多标签页任务能力 02-25
PA Bench
多标签页
模型评估 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
Diffusion Model |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
Diffusion Model |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
Diffusion Model |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[ARXIV] | 3min | school
超越星级评分:基于LLM与文本分类的细粒度情感分析框架 02-25
LLM
情感分析
ABSA |
[自动]
[ARXIV] | 3min | school
离线强化学习:面向离动力学环境的局部动力学感知域适应 02-25
离线强化学习
LoDADA
域适应 |
[自动]
[ARXIV] | 2min | school
工具构建:通往高级智能的路径 02-25
LLM
超级智能
工具构建 |
[自动]
[ARXIV] | 3min | school
动机优化:提升大语言模型任务表现的关键机制 02-25
动机优化
训练范式
情感神经科学 |
[自动]
[ARXIV] | 3min | school
VAUQ:面向LVLM自评估的视觉感知不确定性量化 02-25
LVLM
多模态
不确定性量化 |
[自动]
[ARXIV] | 4min | school
ProxyFL:面向联邦半监督学习的代理引导框架 02-25
联邦学习
半监督学习
FSSL |
[自动]
[ARXIV] | 5min | school
DeepSpeed图像工作负载评测:视觉Transformer扩展性能 02-25
DeepSpeed
ViT
视觉Transformer |
[自动]
[ARXIV] | 3min | school
非单调损失函数的共形风险控制方法 02-25
非单调损失
保序风险控制
共形预测 |
[自动]
[ARXIV] | 3min | school
部分可观测平均场博弈的循环结构策略梯度算法 02-25
平均场博弈
MFG
策略梯度 |
[自动]
[ARXIV] | 4min | school
行为学习:从数据中学习分层优化结构 02-25
行为学习
分层优化
可解释性 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Mercury 2:基于扩散模型的最快推理 LLM 02-25
Mercury 2
扩散模型
推理模型 |
[自动]
[ARXIV] | 4min | school
JUCAL:分类任务中偶然与认知不确定性的联合校准 02-25
不确定性校准
JUCAL
偶然不确定性 |
[自动]
[ARXIV] | 3min | school
面向大规模视频推理的综合基准测试套件 02-24
视频推理
VBVR
基准测试 |
[自动]
[ARXIV] | 3min | school
非单调损失函数的保形风险控制方法 02-24
保形预测
风险控制
非单调损失 |
[自动]
[ARXIV] | 4min | school
行为学习:从数据中学习分层优化结构 02-24
行为学习
分层优化
可解释性 |
[自动]
[ARXIV] | 4min | school
JUCAL:分类任务中偶然与认知不确定性的联合校准 02-24
不确定性校准
JUCAL
偶然不确定性 |
[自动]
[ARXIV] | 4min | school
AdaEvolve:基于大语言模型的自适应零阶优化方法 02-24
AdaEvolve
LLM
零阶优化 |
[自动]
[ARXIV] | 3min | school
部分可观测平均场博弈的循环结构策略梯度算法 02-24
平均场博弈
部分可观测
策略梯度 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-24
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[HACKER_NEWS] | 2min | newspaper
Steerling-8B:可解释自身生成任一 token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[HACKER_NEWS] | 2min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[HACKER_NEWS] | 2min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[JUEJIN] | 2min | sticky_note_2
DeepMind研究:多智能体协作瓶颈与Agent能力天花板分析 02-24
DeepMind
多智能体
Agent |
[自动]
[JUEJIN] | 2min | sticky_note_2
ArcFlow实现FLUX与Qwen推理40倍加速 02-24
ArcFlow
FLUX
Qwen |
[自动]
[HACKER_NEWS] | 1min | newspaper
53款模型“洗车”测试:评估多模态AI在物理场景中的表现 02-24
多模态
物理场景
模型评估 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[ARXIV] | 4min | school
部分软匹配距离:基于部分单元对应的神经表征比较 02-24
神经表征
部分软匹配
最优传输 |
[自动]
[ARXIV] | 3min | school
用于软优势策略优化的平滑门函数 02-24
强化学习
GRPO
SAPO |
[自动]
[ARXIV] | 3min | school
无需训练的图神经网络跨架构合并方法 02-24
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
城市编辑:面向依赖感知的分层智能体城市地理空间修改 02-24
City Editing
分层智能体
多模态推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-24
First Proof
数学证明
AI推理 |
[自动]
[ARXIV] | 4min | school
Soft Sequence Policy Optimization:连接GMPO与SAPO 02-24
SSPO
LLM对齐
强化学习 |
[自动]
[ARXIV] | 3min | school
RetinaVision:基于XAI增强调控的深度学习视网膜疾病分类 02-24
计算机视觉
医疗AI
深度学习 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[ARXIV] | 3min | school
统一图神经网络均匀表达能力的通用方法 02-24
GNN
图神经网络
表达能力 |
[自动]
[ARXIV] | 3min | school
扩散模型无需噪声调节的几何学原理 02-24
扩散模型
Flow Matching
几何学原理 |
[自动]
[ARXIV] | 4min | school
基准测试图神经网络在解决难约束满足问题中的性能 02-24
GNN
图神经网络
约束满足问题 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-24
数学推理
First Proof
研究级推理 |
[自动]
[ARXIV] | 4min | school
U(d)子群导出自然RNN与Transformer架构 02-24
RNN
Transformer
序列模型 |
[自动]
[ARXIV] | 3min | school
RVR:检索-验证-检索机制提升综合问答能力 02-24
RVR
RAG
检索增强 |
[自动]
[ARXIV] | 3min | school
K-partition 集成方法:通过置信度分配提升模型性能 02-24
CAKE
聚类集成
置信度评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[ARXIV] | 3min | school
统一图神经网络均匀表达能力的通用方法 02-23
GNN
图神经网络
表达能力 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型向弱势用户提供的信息准确度较低 02-23
AI偏见
数字鸿沟
模型评估 |
[自动]
[ARXIV] | 3min | school
扩散模型无需噪声条件:几何视角的解释 02-23
扩散模型
几何视角
生成模型 |
[自动]
[ARXIV] | 4min | school
基准测试图神经网络在求解难约束满足问题中的性能 02-23
GNN
图神经网络
约束满足问题 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
First Proof
数学证明
推理能力 |
[自动]
[ARXIV] | 3min | school
为K分区集成模型分配置信度以提升预测性能 02-23
聚类分析
集成学习
置信度评估 |
[自动]
[ARXIV] | 4min | school
U(d)子群自然导出RNN与Transformer架构 02-23
RNN
Transformer
U(d) |
[自动]
[ARXIV] | 3min | school
RVR:检索-验证-检索框架提升综合问答能力 02-23
RVR
RAG
检索增强 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍 02-23
Gemini 3.1 Pro
Google
ARC-AGI 2 |
[自动]
[HACKER_NEWS] | 1min | newspaper
53 款模型参与“洗车”基准测试 02-23
基准测试
模型评估
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍 02-23
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI模型在First Proof数学挑战中的证明尝试 02-23
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-23
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-23
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
First Proof
数学证明
推理能力 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-23
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
数学推理
First Proof
专家级问题 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT研究:主流AI模型对低学历及非美用户提供信息准确度较低 02-23
MIT
LLM
偏见 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍 02-23
Gemini 3.1 Pro
Google
ARC-AGI |
[自动]
[ARXIV] | 3min | school
面向扩散语言模型的感知剪枝方法 02-23
扩散模型
语言模型
模型剪枝 |
[自动]
[ARXIV] | 3min | school
语言模型处理差异论元标记时的类型学对齐差异 02-23
语言模型
类型学
区分性论元标记 |
[自动]
[ARXIV] | 3min | school
多轮人机协作中用户需求的精准对齐方法 02-23
人机协作
多轮对话
决策质量 |
[自动]
[ARXIV] | 4min | school
MARS:基于边界感知与自我优化的奖励建模 02-23
RLHF
奖励模型
MARS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究:主流AI聊天机器人向弱势用户提供的信息准确度较低 02-22
AI偏见
信息准确性
弱势群体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-22
AI模型
First Proof
数学挑战 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍 02-22
Gemini
Google
ARC-AGI |
[自动]
[ARXIV] | 4min | school
面向扩散语言模型的感知汇点剪枝方法 02-22
扩散模型
DLM
模型剪枝 |
[自动]
[ARXIV] | 3min | school
语言模型处理差异论元标记的类型对齐差异 02-22
语言模型
GPT-2
计算语言学 |
[自动]
[ARXIV] | 3min | school
细粒度细节靶向提升黑盒大视觉模型攻击能力 02-22
LVLM
黑盒攻击
对抗样本 |
[自动]
[ARXIV] | 3min | school
多轮人机协作框架支持用户自定义需求 02-22
人机协作
多轮对话
决策质量 |
[自动]
[ARXIV] | 4min | school
MARS:基于边距感知奖励建模与自我精炼 02-22
MARS
RLHF
Reward Model |
[自动]
[HACKER_NEWS] | 1min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
时间序列
前向传播 |
[自动]
[HACKER_NEWS] | 1min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
前向传播
时间序列 |
[自动]
[HACKER_NEWS] | 2min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
时间序列
神经网络 |
[自动]
[ARXIV] | 4min | school
面向扩散语言模型的Sink感知剪枝方法 02-21
扩散模型
语言模型
模型剪枝 |
[自动]
[ARXIV] | 4min | school
通过细粒度细节定位推进黑盒LVLM攻击边界 02-21
LVLM
黑盒攻击
对抗样本 |
[自动]
[ARXIV] | 2min | school
语言模型处理差价论元标记的类型学对齐差异 02-21
语言模型
计算语言学
类型学 |
[自动]
[ARXIV] | 3min | school
多轮人机协作框架支持用户自定义需求 02-21
人机协作
LLM
决策质量 |
[自动]
[ARXIV] | 3min | school
基于分词器的语言识别模型研究 02-21
UniLID
语言识别
分词器 |
[自动]
[ARXIV] | 4min | school
MMARS:基于边际感知与自我精炼的奖励建模 02-21
RLHF
奖励建模
数据增强 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI模型针对First Proof数学挑战的证明尝试与推理能力测试 02-21
LLM
数学推理
First Proof |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-21
Gemini
Google
ARC-AGI |
[自动]
[HACKER_NEWS] | 1min | newspaper
大语言模型推理失败机制分析 02-21
LLM
推理
逻辑错误 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型向弱势用户提供信息准确度较低 02-21
AI偏见
公平性
准确性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-21
数学推理
First Proof
研究级推理 |
[自动]
[ARXIV] | 3min | school
面向扩散语言模型的Sink感知剪枝方法 02-20
扩散模型
语言模型
模型剪枝 |
[自动]
[ARXIV] | 3min | school
语言模型对差异论元标记处理的类型学对齐差异 02-20
语言模型
GPT-2
计算语言学 |
[自动]
[ARXIV] | 3min | school
基于用户指定需求的多轮人机协作框架 02-20
人机协作
多轮对话
决策质量 |
[自动]
[ARXIV] | 3min | school
基于分词器的语言识别方法研究 02-20
UniLID
语言识别
LID |
[自动]
[ARXIV] | 4min | school
MARS:基于边际感知与自我精炼的奖励建模 02-20
MARS
RLHF
奖励模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 发布自主智能体 METR 基准测试数据 02-20
Anthropic
智能体
Agent |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 公布 Agent 自主性研究及 METR 基准数据 02-20
Anthropic
Agent
自主性 |
[自动]
[HACKER_NEWS] | 1min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型对弱势群体提供信息准确度较低 02-20
AI偏见
公平性
包容性 |
[自动]
[HACKER_NEWS] | 1min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-20
Gemini 3.1 Pro
Google
ARC-AGI |
[自动]
[HACKER_NEWS] | 1min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
利用注意力匹配加速 KV 键值对压缩 02-20
KV压缩
注意力机制
推理加速 |
[自动]
[HACKER_NEWS] | 3min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[HACKER_NEWS] | 1min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[ARXIV] | 3min | school
评估LLM辅助对生物学新手表现的影响 02-20
LLM
生物学
随机对照试验 |
[自动]
[ARXIV] | 4min | school
知识嵌入潜在投影提升鲁棒表征学习 02-20
表征学习
数据不平衡
EHR |
[自动]
[ARXIV] | 2min | school
机器遗忘中保护未删除数据隐私的方法 02-20
机器遗忘
隐私保护
重构攻击 |
[自动]
[ARXIV] | 4min | school
强化快速权重结合下一序列预测模型 02-20
REFINE
强化学习
快速权重 |
[自动]
[ARXIV] | 3min | school
因果性是可解释性泛化的关键 02-20
可解释性
因果推断
泛化性 |
[自动]
[ARXIV] | 2min | school
以对象为中心的表征是否更利于组合泛化 02-20
组合泛化
对象中心
视觉表征 |
[自动]
[ARXIV] | 3min | school
Calibrate-Then-Act:面向大模型智能体的成本感知探索 02-20
LLM Agents
成本感知
CTA框架 |
[自动]
[ARXIV] | 3min | school
知识嵌入隐投影用于鲁棒表征学习 02-19
表征学习
EHR
数据不平衡 |
[自动]
[ARXIV] | 2min | school
机器遗忘中保护未删除数据的隐私防御机制 02-19
机器遗忘
隐私保护
重构攻击 |
[自动]
[ARXIV] | 4min | school
强化快速权重与下一序列预测 02-19
REFINE
快速权重
强化学习 |
[自动]
[ARXIV] | 2min | school
因果性是可解释性泛化的关键 02-19
因果推断
可解释性
LLM |
[自动]
[ARXIV] | 3min | school
以对象为中心的表征在组合泛化任务中的表现评估 02-19
组合泛化
以对象为中心
视觉问答 |
[自动]
[ARXIV] | 4min | school
Calibrate-Then-Act:大模型智能体的成本感知探索 02-19
LLM Agents
成本感知
探索策略 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic发布Agent自主性研究及METR数据 02-19
Anthropic
Agent
自主性 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
长期对话语境下LLM个性化特征与回音室效应分析 02-19
LLM
个性化
回音室效应 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
美德伦理在AI对齐中的有效性 02-19
AI对齐
美德伦理
AI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
个性化功能可能导致大语言模型迎合用户观点形成回声室 02-19
LLM
个性化
回声室 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话语境下LLM观点映射与回声室效应 02-19
LLM
个性化
回声室效应 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC伯克利利用IT-Bench和MAST诊断企业智能体失败原因 02-19
IBM
UC Berkeley
IT-Bench |
[自动]
[BLOGS_PODCASTS] | 1min | mic
长期对话导致大语言模型镜像用户观点并形成回声室 02-19
LLM
个性化
回声室 |
[自动]
[ARXIV] | 3min | school
通过任务复杂度量化验证浅层对齐假说 02-19
浅层对齐假说
SAH
任务复杂度 |
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 上下文长度外推技术综述 02-19
LLM
上下文窗口
外推 |
[自动]
[ARXIV] | 4min | school
CrispEdit:低曲率投影实现可扩展的大模型无损编辑 02-19
LLM编辑
模型编辑
CrispEdit |
[自动]
[ARXIV] | 3min | school
Avey-B:基于视觉基础模型的通用具身智能代理 02-19
Avey-B
NLP
Transformer |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Qwen3.5-397B-A17B:最小的高效Open-Opus级模型 02-18
Qwen3.5
模型压缩
性能优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因 02-18
IBM
UC Berkeley
IT-Bench |
[自动]
[ARXIV] | 3min | school
胸部X光分类的任务无关持续学习方法 02-18
持续学习
胸部X光
医学影像 |
[自动]
[ARXIV] | 3min | school
基于任务复杂度的浅层对齐假说操作化研究 02-18
浅层对齐
SAH
任务复杂度 |
[自动]
[ARXIV] | 3min | school
基于D最优统计的高维仿真代理测试时适应稳定化方法 02-18
TTA
仿真代理
分布偏移 |
[自动]
[ARXIV] | 3min | school
利用强化学习解决未知可行性的参数鲁棒避障问题 02-18
强化学习
鲁棒性
避障 |
[自动]
[ARXIV] | 4min | school
Dex4D:任务无关点跟踪策略实现灵巧操作跨域迁移 02-18
灵巧操作
Sim-to-Real
强化学习 |
[自动]
[ARXIV] | 4min | school
CrispEdit:低曲率投影实现可扩展的大模型无损编辑 02-18
模型编辑
CrispEdit
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC Berkeley利用IT-Bench和MAST诊断企业智能体失败原因 02-18
IBM
UC Berkeley
IT-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式并获合作者验证 02-18
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 5min | school
Avey-B:基于注意力机制的高效视觉Transformer模型 02-18
Avey-B
Transformer
NLP |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2推导胶子振幅新公式并获验证 02-18
GPT-5.2
理论物理
胶子振幅 |
[自动]
[JUEJIN] | 2min | sticky_note_2
SkillsBench 论文解读:跨任务基准测试如何揭示 Agent 技能的实际效用 02-18
Agent
LLM
SkillsBench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话语境导致LLM迎合用户观点形成回声室 02-18
LLM
个性化
回声室 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2推导新胶子振幅公式获正式证明 02-18
GPT-5.2
理论物理
科学发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2 提出胶子振幅新公式并获合作验证 02-18
GPT-5.2
理论物理
胶子振幅 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出胶子振幅新公式并获学术验证 02-18
GPT-5.2
理论物理
胶子振幅 |
[自动]
[ARXIV] | 3min | school
长上下文LLM缩放缺陷:隐私与个性化任务揭示注意力分散 02-18
长上下文
LLM
个性化 |
[自动]
[ARXIV] | 4min | school
超越掩码扩散语言模型的扩展性研究 02-18
扩散模型
语言模型
扩展定律 |
[自动]
[ARXIV] | 3min | school
语言统计对称性塑造模型表征的几何结构 02-18
表征几何
统计对称性
词嵌入 |
[自动]
[ARXIV] | 4min | school
离散扩散模型高效采样:锐利且自适应的理论保证 02-18
离散扩散模型
CTMC
采样效率 |
[自动]
[ARXIV] | 3min | school
基于结构化世界模型先验的冷启动个性化方案 02-18
冷启动
个性化
世界模型 |
[自动]
[ARXIV] | 4min | school
基于正则化与对称性重审扩散模型及其分子图生成应用 02-18
扩散模型
分子图生成
对称性 |
[自动]
[ARXIV] | 2min | school
基于参数高效微调与往返翻译的文本风格迁移 02-18
文本风格迁移
参数高效微调
LLM |
[自动]
[ARXIV] | 3min | school
BPP:聚焦关键历史帧的长上下文机器人模仿学习 02-18
机器人
模仿学习
长上下文 |
[自动]
[ARXIV] | 3min | school
长上下文LLM隐私与个性化任务中的缩放差距研究 02-17
长上下文
隐私保护
个性化 |
[自动]
[ARXIV] | 3min | school
超越掩码扩散语言模型的扩展性研究 02-17
扩散模型
语言模型
扩展定律 |
[自动]
[ARXIV] | 3min | school
语言统计对称性塑造模型表征的几何结构 02-17
表征学习
几何结构
统计对称性 |
[自动]
[ARXIV] | 4min | school
离散扩散模型高效采样:具备锐利性与自适应保证 02-17
离散扩散模型
高效采样
tau-leaping |
[自动]
[ARXIV] | 3min | school
基于结构化世界模型的无训练先验用于冷启动个性化 02-17
个性化
冷启动
世界模型 |
[自动]
[ARXIV] | 4min | school
基于标准化的扩散模型对称性重思考与分子图生成 02-17
扩散模型
分子图生成
对称性 |
[自动]
[ARXIV] | 4min | school
基于参数高效微调与往返翻译的文本风格迁移 02-17
文本风格迁移
PEFT
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2提出胶子振幅新公式并获验证 02-17
GPT-5.2
OpenAI
理论物理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think:推进科学与工程研究 02-17
Gemini 3
DeepMind
Deep Think |
[自动]
[ARXIV] | 3min | school
BPP:聚焦关键历史帧的长上下文机器人模仿学习 02-17
机器人
模仿学习
长上下文 |
[自动]
[JUEJIN] | 2min | sticky_note_2
Qwen3.5-397B-A17B:极致稀疏MoE架构与多模态能力详解 02-17
Qwen3.5
MoE
多模态 |
[自动]
[HACKER_NEWS] | 4min | newspaper
语义消融实验:揭示AI写作为何平庸同质化 02-17
语义消融
AI写作
同质化 |
[自动]
[JUEJIN] | 3min | sticky_note_2
SkillsBench论文:评估Agent技能在多任务中的实际效用 02-17
Agent
LLM
SkillsBench |
[自动]
[HACKER_NEWS] | 7min | newspaper
SkillsBench:评估智能体技能在多样化任务中的表现基准 02-17
SkillsBench
智能体
Agent |
[自动]
[ARXIV] | 4min | school
过程监督多智能体强化学习提升临床推理可靠性 02-17
多智能体
强化学习
临床推理 |
[自动]
[ARXIV] | 4min | school
科学推理模型引入拒答机制以提升准确性 02-17
科学推理
拒答机制
NLI |
[自动]
[HACKER_NEWS] | 4min | newspaper
研究:自生成的智能体技能通常无效 02-17
AI Agent
智能体
LLM |
[自动]
[ARXIV] | 4min | school
延迟视觉摄入优化图文密集文档问答 02-17
多模态
文档问答
VLM |
[自动]
[ARXIV] | 5min | school
基于枢纽重采样的LLM强化学习深度密集探索 02-17
LLM
强化学习
RLHF |
[自动]
[ARXIV] | 4min | school
UniWeTok:统一二进制分词器支持2^128码本规模 02-17
UniWeTok
多模态
Tokenizer |
[自动]
[ARXIV] | 4min | school
GPT-5与其他大模型长短上下文性能对比 02-17
GPT-5
LLM
长文本 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式获学术验证 02-17
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 3min | school
语义分块与自然语言熵:优化文本切分策略 02-17
语义分块
自然语言熵
文本切分 |
[自动]
[HACKER_NEWS] | 4min | newspaper
研究:自生成的Agent技能实际无效 02-17
Agent
LLM
研究 |
[自动]
[ARXIV] | 4min | school
基于扩散模型从面部嵌入重建真实人脸 02-17
扩散模型
人脸重建
KAN |
[自动]
[ARXIV] | 4min | school
基于仿真过滤的模块化策略从人类视频学习有效行为 02-17
机器人
模仿学习
仿真过滤 |
[自动]
[ARXIV] | 4min | school
在线镜像 descent 使用镜像图组合改进遗憾保证 02-17
在线镜像下降
OMD
在线凸优化 |
[自动]
[ARXIV] | 5min | school
CoPE-VideoLM:基于编解码基元的高效视频语言模型 02-17
VideoLM
视频理解
多模态 |
[自动]
[ARXIV] | 3min | school
语义分块与自然语言熵的关联研究 02-16
语义分块
自然语言熵
LLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
研究:自生成的Agent技能通常无效 02-16
Agent
LLM
自生成技能 |
[自动]
[ARXIV] | 4min | school
基于镜像映射组合改进在线镜像下降的遗憾界 02-16
在线优化
OMD
遗憾界 |
[自动]
[ARXIV] | 3min | school
基于扩散模型从面部嵌入实现真实人脸重建 02-16
扩散模型
人脸重建
隐私保护 |
[自动]
[ARXIV] | 4min | school
仿真筛选模块化策略:从人类视频学习有效行为 02-16
机器人
强化学习
模仿学习 |
[自动]
[HACKER_NEWS] | 7min | newspaper
LCM:无损上下文管理技术论文 02-16
LCM
上下文管理
无损 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2 提出胶子振幅新公式并获合作者验证 02-16
GPT-5.2
理论物理
胶子振幅 |
[自动]
[ARXIV] | 4min | school
CoPE-VideoLM:基于编解码基元的高效视频语言模型 02-16
VideoLM
多模态
视频理解 |
[自动]
[HACKER_NEWS] | 4min | newspaper
研究:自生成的Agent技能通常无效 02-16
Agent
LLM
自生成技能 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出胶子振幅新公式并获合作验证 02-16
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 4min | school
面向语言模型的在线上下文蒸馏方法 02-16
LLM
蒸馏
上下文学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究 02-16
自主研究
数学
AI |
[自动]
[ARXIV] | 4min | school
视觉-语言-动作对齐:扩展验证比扩展策略学习更有效 02-16
VLA
具身智能
CoVer |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-16
多模态
思维链
测试时扩展 |
[自动]
[ARXIV] | 5min | school
CM2:基于清单奖励强化学习的多步智能体工具调用 02-16
强化学习
Agent
工具调用 |
[自动]
[ARXIV] | 4min | school
AttentionRetriever:注意力层即长文档检索器 02-16
RAG
长文档
检索 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究 02-15
自主研究
数学
AI |
[自动]
[ARXIV] | 4min | school
语言模型在线策略上下文蒸馏方法 02-15
模型蒸馏
上下文学习
在线策略 |
[自动]
[ARXIV] | 4min | school
扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐 02-15
VLA
具身智能
机器人 |
[自动]
[ARXIV] | 4min | school
WebAgents测试时扩展:智能体性能提升方法 02-15
WebAgents
测试时扩展
CATTS |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-15
多模态
思维链
测试时扩展 |
[自动]
[ARXIV] | 4min | school
MonarchRT:面向实时视频生成的高效注意力机制 02-15
视频生成
DiT
注意力机制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:面向科研与工程的科学推理模型 02-15
Gemini 3
Deep Think
科学推理 |
[自动]
[ARXIV] | 3min | school
CM2:基于清单奖励强化学习的多步智能体工具调用 02-15
CM2
强化学习
Agent |
[自动]
[ARXIV] | 3min | school
AttentionRetriever:注意力层隐式实现长文档检索 02-15
RAG
长文档检索
AttentionRetriever |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究 02-15
自主研究
数学
AI科学家 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2提出胶子振幅新公式并获验证 02-15
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 3min | school
AI时代的创意所有权界定 02-15
版权
生成式AI
法律 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究:AI 探索自动化定理证明 02-15
自动化定理证明
AI for Math
形式化验证 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式并获合作验证 02-15
GPT-5.2
OpenAI
理论物理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式获学术验证 02-14
GPT-5.2
理论物理
胶子振幅 |
[自动]
[ARXIV] | 4min | school
扩展验证比扩展策略学习更有效实现视觉-语言-动作对齐 02-14
VLA
具身智能
机器人 |
[自动]
[ARXIV] | 4min | school
基于策略上下文蒸馏的大语言模型优化方法 02-14
LLM
蒸馏
上下文学习 |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展 02-14
多模态
思维链
测试时扩展 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2推导新胶子振幅公式获正式验证 02-14
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 4min | school
CM2:基于清单奖励强化学习的多步多轮智能体工具调用 02-14
智能体
强化学习
工具调用 |
[自动]
[ARXIV] | 3min | school
AttentionRetriever:注意力层可作为长文档检索器 02-14
RAG
长文档检索
AttentionRetriever |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 3min | newspaper
G 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理领域新成果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 5min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 5min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
AI for Science |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新成果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[ARXIV] | 4min | school
面向语言模型的在线上下文蒸馏方法 02-13
LLM
模型蒸馏
上下文学习 |
[自动]
[ARXIV] | 4min | school
扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐 02-13
VLA
具身智能
机器人 |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-13
多模态
思维链
测试时扩展 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-13
GPT-5.2
理论物理
AI for Science |
[自动]
[ARXIV] | 4min | school
AttentionRetriever:注意力层即长文档检索器 02-13
RAG
长文档检索
AttentionRetriever |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Rafael Gómez-Bombarelli:AI与模拟加速科学发现的转折点 02-13
AI for Science
科学发现
模拟技术 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI与模拟加速科学发现的转折点 02-13
科学发现
AI模拟
Rafael Gómez-Bombarelli |
[自动]
[HACKER_NEWS] | 3min | newspaper
尼克·博斯特罗姆新论文探讨超级智能的启动时机 02-13
超级智能
尼克·博斯特罗姆
AI安全 |
[自动]
[ARXIV] | 4min | school
训练LRM模型:自适应反思与长度协调惩罚提升推理效率 02-13
LRM
推理效率
自适应反思 |
[自动]
[ARXIV] | 4min | school
离线强化学习在Q星近似与部分覆盖下的复杂度分析 02-13
离线强化学习
Q星近似
部分覆盖 |
[自动]
[ARXIV] | 4min | school
基于奖励外推的广义在线策略蒸馏算法 02-13
LLM
强化学习
知识蒸馏 |
[自动]
[ARXIV] | 4min | school
利用辅助信息实现少样本设计优化 02-13
贝叶斯优化
少样本学习
设计优化 |
[自动]
[ARXIV] | 3min | school
Pensieve范式:有状态语言模型自主管理上下文 02-13
StateLM
有状态模型
上下文管理 |
[自动]
[ARXIV] | 4min | school
P-GenRM:个性化生成式奖励模型与基于用户的测试时缩放 02-13
P-GenRM
个性化对齐
奖励模型 |
[自动]
[ARXIV] | 4min | school
Meta-Sel:基于监督元学习的高效上下文学习示例选择方法 02-13
ICL
元学习
示例选择 |
[自动]
[ARXIV] | 4min | school
长思维链监督微调中数据重复优于数据扩展 02-13
长思维链
监督微调
数据重复 |
[自动]
[ARXIV] | 4min | school
超越VLM奖励:扩散原生潜在奖励建模 02-13
扩散模型
DiNa-LRM
奖励建模 |
[自动]
[ARXIV] | 4min | school
权重衰减提升语言模型可塑性 02-13
权重衰减
模型可塑性
微调 |
[自动]
[ARXIV] | 3min | school
基于扩散预训练的稠密上下文嵌入模型 02-13
Embeddings
扩散模型
RAG |
[自动]
[ARXIV] | 4min | school
基于归一化流的高效分层目标条件强化学习 02-13
强化学习
分层强化学习
归一化流 |
[自动]
[ARXIV] | 5min | school
SCRAPL:基于随机路径散射变换的机器学习框架 02-13
SCRAPL
Scattering Transform
小波散射 |
[自动]
[ARXIV] | 3min | school
GENIUS:生成式流体智能评估套件 02-13
GENIUS
流体智力
多模态评估 |
[自动]
[ARXIV] | 3min | school
长思维链监督微调中数据重复优于数据扩展 02-12
长思维链
监督微调
数据重复 |
[自动]
[ARXIV] | 4min | school
超越VLM奖励:扩散原生潜在奖励建模 02-12
扩散模型
DiNa-LRM
奖励建模 |
[自动]
[ARXIV] | 3min | school
权重衰减提升语言模型可塑性 02-12
LLM
权重衰减
模型可塑性 |
[自动]
[ARXIV] | 4min | school
扩散预训练模型生成稠密上下文嵌入 02-12
Embeddings
扩散模型
RAG |
[自动]
[ARXIV] | 3min | school
基于归一化流的高效分层目标条件强化学习 02-12
强化学习
归一化流
分层强化学习 |
[自动]
[ARXIV] | 3min | school
TabICLv2:更优性能与可扩展性的开源表格基础模型 02-12
TabICLv2
表格基础模型
RealTabPFN |
[自动]
[ARXIV] | 5min | school
SCRAPL:基于随机路径散射变换的机器学习框架 02-12
SCRAPL
Scattering Transform
Wavelet |
[自动]
[ARXIV] | 3min | school
GENIUS:生成式流体智能评估套件 02-12
GENIUS
流体智能
GFI |
[自动]
[JUEJIN] | 2min | sticky_note_2
智谱GLM-5即Pony Alpha:对标Claude Opus 02-12
智谱AI
GLM-5
Pony Alpha |
[自动]
[HACKER_NEWS] | 3min | newspaper
大语言模型面临的幻觉与逻辑推理局限 02-12
LLM
幻觉
逻辑推理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI与模拟加速科学发现:拉斐尔·戈麦斯-巴雷利的观点 02-12
AI
科学发现
模拟 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大语言模型无法独立攻克癌症的局限性分析 02-12
LLM
癌症研究
AI 局限性 |
[自动]
[HACKER_NEWS] | 3min | newspaper
GPT-5在法律推理实验中表现优于联邦法官 02-12
GPT-5
法律推理
联邦法官 |
[自动]
[ARXIV] | 2min | school
提升自动驾驶感知多租户DNN推理的可预测性 02-12
arxiv
cs.CV |
[自动]
[ARXIV] | 3min | school
LoRA-Squeeze:LoRA模块的调优后与调优中压缩方法 02-12
LoRA
PEFT
模型压缩 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LLM 单独使用无法治愈癌症:科学与模拟的局限 02-12
LLM
生物医学
AI for Science |
[自动]
[ARXIV] | 2min | school
迈向可解释联邦学习:理解差分隐私的影响 02-12
联邦学习
差分隐私
可解释性 |
[自动]
[ARXIV] | 2min | school
用于增强科学图表分析的智能代理 02-12
智能代理
科学图表
多模态 |
[自动]
[ARXIV] | 2min | school
步级解析数据归因:面向循环Transformer 02-12
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
Olaf-World:面向视频世界模型的潜在动作定向方法 02-12
arxiv
cs.CV |
[自动]
[ARXIV] | 1min | school
Learning on the Manifold: Unlocking Standard Diffusion 02-12
Diffusion Transformer
DiT
表征学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GLM-OCR:面向复杂文档理解的多模态OCR模型 02-12
GLM-OCR
多模态
OCR |
[自动]
[ARXIV] | 5min | school
Agent World Model:面向智能体强化学习的无限合成环境 02-12
Agent World Model
强化学习
合成环境 |
[自动]
[ARXIV] | 3min | school
迈向可解释联邦学习:理解差分隐私的影响 02-11
联邦学习
差分隐私
可解释性 |
[自动]
[ARXIV] | 3min | school
视频扩散模型因果性与去噪过程可分离 02-11
arxiv
cs.CV |
[自动]
[ARXIV] | 1min | school
基于表征编码器解锁标准扩散Transformer 02-11
DiT
扩散模型
流匹配 |
[自动]
[ARXIV] | 1min | school
Quantum-Audit:评估大语言模型量子计算推理能力极限 02-11
arxiv
cs.CL |
[自动]
[ARXIV] | 4min | school
CODE-SHARP:基于分层奖励程序的技能持续演化框架 02-11
CODE-SHARP
强化学习
RL |
[自动]
[ARXIV] | 3min | school
Agent World Model: Infinity Synthetic Environments for 02-11
Agent
World Model
强化学习 |
[自动]
[ARXIV] | 1min | school
循环Transformer的步级数据归因方法 02-11
Transformer
数据归因
模型可解释性 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
大语言模型无法治愈癌症:科学家的模拟困境 02-11
LLM
科学发现
生物医学 |
[自动]
[ARXIV] | 3min | school
Olaf-World: Orienting Latent Actions for Video World Mo 02-11
世界模型
Olaf-World
潜在动作 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI 核心术语解析:从神经网络原理到词嵌入与潜空间 02-11
神经网络
词嵌入
潜空间 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GLM-OCR:兼顾准确度、速度与通用性的多模态大模型 02-11
GLM-OCR
多模态
OCR |
[自动]
[ARXIV] | 2min | school
Anagent For Enhancing Scientific Table & Figure Analysi 02-11
Anagent
多智能体
科学图表分析 |
[自动]
[HACKER_NEWS] | 4min | newspaper
The Little Learner:通往深度学习的直线路径 02-11
深度学习
机器学习
神经网络 |
[自动]
[ARXIV] | 1min | school
Transformer模型在低信噪比时间序列预测中的统计基准测试 02-11
arxiv
cs.LG |
[自动]
[ARXIV] | 2min | school
CoFEH:LLM驱动的协同贝叶斯特征工程框架 02-11
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
Code2World: A GUI World Model via Renderable Code Gener 02-11
arxiv
cs.CV |
[自动]
[HACKER_NEWS] | 1min | newspaper
The Little Learner: A Straight Line to Deep Learning 02-11
深度学习
机器学习
神经网络 |
[自动]
[ARXIV] | 4min | school
Robustness Is a Function, Not a Number: A Factorized Co 02-11
arxiv
cs.RO |
[自动]
[ARXIV] | 2min | school
GEBench:将图像生成模型评估为GUI环境的基准 02-11
GEBench
GUI生成
图像生成 |
[自动]
[ARXIV] | 3min | school
ARO: A New Lens On Matrix Optimization For Large Models 02-11
ARO
矩阵优化
LLM |
[自动]
[ARXIV] | 4min | school
ArcFlow: Unleashing 2-Step Text-to-Image Generation via 02-11
arxiv
cs.CV |
[自动]
[ARXIV] | 2min | school
ANCRe: Adaptive Neural Connection Reassignment for Effi 02-11
ANCRe
深度学习
残差连接 |
[自动]
[HACKER_NEWS] | 4min | newspaper
The Little Learner: A Straight Line to Deep Learning 02-11
深度学习
Deep Learning
机器学习 |
[自动]
[ARXIV] | 3min | school
鲁棒性是函数而非数值:基于视觉驾驶的OOD鲁棒性因子化研究 02-10
OOD鲁棒性
视觉驾驶
因子化 |
[自动]
[ARXIV] | 4min | school
ARO:面向大模型矩阵优化的新视角 02-10
矩阵优化
ARO
大模型 |
[自动]
[ARXIV] | 2min | school
ArcFlow:高精度非线性流蒸馏实现两步文生图生成 02-10
ArcFlow
文生图
流蒸馏 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
The Scientist and the Simulator 02-10
LLM
生物医药
科学研究 |
[自动]
[ARXIV] | 3min | school
GEBench: Benchmarking Image Generation Models as GUI En 02-10
GEBench
GUI生成
图像生成 |
[自动]
[ARXIV] | 3min | school
下一代验证码:利用认知差异防御GUI智能体 02-10
arxiv
cs.LG |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型而LLM仅基于词模型预测 02-10
世界模型
词模型
智能体 |
[自动]
[ARXIV] | 3min | school
ANCRe:自适应神经连接重分配实现高效深度扩展 02-10
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
针对LLM服务框架而非模型的延迟型拒绝服务攻击研究 02-10
arxiv
cs.CR |
[自动]
[ARXIV] | 4min | school
基于朗之万动力学的直接软策略采样 02-10
arxiv
cs.LG |
[自动]
[BLOGS_PODCASTS] | 1min | mic
专家依赖世界模型推断隐藏状态,大语言模型需突破词模型局限 02-10
世界模型
词模型
隐藏状态 |
[自动]
[ARXIV] | 1min | school
MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Rei 02-10
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
Harpoon:面向条件表格扩散模型的广义流形引导 02-10
扩散模型
表格数据
流形引导 |
[自动]
[ARXIV] | 3min | school
智能体不确定性研究揭示过度自信问题 02-09
AI Agents
不确定性
过度自信 |
[自动]
[ARXIV] | 4min | school
学习大模型神经元激活的生成式元模型 02-09
神经元激活
生成式模型
元模型 |
[自动]
[ARXIV] | 4min | school
基于熵排序流的非监督解耦表示学习模型 02-09
无监督学习
解耦表示
EOFlows |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型决策,大语言模型需超越词模型 02-09
世界模型
词模型
专家系统 |
[自动]
[ARXIV] | 4min | school
InftyThink+: 基于强化学习的高效无限视野推理框架 02-09
强化学习
推理框架
思维链 |
[自动]
[ARXIV] | 4min | school
DreamDojo:基于大规模人类视频的通用机器人世界模型 02-09
机器人
世界模型
DreamDojo |
[自动]
[ARXIV] | 4min | school
DAWN:面向扩散大模型的依赖感知快速推理 02-09
扩散模型
DAWN
并行解码 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家具备世界模型而LLM仅拥有词模型 02-09
LLM
世界模型
词模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
专家依赖世界模型决策,LLM需超越词模型以实现推理 02-09
世界模型
推理
智能体 |
[自动]
[HACKER_NEWS] | 3min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-09
世界模型
词模型
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-09
世界模型
词模型
LLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
停止生成,开始思考:大模型推理能力进化路径 02-09
LLM
推理能力
思维链 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直观物理 02-09
VLM
直觉物理
强化学习 |
[自动]
[ARXIV] | 4min | school
好奇心即知识:基于主动推理的自一致学习与无遗憾优化 02-09
主动推理
好奇心
自一致学习 |
[自动]
[ARXIV] | 5min | school
共享LoRA子空间实现近乎严格的持续学习 02-09
持续学习
LoRA
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:通过伪逆变换提升模型可逆性与表达能力 02-09
神经网络
可逆性
SPNN |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式主体建模框架 02-09
PhysicsAgentABM
Agent
多智能体 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-09
DyTopo
Multi-Agent
动态拓扑 |
[自动]
[ARXIV] | 4min | school
DFlash:基于块扩散的闪存推测解码方法 02-09
LLM
推理加速
推测解码 |
[自动]
[ARXIV] | 4min | school
CommCP:基于共形预测的LLM通信提升多智能体协调效率 02-09
LLM
多智能体
共形预测 |
[自动]
[ARXIV] | 5min | school
AP-OOD:基于注意力池化的分布外检测方法 02-09
OOD检测
注意力机制
NLP |
[自动]
[ARXIV] | 3min | school
面向运行时智能体记忆的查询感知预算层路由 02-08
Agent
LLM
智能体 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直觉物理 02-08
VLM
直觉物理
多模态 |
[自动]
[ARXIV] | 4min | school
好奇心即知识:基于主动推理的自一致学习与无悔优化 02-08
主动推理
好奇心
探索与利用 |
[自动]
[ARXIV] | 5min | school
共享LoRA子空间实现近乎严格的持续学习 02-08
LoRA
持续学习
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:基于伪逆变换的高效架构设计 02-08
神经网络
伪逆
SPNN |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型,大语言模型仅有词模型 02-08
LLM
世界模型
词模型 |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式智能体建模 02-08
PhysicsAgentABM
智能体
多主体系统 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-08
多智能体
DyTopo
动态拓扑 |
[自动]
[ARXIV] | 4min | school
CommCP:基于LLM通信与共形预测的多智能体高效协调 02-08
LLM
Multi-Agent
CommCP |
[自动]
[ARXIV] | 4min | school
AP-OOD:基于注意力池化的分布外检测方法 02-08
OOD检测
注意力机制
注意力池化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-08
LLM
世界模型
词模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-08
世界模型
词模型
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
基于人类反馈的强化学习:原理与应用 02-07
RLHF
强化学习
人类反馈 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型而LLM仅依赖词模型 02-07
世界模型
LLM
词模型 |
[自动]
[ARXIV] | 5min | school
面向运行时智能体记忆的查询感知预算层路由 02-07
Agent
LLM
Memory |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直观物理 02-07
VLM
多模态
具身智能 |
[自动]
[ARXIV] | 3min | school
好奇心即知识:基于主动推理的自一致学习与无悔优化 02-07
主动推理
强化学习
好奇心 |
[自动]
[ARXIV] | 5min | school
共享 LoRA 子空间实现近乎严格的持续学习 02-07
LoRA
持续学习
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:通过伪可逆性提升模型可逆性 02-07
神经网络
伪可逆
SPNN |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式智能体建模 02-07
PhysicsAgentABM
生成式ABM
多主体系统 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-07
DyTopo
多智能体
动态拓扑 |
[自动]
[ARXIV] | 4min | school
CommCP:基于共形预测的LLM通信提升多智能体协调效率 02-07
LLM
Multi-Agent
共形预测 |
[自动]
[ARXIV] | 4min | school
AP-OOD:基于注意力池化的分布外检测方法 02-07
OOD检测
NLP
注意力机制 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:基于多传感器数据生成驾驶场景 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 5min | newspaper
基于人类反馈的强化学习:原理与应用 02-07
RLHF
强化学习
人类反馈 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Waymo 世界模型:利用生成式世界模型提升自动驾驶决策能力 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:自动驾驶场景生成与仿真应用 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:利用生成式世界模拟提升自动驾驶决策 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 7min | newspaper
基于人类反馈的强化学习机制解析 02-07
RLHF
强化学习
人类反馈 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理的可视化解析 02-07
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更难 02-07
LLM
ICL
上下文学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习的难度超出预期 02-07
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络可视化:直观理解深度学习原理 02-07
神经网络
深度学习
可视化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
从上下文学习的难度超出预期 02-07
上下文学习
ICL
LLM |
[自动]
[ARXIV] | 3min | school
面向运行时智能体记忆的查询感知预算分层路由 02-06
Agent
Memory
RAG |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直觉物理 02-06
VLM
直觉物理
强化学习 |
[自动]
[ARXIV] | 3min | school
好奇心即知识:基于主动推理的自一致学习与无遗憾优化 02-06
主动推理
探索与利用
自由能 |
[自动]
[ARXIV] | 3min | school
共享 LoRA 子空间实现近乎严格的持续学习 02-06
LoRA
持续学习
微调 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:兼具可逆性与灵活性的新架构 02-06
神经网络
可逆性
伪逆 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更具挑战性 02-06
LLM
ICL
上下文学习 |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式智能体建模 02-06
PhysicsAgentABM
多智能体系统
ABM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合自动化闭环实验降低无细胞蛋白合成成本40% 02-06
GPT-5
AI for Science
生物科技 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-06
DyTopo
多智能体
动态拓扑 |
[自动]
[ARXIV] | 5min | school
DFlash:基于块扩散的Flash推测解码方法 02-06
LLM
推理加速
推测解码 |
[自动]
[ARXIV] | 4min | school
CommCP:基于LLM通信与共形预测的高效多智能体协调 02-06
LLM
多智能体
具身智能 |
[自动]
[ARXIV] | 5min | school
AP-OOD:基于注意力池化的分布外检测方法 02-06
OOD检测
注意力机制
NLP |
[自动]
[HACKER_NEWS] | 3min | newspaper
上下文学习难度超出原有认知 02-06
上下文学习
ICL
大模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更难 02-06
LLM
上下文学习
ICL |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习的难度超出原有认知 02-06
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理的可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
超网络:用于处理层级数据的神经网络架构 02-06
超网络
层级数据
神经网络架构 |
[自动]
[HACKER_NEWS] | 6min | newspaper
超网络:面向层级数据的神经网络架构 02-06
超网络
Hypernetworks
层级数据 |
[自动]
[ARXIV] | 3min | school
数据块模型中的精确恢复方法 02-06
社区检测
随机块模型
数据块模型 |
[自动]
[ARXIV] | 4min | school
受限群组相对策略优化 02-06
GRPO
强化学习
策略优化 |
[自动]
[ARXIV] | 4min | school
Wedge Sampling:实现近线性样本复杂度的张量补全算法 02-06
张量补全
楔形采样
低秩张量 |
[自动]
[ARXIV] | 5min | school
RRAttention:基于轮询移位的动态块稀疏注意力机制 02-06
RRAttention
稀疏注意力
长上下文 |
[自动]
[ARXIV] | 4min | school
DLM-Scope:利用稀疏自编码器解析扩散语言模型 02-06
DLM
SAE
稀疏自编码器 |
[自动]
[ARXIV] | 3min | school
面向物联网模型适应性的对比持续学习方法 02-06
持续学习
对比学习
物联网 |
[自动]
[ARXIV] | 4min | school
重新思考大模型强化学习中的信任区域机制 02-06
强化学习
LLM
PPO |
[自动]
[ARXIV] | 3min | school
蛋白质自回归建模:基于多尺度结构生成的方案 02-06
蛋白质生成
自回归模型
多尺度建模 |
[自动]
[ARXIV] | 4min | school
强化注意力学习:通过奖励机制优化视觉注意力模型 02-06
强化学习
多模态
注意力机制 |
[自动]
[ARXIV] | 4min | school
多层交叉注意力机制在多模态上下文学习中具有可证明的最优性 02-06
多模态
上下文学习
ICL |
[自动]
[ARXIV] | 5min | school
重新思考大模型强化学习中的信任区域 02-05
RLHF
PPO
强化学习 |
[自动]
[ARXIV] | 3min | school
蛋白质多尺度结构生成的自回归建模方法 02-05
蛋白质生成
自回归模型
多尺度建模 |
[自动]
[ARXIV] | 4min | school
强化注意力学习:基于奖励反馈的注意力机制优化方法 02-05
强化学习
注意力机制
多模态 |
[自动]
[ARXIV] | 3min | school
多层交叉注意力被证明是多模态上下文学习的最优解 02-05
多模态
上下文学习
ICL |
[自动]
[ARXIV] | 5min | school
Multi-Head LatentMoE与Head并行:通信高效且确定性的MoE方案 02-05
MoE
分布式训练
通信优化 |
[自动]
[ARXIV] | 3min | school
面向物联网模型适应性的对比持续学习 02-05
持续学习
对比学习
物联网 |
[自动]
[HACKER_NEWS] | 4min | newspaper
超网络:面向层级数据的神经网络架构 02-05
超网络
层级数据
神经网络架构 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称感知泰勒近似实现恒定Token成本注意力机制 02-05
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 6min | newspaper
对称感知泰勒近似实现恒定Token成本注意力机制 02-05
注意力机制
Transformer
泰勒近似 |
[自动]
[ARXIV] | 4min | school
基于急停干预的鲁棒干预学习 02-05
干预学习
自动驾驶
鲁棒性 |
[自动]
[ARXIV] | 4min | school
加速科学研究:Gemini 案例研究与通用技术 02-05
Gemini
科学研究
数学发现 |
[自动]
[ARXIV] | 4min | school
利用权重更新稀疏性提升分布式强化学习通信效率 02-05
分布式强化学习
通信效率
权重稀疏性 |
[自动]
[ARXIV] | 5min | school
PrevizWhiz:结合粗略3D场景与2D视频引导生成式预演 02-05
AIGC
视频生成
3D场景 |
[自动]
[ARXIV] | 5min | school
PLATE:用于几何感知持续学习的可塑性调谐高效适配器 02-05
持续学习
PLATE
模型适配 |
[自动]
[ARXIV] | 3min | school
Parallel-Probe:通过二维探测实现高效并行思维 02-05
并行推理
思维链
2D Probing |
[自动]
[ARXIV] | 4min | school
AutoFigure:自动生成与润色出版级科学插图 02-05
AutoFigure
FigureBench
科学插图 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称性泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[ARXIV] | 4min | school
利用权重更新稀疏性的通信高效分布式强化学习 02-04
分布式训练
强化学习
通信优化 |
[自动]
[ARXIV] | 4min | school
利用 Gemini 加速科学研究:案例研究与通用技术 02-04
Gemini
科学研究
数学证明 |
[自动]
[ARXIV] | 5min | school
PrevizWhiz:结合粗略3D场景与2D视频引导生成视频预演 02-04
视频生成
3D视觉
PrevizWhiz |
[自动]
[ARXIV] | 4min | school
PLATE:面向几何感知持续学习的可塑性调谐高效适配器 02-04
持续学习
PLATE
高效适配器 |
[自动]
[ARXIV] | 3min | school
Parallel-Probe:通过2D探测实现高效并行思维 02-04
LLM
并行推理
思维链 |
[自动]
[ARXIV] | 4min | school
AutoFigure:自动生成与优化出版级科学插图 02-04
AutoFigure
FigureBench
科学插图 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称性泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 5min | newspaper
基于对称性泰勒近似实现恒定每Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 7min | newspaper
基于对称感知泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 7min | newspaper
基于对称泰勒近似实现恒定Token成本注意力机制 02-04
Attention机制
Taylor近似
线性注意力 |
[自动]
[HACKER_NEWS] | 5min | newspaper
对称感知泰勒近似实现恒定Token成本注意力机制 02-04
Attention机制
Taylor近似
Token成本 |
[自动]
[ARXIV] | 4min | school
面向冲突目标的免奖励对齐方法 02-04
RACO
对齐
多目标优化 |
[自动]
[ARXIV] | 4min | school
通过文本反馈扩展强化学习的能力边界 02-04
强化学习
RLHF
文本反馈 |
[自动]
[ARXIV] | 3min | school
训练LLM采用分治推理提升测试时扩展性 02-04
LLM
推理
强化学习 |
[自动]
[ARXIV] | 4min | school
基于流策略梯度的机器人控制方法 02-04
机器人控制
流匹配
策略梯度 |
[自动]
[ARXIV] | 4min | school
RE-TRAC:面向深度搜索智能体的递归轨迹压缩算法 02-04
Re-TRAC
深度搜索智能体
ReAct |
[自动]
[ARXIV] | 5min | school
PixelGen:像素扩散结合感知损失超越潜在扩散 02-04
PixelGen
扩散模型
计算机视觉 |
[自动]
[ARXIV] | 4min | school
MemSkill:面向自进化代理的记忆技能学习与演化框架 02-04
MemSkill
智能体
Agent |
[自动]
[ARXIV] | 3min | school
MEG-XL:长上下文预训练实现数据高效的脑电转文本 02-04
MEG-XL
脑机接口
脑电转文本 |
[自动]
[ARXIV] | 3min | school
训练LLM采用分治推理提升测试时扩展性 02-03
LLM
推理
强化学习 |
[自动]
[ARXIV] | 4min | school
无奖励对齐技术处理多目标冲突 02-03
RACO
对齐技术
多目标优化 |
[自动]
[ARXIV] | 4min | school
基于流策略梯度的机器人控制方法 02-03
机器人控制
流匹配
策略梯度 |
[自动]
[ARXIV] | 4min | school
基于文本反馈扩展强化学习的能力 02-03
强化学习
RLHF
文本反馈 |
[自动]
[ARXIV] | 4min | school
RLAnything:完全动态强化学习系统构建环境、策略与奖励模型 02-03
强化学习
RL
LLM |
[自动]
[ARXIV] | 4min | school
RE-TRAC:面向深度搜索智能体的递归轨迹压缩方法 02-03
Re-TRAC
深度搜索
智能体 |
[自动]
[ARXIV] | 4min | school
PixelGen:引入感知损失的像素扩散模型性能超越潜在扩散 02-03
PixelGen
扩散模型
计算机视觉 |
[自动]
[ARXIV] | 4min | school
MemSkill:赋予自进化代理学习与演进记忆技能 02-03
MemSkill
智能体
记忆机制 |
[自动]
[ARXIV] | 3min | school
MEG-XL:基于长上下文预训练的高效脑电转文本模型 02-03
MEG-XL
脑机接口
BCI |
[自动]
[HACKER_NEWS] | 3min | newspaper
模型对齐偏差如何随智能水平与任务复杂度演变 02-03
模型对齐
智能水平
任务复杂度 |
[自动]
[HACKER_NEWS] | 4min | newspaper
模型智能与任务复杂度如何影响对齐偏差 02-03
对齐
模型智能
任务复杂度 |
[自动]
[HACKER_NEWS] | 4min | newspaper
模型对齐问题如何随智能水平与任务复杂度演变 02-03
模型对齐
智能水平
任务复杂度 |
[自动]
[HACKER_NEWS] | 3min | newspaper
训练万亿参数模型以生成幽默内容 02-03
LLM
万亿参数
幽默生成 |
[自动]
[ARXIV] | 3min | school
误差分类引导的提示词优化方法 02-03
提示词工程
ETGPO
自动优化 |
[自动]
[HACKER_NEWS] | 3min | newspaper
训练万亿参数模型使其具备幽默感 02-03
LLM
幽默感
万亿参数 |
[自动]
[ARXIV] | 3min | school
研究揭示RLHF如何加剧大模型谄媚行为 02-03
RLHF
谄媚行为
模型偏见 |
[自动]
[ARXIV] | 4min | school
智能体推理与工具使用的竞争:量化干扰与解调优 02-03
智能体
强化学习
工具使用 |
[自动]
[ARXIV] | 3min | school
大语言模型稀疏奖励子系统 02-03
LLM
稀疏奖励
价值神经元 |
[自动]
[ARXIV] | 4min | school
基于预测集的最优决策方法 02-03
预测集
最优决策
决策理论 |
[自动]
[ARXIV] | 4min | school
基于资格推理与分节强化学习的引理可靠利用 02-03
数学推理
引理应用
RULES |
[自动]
[ARXIV] | 4min | school
可扩展随机小波特征:带收敛保证的高效非平稳核近似 02-03
机器学习
非平稳核
小波变换 |
[自动]
[ARXIV] | 3min | school
HERMES:基于视觉语言模型的长尾自动驾驶端到端风险感知系统 02-03
自动驾驶
VLM
长尾场景 |
[自动]
[ARXIV] | 4min | school
DeALOG:基于日志中介的去中心化多智能体推理框架 02-03
Multi-Agent
去中心化
日志中介 |
[自动]
[ARXIV] | 3min | school
粒子引导扩散模型用于偏微分方程求解 02-03
扩散模型
PDE求解
物理引导 |
[自动]
[ARXIV] | 4min | school
函数空间逆问题的解耦扩散采样方法 02-03
扩散模型
逆问题
PDE |
[自动]
[ARXIV] | 4min | school
共享 autonomy 范式下信念与策略学习的端到端优化 02-03
共享自主
BRACE
端到端优化 |
[自动]
[ARXIV] | 3min | school
VideoGPA:提取几何先验实现三维一致性视频生成 02-03
VideoGPA
视频生成
3D一致性 |
[自动]
[ARXIV] | 4min | school
UPA:基于树搜索与筛选的无监督提示代理 02-03
Prompt优化
UPA
无监督学习 |
[自动]
[ARXIV] | 5min | school
TEON:张量化正交化方法优化大语言模型预训练 02-03
TEON
优化器
预训练 |
[自动]
[ARXIV] | 5min | school
PaperBanana:面向AI科研人员的学术绘图自动化工具 02-03
PaperBanana
学术绘图
智能体框架 |
[自动]
[ARXIV] | 4min | school
FOCUS:DLLMs 如何突破算力瓶颈 02-03
DLLMs
扩散模型
推理加速 |
[自动]
[ARXIV] | 3min | school
粒子引导扩散模型求解偏微分方程 02-02
扩散模型
偏微分方程
PDE |
[自动]
[ARXIV] | 4min | school
函数空间逆问题的解耦扩散采样方法 02-02
扩散模型
逆问题
PDE |
[自动]
[ARXIV] | 4min | school
共享自治系统中信念与策略学习的端到端优化 02-02
共享自治
BRACE
贝叶斯推断 |
[自动]
[ARXIV] | 5min | school
VideoGPA:提取几何先验实现三维一致视频生成 02-02
视频生成
3D一致性
扩散模型 |
[自动]
[ARXIV] | 4min | school
UPA:基于树搜索与筛选的无监督提示智能体 02-02
Prompt优化
LLM智能体
无监督学习 |
[自动]
[ARXIV] | 5min | school
TEON:张量化正交化技术优化大语言模型预训练 02-02
TEON
优化器
Muon |
[自动]
[ARXIV] | 4min | school
IRL-DAL:基于能量引导扩散模型的自动驾驶安全自适应轨迹规划 02-02
自动驾驶
扩散模型
逆向强化学习 |
[自动]
[ARXIV] | 4min | school
FOCUS:DLLMs如何突破算力瓶颈 02-02
DLLMs
扩散模型
算力优化 |
[自动]
[ARXIV] | 3min | school
基于输出监督学习的思维链混淆技术可泛化至未见任务 02-02
思维链
CoT
输出监督 |
[自动]
[ARXIV] | 4min | school
SplineFlow:基于B样条插值的动力系统流匹配方法 02-02
流匹配
SplineFlow
B样条 |
[自动]
[ARXIV] | 4min | school
RN-D:基于正则化网络的离散分类演员与同策强化学习 02-02
强化学习
RL
连续控制 |
[自动]
[ARXIV] | 4min | school
OrLog:结合大模型与概率推理解决复杂查询 02-02
神经符号AI
概率推理
复杂查询 |
[自动]
[ARXIV] | 4min | school
ExplainerPFN:面向表格数据的无模型零样本特征重要性估计 02-02
ExplainerPFN
TabPFN
表格数据 |
[自动]
[ARXIV] | 4min | school
CATTO:平衡语言模型偏好与置信度的方法 02-02
LLM
CATTO
校准 |
[自动]
[HACKER_NEWS] | 7min | newspaper
迈向智能体系统规模化科学:探究其生效机制与适用场景 02-02
智能体
Agent系统
规模化 |
[自动]
[ARXIV] | 3min | school
神经网络转逻辑流以优化边缘计算性能 02-02
边缘计算
神经网络
逻辑流 |
[自动]
[ARXIV] | 6min | school
混合线性注意力新架构:高效蒸馏与超长上下文处理 02-02
HALO
HypeNet
混合架构 |
[自动]
[ARXIV] | 4min | school
推理大语言模型从被动求解到主动提问的转变 02-02
推理
CoT
主动交互 |
[自动]
[ARXIV] | 4min | school
探索面向智能体的推理奖励模型 02-02
Agentic RL
Reward Model
推理奖励 |
[自动]
[ARXIV] | 4min | school
UEval:统一多模态生成基准 02-02
UEval
多模态
基准测试 |
[自动]
[ARXIV] | 3min | school
Routing the Lottery: 面向异构数据的自适应子网络路由 02-02
模型剪枝
彩票假设
异构数据 |
[自动]
[ARXIV] | 4min | school
DynaWeb:基于模型的强化学习网页智能体 02-02
DynaWeb
Web Agent
强化学习 |
[自动]
[ARXIV] | 4min | school
神经网络转逻辑流以优化边缘计算性能 02-01
边缘计算
神经网络
模型优化 |
[自动]
[ARXIV] | 4min | school
混合线性注意力新架构:高效蒸馏与超长上下文处理 02-01
Transformer
混合架构
线性注意力 |
[自动]
[ARXIV] | 3min | school
推理大语言模型从被动求解转向主动询问 02-01
推理
交互式推理
PIR |
[自动]
[ARXIV] | 4min | school
探索面向智能体的推理奖励模型 02-01
Agent
RLHF
奖励模型 |
[自动]
[ARXIV] | 4min | school
UEval:统一多模态生成基准评测 02-01
UEval
多模态
基准评测 |
[自动]
[ARXIV] | 4min | school
Routing the Lottery:面向异型数据的自适应子网络 02-01
模型剪枝
彩票假说
自适应路由 |
[自动]
[ARXIV] | 5min | school
DynaWeb:基于模型的强化学习网页智能体 02-01
DynaWeb
Web Agent
强化学习 |
2026年一月
119 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
面向异构数据的自适应子网络路由方法 01-31
模型剪枝
异构数据
自适应子网络 |
[自动]
[ARXIV] | 4min | school
神经网络转逻辑流以优化边缘计算性能 01-31
边缘计算
神经网络
逻辑流 |
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与超长上下文建模 01-31
线性注意力
长上下文
混合架构 |
[自动]
[ARXIV] | 4min | school
推理大语言模型从被动求解转向主动询问 01-31
LLM
推理模型
主动询问 |
[自动]
[ARXIV] | 5min | school
探索面向智能体的推理奖励模型 01-31
Agent
强化学习
奖励模型 |
[自动]
[ARXIV] | 4min | school
发现模型仓库中的隐藏价值 01-31
模型评估
Llama
多臂老虎机 |
[自动]
[ARXIV] | 4min | school
UEval:统一多模态生成基准 01-31
多模态
UEval
基准测试 |
[自动]
[ARXIV] | 5min | school
DynaWeb:基于模型的强化学习网页智能体框架 01-31
DynaWeb
Web Agent
强化学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi k2.5 技术报告发布:长上下文与推理能力详解 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
技术报告
模型架构 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:模型架构与训练细节 01-31
Kimi K2.5
Moonshot AI
技术报告 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:架构与性能细节 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
Moonshot AI
技术报告 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:长上下文与多模态推理能力详解 01-31
Kimi K2.5
技术报告
长上下文 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi k2.5 技术报告发布 01-31
Kimi
K2.5
技术报告 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 7min | newspaper
月之暗面发布 Kimi k2.5 技术报告 01-31
月之暗面
Kimi
K2.5 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
Moonshot AI
技术报告 |
[自动]
[ARXIV] | 4min | school
面向异构数据的自适应子网络路由机制 01-30
模型剪枝
异构数据
子网络 |
[自动]
[ARXIV] | 4min | school
神经网络转逻辑流以优化边缘计算 01-30
边缘计算
神经网络
模型优化 |
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与极长上下文处理 01-30
HALO
HypeNet
长上下文 |
[自动]
[ARXIV] | 3min | school
推理大模型从被动求解转向主动提问 01-30
推理模型
主动交互
思维链 |
[自动]
[ARXIV] | 4min | school
探索面向智能体的推理奖励模型 01-30
Agent
强化学习
推理奖励模型 |
[自动]
[ARXIV] | 3min | school
发现模型仓库中被忽视的高质量模型 01-30
模型评估
Llama-3.1
微调 |
[自动]
[ARXIV] | 3min | school
UEval:统一多模态生成基准 01-30
UEval
多模态
统一模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:强化学习与长上下文能力升级 01-30
Kimi
K2.5
强化学习 |
[自动]
[ARXIV] | 4min | school
FineInstructions:将合成指令数据扩展至预训练规模 01-30
LLM
预训练
指令微调 |
[自动]
[ARXIV] | 4min | school
DynaWeb:基于模型的强化学习网页智能体 01-30
DynaWeb
Web Agent
强化学习 |
[自动]
[HACKER_NEWS] | 7min | newspaper
月之暗面发布Kimi K2.5技术报告 01-30
Kimi
K2.5
月之暗面 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-30
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 6min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-30
Kimi K2.5
技术报告
长上下文 |
[自动]
[ARXIV] | 4min | school
面向文本检索器域适应的影响引导采样方法 01-30
文本检索
域适应
密集检索 |
[自动]
[ARXIV] | 3min | school
面向大语言模型的时间引导机制 01-30
LLM
对比解码
时间引导 |
[自动]
[ARXIV] | 3min | school
基于认知上下文学习构建大模型多智能体系统的信任机制 01-30
多智能体
信任机制
ECL |
[自动]
[ARXIV] | 3min | school
基于经验的试错算法超越语言模型 01-30
LLM
SCOUT
探索与利用 |
[自动]
[ARXIV] | 6min | school
为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理 01-30
Adam优化器
梯度尺度不变性
深度学习 |
[自动]
[ARXIV] | 4min | school
FISMO:基于Fisher结构的动量正交化优化器 01-30
FISMO
优化器
深度学习 |
[自动]
[ARXIV] | 3min | school
进化策略导致大语言模型出现灾难性遗忘 01-30
进化策略
灾难性遗忘
持续学习 |
[自动]
[ARXIV] | 4min | school
机器翻译评估中的跨向污染问题研究 01-30
机器翻译
数据污染
FLORES-200 |
[自动]
[ARXIV] | 4min | school
探索Transformer在表格数据变分自编码器中的位置 01-30
Transformer
VAE
表格数据 |
[自动]
[ARXIV] | 4min | school
SokoBench:评估大模型长周期规划与推理能力 01-30
SokoBench
长周期规划
推理能力 |
[自动]
[ARXIV] | 4min | school
R^{2k}维度理论上足以支持基于嵌入的Top-k检索 01-30
向量检索
嵌入维度
Top-k检索 |
[自动]
[ARXIV] | 3min | school
PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型 01-30
时间序列
PatchFormer
零样本预测 |
[自动]
[ARXIV] | 4min | school
Deep Researcher:结合序列规划反思与候选交叉的深度研究框架 01-30
Deep Researcher
AI Agent
智能体架构 |
[自动]
[ARXIV] | 4min | school
C3Box:基于CLIP的类增量学习工具箱 01-30
CLIP
类增量学习
CIL |
[自动]
[ARXIV] | 4min | school
进化策略导致大语言模型出现灾难性遗忘 01-29
进化策略
灾难性遗忘
持续学习 |
[自动]
[ARXIV] | 3min | school
机器翻译评估中的跨向污染问题研究 01-29
机器翻译
数据污染
FLORES |
[自动]
[ARXIV] | 4min | school
探索Transformer在表格数据变分自编码器中的位置 01-29
Transformer
VAE
表格数据 |
[自动]
[ARXIV] | 3min | school
基于嵌入的Top-$k$检索:理论上$\mathbb{R}^{2k}$维空间已足够 01-29
向量检索
嵌入
Top-k |
[自动]
[ARXIV] | 4min | school
后训练公平性控制:推荐系统动态公平性单训练框架 01-29
推荐系统
公平性
Cofair |
[自动]
[ARXIV] | 4min | school
SokoBench:评估大模型长程规划与推理能力 01-29
SokoBench
长程规划
推理能力 |
[自动]
[ARXIV] | 5min | school
PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型 01-29
时序预测
PatchFormer
零样本学习 |
[自动]
[ARXIV] | 3min | school
Deep Researcher:序列规划反思与候选交叉 01-29
Deep Researcher
AI Agent
反思机制 |
[自动]
[ARXIV] | 4min | school
C3Box:基于CLIP的类增量学习工具箱 01-29
CLIP
增量学习
CIL |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Alyah:评估阿拉伯语大模型阿联酋方言能力 01-29
LLM
阿拉伯语
方言评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Alyah:评估阿拉伯语大模型阿联酋方言能力 01-29
LLM
模型评估
阿拉伯语 |
[自动]
[ARXIV] | 4min | school
🧠RHSIA!非理想颅内动脉瘤实时血流替代技术,精准高效! 01-28
RHSIA
血流动力学
颅内动脉瘤 |
[自动]
[ARXIV] | 4min | school
无需真值!🔥颠覆性校准技术来了!🤯 01-28
模型校准
无监督学习
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Alyah ⭐️:阿拉伯语LLM方言鲁棒性评估!🔥 01-28
LLM
阿拉伯语
方言评估 |
[自动]
[ARXIV] | 4min | school
🚀低资源机器翻译的救星!结构化自反思引领新突破✨ 01-28
机器翻译
低资源语言
自反思 |
[自动]
[ARXIV] | 5min | school
🚀SONIC: 颠覆频谱学习!神经网络不变性卷积的终极突破? 01-28
SONIC
频谱学习
神经网络 |
[自动]
[ARXIV] | 4min | school
🔥肿瘤会诊新革命!LLM系统Oncotimia惊艳亮相! 01-28
LLM
RAG
医疗AI |
[自动]
[ARXIV] | 4min | school
🔥动态环境下的对抗约束:Bandits算法如何应对未知挑战? 01-28
Bandits
对抗约束
动态环境 |
[自动]
[ARXIV] | 6min | school
🔥Post-LayerNorm强势回归!稳定、高效、深度训练的新神器! 01-28
Transformer
Post-LayerNorm
Keel |
[自动]
[ARXIV] | 5min | school
🌍 M-SGWR: 多尺度相似+地理加权回归!空间建模神器🚀 01-28
M-SGWR
地理加权回归
空间建模 |
[自动]
[ARXIV] | 5min | school
✨告别遗忘!Self-Distillation解锁持续学习新范式! 01-28
持续学习
Self-Distillation
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
MEG情绪分析新突破!🔬脑数据标注+情感计算,解锁大脑密码!🧠✨ 01-28
MEG
情绪分析
脑机接口 |
[自动]
[ARXIV] | 4min | school
🚀复用FLOPs!RL突破性扩展:超离策略前缀如何解决硬难题? 01-28
强化学习
RL
LLM |
[自动]
[ARXIV] | 4min | school
🔥模型自学革命!突破可学习性边界,推理能力暴涨! 01-28
SOAR
强化学习
推理能力 |
[自动]
[ARXIV] | 5min | school
🔥POPE:利用特权探索破解硬核难题! 01-28
POPE
强化学习
LLM |
[自动]
[ARXIV] | 5min | school
💥无需标注!基于核变化点检测的无监督文本分割! 01-28
文本分割
无监督学习
核方法 |
[自动]
[ARXIV] | 4min | school
🌍 242种语言大比拼!Wikipedia数据揭秘跨语言比较语言学新突破! 01-28
比较语言学
BPE
多语言 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🇦🇪 Alyah ⭐️:揭秘阿拉伯LLM方言鲁棒评估! 01-28
LLM
阿拉伯语
方言评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
阿联酋方言评测新突破!Alyah让阿拉伯语大模型更鲁棒🚀 01-27
Alyah
阿拉伯语
方言评测 |
[自动]
[ARXIV] | 4min | school
突破极限!AI如何教会自己推理?🤯 边缘学习性的惊天秘密!🚀 01-27
SOAR
强化学习
元学习 |
[自动]
[ARXIV] | 5min | school
ctELM:用LLM解码临床试验嵌入!解锁临床新价值🔥 01-27
ctELM
临床试验
嵌入语言模型 |
[自动]
[ARXIV] | 5min | school
🚀RL新突破!复用FLOPs,硬难题上通过离线前缀扩展 01-27
PrefixRL
强化学习
LLM |
[自动]
[ARXIV] | 4min | school
🔥无需标注!核变点检测+句嵌入实现超强文本分割🚀 01-27
文本分割
无监督学习
句嵌入 |
[自动]
[ARXIV] | 4min | school
🔥POPE:用特权探索让AI学会解决复杂难题! 01-27
强化学习
LLM
推理能力 |
[自动]
[ARXIV] | 4min | school
🔍脑电+情感=超强分析!MEG数据解锁情绪新维度 01-27
MEG
情感分析
脑机接口 |
[自动]
[HACKER_NEWS] | 2min | newspaper
🔥两个扭曲形状竟解开百年拓扑谜题?🧩 01-27
拓扑学
海伍德猜想
数学 |
[自动]
[HACKER_NEWS] | 2min | newspaper
数学、物理、生物的万能模式!🧪🧬2013年震撼发现 01-27
本福德定律
统计学
幂律分布 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
⭐️Alyah:阿联酋方言能力评估!阿拉伯语LLM新突破! 01-27
LLM
阿拉伯语
方言评估 |
[自动]
[HACKER_NEWS] | 2min | newspaper
🔥 跨越数理化生!这个万能模式正在颠覆科学界!🤯 01-27
Scaling Laws
异速生长
复杂系统 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🧠炸裂!Gemini Flash在俄罗斯大战Opus胜率66%!🚀 01-27
Gemini Flash
Claude Opus
TetrisBench |
[自动]
[HACKER_NEWS] | 3min | newspaper
阿里Qwen3-Max-Thinking深度思考模型!震撼发布🔥 01-27
Qwen3
通义千问
深度思考 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AssetOpsBench:填补AI基准与工业现实的鸿沟!🤖🏭🚀 01-27
AssetOpsBench
AI Agent
LLM |
[自动]
[ARXIV] | 5min | school
🚀BONO-Bench:可追溯Pareto集的双目标优化基准测试! 01-27
多目标优化
基准测试
Pareto集 |
[自动]
[ARXIV] | 5min | school
🚀AnyView:动态场景任意新视角合成!开创性技术突破🔥 01-27
计算机视觉
视频生成
扩散模型 |
[自动]
[ARXIV] | 5min | school
🔥自回归+掩码扩散!下一代生成模型架构强势登场! 01-27
扩散模型
自回归
语言建模 |
[自动]
[ARXIV] | 6min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量! 01-27
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 6min | school
🔥LLM序列标注新突破!揭秘高效策略,性能飙升! 01-27
LLM
序列标注
NLP |
[自动]
[ARXIV] | 5min | school
🌍Spatial-Agent:科学核心驱动的智能地理空间推理!🚀 01-27
Spatial-Agent
Agent
地理空间推理 |
[自动]
[HACKER_NEWS] | 4min | newspaper
⚡️俄罗斯方块爆杀Opus!Gemini Flash胜率66%震撼实测🎮 01-27
LLM
Gemini Flash
Claude Opus |
[自动]
[ARXIV] | 6min | school
⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成!🔥 01-27
分子生成
SE(3)
等变模型 |
[自动]
[HACKER_NEWS] | 3min | newspaper
震惊!Gemini Flash击败Opus!🎮Tetris胜率66%🚀 01-27
LLM
Gemini Flash
Claude 3 Opus |
[自动]
[ARXIV] | 4min | school
🧬重磅!基于SE(3)流的刚体模态3D分子生成! 01-26
3D分子生成
SE(3)流
刚体模态 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AssetOpsBench:打破AI Agent评测与工业现实的壁垒!🚀 01-26
AI Agent
AssetOpsBench
工业智能 |
[自动]
[ARXIV] | 5min | school
🚀动态场景新视角合成!AnyView实现任意视角自由切换!🤯 01-26
动态场景
新视角合成
扩散模型 |
[自动]
[ARXIV] | 5min | school
🚀 自回归+掩码扩散:下一代生成式AI!🔥 01-26
扩散模型
自回归
生成式AI |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔥Qwen3-Max-Thinking!深度推理颠覆想象! 01-26
Qwen
通义千问
深度推理 |
[自动]
[ARXIV] | 5min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀 01-26
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 5min | school
🔥LLM序列标注新策略!突破性能天花板🚀 01-26
LLM
序列标注
NER |
[自动]
[ARXIV] | 3min | school
🔥IoT攻击数据生成神器!Latent Diffusion让入侵检测更准! 01-26
LDM
潜在扩散模型
物联网 |
[自动]
[ARXIV] | 6min | school
🔥BONO-Bench震撼发布!首套可追溯Pareto集的双目标优化基准测试! 01-26
BONO-Bench
双目标优化
Pareto集 |
[自动]
[ARXIV] | 5min | school
🌍 Spatial-Agent:具科学核心的智能体地理空间推理! 01-26
Spatial-Agent
地理空间推理
GeoFlow Graphs |
[自动]
[HACKER_NEWS] | 2min | newspaper
🧠科学家揭秘定义“你”边界的脑电波!灵魂的物理证据? 01-26
脑科学
神经科学
脑电波 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔍 深度拆解:AI伪造数学证明的惊人真相!🚀 01-26
LLM
幻觉
数学证明 |
[自动]
[HACKER_NEWS] | 2min | newspaper
🧠揭秘“你”的边界!科学家发现定义“自我”的关键脑波🚀 01-26
脑科学
自我意识
神经科学 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🤖AI竟伪造数学证明?深扒“创意数学”背后的惊人真相! 01-26
AI
数学证明
形式化验证 |
[自动]
[ARXIV] | 6min | school
🤖抽屉打不开?揭秘零样本组合动作识别中的“物体捷径”! 01-25
计算机视觉
零样本学习
动作识别 |
[自动]
[ARXIV] | 4min | school
🤖反事实训练!让模型学会靠谱又可落地的解释! 01-25
反事实训练
模型解释性
可解释AI |
[自动]
[ARXIV] | 7min | school
高效定理证明新突破!结构化提示实现少样本学习 🚀 01-25
定理证明
Lean
DeepSeek-Prover |
[自动]
[ARXIV] | 3min | school
超越预测不确定性!🚀结构约束下的可靠表征学习!🔥 01-25
表征学习
不确定性
结构约束 |
[自动]
[ARXIV] | 4min | school
测试时也能发现新规律?🤯AI解锁动态学习能力! 01-25
TTT-Discover
测试时训练
强化学习 |
[自动]
[ARXIV] | 5min | school
Cosmos重磅:微调视频模型!解锁 visuomotor 控制与规划 🚀✨ 01-25
Cosmos
机器人
视觉运动控制 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AssetOpsBench:连接AI测评与工业现实!填补鸿沟🚀 01-25
AssetOpsBench
AI Agent
工业运维 |
[自动]
[ARXIV] | 5min | school
🚀沙盒机制唤醒LLM智能体通用能力!AI Agent突破性架构! 01-25
LLM
AI Agent
沙盒机制 |
[自动]
[ARXIV] | 5min | school
🔥PyraTok!视频生成神器:语言对齐金字塔Tokenizer震撼来袭! 01-25
PyraTok
视频生成
视频理解 |
无匹配条目