目录
论文
条目:700
2026年三月
10 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
面向硬件加速器的运行时可重构多精度量化乘法按位脉动阵列架构 03-01
硬件加速器
脉动阵列
量化 |
[自动]
[ARXIV] | 4min | school
通过锚定机制实现模型一致性 03-01
模型一致性
锚定机制
cs.LG |
[自动]
[ARXIV] | 4min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 03-01
VLM
视觉语言模型
报告偏差 |
[自动]
[ARXIV] | 3min | school
理解AI科研工具使用行为:Asta交互数据集 03-01
AI科研工具
Asta数据集
用户行为分析 |
[自动]
[ARXIV] | 3min | school
基于单纯形投影的可微零一损失函数 03-01
损失函数
0-1损失
可微性 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 03-01
多模态
视觉语言模型
最优传输 |
[自动]
[ARXIV] | 5min | school
SeeThrough3D:文本生成图像中的遮挡感知3D控制 03-01
SeeThrough3D
文本生成图像
T2I |
[自动]
[ARXIV] | 4min | school
1MB数据集足以训练模型:小样本学习新范式 03-01
PLADA
小样本学习
数据蒸馏 |
[自动]
[HACKER_NEWS] | 4min | newspaper
构建极简Transformer模型实现十位数加法运算 03-01
Transformer
算法推理
算术运算 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic模型蒸馏与SWE-Bench失效机制分析 03-01
Anthropic
模型蒸馏
SWE-Bench |
2026年二月
571 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 02-28
VLM
视觉语言模型
报告偏差 |
[自动]
[JUEJIN] | 1min | sticky_note_2
深度学习通用逼近定理:神经网络的理论基础与核心原理 02-28
深度学习
神经网络
通用逼近定理 |
[自动]
[ARXIV] | 4min | school
数据集压缩至1MB:模型训练效率优化方法 02-28
数据集蒸馏
PLADA
模型训练 |
[自动]
[ARXIV] | 3min | school
基于锚点机制实现模型一致性 02-28
模型一致性
锚点机制
模型不一致性 |
[自动]
[ARXIV] | 4min | school
基于超单纯形投影的可微零一损失函数 02-28
0-1损失
可微损失
超单纯形 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-28
多模态
视觉语言模型
最优传输 |
[自动]
[ARXIV] | 4min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 02-28
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[ARXIV] | 4min | school
Asta交互数据集:解析AI科研工具的使用模式与用户参与度 02-28
Asta数据集
AI科研工具
用户行为分析 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AIE Europe与World’s Fair论文提交今日截止 02-28
AIE Europe
AIE World's Fair
CAIS |
[自动]
[HACKER_NEWS] | 4min | newspaper
最小Transformer模型实现两位数加法运算 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 7min | newspaper
能对齐十位数加法运算的最小 Transformer 模型 02-28
Transformer
算法可解释性
算术运算 |
[自动]
[HACKER_NEWS] | 6min | newspaper
能对齐十位数加法运算的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 5min | newspaper
能计算两个10位数加法的最小Transformer模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 4min | newspaper
能计算两位十进制数相加的最小 Transformer 模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 6min | newspaper
能对齐十位数加法的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[HACKER_NEWS] | 6min | newspaper
能计算两个10位数加法的最小Transformer模型 02-28
Transformer
算法推理
算术运算 |
[自动]
[HACKER_NEWS] | 6min | newspaper
能对齐十位数加法运算的最小Transformer模型 02-28
Transformer
算法
算术 |
[自动]
[ARXIV] | 3min | school
通过锚定机制提升模型一致性 02-27
模型一致性
锚定机制
模型差异 |
[自动]
[ARXIV] | 4min | school
规模难以克服语用学:报告偏差对视觉语言推理的影响 02-27
VLM
视觉语言模型
报告偏差 |
[自动]
[ARXIV] | 3min | school
数据集压缩至1MB:小规模数据集的模型训练效果评估 02-27
PLADA
数据集压缩
伪标签 |
[自动]
[ARXIV] | 3min | school
基于超单纯形投影的可微零一损失函数 02-27
机器学习
损失函数
0-1损失 |
[自动]
[ARXIV] | 4min | school
基于Asta数据集的AI科研工具使用与交互行为分析 02-27
Asta数据集
AI科研工具
用户行为分析 |
[自动]
[ARXIV] | 4min | school
SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐 02-27
多模态
视觉语言模型
最优传输 |
[自动]
[ARXIV] | 5min | school
SeeThrough3D:文本生成图像中的遮挡感知三维控制 02-27
SeeThrough3D
文本生成图像
3D控制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
METR Joel Becker谈指数级时间评估与AI生产力局限 02-27
METR
Joel Becker
指数级评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer中的混合专家模型架构解析 02-27
Transformer
MoE
混合专家 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 与太平洋西北国家实验室推基准测试,加速联邦许可流程 02-27
OpenAI
基准测试
AI 编程代理 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Anthropic 模型蒸馏与 SWE-Bench 失效机制分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[GITHUB_TRENDING] | 12min | hub
动手学深度学习:面向中文读者的可运行教材 02-27
深度学习
D2L
PyTorch |
[自动]
[ARXIV] | 5min | school
面向高效高分辨率GUI智能体的时空令牌剪枝 02-27
GUI Agent
Token Pruning
Qwen2-VL |
[自动]
[ARXIV] | 4min | school
面向低延迟口语对话的语篇感知双流响应生成 02-27
DDTSR
低延迟
口语对话 |
[自动]
[ARXIV] | 2min | school
缓解可读性代价:基于解耦证明者-验证者博弈的方法 02-27
LLM
可解释性
模型评估 |
[自动]
[ARXIV] | 4min | school
无模型通用AI框架 02-27
通用人工智能
强化学习
无模型 |
[自动]
[ARXIV] | 3min | school
基于优化的系统为何难以实现规范响应:代理与架构限制 02-27
RLHF
AI对齐
智能体 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Transformer架构中的混合专家模型原理与应用 02-27
Transformer
MoE
混合专家模型 |
[自动]
[ARXIV] | 4min | school
ReCoN-Ipsundrum:具备情感耦合控制与机制关联意识指标的可检查循环持久代理 02-27
ReCoN-Ipsundrum
机器意识
AI Agent |
[自动]
[ARXIV] | 4min | school
MovieTeller:工具增强且ID一致的渐进式摘要生成 02-27
MovieTeller
视频摘要
VLM |
[自动]
[ARXIV] | 4min | school
提升推理语言模型的参数化知识获取能力 02-27
LLM
推理模型
参数化知识 |
[自动]
[ARXIV] | 3min | school
LiCQA:轻量级复杂问答系统 02-27
LiCQA
复杂问答
QA系统 |
[自动]
[ARXIV] | 5min | school
GUI-Libra:动作感知监督与可验证强化学习的原生GUI智能体 02-27
GUI Agent
强化学习
RL |
[自动]
[ARXIV] | 4min | school
DySCO:面向长上下文大模型的动态注意力缩放解码方法 02-27
DySCO
长上下文
解码算法 |
[自动]
[ARXIV] | 4min | school
提升推理语言模型的参数化知识访问能力 02-26
推理模型
参数化知识
强化学习 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer 架构中的混合专家模型原理与优势 02-26
MoE
Transformer
混合专家 |
[自动]
[ARXIV] | 4min | school
LiCQA:面向复杂问答的轻量级系统 02-26
LiCQA
复杂问答
轻量级系统 |
[自动]
[ARXIV] | 4min | school
DySCO:面向长上下文大模型的动态注意力缩放解码 02-26
DySCO
长上下文
注意力机制 |
[自动]
[HACKER_NEWS] | 4min | newspaper
用概念代数引导可解释的语言模型 02-26
可解释性
概念代数
模型控制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer中的混合专家模型:架构原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
MoE
Transformer
混合专家模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Transformer架构中的混合专家模型原理与应用 02-26
Transformer
MoE
混合专家模型 |
[自动]
[HACKER_NEWS] | 7min | newspaper
PA基准:评估Web智能体在真实个人助理工作流中的表现 02-26
Web智能体
PA基准
个人助理 |
[自动]
[JUEJIN] | 2min | sticky_note_2
空洞卷积原理:如何解决计算机视觉的精度与视野矛盾 02-26
空洞卷积
计算机视觉
深度学习 |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型非线性变换解析:从MLP到MoE的架构演进 02-26
非线性变换
MLP
MoE |
[自动]
[HACKER_NEWS] | 6min | newspaper
PA基准:评估Web智能体在真实个人助理工作流中的表现 02-26
Web智能体
PA基准
个人助理 |
[自动]
[ARXIV] | 5min | school
用于Wasserstein测地线与最优传输动力学的神经求解器 02-26
最优传输
Wasserstein
神经网络 |
[自动]
[ARXIV] | 4min | school
函数空间经验贝叶斯正则化:基于t分布先验 02-26
贝叶斯深度学习
函数空间
经验贝叶斯 |
[自动]
[ARXIV] | 4min | school
TG-ASR:基于并行门控交叉注意力的翻译引导低资源语音识别 02-26
ASR
语音识别
低资源学习 |
[自动]
[ARXIV] | 4min | school
CxMP:评估语言模型构式理解的语言学最小对子基准 02-26
CxMP
构式语法
最小对子 |
[自动]
[ARXIV] | 3min | school
扩散对偶性第二章:Ψ采样器与高效课程 02-26
扩散模型
离散扩散
Psi采样器 |
[自动]
[ARXIV] | 4min | school
平滑无关学习统计查询复杂度下界 02-26
计算复杂度
统计查询
SQ下界 |
[自动]
[ARXIV] | 4min | school
基于试错学习的反思式测试时规划:用于具身大模型 02-26
具身智能
反思机制
测试时规划 |
[自动]
[ARXIV] | 5min | school
任意模态下的多向量索引压缩方法 02-26
多向量索引
模态压缩
Late Interaction |
[自动]
[ARXIV] | 5min | school
为何LLM后训练中Pass@k优化会降低Pass@1性能 02-26
LLM
后训练
Pass@k |
[自动]
[ARXIV] | 4min | school
Test-Time训练结合KV绑定等价于线性注意力 02-26
TTT
线性注意力
KV绑定 |
[自动]
[ARXIV] | 4min | school
Squint:面向机器人虚实迁移的快速视觉强化学习 02-26
强化学习
机器人
Sim-to-Real |
[自动]
[ARXIV] | 4min | school
Aletheia自主攻克FirstProof数学定理 02-26
Aletheia
Gemini 3
数学定理 |
[自动]
[ARXIV] | 4min | school
针对平滑对抗学习的统计查询下界研究 02-25
统计查询
计算复杂性
对抗学习 |
[自动]
[ARXIV] | 4min | school
扩散对偶性第二章:Ψ采样器与高效课程 02-25
扩散模型
离散扩散
采样器 |
[自动]
[ARXIV] | 6min | school
多模态任意向量索引压缩技术 02-25
向量检索
多模态
索引压缩 |
[自动]
[ARXIV] | 4min | school
基于试错反思的具身大模型测试时规划 02-25
具身智能
反思机制
测试时规划 |
[自动]
[ARXIV] | 5min | school
为何Pass@k优化会降低Pass@1:大模型后训练中的提示干扰 02-25
LLM
后训练
代码生成 |
[自动]
[ARXIV] | 4min | school
Squint:面向机器人具身迁移的快速视觉强化学习 02-25
强化学习
机器人
Sim-to-Real |
[自动]
[ARXIV] | 4min | school
KV绑定测试时训练等价于线性注意力 02-25
TTT
线性注意力
KV缓存 |
[自动]
[ARXIV] | 4min | school
Aletheia模型自主攻克FirstProof数学定理证明 02-25
Aletheia
FirstProof
数学定理证明 |
[自动]
[HACKER_NEWS] | 4min | newspaper
PA Bench:评估前沿模型多标签页任务能力 02-25
PA Bench
多标签页
模型评估 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
Diffusion Model |
[自动]
[HACKER_NEWS] | 4min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
Diffusion Model |
[自动]
[HACKER_NEWS] | 5min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
Diffusion Model |
[自动]
[HACKER_NEWS] | 4min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Mercury 2:基于扩散模型的快速推理大语言模型 02-25
Mercury 2
扩散模型
推理加速 |
[自动]
[ARXIV] | 3min | school
超越星级评分:基于LLM与文本分类的细粒度情感分析框架 02-25
LLM
情感分析
ABSA |
[自动]
[ARXIV] | 4min | school
离线强化学习:面向离动力学环境的局部动力学感知域适应 02-25
离线强化学习
LoDADA
域适应 |
[自动]
[ARXIV] | 3min | school
工具构建:通往高级智能的路径 02-25
LLM
超级智能
工具构建 |
[自动]
[ARXIV] | 3min | school
动机优化:提升大语言模型任务表现的关键机制 02-25
动机优化
训练范式
情感神经科学 |
[自动]
[ARXIV] | 4min | school
VAUQ:面向LVLM自评估的视觉感知不确定性量化 02-25
LVLM
多模态
不确定性量化 |
[自动]
[ARXIV] | 4min | school
ProxyFL:面向联邦半监督学习的代理引导框架 02-25
联邦学习
半监督学习
FSSL |
[自动]
[ARXIV] | 5min | school
DeepSpeed图像工作负载评测:视觉Transformer扩展性能 02-25
DeepSpeed
ViT
视觉Transformer |
[自动]
[ARXIV] | 4min | school
非单调损失函数的共形风险控制方法 02-25
非单调损失
保序风险控制
共形预测 |
[自动]
[ARXIV] | 4min | school
部分可观测平均场博弈的循环结构策略梯度算法 02-25
平均场博弈
MFG
策略梯度 |
[自动]
[ARXIV] | 4min | school
行为学习:从数据中学习分层优化结构 02-25
行为学习
分层优化
可解释性 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Mercury 2:基于扩散模型的最快推理 LLM 02-25
Mercury 2
扩散模型
推理模型 |
[自动]
[ARXIV] | 4min | school
JUCAL:分类任务中偶然与认知不确定性的联合校准 02-25
不确定性校准
JUCAL
偶然不确定性 |
[自动]
[ARXIV] | 4min | school
面向大规模视频推理的综合基准测试套件 02-24
视频推理
VBVR
基准测试 |
[自动]
[ARXIV] | 4min | school
非单调损失函数的保形风险控制方法 02-24
保形预测
风险控制
非单调损失 |
[自动]
[ARXIV] | 4min | school
行为学习:从数据中学习分层优化结构 02-24
行为学习
分层优化
可解释性 |
[自动]
[ARXIV] | 4min | school
JUCAL:分类任务中偶然与认知不确定性的联合校准 02-24
不确定性校准
JUCAL
偶然不确定性 |
[自动]
[ARXIV] | 4min | school
AdaEvolve:基于大语言模型的自适应零阶优化方法 02-24
AdaEvolve
LLM
零阶优化 |
[自动]
[ARXIV] | 4min | school
部分可观测平均场博弈的循环结构策略梯度算法 02-24
平均场博弈
部分可观测
策略梯度 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-24
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[HACKER_NEWS] | 6min | newspaper
Steerling-8B:可解释自身生成任一 token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[HACKER_NEWS] | 5min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[JUEJIN] | 2min | sticky_note_2
DeepMind研究:多智能体协作瓶颈与Agent能力天花板分析 02-24
DeepMind
多智能体
Agent |
[自动]
[JUEJIN] | 2min | sticky_note_2
ArcFlow实现FLUX与Qwen推理40倍加速 02-24
ArcFlow
FLUX
Qwen |
[自动]
[HACKER_NEWS] | 3min | newspaper
53款模型“洗车”测试:评估多模态AI在物理场景中的表现 02-24
多模态
物理场景
模型评估 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
Steerling-8B:可解释自身生成任一 Token 的语言模型 02-24
Steerling-8B
可解释性
LLM |
[自动]
[ARXIV] | 4min | school
部分软匹配距离:基于部分单元对应的神经表征比较 02-24
神经表征
部分软匹配
最优传输 |
[自动]
[ARXIV] | 4min | school
用于软优势策略优化的平滑门函数 02-24
强化学习
GRPO
SAPO |
[自动]
[ARXIV] | 4min | school
无需训练的图神经网络跨架构合并方法 02-24
arxiv
cs.LG |
[自动]
[ARXIV] | 4min | school
城市编辑:面向依赖感知的分层智能体城市地理空间修改 02-24
City Editing
分层智能体
多模态推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-24
First Proof
数学证明
AI推理 |
[自动]
[ARXIV] | 5min | school
Soft Sequence Policy Optimization:连接GMPO与SAPO 02-24
SSPO
LLM对齐
强化学习 |
[自动]
[ARXIV] | 4min | school
RetinaVision:基于XAI增强调控的深度学习视网膜疾病分类 02-24
计算机视觉
医疗AI
深度学习 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[ARXIV] | 4min | school
统一图神经网络均匀表达能力的通用方法 02-24
GNN
图神经网络
表达能力 |
[自动]
[ARXIV] | 4min | school
扩散模型无需噪声调节的几何学原理 02-24
扩散模型
Flow Matching
几何学原理 |
[自动]
[ARXIV] | 4min | school
基准测试图神经网络在解决难约束满足问题中的性能 02-24
GNN
图神经网络
约束满足问题 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-24
数学推理
First Proof
研究级推理 |
[自动]
[ARXIV] | 5min | school
U(d)子群导出自然RNN与Transformer架构 02-24
RNN
Transformer
序列模型 |
[自动]
[ARXIV] | 3min | school
RVR:检索-验证-检索机制提升综合问答能力 02-24
RVR
RAG
检索增强 |
[自动]
[ARXIV] | 4min | school
K-partition 集成方法:通过置信度分配提升模型性能 02-24
CAKE
聚类集成
置信度评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[ARXIV] | 3min | school
统一图神经网络均匀表达能力的通用方法 02-23
GNN
图神经网络
表达能力 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型向弱势用户提供的信息准确度较低 02-23
AI偏见
数字鸿沟
模型评估 |
[自动]
[ARXIV] | 4min | school
扩散模型无需噪声条件:几何视角的解释 02-23
扩散模型
几何视角
生成模型 |
[自动]
[ARXIV] | 4min | school
基准测试图神经网络在求解难约束满足问题中的性能 02-23
GNN
图神经网络
约束满足问题 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
First Proof
数学证明
推理能力 |
[自动]
[ARXIV] | 4min | school
为K分区集成模型分配置信度以提升预测性能 02-23
聚类分析
集成学习
置信度评估 |
[自动]
[ARXIV] | 4min | school
U(d)子群自然导出RNN与Transformer架构 02-23
RNN
Transformer
U(d) |
[自动]
[ARXIV] | 4min | school
RVR:检索-验证-检索框架提升综合问答能力 02-23
RVR
RAG
检索增强 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍 02-23
Gemini 3.1 Pro
Google
ARC-AGI 2 |
[自动]
[HACKER_NEWS] | 4min | newspaper
53 款模型参与“洗车”基准测试 02-23
基准测试
模型评估
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍 02-23
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI模型在First Proof数学挑战中的证明尝试 02-23
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-23
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-23
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
First Proof
数学证明
推理能力 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-23
Gemini
Google
ARC-AGI |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
数学推理
First Proof
专家级问题 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT研究:主流AI模型对低学历及非美用户提供信息准确度较低 02-23
MIT
LLM
偏见 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍 02-23
Gemini 3.1 Pro
Google
ARC-AGI |
[自动]
[ARXIV] | 4min | school
面向扩散语言模型的感知剪枝方法 02-23
扩散模型
语言模型
模型剪枝 |
[自动]
[ARXIV] | 3min | school
语言模型处理差异论元标记时的类型学对齐差异 02-23
语言模型
类型学
区分性论元标记 |
[自动]
[ARXIV] | 3min | school
多轮人机协作中用户需求的精准对齐方法 02-23
人机协作
多轮对话
决策质量 |
[自动]
[ARXIV] | 4min | school
MARS:基于边界感知与自我优化的奖励建模 02-23
RLHF
奖励模型
MARS |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究:主流AI聊天机器人向弱势用户提供的信息准确度较低 02-22
AI偏见
信息准确性
弱势群体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-22
AI模型
First Proof
数学挑战 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍 02-22
Gemini
Google
ARC-AGI |
[自动]
[ARXIV] | 4min | school
面向扩散语言模型的感知汇点剪枝方法 02-22
扩散模型
DLM
模型剪枝 |
[自动]
[ARXIV] | 3min | school
语言模型处理差异论元标记的类型对齐差异 02-22
语言模型
GPT-2
计算语言学 |
[自动]
[ARXIV] | 4min | school
细粒度细节靶向提升黑盒大视觉模型攻击能力 02-22
LVLM
黑盒攻击
对抗样本 |
[自动]
[ARXIV] | 4min | school
多轮人机协作框架支持用户自定义需求 02-22
人机协作
多轮对话
决策质量 |
[自动]
[ARXIV] | 4min | school
MARS:基于边距感知奖励建模与自我精炼 02-22
MARS
RLHF
Reward Model |
[自动]
[HACKER_NEWS] | 6min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
时间序列
前向传播 |
[自动]
[HACKER_NEWS] | 4min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
前向传播
时间序列 |
[自动]
[HACKER_NEWS] | 6min | newspaper
误差随时间前向传播机制解析 02-22
误差传播
时间序列
神经网络 |
[自动]
[ARXIV] | 5min | school
面向扩散语言模型的Sink感知剪枝方法 02-21
扩散模型
语言模型
模型剪枝 |
[自动]
[ARXIV] | 4min | school
通过细粒度细节定位推进黑盒LVLM攻击边界 02-21
LVLM
黑盒攻击
对抗样本 |
[自动]
[ARXIV] | 3min | school
语言模型处理差价论元标记的类型学对齐差异 02-21
语言模型
计算语言学
类型学 |
[自动]
[ARXIV] | 4min | school
多轮人机协作框架支持用户自定义需求 02-21
人机协作
LLM
决策质量 |
[自动]
[ARXIV] | 4min | school
基于分词器的语言识别模型研究 02-21
UniLID
语言识别
分词器 |
[自动]
[ARXIV] | 5min | school
MMARS:基于边际感知与自我精炼的奖励建模 02-21
RLHF
奖励建模
数据增强 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI模型针对First Proof数学挑战的证明尝试与推理能力测试 02-21
LLM
数学推理
First Proof |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-21
Gemini
Google
ARC-AGI |
[自动]
[HACKER_NEWS] | 4min | newspaper
大语言模型推理失败机制分析 02-21
LLM
推理
逻辑错误 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
研究显示主流AI模型向弱势用户提供信息准确度较低 02-21
AI偏见
公平性
准确性 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-21
数学推理
First Proof
研究级推理 |
[自动]
[ARXIV] | 4min | school
面向扩散语言模型的Sink感知剪枝方法 02-20
扩散模型
语言模型
模型剪枝 |
[自动]
[ARXIV] | 3min | school
语言模型对差异论元标记处理的类型学对齐差异 02-20
语言模型
GPT-2
计算语言学 |
[自动]
[ARXIV] | 3min | school
基于用户指定需求的多轮人机协作框架 02-20
人机协作
多轮对话
决策质量 |
[自动]
[ARXIV] | 4min | school
基于分词器的语言识别方法研究 02-20
UniLID
语言识别
LID |
[自动]
[ARXIV] | 5min | school
MARS:基于边际感知与自我精炼的奖励建模 02-20
MARS
RLHF
奖励模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 发布自主智能体 METR 基准测试数据 02-20
Anthropic
智能体
Agent |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 公布 Agent 自主性研究及 METR 基准数据 02-20
Anthropic
Agent
自主性 |
[自动]
[HACKER_NEWS] | 4min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
研究显示主流AI模型对弱势群体提供信息准确度较低 02-20
AI偏见
公平性
包容性 |
[自动]
[HACKER_NEWS] | 4min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-20
Gemini 3.1 Pro
Google
ARC-AGI |
[自动]
[HACKER_NEWS] | 4min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[HACKER_NEWS] | 5min | newspaper
利用注意力匹配加速 KV 键值对压缩 02-20
KV压缩
注意力机制
推理加速 |
[自动]
[HACKER_NEWS] | 6min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
一致性扩散语言模型提速14倍且无损质量 02-20
扩散模型
一致性模型
语言模型 |
[自动]
[ARXIV] | 3min | school
评估LLM辅助对生物学新手表现的影响 02-20
LLM
生物学
随机对照试验 |
[自动]
[ARXIV] | 4min | school
知识嵌入潜在投影提升鲁棒表征学习 02-20
表征学习
数据不平衡
EHR |
[自动]
[ARXIV] | 3min | school
机器遗忘中保护未删除数据隐私的方法 02-20
机器遗忘
隐私保护
重构攻击 |
[自动]
[ARXIV] | 4min | school
强化快速权重结合下一序列预测模型 02-20
REFINE
强化学习
快速权重 |
[自动]
[ARXIV] | 4min | school
因果性是可解释性泛化的关键 02-20
可解释性
因果推断
泛化性 |
[自动]
[ARXIV] | 3min | school
以对象为中心的表征是否更利于组合泛化 02-20
组合泛化
对象中心
视觉表征 |
[自动]
[ARXIV] | 5min | school
Calibrate-Then-Act:面向大模型智能体的成本感知探索 02-20
LLM Agents
成本感知
CTA框架 |
[自动]
[ARXIV] | 4min | school
知识嵌入隐投影用于鲁棒表征学习 02-19
表征学习
EHR
数据不平衡 |
[自动]
[ARXIV] | 3min | school
机器遗忘中保护未删除数据的隐私防御机制 02-19
机器遗忘
隐私保护
重构攻击 |
[自动]
[ARXIV] | 4min | school
强化快速权重与下一序列预测 02-19
REFINE
快速权重
强化学习 |
[自动]
[ARXIV] | 3min | school
因果性是可解释性泛化的关键 02-19
因果推断
可解释性
LLM |
[自动]
[ARXIV] | 4min | school
以对象为中心的表征在组合泛化任务中的表现评估 02-19
组合泛化
以对象为中心
视觉问答 |
[自动]
[ARXIV] | 5min | school
Calibrate-Then-Act:大模型智能体的成本感知探索 02-19
LLM Agents
成本感知
探索策略 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic发布Agent自主性研究及METR数据 02-19
Anthropic
Agent
自主性 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
长期对话语境下LLM个性化特征与回音室效应分析 02-19
LLM
个性化
回音室效应 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
美德伦理在AI对齐中的有效性 02-19
AI对齐
美德伦理
AI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
个性化功能可能导致大语言模型迎合用户观点形成回声室 02-19
LLM
个性化
回声室 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话语境下LLM观点映射与回声室效应 02-19
LLM
个性化
回声室效应 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC伯克利利用IT-Bench和MAST诊断企业智能体失败原因 02-19
IBM
UC Berkeley
IT-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话导致大语言模型镜像用户观点并形成回声室 02-19
LLM
个性化
回声室 |
[自动]
[ARXIV] | 3min | school
通过任务复杂度量化验证浅层对齐假说 02-19
浅层对齐假说
SAH
任务复杂度 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM 上下文长度外推技术综述 02-19
LLM
上下文窗口
外推 |
[自动]
[ARXIV] | 4min | school
CrispEdit:低曲率投影实现可扩展的大模型无损编辑 02-19
LLM编辑
模型编辑
CrispEdit |
[自动]
[ARXIV] | 3min | school
Avey-B:基于视觉基础模型的通用具身智能代理 02-19
Avey-B
NLP
Transformer |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Qwen3.5-397B-A17B:最小的高效Open-Opus级模型 02-18
Qwen3.5
模型压缩
性能优化 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因 02-18
IBM
UC Berkeley
IT-Bench |
[自动]
[ARXIV] | 3min | school
胸部X光分类的任务无关持续学习方法 02-18
持续学习
胸部X光
医学影像 |
[自动]
[ARXIV] | 3min | school
基于任务复杂度的浅层对齐假说操作化研究 02-18
浅层对齐
SAH
任务复杂度 |
[自动]
[ARXIV] | 3min | school
基于D最优统计的高维仿真代理测试时适应稳定化方法 02-18
TTA
仿真代理
分布偏移 |
[自动]
[ARXIV] | 3min | school
利用强化学习解决未知可行性的参数鲁棒避障问题 02-18
强化学习
鲁棒性
避障 |
[自动]
[ARXIV] | 4min | school
Dex4D:任务无关点跟踪策略实现灵巧操作跨域迁移 02-18
灵巧操作
Sim-to-Real
强化学习 |
[自动]
[ARXIV] | 4min | school
CrispEdit:低曲率投影实现可扩展的大模型无损编辑 02-18
模型编辑
CrispEdit
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
IBM与UC Berkeley利用IT-Bench和MAST诊断企业智能体失败原因 02-18
IBM
UC Berkeley
IT-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式并获合作者验证 02-18
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 5min | school
Avey-B:基于注意力机制的高效视觉Transformer模型 02-18
Avey-B
Transformer
NLP |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2推导胶子振幅新公式并获验证 02-18
GPT-5.2
理论物理
胶子振幅 |
[自动]
[JUEJIN] | 2min | sticky_note_2
SkillsBench 论文解读:跨任务基准测试如何揭示 Agent 技能的实际效用 02-18
Agent
LLM
SkillsBench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
长期对话语境导致LLM迎合用户观点形成回声室 02-18
LLM
个性化
回声室 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2推导新胶子振幅公式获正式证明 02-18
GPT-5.2
理论物理
科学发现 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2 提出胶子振幅新公式并获合作验证 02-18
GPT-5.2
理论物理
胶子振幅 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出胶子振幅新公式并获学术验证 02-18
GPT-5.2
理论物理
胶子振幅 |
[自动]
[ARXIV] | 3min | school
长上下文LLM缩放缺陷:隐私与个性化任务揭示注意力分散 02-18
长上下文
LLM
个性化 |
[自动]
[ARXIV] | 4min | school
超越掩码扩散语言模型的扩展性研究 02-18
扩散模型
语言模型
扩展定律 |
[自动]
[ARXIV] | 4min | school
语言统计对称性塑造模型表征的几何结构 02-18
表征几何
统计对称性
词嵌入 |
[自动]
[ARXIV] | 4min | school
离散扩散模型高效采样:锐利且自适应的理论保证 02-18
离散扩散模型
CTMC
采样效率 |
[自动]
[ARXIV] | 3min | school
基于结构化世界模型先验的冷启动个性化方案 02-18
冷启动
个性化
世界模型 |
[自动]
[ARXIV] | 4min | school
基于正则化与对称性重审扩散模型及其分子图生成应用 02-18
扩散模型
分子图生成
对称性 |
[自动]
[ARXIV] | 2min | school
基于参数高效微调与往返翻译的文本风格迁移 02-18
文本风格迁移
参数高效微调
LLM |
[自动]
[ARXIV] | 3min | school
BPP:聚焦关键历史帧的长上下文机器人模仿学习 02-18
机器人
模仿学习
长上下文 |
[自动]
[ARXIV] | 3min | school
长上下文LLM隐私与个性化任务中的缩放差距研究 02-17
长上下文
隐私保护
个性化 |
[自动]
[ARXIV] | 3min | school
超越掩码扩散语言模型的扩展性研究 02-17
扩散模型
语言模型
扩展定律 |
[自动]
[ARXIV] | 3min | school
语言统计对称性塑造模型表征的几何结构 02-17
表征学习
几何结构
统计对称性 |
[自动]
[ARXIV] | 4min | school
离散扩散模型高效采样:具备锐利性与自适应保证 02-17
离散扩散模型
高效采样
tau-leaping |
[自动]
[ARXIV] | 3min | school
基于结构化世界模型的无训练先验用于冷启动个性化 02-17
个性化
冷启动
世界模型 |
[自动]
[ARXIV] | 4min | school
基于标准化的扩散模型对称性重思考与分子图生成 02-17
扩散模型
分子图生成
对称性 |
[自动]
[ARXIV] | 4min | school
基于参数高效微调与往返翻译的文本风格迁移 02-17
文本风格迁移
PEFT
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2提出胶子振幅新公式并获验证 02-17
GPT-5.2
OpenAI
理论物理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3 Deep Think:推进科学与工程研究 02-17
Gemini 3
DeepMind
Deep Think |
[自动]
[ARXIV] | 3min | school
BPP:聚焦关键历史帧的长上下文机器人模仿学习 02-17
机器人
模仿学习
长上下文 |
[自动]
[JUEJIN] | 2min | sticky_note_2
Qwen3.5-397B-A17B:极致稀疏MoE架构与多模态能力详解 02-17
Qwen3.5
MoE
多模态 |
[自动]
[HACKER_NEWS] | 4min | newspaper
语义消融实验:揭示AI写作为何平庸同质化 02-17
语义消融
AI写作
同质化 |
[自动]
[JUEJIN] | 3min | sticky_note_2
SkillsBench论文:评估Agent技能在多任务中的实际效用 02-17
Agent
LLM
SkillsBench |
[自动]
[HACKER_NEWS] | 7min | newspaper
SkillsBench:评估智能体技能在多样化任务中的表现基准 02-17
SkillsBench
智能体
Agent |
[自动]
[ARXIV] | 4min | school
过程监督多智能体强化学习提升临床推理可靠性 02-17
多智能体
强化学习
临床推理 |
[自动]
[ARXIV] | 4min | school
科学推理模型引入拒答机制以提升准确性 02-17
科学推理
拒答机制
NLI |
[自动]
[HACKER_NEWS] | 4min | newspaper
研究:自生成的智能体技能通常无效 02-17
AI Agent
智能体
LLM |
[自动]
[ARXIV] | 4min | school
延迟视觉摄入优化图文密集文档问答 02-17
多模态
文档问答
VLM |
[自动]
[ARXIV] | 5min | school
基于枢纽重采样的LLM强化学习深度密集探索 02-17
LLM
强化学习
RLHF |
[自动]
[ARXIV] | 5min | school
UniWeTok:统一二进制分词器支持2^128码本规模 02-17
UniWeTok
多模态
Tokenizer |
[自动]
[ARXIV] | 4min | school
GPT-5与其他大模型长短上下文性能对比 02-17
GPT-5
LLM
长文本 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式获学术验证 02-17
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 3min | school
语义分块与自然语言熵:优化文本切分策略 02-17
语义分块
自然语言熵
文本切分 |
[自动]
[HACKER_NEWS] | 4min | newspaper
研究:自生成的Agent技能实际无效 02-17
Agent
LLM
研究 |
[自动]
[ARXIV] | 4min | school
基于扩散模型从面部嵌入重建真实人脸 02-17
扩散模型
人脸重建
KAN |
[自动]
[ARXIV] | 4min | school
基于仿真过滤的模块化策略从人类视频学习有效行为 02-17
机器人
模仿学习
仿真过滤 |
[自动]
[ARXIV] | 4min | school
在线镜像 descent 使用镜像图组合改进遗憾保证 02-17
在线镜像下降
OMD
在线凸优化 |
[自动]
[ARXIV] | 5min | school
CoPE-VideoLM:基于编解码基元的高效视频语言模型 02-17
VideoLM
视频理解
多模态 |
[自动]
[ARXIV] | 3min | school
语义分块与自然语言熵的关联研究 02-16
语义分块
自然语言熵
LLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
研究:自生成的Agent技能通常无效 02-16
Agent
LLM
自生成技能 |
[自动]
[ARXIV] | 4min | school
基于镜像映射组合改进在线镜像下降的遗憾界 02-16
在线优化
OMD
遗憾界 |
[自动]
[ARXIV] | 3min | school
基于扩散模型从面部嵌入实现真实人脸重建 02-16
扩散模型
人脸重建
隐私保护 |
[自动]
[ARXIV] | 4min | school
仿真筛选模块化策略:从人类视频学习有效行为 02-16
机器人
强化学习
模仿学习 |
[自动]
[HACKER_NEWS] | 7min | newspaper
LCM:无损上下文管理技术论文 02-16
LCM
上下文管理
无损 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2 提出胶子振幅新公式并获合作者验证 02-16
GPT-5.2
理论物理
胶子振幅 |
[自动]
[ARXIV] | 4min | school
CoPE-VideoLM:基于编解码基元的高效视频语言模型 02-16
VideoLM
多模态
视频理解 |
[自动]
[HACKER_NEWS] | 4min | newspaper
研究:自生成的Agent技能通常无效 02-16
Agent
LLM
自生成技能 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出胶子振幅新公式并获合作验证 02-16
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 4min | school
面向语言模型的在线上下文蒸馏方法 02-16
LLM
蒸馏
上下文学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究 02-16
自主研究
数学
AI |
[自动]
[ARXIV] | 4min | school
视觉-语言-动作对齐:扩展验证比扩展策略学习更有效 02-16
VLA
具身智能
CoVer |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-16
多模态
思维链
测试时扩展 |
[自动]
[ARXIV] | 5min | school
CM2:基于清单奖励强化学习的多步智能体工具调用 02-16
强化学习
Agent
工具调用 |
[自动]
[ARXIV] | 4min | school
AttentionRetriever:注意力层即长文档检索器 02-16
RAG
长文档
检索 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究 02-15
自主研究
数学
AI |
[自动]
[ARXIV] | 4min | school
语言模型在线策略上下文蒸馏方法 02-15
模型蒸馏
上下文学习
在线策略 |
[自动]
[ARXIV] | 4min | school
扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐 02-15
VLA
具身智能
机器人 |
[自动]
[ARXIV] | 4min | school
WebAgents测试时扩展:智能体性能提升方法 02-15
WebAgents
测试时扩展
CATTS |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-15
多模态
思维链
测试时扩展 |
[自动]
[ARXIV] | 4min | school
MonarchRT:面向实时视频生成的高效注意力机制 02-15
视频生成
DiT
注意力机制 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Gemini 3 Deep Think:面向科研与工程的科学推理模型 02-15
Gemini 3
Deep Think
科学推理 |
[自动]
[ARXIV] | 4min | school
CM2:基于清单奖励强化学习的多步智能体工具调用 02-15
CM2
强化学习
Agent |
[自动]
[ARXIV] | 3min | school
AttentionRetriever:注意力层隐式实现长文档检索 02-15
RAG
长文档检索
AttentionRetriever |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究 02-15
自主研究
数学
AI科学家 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2提出胶子振幅新公式并获验证 02-15
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 3min | school
AI时代的创意所有权界定 02-15
版权
生成式AI
法律 |
[自动]
[HACKER_NEWS] | 4min | newspaper
迈向自主数学研究:AI 探索自动化定理证明 02-15
自动化定理证明
AI for Math
形式化验证 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式并获合作验证 02-15
GPT-5.2
OpenAI
理论物理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2提出新胶子振幅公式获学术验证 02-14
GPT-5.2
理论物理
胶子振幅 |
[自动]
[ARXIV] | 4min | school
扩展验证比扩展策略学习更有效实现视觉-语言-动作对齐 02-14
VLA
具身智能
机器人 |
[自动]
[ARXIV] | 4min | school
基于策略上下文蒸馏的大语言模型优化方法 02-14
LLM
蒸馏
上下文学习 |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展 02-14
多模态
思维链
测试时扩展 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5.2推导新胶子振幅公式获正式验证 02-14
GPT-5.2
OpenAI
理论物理 |
[自动]
[ARXIV] | 5min | school
CM2:基于清单奖励强化学习的多步多轮智能体工具调用 02-14
智能体
强化学习
工具调用 |
[自动]
[ARXIV] | 4min | school
AttentionRetriever:注意力层可作为长文档检索器 02-14
RAG
长文档检索
AttentionRetriever |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 3min | newspaper
G 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理领域新成果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 5min | newspaper
神经渲染技术探索与应用实践 02-14
神经渲染
NeRF
3D重建 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[HACKER_NEWS] | 5min | newspaper
GPT-5.2 推导出理论物理新结果 02-14
GPT-5.2
理论物理
AI for Science |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新成果 02-14
GPT-5.2
理论物理
科学发现 |
[自动]
[ARXIV] | 4min | school
面向语言模型的在线上下文蒸馏方法 02-13
LLM
模型蒸馏
上下文学习 |
[自动]
[ARXIV] | 4min | school
扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐 02-13
VLA
具身智能
机器人 |
[自动]
[ARXIV] | 4min | school
UniT:统一多模态思维链测试时扩展方法 02-13
多模态
思维链
测试时扩展 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GPT-5.2 推导出理论物理新结果 02-13
GPT-5.2
理论物理
AI for Science |
[自动]
[ARXIV] | 4min | school
AttentionRetriever:注意力层即长文档检索器 02-13
RAG
长文档检索
AttentionRetriever |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Rafael Gómez-Bombarelli:AI与模拟加速科学发现的转折点 02-13
AI for Science
科学发现
模拟技术 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI与模拟加速科学发现的转折点 02-13
科学发现
AI模拟
Rafael Gómez-Bombarelli |
[自动]
[HACKER_NEWS] | 3min | newspaper
尼克·博斯特罗姆新论文探讨超级智能的启动时机 02-13
超级智能
尼克·博斯特罗姆
AI安全 |
[自动]
[ARXIV] | 4min | school
训练LRM模型:自适应反思与长度协调惩罚提升推理效率 02-13
LRM
推理效率
自适应反思 |
[自动]
[ARXIV] | 4min | school
离线强化学习在Q星近似与部分覆盖下的复杂度分析 02-13
离线强化学习
Q星近似
部分覆盖 |
[自动]
[ARXIV] | 4min | school
基于奖励外推的广义在线策略蒸馏算法 02-13
LLM
强化学习
知识蒸馏 |
[自动]
[ARXIV] | 4min | school
利用辅助信息实现少样本设计优化 02-13
贝叶斯优化
少样本学习
设计优化 |
[自动]
[ARXIV] | 3min | school
Pensieve范式:有状态语言模型自主管理上下文 02-13
StateLM
有状态模型
上下文管理 |
[自动]
[ARXIV] | 4min | school
P-GenRM:个性化生成式奖励模型与基于用户的测试时缩放 02-13
P-GenRM
个性化对齐
奖励模型 |
[自动]
[ARXIV] | 4min | school
Meta-Sel:基于监督元学习的高效上下文学习示例选择方法 02-13
ICL
元学习
示例选择 |
[自动]
[ARXIV] | 4min | school
长思维链监督微调中数据重复优于数据扩展 02-13
长思维链
监督微调
数据重复 |
[自动]
[ARXIV] | 4min | school
超越VLM奖励:扩散原生潜在奖励建模 02-13
扩散模型
DiNa-LRM
奖励建模 |
[自动]
[ARXIV] | 4min | school
权重衰减提升语言模型可塑性 02-13
权重衰减
模型可塑性
微调 |
[自动]
[ARXIV] | 4min | school
基于扩散预训练的稠密上下文嵌入模型 02-13
Embeddings
扩散模型
RAG |
[自动]
[ARXIV] | 4min | school
基于归一化流的高效分层目标条件强化学习 02-13
强化学习
分层强化学习
归一化流 |
[自动]
[ARXIV] | 5min | school
SCRAPL:基于随机路径散射变换的机器学习框架 02-13
SCRAPL
Scattering Transform
小波散射 |
[自动]
[ARXIV] | 3min | school
GENIUS:生成式流体智能评估套件 02-13
GENIUS
流体智力
多模态评估 |
[自动]
[ARXIV] | 3min | school
长思维链监督微调中数据重复优于数据扩展 02-12
长思维链
监督微调
数据重复 |
[自动]
[ARXIV] | 4min | school
超越VLM奖励:扩散原生潜在奖励建模 02-12
扩散模型
DiNa-LRM
奖励建模 |
[自动]
[ARXIV] | 4min | school
权重衰减提升语言模型可塑性 02-12
LLM
权重衰减
模型可塑性 |
[自动]
[ARXIV] | 4min | school
扩散预训练模型生成稠密上下文嵌入 02-12
Embeddings
扩散模型
RAG |
[自动]
[ARXIV] | 3min | school
基于归一化流的高效分层目标条件强化学习 02-12
强化学习
归一化流
分层强化学习 |
[自动]
[ARXIV] | 4min | school
TabICLv2:更优性能与可扩展性的开源表格基础模型 02-12
TabICLv2
表格基础模型
RealTabPFN |
[自动]
[ARXIV] | 5min | school
SCRAPL:基于随机路径散射变换的机器学习框架 02-12
SCRAPL
Scattering Transform
Wavelet |
[自动]
[ARXIV] | 3min | school
GENIUS:生成式流体智能评估套件 02-12
GENIUS
流体智能
GFI |
[自动]
[JUEJIN] | 2min | sticky_note_2
智谱GLM-5即Pony Alpha:对标Claude Opus 02-12
智谱AI
GLM-5
Pony Alpha |
[自动]
[HACKER_NEWS] | 3min | newspaper
大语言模型面临的幻觉与逻辑推理局限 02-12
LLM
幻觉
逻辑推理 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI与模拟加速科学发现:拉斐尔·戈麦斯-巴雷利的观点 02-12
AI
科学发现
模拟 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
大语言模型无法独立攻克癌症的局限性分析 02-12
LLM
癌症研究
AI 局限性 |
[自动]
[HACKER_NEWS] | 3min | newspaper
GPT-5在法律推理实验中表现优于联邦法官 02-12
GPT-5
法律推理
联邦法官 |
[自动]
[ARXIV] | 3min | school
提升自动驾驶感知多租户DNN推理的可预测性 02-12
arxiv
cs.CV |
[自动]
[ARXIV] | 4min | school
LoRA-Squeeze:LoRA模块的调优后与调优中压缩方法 02-12
LoRA
PEFT
模型压缩 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LLM 单独使用无法治愈癌症:科学与模拟的局限 02-12
LLM
生物医学
AI for Science |
[自动]
[ARXIV] | 2min | school
迈向可解释联邦学习:理解差分隐私的影响 02-12
联邦学习
差分隐私
可解释性 |
[自动]
[ARXIV] | 2min | school
用于增强科学图表分析的智能代理 02-12
智能代理
科学图表
多模态 |
[自动]
[ARXIV] | 2min | school
步级解析数据归因:面向循环Transformer 02-12
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
Olaf-World:面向视频世界模型的潜在动作定向方法 02-12
arxiv
cs.CV |
[自动]
[ARXIV] | 1min | school
Learning on the Manifold: Unlocking Standard Diffusion 02-12
Diffusion Transformer
DiT
表征学习 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GLM-OCR:面向复杂文档理解的多模态OCR模型 02-12
GLM-OCR
多模态
OCR |
[自动]
[ARXIV] | 5min | school
Agent World Model:面向智能体强化学习的无限合成环境 02-12
Agent World Model
强化学习
合成环境 |
[自动]
[ARXIV] | 3min | school
迈向可解释联邦学习:理解差分隐私的影响 02-11
联邦学习
差分隐私
可解释性 |
[自动]
[ARXIV] | 3min | school
视频扩散模型因果性与去噪过程可分离 02-11
arxiv
cs.CV |
[自动]
[ARXIV] | 1min | school
基于表征编码器解锁标准扩散Transformer 02-11
DiT
扩散模型
流匹配 |
[自动]
[ARXIV] | 1min | school
Quantum-Audit:评估大语言模型量子计算推理能力极限 02-11
arxiv
cs.CL |
[自动]
[ARXIV] | 4min | school
CODE-SHARP:基于分层奖励程序的技能持续演化框架 02-11
CODE-SHARP
强化学习
RL |
[自动]
[ARXIV] | 3min | school
Agent World Model: Infinity Synthetic Environments for 02-11
Agent
World Model
强化学习 |
[自动]
[ARXIV] | 1min | school
循环Transformer的步级数据归因方法 02-11
Transformer
数据归因
模型可解释性 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
大语言模型无法治愈癌症:科学家的模拟困境 02-11
LLM
科学发现
生物医学 |
[自动]
[ARXIV] | 3min | school
Olaf-World: Orienting Latent Actions for Video World Mo 02-11
世界模型
Olaf-World
潜在动作 |
[自动]
[JUEJIN] | 2min | sticky_note_2
AI 核心术语解析:从神经网络原理到词嵌入与潜空间 02-11
神经网络
词嵌入
潜空间 |
[自动]
[HACKER_NEWS] | 4min | newspaper
GLM-OCR:兼顾准确度、速度与通用性的多模态大模型 02-11
GLM-OCR
多模态
OCR |
[自动]
[ARXIV] | 2min | school
Anagent For Enhancing Scientific Table & Figure Analysi 02-11
Anagent
多智能体
科学图表分析 |
[自动]
[HACKER_NEWS] | 4min | newspaper
The Little Learner:通往深度学习的直线路径 02-11
深度学习
机器学习
神经网络 |
[自动]
[ARXIV] | 1min | school
Transformer模型在低信噪比时间序列预测中的统计基准测试 02-11
arxiv
cs.LG |
[自动]
[ARXIV] | 2min | school
CoFEH:LLM驱动的协同贝叶斯特征工程框架 02-11
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
Code2World: A GUI World Model via Renderable Code Gener 02-11
arxiv
cs.CV |
[自动]
[HACKER_NEWS] | 1min | newspaper
The Little Learner: A Straight Line to Deep Learning 02-11
深度学习
机器学习
神经网络 |
[自动]
[ARXIV] | 4min | school
Robustness Is a Function, Not a Number: A Factorized Co 02-11
arxiv
cs.RO |
[自动]
[ARXIV] | 2min | school
GEBench:将图像生成模型评估为GUI环境的基准 02-11
GEBench
GUI生成
图像生成 |
[自动]
[ARXIV] | 3min | school
ARO: A New Lens On Matrix Optimization For Large Models 02-11
ARO
矩阵优化
LLM |
[自动]
[ARXIV] | 4min | school
ArcFlow: Unleashing 2-Step Text-to-Image Generation via 02-11
arxiv
cs.CV |
[自动]
[ARXIV] | 2min | school
ANCRe: Adaptive Neural Connection Reassignment for Effi 02-11
ANCRe
深度学习
残差连接 |
[自动]
[HACKER_NEWS] | 4min | newspaper
The Little Learner: A Straight Line to Deep Learning 02-11
深度学习
Deep Learning
机器学习 |
[自动]
[ARXIV] | 3min | school
鲁棒性是函数而非数值:基于视觉驾驶的OOD鲁棒性因子化研究 02-10
OOD鲁棒性
视觉驾驶
因子化 |
[自动]
[ARXIV] | 4min | school
ARO:面向大模型矩阵优化的新视角 02-10
矩阵优化
ARO
大模型 |
[自动]
[ARXIV] | 2min | school
ArcFlow:高精度非线性流蒸馏实现两步文生图生成 02-10
ArcFlow
文生图
流蒸馏 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
The Scientist and the Simulator 02-10
LLM
生物医药
科学研究 |
[自动]
[ARXIV] | 3min | school
GEBench: Benchmarking Image Generation Models as GUI En 02-10
GEBench
GUI生成
图像生成 |
[自动]
[ARXIV] | 3min | school
下一代验证码:利用认知差异防御GUI智能体 02-10
arxiv
cs.LG |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型而LLM仅基于词模型预测 02-10
世界模型
词模型
智能体 |
[自动]
[ARXIV] | 3min | school
ANCRe:自适应神经连接重分配实现高效深度扩展 02-10
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
针对LLM服务框架而非模型的延迟型拒绝服务攻击研究 02-10
arxiv
cs.CR |
[自动]
[ARXIV] | 4min | school
基于朗之万动力学的直接软策略采样 02-10
arxiv
cs.LG |
[自动]
[BLOGS_PODCASTS] | 1min | mic
专家依赖世界模型推断隐藏状态,大语言模型需突破词模型局限 02-10
世界模型
词模型
隐藏状态 |
[自动]
[ARXIV] | 1min | school
MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Rei 02-10
arxiv
cs.LG |
[自动]
[ARXIV] | 3min | school
Harpoon:面向条件表格扩散模型的广义流形引导 02-10
扩散模型
表格数据
流形引导 |
[自动]
[ARXIV] | 3min | school
智能体不确定性研究揭示过度自信问题 02-09
AI Agents
不确定性
过度自信 |
[自动]
[ARXIV] | 4min | school
学习大模型神经元激活的生成式元模型 02-09
神经元激活
生成式模型
元模型 |
[自动]
[ARXIV] | 4min | school
基于熵排序流的非监督解耦表示学习模型 02-09
无监督学习
解耦表示
EOFlows |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型决策,大语言模型需超越词模型 02-09
世界模型
词模型
专家系统 |
[自动]
[ARXIV] | 4min | school
InftyThink+: 基于强化学习的高效无限视野推理框架 02-09
强化学习
推理框架
思维链 |
[自动]
[ARXIV] | 4min | school
DreamDojo:基于大规模人类视频的通用机器人世界模型 02-09
机器人
世界模型
DreamDojo |
[自动]
[ARXIV] | 4min | school
DAWN:面向扩散大模型的依赖感知快速推理 02-09
扩散模型
DAWN
并行解码 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家具备世界模型而LLM仅拥有词模型 02-09
LLM
世界模型
词模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
专家依赖世界模型决策,LLM需超越词模型以实现推理 02-09
世界模型
推理
智能体 |
[自动]
[HACKER_NEWS] | 3min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-09
世界模型
词模型
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-09
世界模型
词模型
LLM |
[自动]
[HACKER_NEWS] | 3min | newspaper
停止生成,开始思考:大模型推理能力进化路径 02-09
LLM
推理能力
思维链 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直观物理 02-09
VLM
直觉物理
强化学习 |
[自动]
[ARXIV] | 4min | school
好奇心即知识:基于主动推理的自一致学习与无遗憾优化 02-09
主动推理
好奇心
自一致学习 |
[自动]
[ARXIV] | 5min | school
共享LoRA子空间实现近乎严格的持续学习 02-09
持续学习
LoRA
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:通过伪逆变换提升模型可逆性与表达能力 02-09
神经网络
可逆性
SPNN |
[自动]
[ARXIV] | 5min | school
PhysicsAgentABM:物理引导的生成式主体建模框架 02-09
PhysicsAgentABM
Agent
多智能体 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-09
DyTopo
Multi-Agent
动态拓扑 |
[自动]
[ARXIV] | 4min | school
DFlash:基于块扩散的闪存推测解码方法 02-09
LLM
推理加速
推测解码 |
[自动]
[ARXIV] | 4min | school
CommCP:基于共形预测的LLM通信提升多智能体协调效率 02-09
LLM
多智能体
共形预测 |
[自动]
[ARXIV] | 5min | school
AP-OOD:基于注意力池化的分布外检测方法 02-09
OOD检测
注意力机制
NLP |
[自动]
[ARXIV] | 3min | school
面向运行时智能体记忆的查询感知预算层路由 02-08
Agent
LLM
智能体 |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直觉物理 02-08
VLM
直觉物理
多模态 |
[自动]
[ARXIV] | 4min | school
好奇心即知识:基于主动推理的自一致学习与无悔优化 02-08
主动推理
好奇心
探索与利用 |
[自动]
[ARXIV] | 5min | school
共享LoRA子空间实现近乎严格的持续学习 02-08
LoRA
持续学习
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:基于伪逆变换的高效架构设计 02-08
神经网络
伪逆
SPNN |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型,大语言模型仅有词模型 02-08
LLM
世界模型
词模型 |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式智能体建模 02-08
PhysicsAgentABM
智能体
多主体系统 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-08
多智能体
DyTopo
动态拓扑 |
[自动]
[ARXIV] | 4min | school
CommCP:基于LLM通信与共形预测的多智能体高效协调 02-08
LLM
Multi-Agent
CommCP |
[自动]
[ARXIV] | 4min | school
AP-OOD:基于注意力池化的分布外检测方法 02-08
OOD检测
注意力机制
注意力池化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-08
LLM
世界模型
词模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
专家具备世界模型,大语言模型仅有词模型 02-08
世界模型
词模型
LLM |
[自动]
[HACKER_NEWS] | 4min | newspaper
基于人类反馈的强化学习:原理与应用 02-07
RLHF
强化学习
人类反馈 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
专家依赖世界模型而LLM仅依赖词模型 02-07
世界模型
LLM
词模型 |
[自动]
[ARXIV] | 5min | school
面向运行时智能体记忆的查询感知预算层路由 02-07
Agent
LLM
Memory |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直观物理 02-07
VLM
多模态
具身智能 |
[自动]
[ARXIV] | 3min | school
好奇心即知识:基于主动推理的自一致学习与无悔优化 02-07
主动推理
强化学习
好奇心 |
[自动]
[ARXIV] | 5min | school
共享 LoRA 子空间实现近乎严格的持续学习 02-07
LoRA
持续学习
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:通过伪可逆性提升模型可逆性 02-07
神经网络
伪可逆
SPNN |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式智能体建模 02-07
PhysicsAgentABM
生成式ABM
多主体系统 |
[自动]
[ARXIV] | 4min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-07
DyTopo
多智能体
动态拓扑 |
[自动]
[ARXIV] | 4min | school
CommCP:基于共形预测的LLM通信提升多智能体协调效率 02-07
LLM
Multi-Agent
共形预测 |
[自动]
[ARXIV] | 4min | school
AP-OOD:基于注意力池化的分布外检测方法 02-07
OOD检测
NLP
注意力机制 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:基于多传感器数据生成驾驶场景 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 5min | newspaper
基于人类反馈的强化学习:原理与应用 02-07
RLHF
强化学习
人类反馈 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Waymo 世界模型:利用生成式世界模型提升自动驾驶决策能力 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:自动驾驶场景生成与仿真应用 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Waymo 世界模型:利用生成式世界模拟提升自动驾驶决策 02-07
Waymo
世界模型
自动驾驶 |
[自动]
[HACKER_NEWS] | 7min | newspaper
基于人类反馈的强化学习机制解析 02-07
RLHF
强化学习
人类反馈 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理的可视化解析 02-07
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更难 02-07
LLM
ICL
上下文学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习的难度超出预期 02-07
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络可视化:直观理解深度学习原理 02-07
神经网络
深度学习
可视化 |
[自动]
[HACKER_NEWS] | 4min | newspaper
从上下文学习的难度超出预期 02-07
上下文学习
ICL
LLM |
[自动]
[ARXIV] | 3min | school
面向运行时智能体记忆的查询感知预算分层路由 02-06
Agent
Memory
RAG |
[自动]
[ARXIV] | 3min | school
视觉语言模型能否通过交互学习直觉物理 02-06
VLM
直觉物理
强化学习 |
[自动]
[ARXIV] | 3min | school
好奇心即知识:基于主动推理的自一致学习与无遗憾优化 02-06
主动推理
探索与利用
自由能 |
[自动]
[ARXIV] | 4min | school
共享 LoRA 子空间实现近乎严格的持续学习 02-06
LoRA
持续学习
微调 |
[自动]
[ARXIV] | 4min | school
伪可逆神经网络:兼具可逆性与灵活性的新架构 02-06
神经网络
可逆性
伪逆 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更具挑战性 02-06
LLM
ICL
上下文学习 |
[自动]
[ARXIV] | 4min | school
PhysicsAgentABM:物理引导的生成式智能体建模 02-06
PhysicsAgentABM
多智能体系统
ABM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
GPT-5结合自动化闭环实验降低无细胞蛋白合成成本40% 02-06
GPT-5
AI for Science
生物科技 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-06
DyTopo
多智能体
动态拓扑 |
[自动]
[ARXIV] | 5min | school
DFlash:基于块扩散的Flash推测解码方法 02-06
LLM
推理加速
推测解码 |
[自动]
[ARXIV] | 4min | school
CommCP:基于LLM通信与共形预测的高效多智能体协调 02-06
LLM
多智能体
具身智能 |
[自动]
[ARXIV] | 5min | school
AP-OOD:基于注意力池化的分布外检测方法 02-06
OOD检测
注意力机制
NLP |
[自动]
[HACKER_NEWS] | 3min | newspaper
上下文学习难度超出原有认知 02-06
上下文学习
ICL
大模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习比预期更难 02-06
LLM
上下文学习
ICL |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
从上下文学习的难度超出原有认知 02-06
上下文学习
ICL
LLM |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 6min | newspaper
神经网络原理的可视化解析 02-06
神经网络
可视化
深度学习 |
[自动]
[HACKER_NEWS] | 3min | newspaper
超网络:用于处理层级数据的神经网络架构 02-06
超网络
层级数据
神经网络架构 |
[自动]
[HACKER_NEWS] | 6min | newspaper
超网络:面向层级数据的神经网络架构 02-06
超网络
Hypernetworks
层级数据 |
[自动]
[ARXIV] | 4min | school
数据块模型中的精确恢复方法 02-06
社区检测
随机块模型
数据块模型 |
[自动]
[ARXIV] | 4min | school
受限群组相对策略优化 02-06
GRPO
强化学习
策略优化 |
[自动]
[ARXIV] | 4min | school
Wedge Sampling:实现近线性样本复杂度的张量补全算法 02-06
张量补全
楔形采样
低秩张量 |
[自动]
[ARXIV] | 5min | school
RRAttention:基于轮询移位的动态块稀疏注意力机制 02-06
RRAttention
稀疏注意力
长上下文 |
[自动]
[ARXIV] | 4min | school
DLM-Scope:利用稀疏自编码器解析扩散语言模型 02-06
DLM
SAE
稀疏自编码器 |
[自动]
[ARXIV] | 3min | school
面向物联网模型适应性的对比持续学习方法 02-06
持续学习
对比学习
物联网 |
[自动]
[ARXIV] | 4min | school
重新思考大模型强化学习中的信任区域机制 02-06
强化学习
LLM
PPO |
[自动]
[ARXIV] | 3min | school
蛋白质自回归建模:基于多尺度结构生成的方案 02-06
蛋白质生成
自回归模型
多尺度建模 |
[自动]
[ARXIV] | 4min | school
强化注意力学习:通过奖励机制优化视觉注意力模型 02-06
强化学习
多模态
注意力机制 |
[自动]
[ARXIV] | 4min | school
多层交叉注意力机制在多模态上下文学习中具有可证明的最优性 02-06
多模态
上下文学习
ICL |
[自动]
[ARXIV] | 5min | school
重新思考大模型强化学习中的信任区域 02-05
RLHF
PPO
强化学习 |
[自动]
[ARXIV] | 3min | school
蛋白质多尺度结构生成的自回归建模方法 02-05
蛋白质生成
自回归模型
多尺度建模 |
[自动]
[ARXIV] | 4min | school
强化注意力学习:基于奖励反馈的注意力机制优化方法 02-05
强化学习
注意力机制
多模态 |
[自动]
[ARXIV] | 3min | school
多层交叉注意力被证明是多模态上下文学习的最优解 02-05
多模态
上下文学习
ICL |
[自动]
[ARXIV] | 5min | school
Multi-Head LatentMoE与Head并行:通信高效且确定性的MoE方案 02-05
MoE
分布式训练
通信优化 |
[自动]
[ARXIV] | 3min | school
面向物联网模型适应性的对比持续学习 02-05
持续学习
对比学习
物联网 |
[自动]
[HACKER_NEWS] | 4min | newspaper
超网络:面向层级数据的神经网络架构 02-05
超网络
层级数据
神经网络架构 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称感知泰勒近似实现恒定Token成本注意力机制 02-05
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 6min | newspaper
对称感知泰勒近似实现恒定Token成本注意力机制 02-05
注意力机制
Transformer
泰勒近似 |
[自动]
[ARXIV] | 4min | school
基于急停干预的鲁棒干预学习 02-05
干预学习
自动驾驶
鲁棒性 |
[自动]
[ARXIV] | 4min | school
加速科学研究:Gemini 案例研究与通用技术 02-05
Gemini
科学研究
数学发现 |
[自动]
[ARXIV] | 4min | school
利用权重更新稀疏性提升分布式强化学习通信效率 02-05
分布式强化学习
通信效率
权重稀疏性 |
[自动]
[ARXIV] | 5min | school
PrevizWhiz:结合粗略3D场景与2D视频引导生成式预演 02-05
AIGC
视频生成
3D场景 |
[自动]
[ARXIV] | 5min | school
PLATE:用于几何感知持续学习的可塑性调谐高效适配器 02-05
持续学习
PLATE
模型适配 |
[自动]
[ARXIV] | 3min | school
Parallel-Probe:通过二维探测实现高效并行思维 02-05
并行推理
思维链
2D Probing |
[自动]
[ARXIV] | 4min | school
AutoFigure:自动生成与润色出版级科学插图 02-05
AutoFigure
FigureBench
科学插图 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称性泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[ARXIV] | 4min | school
利用权重更新稀疏性的通信高效分布式强化学习 02-04
分布式训练
强化学习
通信优化 |
[自动]
[ARXIV] | 4min | school
利用 Gemini 加速科学研究:案例研究与通用技术 02-04
Gemini
科学研究
数学证明 |
[自动]
[ARXIV] | 5min | school
PrevizWhiz:结合粗略3D场景与2D视频引导生成视频预演 02-04
视频生成
3D视觉
PrevizWhiz |
[自动]
[ARXIV] | 4min | school
PLATE:面向几何感知持续学习的可塑性调谐高效适配器 02-04
持续学习
PLATE
高效适配器 |
[自动]
[ARXIV] | 4min | school
Parallel-Probe:通过2D探测实现高效并行思维 02-04
LLM
并行推理
思维链 |
[自动]
[ARXIV] | 4min | school
AutoFigure:自动生成与优化出版级科学插图 02-04
AutoFigure
FigureBench
科学插图 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称性泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 5min | newspaper
基于对称性泰勒近似实现恒定每Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 7min | newspaper
基于对称感知泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 7min | newspaper
基于对称泰勒近似实现恒定Token成本注意力机制 02-04
Attention机制
Taylor近似
线性注意力 |
[自动]
[HACKER_NEWS] | 5min | newspaper
对称感知泰勒近似实现恒定Token成本注意力机制 02-04
Attention机制
Taylor近似
Token成本 |
[自动]
[ARXIV] | 4min | school
面向冲突目标的免奖励对齐方法 02-04
RACO
对齐
多目标优化 |
[自动]
[ARXIV] | 4min | school
通过文本反馈扩展强化学习的能力边界 02-04
强化学习
RLHF
文本反馈 |
[自动]
[ARXIV] | 3min | school
训练LLM采用分治推理提升测试时扩展性 02-04
LLM
推理
强化学习 |
[自动]
[ARXIV] | 5min | school
基于流策略梯度的机器人控制方法 02-04
机器人控制
流匹配
策略梯度 |
[自动]
[ARXIV] | 4min | school
RE-TRAC:面向深度搜索智能体的递归轨迹压缩算法 02-04
Re-TRAC
深度搜索智能体
ReAct |
[自动]
[ARXIV] | 5min | school
PixelGen:像素扩散结合感知损失超越潜在扩散 02-04
PixelGen
扩散模型
计算机视觉 |
[自动]
[ARXIV] | 4min | school
MemSkill:面向自进化代理的记忆技能学习与演化框架 02-04
MemSkill
智能体
Agent |
[自动]
[ARXIV] | 3min | school
MEG-XL:长上下文预训练实现数据高效的脑电转文本 02-04
MEG-XL
脑机接口
脑电转文本 |
[自动]
[ARXIV] | 3min | school
训练LLM采用分治推理提升测试时扩展性 02-03
LLM
推理
强化学习 |
[自动]
[ARXIV] | 4min | school
无奖励对齐技术处理多目标冲突 02-03
RACO
对齐技术
多目标优化 |
[自动]
[ARXIV] | 4min | school
基于流策略梯度的机器人控制方法 02-03
机器人控制
流匹配
策略梯度 |
[自动]
[ARXIV] | 4min | school
基于文本反馈扩展强化学习的能力 02-03
强化学习
RLHF
文本反馈 |
[自动]
[ARXIV] | 4min | school
RLAnything:完全动态强化学习系统构建环境、策略与奖励模型 02-03
强化学习
RL
LLM |
[自动]
[ARXIV] | 4min | school
RE-TRAC:面向深度搜索智能体的递归轨迹压缩方法 02-03
Re-TRAC
深度搜索
智能体 |
[自动]
[ARXIV] | 4min | school
PixelGen:引入感知损失的像素扩散模型性能超越潜在扩散 02-03
PixelGen
扩散模型
计算机视觉 |
[自动]
[ARXIV] | 4min | school
MemSkill:赋予自进化代理学习与演进记忆技能 02-03
MemSkill
智能体
记忆机制 |
[自动]
[ARXIV] | 4min | school
MEG-XL:基于长上下文预训练的高效脑电转文本模型 02-03
MEG-XL
脑机接口
BCI |
[自动]
[HACKER_NEWS] | 3min | newspaper
模型对齐偏差如何随智能水平与任务复杂度演变 02-03
模型对齐
智能水平
任务复杂度 |
[自动]
[HACKER_NEWS] | 4min | newspaper
模型智能与任务复杂度如何影响对齐偏差 02-03
对齐
模型智能
任务复杂度 |
[自动]
[HACKER_NEWS] | 4min | newspaper
模型对齐问题如何随智能水平与任务复杂度演变 02-03
模型对齐
智能水平
任务复杂度 |
[自动]
[HACKER_NEWS] | 3min | newspaper
训练万亿参数模型以生成幽默内容 02-03
LLM
万亿参数
幽默生成 |
[自动]
[ARXIV] | 3min | school
误差分类引导的提示词优化方法 02-03
提示词工程
ETGPO
自动优化 |
[自动]
[HACKER_NEWS] | 3min | newspaper
训练万亿参数模型使其具备幽默感 02-03
LLM
幽默感
万亿参数 |
[自动]
[ARXIV] | 3min | school
研究揭示RLHF如何加剧大模型谄媚行为 02-03
RLHF
谄媚行为
模型偏见 |
[自动]
[ARXIV] | 4min | school
智能体推理与工具使用的竞争:量化干扰与解调优 02-03
智能体
强化学习
工具使用 |
[自动]
[ARXIV] | 3min | school
大语言模型稀疏奖励子系统 02-03
LLM
稀疏奖励
价值神经元 |
[自动]
[ARXIV] | 4min | school
基于预测集的最优决策方法 02-03
预测集
最优决策
决策理论 |
[自动]
[ARXIV] | 4min | school
基于资格推理与分节强化学习的引理可靠利用 02-03
数学推理
引理应用
RULES |
[自动]
[ARXIV] | 4min | school
可扩展随机小波特征:带收敛保证的高效非平稳核近似 02-03
机器学习
非平稳核
小波变换 |
[自动]
[ARXIV] | 3min | school
HERMES:基于视觉语言模型的长尾自动驾驶端到端风险感知系统 02-03
自动驾驶
VLM
长尾场景 |
[自动]
[ARXIV] | 4min | school
DeALOG:基于日志中介的去中心化多智能体推理框架 02-03
Multi-Agent
去中心化
日志中介 |
[自动]
[ARXIV] | 3min | school
粒子引导扩散模型用于偏微分方程求解 02-03
扩散模型
PDE求解
物理引导 |
[自动]
[ARXIV] | 5min | school
函数空间逆问题的解耦扩散采样方法 02-03
扩散模型
逆问题
PDE |
[自动]
[ARXIV] | 4min | school
共享 autonomy 范式下信念与策略学习的端到端优化 02-03
共享自主
BRACE
端到端优化 |
[自动]
[ARXIV] | 4min | school
VideoGPA:提取几何先验实现三维一致性视频生成 02-03
VideoGPA
视频生成
3D一致性 |
[自动]
[ARXIV] | 4min | school
UPA:基于树搜索与筛选的无监督提示代理 02-03
Prompt优化
UPA
无监督学习 |
[自动]
[ARXIV] | 5min | school
TEON:张量化正交化方法优化大语言模型预训练 02-03
TEON
优化器
预训练 |
[自动]
[ARXIV] | 5min | school
PaperBanana:面向AI科研人员的学术绘图自动化工具 02-03
PaperBanana
学术绘图
智能体框架 |
[自动]
[ARXIV] | 4min | school
FOCUS:DLLMs 如何突破算力瓶颈 02-03
DLLMs
扩散模型
推理加速 |
[自动]
[ARXIV] | 3min | school
粒子引导扩散模型求解偏微分方程 02-02
扩散模型
偏微分方程
PDE |
[自动]
[ARXIV] | 4min | school
函数空间逆问题的解耦扩散采样方法 02-02
扩散模型
逆问题
PDE |
[自动]
[ARXIV] | 4min | school
共享自治系统中信念与策略学习的端到端优化 02-02
共享自治
BRACE
贝叶斯推断 |
[自动]
[ARXIV] | 5min | school
VideoGPA:提取几何先验实现三维一致视频生成 02-02
视频生成
3D一致性
扩散模型 |
[自动]
[ARXIV] | 4min | school
UPA:基于树搜索与筛选的无监督提示智能体 02-02
Prompt优化
LLM智能体
无监督学习 |
[自动]
[ARXIV] | 5min | school
TEON:张量化正交化技术优化大语言模型预训练 02-02
TEON
优化器
Muon |
[自动]
[ARXIV] | 4min | school
IRL-DAL:基于能量引导扩散模型的自动驾驶安全自适应轨迹规划 02-02
自动驾驶
扩散模型
逆向强化学习 |
[自动]
[ARXIV] | 4min | school
FOCUS:DLLMs如何突破算力瓶颈 02-02
DLLMs
扩散模型
算力优化 |
[自动]
[ARXIV] | 3min | school
基于输出监督学习的思维链混淆技术可泛化至未见任务 02-02
思维链
CoT
输出监督 |
[自动]
[ARXIV] | 4min | school
SplineFlow:基于B样条插值的动力系统流匹配方法 02-02
流匹配
SplineFlow
B样条 |
[自动]
[ARXIV] | 4min | school
RN-D:基于正则化网络的离散分类演员与同策强化学习 02-02
强化学习
RL
连续控制 |
[自动]
[ARXIV] | 4min | school
OrLog:结合大模型与概率推理解决复杂查询 02-02
神经符号AI
概率推理
复杂查询 |
[自动]
[ARXIV] | 4min | school
ExplainerPFN:面向表格数据的无模型零样本特征重要性估计 02-02
ExplainerPFN
TabPFN
表格数据 |
[自动]
[ARXIV] | 4min | school
CATTO:平衡语言模型偏好与置信度的方法 02-02
LLM
CATTO
校准 |
[自动]
[HACKER_NEWS] | 7min | newspaper
迈向智能体系统规模化科学:探究其生效机制与适用场景 02-02
智能体
Agent系统
规模化 |
[自动]
[ARXIV] | 3min | school
神经网络转逻辑流以优化边缘计算性能 02-02
边缘计算
神经网络
逻辑流 |
[自动]
[ARXIV] | 6min | school
混合线性注意力新架构:高效蒸馏与超长上下文处理 02-02
HALO
HypeNet
混合架构 |
[自动]
[ARXIV] | 4min | school
推理大语言模型从被动求解到主动提问的转变 02-02
推理
CoT
主动交互 |
[自动]
[ARXIV] | 4min | school
探索面向智能体的推理奖励模型 02-02
Agentic RL
Reward Model
推理奖励 |
[自动]
[ARXIV] | 4min | school
UEval:统一多模态生成基准 02-02
UEval
多模态
基准测试 |
[自动]
[ARXIV] | 3min | school
Routing the Lottery: 面向异构数据的自适应子网络路由 02-02
模型剪枝
彩票假设
异构数据 |
[自动]
[ARXIV] | 5min | school
DynaWeb:基于模型的强化学习网页智能体 02-02
DynaWeb
Web Agent
强化学习 |
[自动]
[ARXIV] | 4min | school
神经网络转逻辑流以优化边缘计算性能 02-01
边缘计算
神经网络
模型优化 |
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与超长上下文处理 02-01
Transformer
混合架构
线性注意力 |
[自动]
[ARXIV] | 3min | school
推理大语言模型从被动求解转向主动询问 02-01
推理
交互式推理
PIR |
[自动]
[ARXIV] | 4min | school
探索面向智能体的推理奖励模型 02-01
Agent
RLHF
奖励模型 |
[自动]
[ARXIV] | 4min | school
UEval:统一多模态生成基准评测 02-01
UEval
多模态
基准评测 |
[自动]
[ARXIV] | 4min | school
Routing the Lottery:面向异型数据的自适应子网络 02-01
模型剪枝
彩票假说
自适应路由 |
[自动]
[ARXIV] | 5min | school
DynaWeb:基于模型的强化学习网页智能体 02-01
DynaWeb
Web Agent
强化学习 |
2026年一月
119 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
面向异构数据的自适应子网络路由方法 01-31
模型剪枝
异构数据
自适应子网络 |
[自动]
[ARXIV] | 4min | school
神经网络转逻辑流以优化边缘计算性能 01-31
边缘计算
神经网络
逻辑流 |
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与超长上下文建模 01-31
线性注意力
长上下文
混合架构 |
[自动]
[ARXIV] | 4min | school
推理大语言模型从被动求解转向主动询问 01-31
LLM
推理模型
主动询问 |
[自动]
[ARXIV] | 5min | school
探索面向智能体的推理奖励模型 01-31
Agent
强化学习
奖励模型 |
[自动]
[ARXIV] | 4min | school
发现模型仓库中的隐藏价值 01-31
模型评估
Llama
多臂老虎机 |
[自动]
[ARXIV] | 4min | school
UEval:统一多模态生成基准 01-31
多模态
UEval
基准测试 |
[自动]
[ARXIV] | 5min | school
DynaWeb:基于模型的强化学习网页智能体框架 01-31
DynaWeb
Web Agent
强化学习 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Kimi k2.5 技术报告发布:长上下文与推理能力详解 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
技术报告
模型架构 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Kimi K2.5 技术报告发布:模型架构与训练细节 01-31
Kimi K2.5
Moonshot AI
技术报告 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:架构与性能细节 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
Moonshot AI
技术报告 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:长上下文与多模态推理能力详解 01-31
Kimi K2.5
技术报告
长上下文 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi k2.5 技术报告发布 01-31
Kimi
K2.5
技术报告 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 7min | newspaper
月之暗面发布 Kimi k2.5 技术报告 01-31
月之暗面
Kimi
K2.5 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
Moonshot AI
技术报告 |
[自动]
[ARXIV] | 4min | school
面向异构数据的自适应子网络路由机制 01-30
模型剪枝
异构数据
子网络 |
[自动]
[ARXIV] | 4min | school
神经网络转逻辑流以优化边缘计算 01-30
边缘计算
神经网络
模型优化 |
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与极长上下文处理 01-30
HALO
HypeNet
长上下文 |
[自动]
[ARXIV] | 4min | school
推理大模型从被动求解转向主动提问 01-30
推理模型
主动交互
思维链 |
[自动]
[ARXIV] | 5min | school
探索面向智能体的推理奖励模型 01-30
Agent
强化学习
推理奖励模型 |
[自动]
[ARXIV] | 3min | school
发现模型仓库中被忽视的高质量模型 01-30
模型评估
Llama-3.1
微调 |
[自动]
[ARXIV] | 3min | school
UEval:统一多模态生成基准 01-30
UEval
多模态
统一模型 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:强化学习与长上下文能力升级 01-30
Kimi
K2.5
强化学习 |
[自动]
[ARXIV] | 4min | school
FineInstructions:将合成指令数据扩展至预训练规模 01-30
LLM
预训练
指令微调 |
[自动]
[ARXIV] | 5min | school
DynaWeb:基于模型的强化学习网页智能体 01-30
DynaWeb
Web Agent
强化学习 |
[自动]
[HACKER_NEWS] | 7min | newspaper
月之暗面发布Kimi K2.5技术报告 01-30
Kimi
K2.5
月之暗面 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-30
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 6min | newspaper
Kimi K2.5 技术报告发布:长上下文与推理能力升级 01-30
Kimi K2.5
技术报告
长上下文 |
[自动]
[ARXIV] | 4min | school
面向文本检索器域适应的影响引导采样方法 01-30
文本检索
域适应
密集检索 |
[自动]
[ARXIV] | 3min | school
面向大语言模型的时间引导机制 01-30
LLM
对比解码
时间引导 |
[自动]
[ARXIV] | 4min | school
基于认知上下文学习构建大模型多智能体系统的信任机制 01-30
多智能体
信任机制
ECL |
[自动]
[ARXIV] | 3min | school
基于经验的试错算法超越语言模型 01-30
LLM
SCOUT
探索与利用 |
[自动]
[ARXIV] | 6min | school
为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理 01-30
Adam优化器
梯度尺度不变性
深度学习 |
[自动]
[ARXIV] | 4min | school
FISMO:基于Fisher结构的动量正交化优化器 01-30
FISMO
优化器
深度学习 |
[自动]
[ARXIV] | 4min | school
进化策略导致大语言模型出现灾难性遗忘 01-30
进化策略
灾难性遗忘
持续学习 |
[自动]
[ARXIV] | 4min | school
机器翻译评估中的跨向污染问题研究 01-30
机器翻译
数据污染
FLORES-200 |
[自动]
[ARXIV] | 4min | school
探索Transformer在表格数据变分自编码器中的位置 01-30
Transformer
VAE
表格数据 |
[自动]
[ARXIV] | 4min | school
SokoBench:评估大模型长周期规划与推理能力 01-30
SokoBench
长周期规划
推理能力 |
[自动]
[ARXIV] | 4min | school
R^{2k}维度理论上足以支持基于嵌入的Top-k检索 01-30
向量检索
嵌入维度
Top-k检索 |
[自动]
[ARXIV] | 3min | school
PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型 01-30
时间序列
PatchFormer
零样本预测 |
[自动]
[ARXIV] | 4min | school
Deep Researcher:结合序列规划反思与候选交叉的深度研究框架 01-30
Deep Researcher
AI Agent
智能体架构 |
[自动]
[ARXIV] | 4min | school
C3Box:基于CLIP的类增量学习工具箱 01-30
CLIP
类增量学习
CIL |
[自动]
[ARXIV] | 4min | school
进化策略导致大语言模型出现灾难性遗忘 01-29
进化策略
灾难性遗忘
持续学习 |
[自动]
[ARXIV] | 3min | school
机器翻译评估中的跨向污染问题研究 01-29
机器翻译
数据污染
FLORES |
[自动]
[ARXIV] | 4min | school
探索Transformer在表格数据变分自编码器中的位置 01-29
Transformer
VAE
表格数据 |
[自动]
[ARXIV] | 3min | school
基于嵌入的Top-$k$检索:理论上$\mathbb{R}^{2k}$维空间已足够 01-29
向量检索
嵌入
Top-k |
[自动]
[ARXIV] | 4min | school
后训练公平性控制:推荐系统动态公平性单训练框架 01-29
推荐系统
公平性
Cofair |
[自动]
[ARXIV] | 4min | school
SokoBench:评估大模型长程规划与推理能力 01-29
SokoBench
长程规划
推理能力 |
[自动]
[ARXIV] | 5min | school
PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型 01-29
时序预测
PatchFormer
零样本学习 |
[自动]
[ARXIV] | 3min | school
Deep Researcher:序列规划反思与候选交叉 01-29
Deep Researcher
AI Agent
反思机制 |
[自动]
[ARXIV] | 4min | school
C3Box:基于CLIP的类增量学习工具箱 01-29
CLIP
增量学习
CIL |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Alyah:评估阿拉伯语大模型阿联酋方言能力 01-29
LLM
阿拉伯语
方言评估 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Alyah:评估阿拉伯语大模型阿联酋方言能力 01-29
LLM
模型评估
阿拉伯语 |
[自动]
[ARXIV] | 4min | school
🧠RHSIA!非理想颅内动脉瘤实时血流替代技术,精准高效! 01-28
RHSIA
血流动力学
颅内动脉瘤 |
[自动]
[ARXIV] | 4min | school
无需真值!🔥颠覆性校准技术来了!🤯 01-28
模型校准
无监督学习
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Alyah ⭐️:阿拉伯语LLM方言鲁棒性评估!🔥 01-28
LLM
阿拉伯语
方言评估 |
[自动]
[ARXIV] | 4min | school
🚀低资源机器翻译的救星!结构化自反思引领新突破✨ 01-28
机器翻译
低资源语言
自反思 |
[自动]
[ARXIV] | 5min | school
🚀SONIC: 颠覆频谱学习!神经网络不变性卷积的终极突破? 01-28
SONIC
频谱学习
神经网络 |
[自动]
[ARXIV] | 4min | school
🔥肿瘤会诊新革命!LLM系统Oncotimia惊艳亮相! 01-28
LLM
RAG
医疗AI |
[自动]
[ARXIV] | 4min | school
🔥动态环境下的对抗约束:Bandits算法如何应对未知挑战? 01-28
Bandits
对抗约束
动态环境 |
[自动]
[ARXIV] | 6min | school
🔥Post-LayerNorm强势回归!稳定、高效、深度训练的新神器! 01-28
Transformer
Post-LayerNorm
Keel |
[自动]
[ARXIV] | 5min | school
🌍 M-SGWR: 多尺度相似+地理加权回归!空间建模神器🚀 01-28
M-SGWR
地理加权回归
空间建模 |
[自动]
[ARXIV] | 5min | school
✨告别遗忘!Self-Distillation解锁持续学习新范式! 01-28
持续学习
Self-Distillation
灾难性遗忘 |
[自动]
[ARXIV] | 4min | school
MEG情绪分析新突破!🔬脑数据标注+情感计算,解锁大脑密码!🧠✨ 01-28
MEG
情绪分析
脑机接口 |
[自动]
[ARXIV] | 4min | school
🚀复用FLOPs!RL突破性扩展:超离策略前缀如何解决硬难题? 01-28
强化学习
RL
LLM |
[自动]
[ARXIV] | 4min | school
🔥模型自学革命!突破可学习性边界,推理能力暴涨! 01-28
SOAR
强化学习
推理能力 |
[自动]
[ARXIV] | 5min | school
🔥POPE:利用特权探索破解硬核难题! 01-28
POPE
强化学习
LLM |
[自动]
[ARXIV] | 5min | school
💥无需标注!基于核变化点检测的无监督文本分割! 01-28
文本分割
无监督学习
核方法 |
[自动]
[ARXIV] | 4min | school
🌍 242种语言大比拼!Wikipedia数据揭秘跨语言比较语言学新突破! 01-28
比较语言学
BPE
多语言 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🇦🇪 Alyah ⭐️:揭秘阿拉伯LLM方言鲁棒评估! 01-28
LLM
阿拉伯语
方言评估 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
阿联酋方言评测新突破!Alyah让阿拉伯语大模型更鲁棒🚀 01-27
Alyah
阿拉伯语
方言评测 |
[自动]
[ARXIV] | 4min | school
突破极限!AI如何教会自己推理?🤯 边缘学习性的惊天秘密!🚀 01-27
SOAR
强化学习
元学习 |
[自动]
[ARXIV] | 5min | school
ctELM:用LLM解码临床试验嵌入!解锁临床新价值🔥 01-27
ctELM
临床试验
嵌入语言模型 |
[自动]
[ARXIV] | 5min | school
🚀RL新突破!复用FLOPs,硬难题上通过离线前缀扩展 01-27
PrefixRL
强化学习
LLM |
[自动]
[ARXIV] | 5min | school
🔥无需标注!核变点检测+句嵌入实现超强文本分割🚀 01-27
文本分割
无监督学习
句嵌入 |
[自动]
[ARXIV] | 4min | school
🔥POPE:用特权探索让AI学会解决复杂难题! 01-27
强化学习
LLM
推理能力 |
[自动]
[ARXIV] | 4min | school
🔍脑电+情感=超强分析!MEG数据解锁情绪新维度 01-27
MEG
情感分析
脑机接口 |
[自动]
[HACKER_NEWS] | 2min | newspaper
🔥两个扭曲形状竟解开百年拓扑谜题?🧩 01-27
拓扑学
海伍德猜想
数学 |
[自动]
[HACKER_NEWS] | 2min | newspaper
数学、物理、生物的万能模式!🧪🧬2013年震撼发现 01-27
本福德定律
统计学
幂律分布 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
⭐️Alyah:阿联酋方言能力评估!阿拉伯语LLM新突破! 01-27
LLM
阿拉伯语
方言评估 |
[自动]
[HACKER_NEWS] | 2min | newspaper
🔥 跨越数理化生!这个万能模式正在颠覆科学界!🤯 01-27
Scaling Laws
异速生长
复杂系统 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🧠炸裂!Gemini Flash在俄罗斯大战Opus胜率66%!🚀 01-27
Gemini Flash
Claude Opus
TetrisBench |
[自动]
[HACKER_NEWS] | 3min | newspaper
阿里Qwen3-Max-Thinking深度思考模型!震撼发布🔥 01-27
Qwen3
通义千问
深度思考 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AssetOpsBench:填补AI基准与工业现实的鸿沟!🤖🏭🚀 01-27
AssetOpsBench
AI Agent
LLM |
[自动]
[ARXIV] | 5min | school
🚀BONO-Bench:可追溯Pareto集的双目标优化基准测试! 01-27
多目标优化
基准测试
Pareto集 |
[自动]
[ARXIV] | 5min | school
🚀AnyView:动态场景任意新视角合成!开创性技术突破🔥 01-27
计算机视觉
视频生成
扩散模型 |
[自动]
[ARXIV] | 6min | school
🔥自回归+掩码扩散!下一代生成模型架构强势登场! 01-27
扩散模型
自回归
语言建模 |
[自动]
[ARXIV] | 6min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量! 01-27
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 6min | school
🔥LLM序列标注新突破!揭秘高效策略,性能飙升! 01-27
LLM
序列标注
NLP |
[自动]
[ARXIV] | 5min | school
🌍Spatial-Agent:科学核心驱动的智能地理空间推理!🚀 01-27
Spatial-Agent
Agent
地理空间推理 |
[自动]
[HACKER_NEWS] | 4min | newspaper
⚡️俄罗斯方块爆杀Opus!Gemini Flash胜率66%震撼实测🎮 01-27
LLM
Gemini Flash
Claude Opus |
[自动]
[ARXIV] | 6min | school
⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成!🔥 01-27
分子生成
SE(3)
等变模型 |
[自动]
[HACKER_NEWS] | 3min | newspaper
震惊!Gemini Flash击败Opus!🎮Tetris胜率66%🚀 01-27
LLM
Gemini Flash
Claude 3 Opus |
[自动]
[ARXIV] | 4min | school
🧬重磅!基于SE(3)流的刚体模态3D分子生成! 01-26
3D分子生成
SE(3)流
刚体模态 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AssetOpsBench:打破AI Agent评测与工业现实的壁垒!🚀 01-26
AI Agent
AssetOpsBench
工业智能 |
[自动]
[ARXIV] | 5min | school
🚀动态场景新视角合成!AnyView实现任意视角自由切换!🤯 01-26
动态场景
新视角合成
扩散模型 |
[自动]
[ARXIV] | 5min | school
🚀 自回归+掩码扩散:下一代生成式AI!🔥 01-26
扩散模型
自回归
生成式AI |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔥Qwen3-Max-Thinking!深度推理颠覆想象! 01-26
Qwen
通义千问
深度推理 |
[自动]
[ARXIV] | 5min | school
🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀 01-26
LLM
训练动力学
损失景观 |
[自动]
[ARXIV] | 5min | school
🔥LLM序列标注新策略!突破性能天花板🚀 01-26
LLM
序列标注
NER |
[自动]
[ARXIV] | 4min | school
🔥IoT攻击数据生成神器!Latent Diffusion让入侵检测更准! 01-26
LDM
潜在扩散模型
物联网 |
[自动]
[ARXIV] | 6min | school
🔥BONO-Bench震撼发布!首套可追溯Pareto集的双目标优化基准测试! 01-26
BONO-Bench
双目标优化
Pareto集 |
[自动]
[ARXIV] | 5min | school
🌍 Spatial-Agent:具科学核心的智能体地理空间推理! 01-26
Spatial-Agent
地理空间推理
GeoFlow Graphs |
[自动]
[HACKER_NEWS] | 2min | newspaper
🧠科学家揭秘定义“你”边界的脑电波!灵魂的物理证据? 01-26
脑科学
神经科学
脑电波 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔍 深度拆解:AI伪造数学证明的惊人真相!🚀 01-26
LLM
幻觉
数学证明 |
[自动]
[HACKER_NEWS] | 2min | newspaper
🧠揭秘“你”的边界!科学家发现定义“自我”的关键脑波🚀 01-26
脑科学
自我意识
神经科学 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🤖AI竟伪造数学证明?深扒“创意数学”背后的惊人真相! 01-26
AI
数学证明
形式化验证 |
[自动]
[ARXIV] | 6min | school
🤖抽屉打不开?揭秘零样本组合动作识别中的“物体捷径”! 01-25
计算机视觉
零样本学习
动作识别 |
[自动]
[ARXIV] | 4min | school
🤖反事实训练!让模型学会靠谱又可落地的解释! 01-25
反事实训练
模型解释性
可解释AI |
[自动]
[ARXIV] | 7min | school
高效定理证明新突破!结构化提示实现少样本学习 🚀 01-25
定理证明
Lean
DeepSeek-Prover |
[自动]
[ARXIV] | 3min | school
超越预测不确定性!🚀结构约束下的可靠表征学习!🔥 01-25
表征学习
不确定性
结构约束 |
[自动]
[ARXIV] | 4min | school
测试时也能发现新规律?🤯AI解锁动态学习能力! 01-25
TTT-Discover
测试时训练
强化学习 |
[自动]
[ARXIV] | 5min | school
Cosmos重磅:微调视频模型!解锁 visuomotor 控制与规划 🚀✨ 01-25
Cosmos
机器人
视觉运动控制 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
AssetOpsBench:连接AI测评与工业现实!填补鸿沟🚀 01-25
AssetOpsBench
AI Agent
工业运维 |
[自动]
[ARXIV] | 5min | school
🚀沙盒机制唤醒LLM智能体通用能力!AI Agent突破性架构! 01-25
LLM
AI Agent
沙盒机制 |
[自动]
[ARXIV] | 5min | school
🔥PyraTok!视频生成神器:语言对齐金字塔Tokenizer震撼来袭! 01-25
PyraTok
视频生成
视频理解 |
无匹配条目