论文

条目：700

2026年三月 10 篇

类型	阅读	条目
[自动] [ARXIV]	3min	school 面向硬件加速器的运行时可重构多精度量化乘法按位脉动阵列架构 03-01 硬件加速器脉动阵列量化
[自动] [ARXIV]	4min	school 通过锚定机制实现模型一致性 03-01 模型一致性锚定机制 cs.LG
[自动] [ARXIV]	4min	school 规模难以克服语用学：报告偏差对视觉语言推理的影响 03-01 VLM 视觉语言模型报告偏差
[自动] [ARXIV]	3min	school 理解AI科研工具使用行为：Asta交互数据集 03-01 AI科研工具 Asta数据集用户行为分析
[自动] [ARXIV]	3min	school 基于单纯形投影的可微零一损失函数 03-01 损失函数 0-1损失可微性
[自动] [ARXIV]	4min	school SOTAlign：基于最优传输的单模态视觉与语言模型半监督对齐 03-01 多模态视觉语言模型最优传输
[自动] [ARXIV]	5min	school SeeThrough3D：文本生成图像中的遮挡感知3D控制 03-01 SeeThrough3D 文本生成图像 T2I
[自动] [ARXIV]	4min	school 1MB数据集足以训练模型：小样本学习新范式 03-01 PLADA 小样本学习数据蒸馏
[自动] [HACKER_NEWS]	4min	newspaper 构建极简Transformer模型实现十位数加法运算 03-01 Transformer 算法推理算术运算
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic模型蒸馏与SWE-Bench失效机制分析 03-01 Anthropic 模型蒸馏 SWE-Bench

2026年二月 571 篇

类型	阅读	条目
[自动] [ARXIV]	3min	school 规模难以克服语用学：报告偏差对视觉语言推理的影响 02-28 VLM 视觉语言模型报告偏差
[自动] [JUEJIN]	1min	sticky_note_2 深度学习通用逼近定理：神经网络的理论基础与核心原理 02-28 深度学习神经网络通用逼近定理
[自动] [ARXIV]	4min	school 数据集压缩至1MB：模型训练效率优化方法 02-28 数据集蒸馏 PLADA 模型训练
[自动] [ARXIV]	3min	school 基于锚点机制实现模型一致性 02-28 模型一致性锚点机制模型不一致性
[自动] [ARXIV]	4min	school 基于超单纯形投影的可微零一损失函数 02-28 0-1损失可微损失超单纯形
[自动] [ARXIV]	4min	school SOTAlign：基于最优传输的单模态视觉与语言模型半监督对齐 02-28 多模态视觉语言模型最优传输
[自动] [ARXIV]	4min	school SeeThrough3D：文本生成图像中的遮挡感知三维控制 02-28 SeeThrough3D 文本生成图像 3D控制
[自动] [ARXIV]	4min	school Asta交互数据集：解析AI科研工具的使用模式与用户参与度 02-28 Asta数据集 AI科研工具用户行为分析
[自动] [BLOGS_PODCASTS]	2min	mic AIE Europe与World’s Fair论文提交今日截止 02-28 AIE Europe AIE World's Fair CAIS
[自动] [HACKER_NEWS]	4min	newspaper 最小Transformer模型实现两位数加法运算 02-28 Transformer 算法算术
[自动] [HACKER_NEWS]	7min	newspaper 能对齐十位数加法运算的最小 Transformer 模型 02-28 Transformer 算法可解释性算术运算
[自动] [HACKER_NEWS]	6min	newspaper 能对齐十位数加法运算的最小Transformer模型 02-28 Transformer 算法算术
[自动] [HACKER_NEWS]	5min	newspaper 能计算两个10位数加法的最小Transformer模型 02-28 Transformer 算法推理算术运算
[自动] [HACKER_NEWS]	4min	newspaper 能计算两位十进制数相加的最小 Transformer 模型 02-28 Transformer 算法推理算术运算
[自动] [HACKER_NEWS]	6min	newspaper 能对齐十位数加法的最小Transformer模型 02-28 Transformer 算法算术
[自动] [HACKER_NEWS]	6min	newspaper 能计算两个10位数加法的最小Transformer模型 02-28 Transformer 算法推理算术运算
[自动] [HACKER_NEWS]	6min	newspaper 能对齐十位数加法运算的最小Transformer模型 02-28 Transformer 算法算术
[自动] [ARXIV]	3min	school 通过锚定机制提升模型一致性 02-27 模型一致性锚定机制模型差异
[自动] [ARXIV]	4min	school 规模难以克服语用学：报告偏差对视觉语言推理的影响 02-27 VLM 视觉语言模型报告偏差
[自动] [ARXIV]	3min	school 数据集压缩至1MB：小规模数据集的模型训练效果评估 02-27 PLADA 数据集压缩伪标签
[自动] [ARXIV]	3min	school 基于超单纯形投影的可微零一损失函数 02-27 机器学习损失函数 0-1损失
[自动] [ARXIV]	4min	school 基于Asta数据集的AI科研工具使用与交互行为分析 02-27 Asta数据集 AI科研工具用户行为分析
[自动] [ARXIV]	4min	school SOTAlign：基于最优传输的单模态视觉与语言模型半监督对齐 02-27 多模态视觉语言模型最优传输
[自动] [ARXIV]	5min	school SeeThrough3D：文本生成图像中的遮挡感知三维控制 02-27 SeeThrough3D 文本生成图像 3D控制
[自动] [BLOGS_PODCASTS]	2min	mic METR Joel Becker谈指数级时间评估与AI生产力局限 02-27 METR Joel Becker 指数级评估
[自动] [BLOGS_PODCASTS]	2min	mic Transformer中的混合专家模型架构解析 02-27 Transformer MoE 混合专家
[自动] [BLOGS_PODCASTS]	2min	mic OpenAI 与太平洋西北国家实验室推基准测试，加速联邦许可流程 02-27 OpenAI 基准测试 AI 编程代理
[自动] [BLOGS_PODCASTS]	4min	mic Anthropic 模型蒸馏与 SWE-Bench 失效机制分析 02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [GITHUB_TRENDING]	12min	hub 动手学深度学习：面向中文读者的可运行教材 02-27 深度学习 D2L PyTorch
[自动] [ARXIV]	5min	school 面向高效高分辨率GUI智能体的时空令牌剪枝 02-27 GUI Agent Token Pruning Qwen2-VL
[自动] [ARXIV]	4min	school 面向低延迟口语对话的语篇感知双流响应生成 02-27 DDTSR 低延迟口语对话
[自动] [ARXIV]	2min	school 缓解可读性代价：基于解耦证明者-验证者博弈的方法 02-27 LLM 可解释性模型评估
[自动] [ARXIV]	4min	school 无模型通用AI框架 02-27 通用人工智能强化学习无模型
[自动] [ARXIV]	3min	school 基于优化的系统为何难以实现规范响应：代理与架构限制 02-27 RLHF AI对齐智能体
[自动] [BLOGS_PODCASTS]	3min	mic Transformer架构中的混合专家模型原理与应用 02-27 Transformer MoE 混合专家模型
[自动] [ARXIV]	4min	school ReCoN-Ipsundrum：具备情感耦合控制与机制关联意识指标的可检查循环持久代理 02-27 ReCoN-Ipsundrum 机器意识 AI Agent
[自动] [ARXIV]	4min	school MovieTeller：工具增强且ID一致的渐进式摘要生成 02-27 MovieTeller 视频摘要 VLM
[自动] [ARXIV]	4min	school 提升推理语言模型的参数化知识获取能力 02-27 LLM 推理模型参数化知识
[自动] [ARXIV]	3min	school LiCQA：轻量级复杂问答系统 02-27 LiCQA 复杂问答 QA系统
[自动] [ARXIV]	5min	school GUI-Libra：动作感知监督与可验证强化学习的原生GUI智能体 02-27 GUI Agent 强化学习 RL
[自动] [ARXIV]	4min	school DySCO：面向长上下文大模型的动态注意力缩放解码方法 02-27 DySCO 长上下文解码算法
[自动] [ARXIV]	4min	school 提升推理语言模型的参数化知识访问能力 02-26 推理模型参数化知识强化学习
[自动] [BLOGS_PODCASTS]	2min	mic Transformer 架构中的混合专家模型原理与优势 02-26 MoE Transformer 混合专家
[自动] [ARXIV]	4min	school LiCQA：面向复杂问答的轻量级系统 02-26 LiCQA 复杂问答轻量级系统
[自动] [ARXIV]	4min	school DySCO：面向长上下文大模型的动态注意力缩放解码 02-26 DySCO 长上下文注意力机制
[自动] [HACKER_NEWS]	4min	newspaper 用概念代数引导可解释的语言模型 02-26 可解释性概念代数模型控制
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家
[自动] [BLOGS_PODCASTS]	2min	mic Transformer中的混合专家模型：架构原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 Transformer MoE 混合专家模型
[自动] [HACKER_NEWS]	7min	newspaper PA基准：评估Web智能体在真实个人助理工作流中的表现 02-26 Web智能体 PA基准个人助理
[自动] [JUEJIN]	2min	sticky_note_2 空洞卷积原理：如何解决计算机视觉的精度与视野矛盾 02-26 空洞卷积计算机视觉深度学习
[自动] [JUEJIN]	2min	sticky_note_2 大模型非线性变换解析：从MLP到MoE的架构演进 02-26 非线性变换 MLP MoE
[自动] [HACKER_NEWS]	6min	newspaper PA基准：评估Web智能体在真实个人助理工作流中的表现 02-26 Web智能体 PA基准个人助理
[自动] [ARXIV]	5min	school 用于Wasserstein测地线与最优传输动力学的神经求解器 02-26 最优传输 Wasserstein 神经网络
[自动] [ARXIV]	4min	school 函数空间经验贝叶斯正则化：基于t分布先验 02-26 贝叶斯深度学习函数空间经验贝叶斯
[自动] [ARXIV]	4min	school TG-ASR：基于并行门控交叉注意力的翻译引导低资源语音识别 02-26 ASR 语音识别低资源学习
[自动] [ARXIV]	4min	school CxMP：评估语言模型构式理解的语言学最小对子基准 02-26 CxMP 构式语法最小对子
[自动] [ARXIV]	3min	school 扩散对偶性第二章：Ψ采样器与高效课程 02-26 扩散模型离散扩散 Psi采样器
[自动] [ARXIV]	4min	school 平滑无关学习统计查询复杂度下界 02-26 计算复杂度统计查询 SQ下界
[自动] [ARXIV]	4min	school 基于试错学习的反思式测试时规划：用于具身大模型 02-26 具身智能反思机制测试时规划
[自动] [ARXIV]	5min	school 任意模态下的多向量索引压缩方法 02-26 多向量索引模态压缩 Late Interaction
[自动] [ARXIV]	5min	school 为何LLM后训练中Pass@k优化会降低Pass@1性能 02-26 LLM 后训练 Pass@k
[自动] [ARXIV]	4min	school Test-Time训练结合KV绑定等价于线性注意力 02-26 TTT 线性注意力 KV绑定
[自动] [ARXIV]	4min	school Squint：面向机器人虚实迁移的快速视觉强化学习 02-26 强化学习机器人 Sim-to-Real
[自动] [ARXIV]	4min	school Aletheia自主攻克FirstProof数学定理 02-26 Aletheia Gemini 3 数学定理
[自动] [ARXIV]	4min	school 针对平滑对抗学习的统计查询下界研究 02-25 统计查询计算复杂性对抗学习
[自动] [ARXIV]	4min	school 扩散对偶性第二章：Ψ采样器与高效课程 02-25 扩散模型离散扩散采样器
[自动] [ARXIV]	6min	school 多模态任意向量索引压缩技术 02-25 向量检索多模态索引压缩
[自动] [ARXIV]	4min	school 基于试错反思的具身大模型测试时规划 02-25 具身智能反思机制测试时规划
[自动] [ARXIV]	5min	school 为何Pass@k优化会降低Pass@1：大模型后训练中的提示干扰 02-25 LLM 后训练代码生成
[自动] [ARXIV]	4min	school Squint：面向机器人具身迁移的快速视觉强化学习 02-25 强化学习机器人 Sim-to-Real
[自动] [ARXIV]	4min	school KV绑定测试时训练等价于线性注意力 02-25 TTT 线性注意力 KV缓存
[自动] [ARXIV]	4min	school Aletheia模型自主攻克FirstProof数学定理证明 02-25 Aletheia FirstProof 数学定理证明
[自动] [HACKER_NEWS]	4min	newspaper PA Bench：评估前沿模型多标签页任务能力 02-25 PA Bench 多标签页模型评估
[自动] [HACKER_NEWS]	5min	newspaper Mercury 2：基于扩散模型的快速推理大语言模型 02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]	4min	newspaper Mercury 2：基于扩散模型的快速推理大语言模型 02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]	5min	newspaper Mercury 2：基于扩散模型的快速推理大语言模型 02-25 Mercury 2 扩散模型推理加速
[自动] [HACKER_NEWS]	4min	newspaper Mercury 2：基于扩散模型的快速推理大语言模型 02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]	4min	newspaper Mercury 2：基于扩散模型的快速推理大语言模型 02-25 Mercury 2 扩散模型推理加速
[自动] [HACKER_NEWS]	4min	newspaper Mercury 2：基于扩散模型的快速推理大语言模型 02-25 Mercury 2 扩散模型推理加速
[自动] [ARXIV]	3min	school 超越星级评分：基于LLM与文本分类的细粒度情感分析框架 02-25 LLM 情感分析 ABSA
[自动] [ARXIV]	4min	school 离线强化学习：面向离动力学环境的局部动力学感知域适应 02-25 离线强化学习 LoDADA 域适应
[自动] [ARXIV]	3min	school 工具构建：通往高级智能的路径 02-25 LLM 超级智能工具构建
[自动] [ARXIV]	3min	school 动机优化：提升大语言模型任务表现的关键机制 02-25 动机优化训练范式情感神经科学
[自动] [ARXIV]	4min	school VAUQ：面向LVLM自评估的视觉感知不确定性量化 02-25 LVLM 多模态不确定性量化
[自动] [ARXIV]	4min	school ProxyFL：面向联邦半监督学习的代理引导框架 02-25 联邦学习半监督学习 FSSL
[自动] [ARXIV]	5min	school DeepSpeed图像工作负载评测：视觉Transformer扩展性能 02-25 DeepSpeed ViT 视觉Transformer
[自动] [ARXIV]	4min	school 非单调损失函数的共形风险控制方法 02-25 非单调损失保序风险控制共形预测
[自动] [ARXIV]	4min	school 部分可观测平均场博弈的循环结构策略梯度算法 02-25 平均场博弈 MFG 策略梯度
[自动] [ARXIV]	4min	school 行为学习：从数据中学习分层优化结构 02-25 行为学习分层优化可解释性
[自动] [HACKER_NEWS]	4min	newspaper Mercury 2：基于扩散模型的最快推理 LLM 02-25 Mercury 2 扩散模型推理模型
[自动] [ARXIV]	4min	school JUCAL：分类任务中偶然与认知不确定性的联合校准 02-25 不确定性校准 JUCAL 偶然不确定性
[自动] [ARXIV]	4min	school 面向大规模视频推理的综合基准测试套件 02-24 视频推理 VBVR 基准测试
[自动] [ARXIV]	4min	school 非单调损失函数的保形风险控制方法 02-24 保形预测风险控制非单调损失
[自动] [ARXIV]	4min	school 行为学习：从数据中学习分层优化结构 02-24 行为学习分层优化可解释性
[自动] [ARXIV]	4min	school JUCAL：分类任务中偶然与认知不确定性的联合校准 02-24 不确定性校准 JUCAL 偶然不确定性
[自动] [ARXIV]	4min	school AdaEvolve：基于大语言模型的自适应零阶优化方法 02-24 AdaEvolve LLM 零阶优化
[自动] [ARXIV]	4min	school 部分可观测平均场博弈的循环结构策略梯度算法 02-24 平均场博弈部分可观测策略梯度
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型在First Proof数学挑战中的证明尝试 02-24 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro发布：ARC-AGI 2得分达3.0两倍 02-24 Gemini Google ARC-AGI
[自动] [HACKER_NEWS]	6min	newspaper Steerling-8B：可解释自身生成任一 token 的语言模型 02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]	3min	newspaper Steerling-8B：可解释自身生成任一 Token 的语言模型 02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]	5min	newspaper Steerling-8B：可解释自身生成任一 Token 的语言模型 02-24 Steerling-8B 可解释性 LLM
[自动] [JUEJIN]	2min	sticky_note_2 DeepMind研究：多智能体协作瓶颈与Agent能力天花板分析 02-24 DeepMind 多智能体 Agent
[自动] [JUEJIN]	2min	sticky_note_2 ArcFlow实现FLUX与Qwen推理40倍加速 02-24 ArcFlow FLUX Qwen
[自动] [HACKER_NEWS]	3min	newspaper 53款模型“洗车”测试：评估多模态AI在物理场景中的表现 02-24 多模态物理场景模型评估
[自动] [HACKER_NEWS]	4min	newspaper Steerling-8B：可解释自身生成任一 Token 的语言模型 02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]	4min	newspaper Steerling-8B：可解释自身生成任一 Token 的语言模型 02-24 Steerling-8B 可解释性 LLM
[自动] [ARXIV]	4min	school 部分软匹配距离：基于部分单元对应的神经表征比较 02-24 神经表征部分软匹配最优传输
[自动] [ARXIV]	4min	school 用于软优势策略优化的平滑门函数 02-24 强化学习 GRPO SAPO
[自动] [ARXIV]	4min	school 无需训练的图神经网络跨架构合并方法 02-24 arxiv cs.LG
[自动] [ARXIV]	4min	school 城市编辑：面向依赖感知的分层智能体城市地理空间修改 02-24 City Editing 分层智能体多模态推理
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型在First Proof数学挑战中的证明尝试 02-24 First Proof 数学证明 AI推理
[自动] [ARXIV]	5min	school Soft Sequence Policy Optimization：连接GMPO与SAPO 02-24 SSPO LLM对齐强化学习
[自动] [ARXIV]	4min	school RetinaVision：基于XAI增强调控的深度学习视网膜疾病分类 02-24 计算机视觉医疗AI 深度学习
[自动] [BLOGS_PODCASTS]	4min	mic Gemini 3.1 Pro发布：ARC-AGI 2得分达3.0两倍 02-24 Gemini Google ARC-AGI
[自动] [ARXIV]	4min	school 统一图神经网络均匀表达能力的通用方法 02-24 GNN 图神经网络表达能力
[自动] [ARXIV]	4min	school 扩散模型无需噪声调节的几何学原理 02-24 扩散模型 Flow Matching 几何学原理
[自动] [ARXIV]	4min	school 基准测试图神经网络在解决难约束满足问题中的性能 02-24 GNN 图神经网络约束满足问题
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型针对First Proof数学挑战的证明尝试 02-24 数学推理 First Proof 研究级推理
[自动] [ARXIV]	5min	school U(d)子群导出自然RNN与Transformer架构 02-24 RNN Transformer 序列模型
[自动] [ARXIV]	3min	school RVR：检索-验证-检索机制提升综合问答能力 02-24 RVR RAG 检索增强
[自动] [ARXIV]	4min	school K-partition 集成方法：通过置信度分配提升模型性能 02-24 CAKE 聚类集成置信度评估
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro发布：ARC-AGI 2得分达3.0两倍 02-24 Gemini Google ARC-AGI
[自动] [ARXIV]	3min	school 统一图神经网络均匀表达能力的通用方法 02-23 GNN 图神经网络表达能力
[自动] [BLOGS_PODCASTS]	2min	mic 研究显示主流AI模型向弱势用户提供的信息准确度较低 02-23 AI偏见数字鸿沟模型评估
[自动] [ARXIV]	4min	school 扩散模型无需噪声条件：几何视角的解释 02-23 扩散模型几何视角生成模型
[自动] [ARXIV]	4min	school 基准测试图神经网络在求解难约束满足问题中的性能 02-23 GNN 图神经网络约束满足问题
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型针对First Proof数学挑战的证明尝试 02-23 First Proof 数学证明推理能力
[自动] [ARXIV]	4min	school 为K分区集成模型分配置信度以提升预测性能 02-23 聚类分析集成学习置信度评估
[自动] [ARXIV]	4min	school U(d)子群自然导出RNN与Transformer架构 02-23 RNN Transformer U(d)
[自动] [ARXIV]	4min	school RVR：检索-验证-检索框架提升综合问答能力 02-23 RVR RAG 检索增强
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro 发布：ARC-AGI 2 得分达 3.0 两倍 02-23 Gemini 3.1 Pro Google ARC-AGI 2
[自动] [HACKER_NEWS]	4min	newspaper 53 款模型参与“洗车”基准测试 02-23 基准测试模型评估 LLM
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro发布：ARC-AGI 2评测分数达3.0两倍 02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]	2min	mic AI模型在First Proof数学挑战中的证明尝试 02-23 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型在First Proof数学挑战中的证明尝试 02-23 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro发布：ARC-AGI 2得分达3.0两倍 02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型针对First Proof数学挑战的证明尝试 02-23 First Proof 数学证明推理能力
[自动] [BLOGS_PODCASTS]	2min	mic Gemini 3.1 Pro发布：ARC-AGI 2得分达3.0两倍 02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型针对First Proof数学挑战的证明尝试 02-23 数学推理 First Proof 专家级问题
[自动] [BLOGS_PODCASTS]	2min	mic MIT研究：主流AI模型对低学历及非美用户提供信息准确度较低 02-23 MIT LLM 偏见
[自动] [BLOGS_PODCASTS]	4min	mic Gemini 3.1 Pro 发布：ARC-AGI 2 得分达 3.0 两倍 02-23 Gemini 3.1 Pro Google ARC-AGI
[自动] [ARXIV]	4min	school 面向扩散语言模型的感知剪枝方法 02-23 扩散模型语言模型模型剪枝
[自动] [ARXIV]	3min	school 语言模型处理差异论元标记时的类型学对齐差异 02-23 语言模型类型学区分性论元标记
[自动] [ARXIV]	3min	school 多轮人机协作中用户需求的精准对齐方法 02-23 人机协作多轮对话决策质量
[自动] [ARXIV]	4min	school MARS：基于边界感知与自我优化的奖励建模 02-23 RLHF 奖励模型 MARS
[自动] [BLOGS_PODCASTS]	2min	mic 研究：主流AI聊天机器人向弱势用户提供的信息准确度较低 02-22 AI偏见信息准确性弱势群体
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型在First Proof数学挑战中的证明尝试 02-22 AI模型 First Proof 数学挑战
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro发布：ARC-AGI 2评测分数达3.0两倍 02-22 Gemini Google ARC-AGI
[自动] [ARXIV]	4min	school 面向扩散语言模型的感知汇点剪枝方法 02-22 扩散模型 DLM 模型剪枝
[自动] [ARXIV]	3min	school 语言模型处理差异论元标记的类型对齐差异 02-22 语言模型 GPT-2 计算语言学
[自动] [ARXIV]	4min	school 细粒度细节靶向提升黑盒大视觉模型攻击能力 02-22 LVLM 黑盒攻击对抗样本
[自动] [ARXIV]	4min	school 多轮人机协作框架支持用户自定义需求 02-22 人机协作多轮对话决策质量
[自动] [ARXIV]	4min	school MARS：基于边距感知奖励建模与自我精炼 02-22 MARS RLHF Reward Model
[自动] [HACKER_NEWS]	6min	newspaper 误差随时间前向传播机制解析 02-22 误差传播时间序列前向传播
[自动] [HACKER_NEWS]	4min	newspaper 误差随时间前向传播机制解析 02-22 误差传播前向传播时间序列
[自动] [HACKER_NEWS]	6min	newspaper 误差随时间前向传播机制解析 02-22 误差传播时间序列神经网络
[自动] [ARXIV]	5min	school 面向扩散语言模型的Sink感知剪枝方法 02-21 扩散模型语言模型模型剪枝
[自动] [ARXIV]	4min	school 通过细粒度细节定位推进黑盒LVLM攻击边界 02-21 LVLM 黑盒攻击对抗样本
[自动] [ARXIV]	3min	school 语言模型处理差价论元标记的类型学对齐差异 02-21 语言模型计算语言学类型学
[自动] [ARXIV]	4min	school 多轮人机协作框架支持用户自定义需求 02-21 人机协作 LLM 决策质量
[自动] [ARXIV]	4min	school 基于分词器的语言识别模型研究 02-21 UniLID 语言识别分词器
[自动] [ARXIV]	5min	school MMARS：基于边际感知与自我精炼的奖励建模 02-21 RLHF 奖励建模数据增强
[自动] [BLOGS_PODCASTS]	3min	mic AI模型针对First Proof数学挑战的证明尝试与推理能力测试 02-21 LLM 数学推理 First Proof
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3.1 Pro发布：ARC-AGI 2得分达3.0两倍 02-21 Gemini Google ARC-AGI
[自动] [HACKER_NEWS]	4min	newspaper 大语言模型推理失败机制分析 02-21 LLM 推理逻辑错误
[自动] [BLOGS_PODCASTS]	2min	mic 研究显示主流AI模型向弱势用户提供信息准确度较低 02-21 AI偏见公平性准确性
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型在First Proof数学挑战中的证明尝试 02-21 数学推理 First Proof 研究级推理
[自动] [ARXIV]	4min	school 面向扩散语言模型的Sink感知剪枝方法 02-20 扩散模型语言模型模型剪枝
[自动] [ARXIV]	3min	school 语言模型对差异论元标记处理的类型学对齐差异 02-20 语言模型 GPT-2 计算语言学
[自动] [ARXIV]	3min	school 基于用户指定需求的多轮人机协作框架 02-20 人机协作多轮对话决策质量
[自动] [ARXIV]	4min	school 基于分词器的语言识别方法研究 02-20 UniLID 语言识别 LID
[自动] [ARXIV]	5min	school MARS：基于边际感知与自我精炼的奖励建模 02-20 MARS RLHF 奖励模型
[自动] [BLOGS_PODCASTS]	2min	mic Anthropic 发布自主智能体 METR 基准测试数据 02-20 Anthropic 智能体 Agent
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic 公布 Agent 自主性研究及 METR 基准数据 02-20 Anthropic Agent 自主性
[自动] [HACKER_NEWS]	4min	newspaper 一致性扩散语言模型提速14倍且无损质量 02-20 扩散模型一致性模型语言模型
[自动] [BLOGS_PODCASTS]	3min	mic 研究显示主流AI模型对弱势群体提供信息准确度较低 02-20 AI偏见公平性包容性
[自动] [HACKER_NEWS]	4min	newspaper 一致性扩散语言模型提速14倍且无损质量 02-20 扩散模型一致性模型语言模型
[自动] [HACKER_NEWS]	4min	newspaper 一致性扩散语言模型提速14倍且无损质量 02-20 扩散模型一致性模型语言模型
[自动] [BLOGS_PODCASTS]	4min	mic Gemini 3.1 Pro发布：ARC-AGI 2得分达3.0两倍 02-20 Gemini 3.1 Pro Google ARC-AGI
[自动] [HACKER_NEWS]	4min	newspaper 一致性扩散语言模型提速14倍且无损质量 02-20 扩散模型一致性模型语言模型
[自动] [HACKER_NEWS]	5min	newspaper 利用注意力匹配加速 KV 键值对压缩 02-20 KV压缩注意力机制推理加速
[自动] [HACKER_NEWS]	6min	newspaper 一致性扩散语言模型提速14倍且无损质量 02-20 扩散模型一致性模型语言模型
[自动] [HACKER_NEWS]	4min	newspaper 一致性扩散语言模型提速14倍且无损质量 02-20 扩散模型一致性模型语言模型
[自动] [ARXIV]	3min	school 评估LLM辅助对生物学新手表现的影响 02-20 LLM 生物学随机对照试验
[自动] [ARXIV]	4min	school 知识嵌入潜在投影提升鲁棒表征学习 02-20 表征学习数据不平衡 EHR
[自动] [ARXIV]	3min	school 机器遗忘中保护未删除数据隐私的方法 02-20 机器遗忘隐私保护重构攻击
[自动] [ARXIV]	4min	school 强化快速权重结合下一序列预测模型 02-20 REFINE 强化学习快速权重
[自动] [ARXIV]	4min	school 因果性是可解释性泛化的关键 02-20 可解释性因果推断泛化性
[自动] [ARXIV]	3min	school 以对象为中心的表征是否更利于组合泛化 02-20 组合泛化对象中心视觉表征
[自动] [ARXIV]	5min	school Calibrate-Then-Act：面向大模型智能体的成本感知探索 02-20 LLM Agents 成本感知 CTA框架
[自动] [ARXIV]	4min	school 知识嵌入隐投影用于鲁棒表征学习 02-19 表征学习 EHR 数据不平衡
[自动] [ARXIV]	3min	school 机器遗忘中保护未删除数据的隐私防御机制 02-19 机器遗忘隐私保护重构攻击
[自动] [ARXIV]	4min	school 强化快速权重与下一序列预测 02-19 REFINE 快速权重强化学习
[自动] [ARXIV]	3min	school 因果性是可解释性泛化的关键 02-19 因果推断可解释性 LLM
[自动] [ARXIV]	4min	school 以对象为中心的表征在组合泛化任务中的表现评估 02-19 组合泛化以对象为中心视觉问答
[自动] [ARXIV]	5min	school Calibrate-Then-Act：大模型智能体的成本感知探索 02-19 LLM Agents 成本感知探索策略
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic发布Agent自主性研究及METR数据 02-19 Anthropic Agent 自主性
[自动] [BLOGS_PODCASTS]	3min	mic 长期对话语境下LLM个性化特征与回音室效应分析 02-19 LLM 个性化回音室效应
[自动] [BLOGS_PODCASTS]	2min	mic 美德伦理在AI对齐中的有效性 02-19 AI对齐美德伦理 AI安全
[自动] [BLOGS_PODCASTS]	2min	mic 个性化功能可能导致大语言模型迎合用户观点形成回声室 02-19 LLM 个性化回声室
[自动] [BLOGS_PODCASTS]	2min	mic 长期对话语境下LLM观点映射与回声室效应 02-19 LLM 个性化回声室效应
[自动] [BLOGS_PODCASTS]	2min	mic IBM与UC伯克利利用IT-Bench和MAST诊断企业智能体失败原因 02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]	2min	mic 长期对话导致大语言模型镜像用户观点并形成回声室 02-19 LLM 个性化回声室
[自动] [ARXIV]	3min	school 通过任务复杂度量化验证浅层对齐假说 02-19 浅层对齐假说 SAH 任务复杂度
[自动] [HACKER_NEWS]	4min	newspaper LLM 上下文长度外推技术综述 02-19 LLM 上下文窗口外推
[自动] [ARXIV]	4min	school CrispEdit：低曲率投影实现可扩展的大模型无损编辑 02-19 LLM编辑模型编辑 CrispEdit
[自动] [ARXIV]	3min	school Avey-B：基于视觉基础模型的通用具身智能代理 02-19 Avey-B NLP Transformer
[自动] [BLOGS_PODCASTS]	2min	mic Qwen3.5-397B-A17B：最小的高效Open-Opus级模型 02-18 Qwen3.5 模型压缩性能优化
[自动] [BLOGS_PODCASTS]	2min	mic IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因 02-18 IBM UC Berkeley IT-Bench
[自动] [ARXIV]	3min	school 胸部X光分类的任务无关持续学习方法 02-18 持续学习胸部X光医学影像
[自动] [ARXIV]	3min	school 基于任务复杂度的浅层对齐假说操作化研究 02-18 浅层对齐 SAH 任务复杂度
[自动] [ARXIV]	3min	school 基于D最优统计的高维仿真代理测试时适应稳定化方法 02-18 TTA 仿真代理分布偏移
[自动] [ARXIV]	3min	school 利用强化学习解决未知可行性的参数鲁棒避障问题 02-18 强化学习鲁棒性避障
[自动] [ARXIV]	4min	school Dex4D：任务无关点跟踪策略实现灵巧操作跨域迁移 02-18 灵巧操作 Sim-to-Real 强化学习
[自动] [ARXIV]	4min	school CrispEdit：低曲率投影实现可扩展的大模型无损编辑 02-18 模型编辑 CrispEdit LLM
[自动] [BLOGS_PODCASTS]	2min	mic IBM与UC Berkeley利用IT-Bench和MAST诊断企业智能体失败原因 02-18 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5.2提出新胶子振幅公式并获合作者验证 02-18 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]	5min	school Avey-B：基于注意力机制的高效视觉Transformer模型 02-18 Avey-B Transformer NLP
[自动] [BLOGS_PODCASTS]	3min	mic GPT-5.2推导胶子振幅新公式并获验证 02-18 GPT-5.2 理论物理胶子振幅
[自动] [JUEJIN]	2min	sticky_note_2 SkillsBench 论文解读：跨任务基准测试如何揭示 Agent 技能的实际效用 02-18 Agent LLM SkillsBench
[自动] [BLOGS_PODCASTS]	2min	mic 长期对话语境导致LLM迎合用户观点形成回声室 02-18 LLM 个性化回声室
[自动] [BLOGS_PODCASTS]	3min	mic GPT-5.2推导新胶子振幅公式获正式证明 02-18 GPT-5.2 理论物理科学发现
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5.2 提出胶子振幅新公式并获合作验证 02-18 GPT-5.2 理论物理胶子振幅
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5.2提出胶子振幅新公式并获学术验证 02-18 GPT-5.2 理论物理胶子振幅
[自动] [ARXIV]	3min	school 长上下文LLM缩放缺陷：隐私与个性化任务揭示注意力分散 02-18 长上下文 LLM 个性化
[自动] [ARXIV]	4min	school 超越掩码扩散语言模型的扩展性研究 02-18 扩散模型语言模型扩展定律
[自动] [ARXIV]	4min	school 语言统计对称性塑造模型表征的几何结构 02-18 表征几何统计对称性词嵌入
[自动] [ARXIV]	4min	school 离散扩散模型高效采样：锐利且自适应的理论保证 02-18 离散扩散模型 CTMC 采样效率
[自动] [ARXIV]	3min	school 基于结构化世界模型先验的冷启动个性化方案 02-18 冷启动个性化世界模型
[自动] [ARXIV]	4min	school 基于正则化与对称性重审扩散模型及其分子图生成应用 02-18 扩散模型分子图生成对称性
[自动] [ARXIV]	2min	school 基于参数高效微调与往返翻译的文本风格迁移 02-18 文本风格迁移参数高效微调 LLM
[自动] [ARXIV]	3min	school BPP：聚焦关键历史帧的长上下文机器人模仿学习 02-18 机器人模仿学习长上下文
[自动] [ARXIV]	3min	school 长上下文LLM隐私与个性化任务中的缩放差距研究 02-17 长上下文隐私保护个性化
[自动] [ARXIV]	3min	school 超越掩码扩散语言模型的扩展性研究 02-17 扩散模型语言模型扩展定律
[自动] [ARXIV]	3min	school 语言统计对称性塑造模型表征的几何结构 02-17 表征学习几何结构统计对称性
[自动] [ARXIV]	4min	school 离散扩散模型高效采样：具备锐利性与自适应保证 02-17 离散扩散模型高效采样 tau-leaping
[自动] [ARXIV]	3min	school 基于结构化世界模型的无训练先验用于冷启动个性化 02-17 个性化冷启动世界模型
[自动] [ARXIV]	4min	school 基于标准化的扩散模型对称性重思考与分子图生成 02-17 扩散模型分子图生成对称性
[自动] [ARXIV]	4min	school 基于参数高效微调与往返翻译的文本风格迁移 02-17 文本风格迁移 PEFT LLM
[自动] [BLOGS_PODCASTS]	3min	mic GPT-5.2提出胶子振幅新公式并获验证 02-17 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]	3min	mic Gemini 3 Deep Think：推进科学与工程研究 02-17 Gemini 3 DeepMind Deep Think
[自动] [ARXIV]	3min	school BPP：聚焦关键历史帧的长上下文机器人模仿学习 02-17 机器人模仿学习长上下文
[自动] [JUEJIN]	2min	sticky_note_2 Qwen3.5-397B-A17B：极致稀疏MoE架构与多模态能力详解 02-17 Qwen3.5 MoE 多模态
[自动] [HACKER_NEWS]	4min	newspaper 语义消融实验：揭示AI写作为何平庸同质化 02-17 语义消融 AI写作同质化
[自动] [JUEJIN]	3min	sticky_note_2 SkillsBench论文：评估Agent技能在多任务中的实际效用 02-17 Agent LLM SkillsBench
[自动] [HACKER_NEWS]	7min	newspaper SkillsBench：评估智能体技能在多样化任务中的表现基准 02-17 SkillsBench 智能体 Agent
[自动] [ARXIV]	4min	school 过程监督多智能体强化学习提升临床推理可靠性 02-17 多智能体强化学习临床推理
[自动] [ARXIV]	4min	school 科学推理模型引入拒答机制以提升准确性 02-17 科学推理拒答机制 NLI
[自动] [HACKER_NEWS]	4min	newspaper 研究：自生成的智能体技能通常无效 02-17 AI Agent 智能体 LLM
[自动] [ARXIV]	4min	school 延迟视觉摄入优化图文密集文档问答 02-17 多模态文档问答 VLM
[自动] [ARXIV]	5min	school 基于枢纽重采样的LLM强化学习深度密集探索 02-17 LLM 强化学习 RLHF
[自动] [ARXIV]	5min	school UniWeTok：统一二进制分词器支持2^128码本规模 02-17 UniWeTok 多模态 Tokenizer
[自动] [ARXIV]	4min	school GPT-5与其他大模型长短上下文性能对比 02-17 GPT-5 LLM 长文本
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5.2提出新胶子振幅公式获学术验证 02-17 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]	3min	school 语义分块与自然语言熵：优化文本切分策略 02-17 语义分块自然语言熵文本切分
[自动] [HACKER_NEWS]	4min	newspaper 研究：自生成的Agent技能实际无效 02-17 Agent LLM 研究
[自动] [ARXIV]	4min	school 基于扩散模型从面部嵌入重建真实人脸 02-17 扩散模型人脸重建 KAN
[自动] [ARXIV]	4min	school 基于仿真过滤的模块化策略从人类视频学习有效行为 02-17 机器人模仿学习仿真过滤
[自动] [ARXIV]	4min	school 在线镜像 descent 使用镜像图组合改进遗憾保证 02-17 在线镜像下降 OMD 在线凸优化
[自动] [ARXIV]	5min	school CoPE-VideoLM：基于编解码基元的高效视频语言模型 02-17 VideoLM 视频理解多模态
[自动] [ARXIV]	3min	school 语义分块与自然语言熵的关联研究 02-16 语义分块自然语言熵 LLM
[自动] [HACKER_NEWS]	3min	newspaper 研究：自生成的Agent技能通常无效 02-16 Agent LLM 自生成技能
[自动] [ARXIV]	4min	school 基于镜像映射组合改进在线镜像下降的遗憾界 02-16 在线优化 OMD 遗憾界
[自动] [ARXIV]	3min	school 基于扩散模型从面部嵌入实现真实人脸重建 02-16 扩散模型人脸重建隐私保护
[自动] [ARXIV]	4min	school 仿真筛选模块化策略：从人类视频学习有效行为 02-16 机器人强化学习模仿学习
[自动] [HACKER_NEWS]	7min	newspaper LCM：无损上下文管理技术论文 02-16 LCM 上下文管理无损
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5.2 提出胶子振幅新公式并获合作者验证 02-16 GPT-5.2 理论物理胶子振幅
[自动] [ARXIV]	4min	school CoPE-VideoLM：基于编解码基元的高效视频语言模型 02-16 VideoLM 多模态视频理解
[自动] [HACKER_NEWS]	4min	newspaper 研究：自生成的Agent技能通常无效 02-16 Agent LLM 自生成技能
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5.2提出胶子振幅新公式并获合作验证 02-16 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]	4min	school 面向语言模型的在线上下文蒸馏方法 02-16 LLM 蒸馏上下文学习
[自动] [HACKER_NEWS]	4min	newspaper 迈向自主数学研究 02-16 自主研究数学 AI
[自动] [ARXIV]	4min	school 视觉-语言-动作对齐：扩展验证比扩展策略学习更有效 02-16 VLA 具身智能 CoVer
[自动] [ARXIV]	4min	school UniT：统一多模态思维链测试时扩展方法 02-16 多模态思维链测试时扩展
[自动] [ARXIV]	5min	school CM2：基于清单奖励强化学习的多步智能体工具调用 02-16 强化学习 Agent 工具调用
[自动] [ARXIV]	4min	school AttentionRetriever：注意力层即长文档检索器 02-16 RAG 长文档检索
[自动] [HACKER_NEWS]	4min	newspaper 迈向自主数学研究 02-15 自主研究数学 AI
[自动] [ARXIV]	4min	school 语言模型在线策略上下文蒸馏方法 02-15 模型蒸馏上下文学习在线策略
[自动] [ARXIV]	4min	school 扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐 02-15 VLA 具身智能机器人
[自动] [ARXIV]	4min	school WebAgents测试时扩展：智能体性能提升方法 02-15 WebAgents 测试时扩展 CATTS
[自动] [ARXIV]	4min	school UniT：统一多模态思维链测试时扩展方法 02-15 多模态思维链测试时扩展
[自动] [ARXIV]	4min	school MonarchRT：面向实时视频生成的高效注意力机制 02-15 视频生成 DiT 注意力机制
[自动] [BLOGS_PODCASTS]	2min	mic Gemini 3 Deep Think：面向科研与工程的科学推理模型 02-15 Gemini 3 Deep Think 科学推理
[自动] [ARXIV]	4min	school CM2：基于清单奖励强化学习的多步智能体工具调用 02-15 CM2 强化学习 Agent
[自动] [ARXIV]	3min	school AttentionRetriever：注意力层隐式实现长文档检索 02-15 RAG 长文档检索 AttentionRetriever
[自动] [HACKER_NEWS]	4min	newspaper 迈向自主数学研究 02-15 自主研究数学 AI科学家
[自动] [BLOGS_PODCASTS]	3min	mic GPT-5.2提出胶子振幅新公式并获验证 02-15 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]	3min	school AI时代的创意所有权界定 02-15 版权生成式AI 法律
[自动] [HACKER_NEWS]	4min	newspaper 迈向自主数学研究：AI 探索自动化定理证明 02-15 自动化定理证明 AI for Math 形式化验证
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5.2提出新胶子振幅公式并获合作验证 02-15 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5.2提出新胶子振幅公式获学术验证 02-14 GPT-5.2 理论物理胶子振幅
[自动] [ARXIV]	4min	school 扩展验证比扩展策略学习更有效实现视觉-语言-动作对齐 02-14 VLA 具身智能机器人
[自动] [ARXIV]	4min	school 基于策略上下文蒸馏的大语言模型优化方法 02-14 LLM 蒸馏上下文学习
[自动] [ARXIV]	4min	school UniT：统一多模态思维链测试时扩展 02-14 多模态思维链测试时扩展
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5.2推导新胶子振幅公式获正式验证 02-14 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]	5min	school CM2：基于清单奖励强化学习的多步多轮智能体工具调用 02-14 智能体强化学习工具调用
[自动] [ARXIV]	4min	school AttentionRetriever：注意力层可作为长文档检索器 02-14 RAG 长文档检索 AttentionRetriever
[自动] [HACKER_NEWS]	4min	newspaper GPT-5.2 推导出理论物理新结果 02-14 GPT-5.2 理论物理科学发现
[自动] [HACKER_NEWS]	3min	newspaper G 02-14 GPT-5.2 理论物理科学发现
[自动] [HACKER_NEWS]	4min	newspaper GPT-5.2 推导出理论物理领域新成果 02-14 GPT-5.2 理论物理科学发现
[自动] [HACKER_NEWS]	5min	newspaper 神经渲染技术探索与应用实践 02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]	4min	newspaper GPT-5.2 推导出理论物理新结果 02-14 GPT-5.2 理论物理科学发现
[自动] [HACKER_NEWS]	5min	newspaper GPT-5.2 推导出理论物理新结果 02-14 GPT-5.2 理论物理 AI for Science
[自动] [HACKER_NEWS]	4min	newspaper GPT-5.2 推导出理论物理新成果 02-14 GPT-5.2 理论物理科学发现
[自动] [ARXIV]	4min	school 面向语言模型的在线上下文蒸馏方法 02-13 LLM 模型蒸馏上下文学习
[自动] [ARXIV]	4min	school 扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐 02-13 VLA 具身智能机器人
[自动] [ARXIV]	4min	school UniT：统一多模态思维链测试时扩展方法 02-13 多模态思维链测试时扩展
[自动] [HACKER_NEWS]	4min	newspaper GPT-5.2 推导出理论物理新结果 02-13 GPT-5.2 理论物理 AI for Science
[自动] [ARXIV]	4min	school AttentionRetriever：注意力层即长文档检索器 02-13 RAG 长文档检索 AttentionRetriever
[自动] [BLOGS_PODCASTS]	3min	mic Rafael Gómez-Bombarelli：AI与模拟加速科学发现的转折点 02-13 AI for Science 科学发现模拟技术
[自动] [BLOGS_PODCASTS]	2min	mic AI与模拟加速科学发现的转折点 02-13 科学发现 AI模拟 Rafael Gómez-Bombarelli
[自动] [HACKER_NEWS]	3min	newspaper 尼克·博斯特罗姆新论文探讨超级智能的启动时机 02-13 超级智能尼克·博斯特罗姆 AI安全
[自动] [ARXIV]	4min	school 训练LRM模型：自适应反思与长度协调惩罚提升推理效率 02-13 LRM 推理效率自适应反思
[自动] [ARXIV]	4min	school 离线强化学习在Q星近似与部分覆盖下的复杂度分析 02-13 离线强化学习 Q星近似部分覆盖
[自动] [ARXIV]	4min	school 基于奖励外推的广义在线策略蒸馏算法 02-13 LLM 强化学习知识蒸馏
[自动] [ARXIV]	4min	school 利用辅助信息实现少样本设计优化 02-13 贝叶斯优化少样本学习设计优化
[自动] [ARXIV]	3min	school Pensieve范式：有状态语言模型自主管理上下文 02-13 StateLM 有状态模型上下文管理
[自动] [ARXIV]	4min	school P-GenRM：个性化生成式奖励模型与基于用户的测试时缩放 02-13 P-GenRM 个性化对齐奖励模型
[自动] [ARXIV]	4min	school Meta-Sel：基于监督元学习的高效上下文学习示例选择方法 02-13 ICL 元学习示例选择
[自动] [ARXIV]	4min	school 长思维链监督微调中数据重复优于数据扩展 02-13 长思维链监督微调数据重复
[自动] [ARXIV]	4min	school 超越VLM奖励：扩散原生潜在奖励建模 02-13 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]	4min	school 权重衰减提升语言模型可塑性 02-13 权重衰减模型可塑性微调
[自动] [ARXIV]	4min	school 基于扩散预训练的稠密上下文嵌入模型 02-13 Embeddings 扩散模型 RAG
[自动] [ARXIV]	4min	school 基于归一化流的高效分层目标条件强化学习 02-13 强化学习分层强化学习归一化流
[自动] [ARXIV]	5min	school SCRAPL：基于随机路径散射变换的机器学习框架 02-13 SCRAPL Scattering Transform 小波散射
[自动] [ARXIV]	3min	school GENIUS：生成式流体智能评估套件 02-13 GENIUS 流体智力多模态评估
[自动] [ARXIV]	3min	school 长思维链监督微调中数据重复优于数据扩展 02-12 长思维链监督微调数据重复
[自动] [ARXIV]	4min	school 超越VLM奖励：扩散原生潜在奖励建模 02-12 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]	4min	school 权重衰减提升语言模型可塑性 02-12 LLM 权重衰减模型可塑性
[自动] [ARXIV]	4min	school 扩散预训练模型生成稠密上下文嵌入 02-12 Embeddings 扩散模型 RAG
[自动] [ARXIV]	3min	school 基于归一化流的高效分层目标条件强化学习 02-12 强化学习归一化流分层强化学习
[自动] [ARXIV]	4min	school TabICLv2：更优性能与可扩展性的开源表格基础模型 02-12 TabICLv2 表格基础模型 RealTabPFN
[自动] [ARXIV]	5min	school SCRAPL：基于随机路径散射变换的机器学习框架 02-12 SCRAPL Scattering Transform Wavelet
[自动] [ARXIV]	3min	school GENIUS：生成式流体智能评估套件 02-12 GENIUS 流体智能 GFI
[自动] [JUEJIN]	2min	sticky_note_2 智谱GLM-5即Pony Alpha：对标Claude Opus 02-12 智谱AI GLM-5 Pony Alpha
[自动] [HACKER_NEWS]	3min	newspaper 大语言模型面临的幻觉与逻辑推理局限 02-12 LLM 幻觉逻辑推理
[自动] [BLOGS_PODCASTS]	3min	mic AI与模拟加速科学发现：拉斐尔·戈麦斯-巴雷利的观点 02-12 AI 科学发现模拟
[自动] [BLOGS_PODCASTS]	2min	mic 大语言模型无法独立攻克癌症的局限性分析 02-12 LLM 癌症研究 AI 局限性
[自动] [HACKER_NEWS]	3min	newspaper GPT-5在法律推理实验中表现优于联邦法官 02-12 GPT-5 法律推理联邦法官
[自动] [ARXIV]	3min	school 提升自动驾驶感知多租户DNN推理的可预测性 02-12 arxiv cs.CV
[自动] [ARXIV]	4min	school LoRA-Squeeze：LoRA模块的调优后与调优中压缩方法 02-12 LoRA PEFT 模型压缩
[自动] [BLOGS_PODCASTS]	2min	mic LLM 单独使用无法治愈癌症：科学与模拟的局限 02-12 LLM 生物医学 AI for Science
[自动] [ARXIV]	2min	school 迈向可解释联邦学习：理解差分隐私的影响 02-12 联邦学习差分隐私可解释性
[自动] [ARXIV]	2min	school 用于增强科学图表分析的智能代理 02-12 智能代理科学图表多模态
[自动] [ARXIV]	2min	school 步级解析数据归因：面向循环Transformer 02-12 arxiv cs.LG
[自动] [ARXIV]	3min	school Olaf-World：面向视频世界模型的潜在动作定向方法 02-12 arxiv cs.CV
[自动] [ARXIV]	1min	school Learning on the Manifold: Unlocking Standard Diffusion 02-12 Diffusion Transformer DiT 表征学习
[自动] [HACKER_NEWS]	4min	newspaper GLM-OCR：面向复杂文档理解的多模态OCR模型 02-12 GLM-OCR 多模态 OCR
[自动] [ARXIV]	5min	school Agent World Model：面向智能体强化学习的无限合成环境 02-12 Agent World Model 强化学习合成环境
[自动] [ARXIV]	3min	school 迈向可解释联邦学习：理解差分隐私的影响 02-11 联邦学习差分隐私可解释性
[自动] [ARXIV]	3min	school 视频扩散模型因果性与去噪过程可分离 02-11 arxiv cs.CV
[自动] [ARXIV]	1min	school 基于表征编码器解锁标准扩散Transformer 02-11 DiT 扩散模型流匹配
[自动] [ARXIV]	1min	school Quantum-Audit：评估大语言模型量子计算推理能力极限 02-11 arxiv cs.CL
[自动] [ARXIV]	4min	school CODE-SHARP：基于分层奖励程序的技能持续演化框架 02-11 CODE-SHARP 强化学习 RL
[自动] [ARXIV]	3min	school Agent World Model: Infinity Synthetic Environments for 02-11 Agent World Model 强化学习
[自动] [ARXIV]	1min	school 循环Transformer的步级数据归因方法 02-11 Transformer 数据归因模型可解释性
[自动] [BLOGS_PODCASTS]	1min	mic 大语言模型无法治愈癌症：科学家的模拟困境 02-11 LLM 科学发现生物医学
[自动] [ARXIV]	3min	school Olaf-World: Orienting Latent Actions for Video World Mo 02-11 世界模型 Olaf-World 潜在动作
[自动] [JUEJIN]	2min	sticky_note_2 AI 核心术语解析：从神经网络原理到词嵌入与潜空间 02-11 神经网络词嵌入潜空间
[自动] [HACKER_NEWS]	4min	newspaper GLM-OCR：兼顾准确度、速度与通用性的多模态大模型 02-11 GLM-OCR 多模态 OCR
[自动] [ARXIV]	2min	school Anagent For Enhancing Scientific Table & Figure Analysi 02-11 Anagent 多智能体科学图表分析
[自动] [HACKER_NEWS]	4min	newspaper The Little Learner：通往深度学习的直线路径 02-11 深度学习机器学习神经网络
[自动] [ARXIV]	1min	school Transformer模型在低信噪比时间序列预测中的统计基准测试 02-11 arxiv cs.LG
[自动] [ARXIV]	2min	school CoFEH：LLM驱动的协同贝叶斯特征工程框架 02-11 arxiv cs.LG
[自动] [ARXIV]	3min	school Code2World: A GUI World Model via Renderable Code Gener 02-11 arxiv cs.CV
[自动] [HACKER_NEWS]	1min	newspaper The Little Learner: A Straight Line to Deep Learning 02-11 深度学习机器学习神经网络
[自动] [ARXIV]	4min	school Robustness Is a Function, Not a Number: A Factorized Co 02-11 arxiv cs.RO
[自动] [ARXIV]	2min	school GEBench：将图像生成模型评估为GUI环境的基准 02-11 GEBench GUI生成图像生成
[自动] [ARXIV]	3min	school ARO: A New Lens On Matrix Optimization For Large Models 02-11 ARO 矩阵优化 LLM
[自动] [ARXIV]	4min	school ArcFlow: Unleashing 2-Step Text-to-Image Generation via 02-11 arxiv cs.CV
[自动] [ARXIV]	2min	school ANCRe: Adaptive Neural Connection Reassignment for Effi 02-11 ANCRe 深度学习残差连接
[自动] [HACKER_NEWS]	4min	newspaper The Little Learner: A Straight Line to Deep Learning 02-11 深度学习 Deep Learning 机器学习
[自动] [ARXIV]	3min	school 鲁棒性是函数而非数值：基于视觉驾驶的OOD鲁棒性因子化研究 02-10 OOD鲁棒性视觉驾驶因子化
[自动] [ARXIV]	4min	school ARO：面向大模型矩阵优化的新视角 02-10 矩阵优化 ARO 大模型
[自动] [ARXIV]	2min	school ArcFlow：高精度非线性流蒸馏实现两步文生图生成 02-10 ArcFlow 文生图流蒸馏
[自动] [BLOGS_PODCASTS]	1min	mic The Scientist and the Simulator 02-10 LLM 生物医药科学研究
[自动] [ARXIV]	3min	school GEBench: Benchmarking Image Generation Models as GUI En 02-10 GEBench GUI生成图像生成
[自动] [ARXIV]	3min	school 下一代验证码：利用认知差异防御GUI智能体 02-10 arxiv cs.LG
[自动] [BLOGS_PODCASTS]	3min	mic 专家依赖世界模型而LLM仅基于词模型预测 02-10 世界模型词模型智能体
[自动] [ARXIV]	3min	school ANCRe：自适应神经连接重分配实现高效深度扩展 02-10 arxiv cs.LG
[自动] [ARXIV]	3min	school 针对LLM服务框架而非模型的延迟型拒绝服务攻击研究 02-10 arxiv cs.CR
[自动] [ARXIV]	4min	school 基于朗之万动力学的直接软策略采样 02-10 arxiv cs.LG
[自动] [BLOGS_PODCASTS]	1min	mic 专家依赖世界模型推断隐藏状态，大语言模型需突破词模型局限 02-10 世界模型词模型隐藏状态
[自动] [ARXIV]	1min	school MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Rei 02-10 arxiv cs.LG
[自动] [ARXIV]	3min	school Harpoon：面向条件表格扩散模型的广义流形引导 02-10 扩散模型表格数据流形引导
[自动] [ARXIV]	3min	school 智能体不确定性研究揭示过度自信问题 02-09 AI Agents 不确定性过度自信
[自动] [ARXIV]	4min	school 学习大模型神经元激活的生成式元模型 02-09 神经元激活生成式模型元模型
[自动] [ARXIV]	4min	school 基于熵排序流的非监督解耦表示学习模型 02-09 无监督学习解耦表示 EOFlows
[自动] [BLOGS_PODCASTS]	3min	mic 专家依赖世界模型决策，大语言模型需超越词模型 02-09 世界模型词模型专家系统
[自动] [ARXIV]	4min	school InftyThink+: 基于强化学习的高效无限视野推理框架 02-09 强化学习推理框架思维链
[自动] [ARXIV]	4min	school DreamDojo：基于大规模人类视频的通用机器人世界模型 02-09 机器人世界模型 DreamDojo
[自动] [ARXIV]	4min	school DAWN：面向扩散大模型的依赖感知快速推理 02-09 扩散模型 DAWN 并行解码
[自动] [BLOGS_PODCASTS]	3min	mic 专家具备世界模型而LLM仅拥有词模型 02-09 LLM 世界模型词模型
[自动] [BLOGS_PODCASTS]	2min	mic 专家依赖世界模型决策，LLM需超越词模型以实现推理 02-09 世界模型推理智能体
[自动] [HACKER_NEWS]	3min	newspaper 专家具备世界模型，大语言模型仅有词模型 02-09 世界模型词模型 LLM
[自动] [HACKER_NEWS]	4min	newspaper 专家具备世界模型，大语言模型仅有词模型 02-09 世界模型词模型 LLM
[自动] [HACKER_NEWS]	3min	newspaper 停止生成，开始思考：大模型推理能力进化路径 02-09 LLM 推理能力思维链
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直观物理 02-09 VLM 直觉物理强化学习
[自动] [ARXIV]	4min	school 好奇心即知识：基于主动推理的自一致学习与无遗憾优化 02-09 主动推理好奇心自一致学习
[自动] [ARXIV]	5min	school 共享LoRA子空间实现近乎严格的持续学习 02-09 持续学习 LoRA 灾难性遗忘
[自动] [ARXIV]	4min	school 伪可逆神经网络：通过伪逆变换提升模型可逆性与表达能力 02-09 神经网络可逆性 SPNN
[自动] [ARXIV]	5min	school PhysicsAgentABM：物理引导的生成式主体建模框架 02-09 PhysicsAgentABM Agent 多智能体
[自动] [ARXIV]	3min	school DyTopo：基于语义匹配的多智能体动态拓扑路由 02-09 DyTopo Multi-Agent 动态拓扑
[自动] [ARXIV]	4min	school DFlash：基于块扩散的闪存推测解码方法 02-09 LLM 推理加速推测解码
[自动] [ARXIV]	4min	school CommCP：基于共形预测的LLM通信提升多智能体协调效率 02-09 LLM 多智能体共形预测
[自动] [ARXIV]	5min	school AP-OOD：基于注意力池化的分布外检测方法 02-09 OOD检测注意力机制 NLP
[自动] [ARXIV]	3min	school 面向运行时智能体记忆的查询感知预算层路由 02-08 Agent LLM 智能体
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直觉物理 02-08 VLM 直觉物理多模态
[自动] [ARXIV]	4min	school 好奇心即知识：基于主动推理的自一致学习与无悔优化 02-08 主动推理好奇心探索与利用
[自动] [ARXIV]	5min	school 共享LoRA子空间实现近乎严格的持续学习 02-08 LoRA 持续学习灾难性遗忘
[自动] [ARXIV]	4min	school 伪可逆神经网络：基于伪逆变换的高效架构设计 02-08 神经网络伪逆 SPNN
[自动] [BLOGS_PODCASTS]	3min	mic 专家依赖世界模型，大语言模型仅有词模型 02-08 LLM 世界模型词模型
[自动] [ARXIV]	4min	school PhysicsAgentABM：物理引导的生成式智能体建模 02-08 PhysicsAgentABM 智能体多主体系统
[自动] [ARXIV]	3min	school DyTopo：基于语义匹配的多智能体动态拓扑路由 02-08 多智能体 DyTopo 动态拓扑
[自动] [ARXIV]	4min	school CommCP：基于LLM通信与共形预测的多智能体高效协调 02-08 LLM Multi-Agent CommCP
[自动] [ARXIV]	4min	school AP-OOD：基于注意力池化的分布外检测方法 02-08 OOD检测注意力机制注意力池化
[自动] [HACKER_NEWS]	4min	newspaper 专家具备世界模型，大语言模型仅有词模型 02-08 LLM 世界模型词模型
[自动] [HACKER_NEWS]	4min	newspaper 专家具备世界模型，大语言模型仅有词模型 02-08 世界模型词模型 LLM
[自动] [HACKER_NEWS]	4min	newspaper 基于人类反馈的强化学习：原理与应用 02-07 RLHF 强化学习人类反馈
[自动] [BLOGS_PODCASTS]	3min	mic 专家依赖世界模型而LLM仅依赖词模型 02-07 世界模型 LLM 词模型
[自动] [ARXIV]	5min	school 面向运行时智能体记忆的查询感知预算层路由 02-07 Agent LLM Memory
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直观物理 02-07 VLM 多模态具身智能
[自动] [ARXIV]	3min	school 好奇心即知识：基于主动推理的自一致学习与无悔优化 02-07 主动推理强化学习好奇心
[自动] [ARXIV]	5min	school 共享 LoRA 子空间实现近乎严格的持续学习 02-07 LoRA 持续学习灾难性遗忘
[自动] [ARXIV]	4min	school 伪可逆神经网络：通过伪可逆性提升模型可逆性 02-07 神经网络伪可逆 SPNN
[自动] [ARXIV]	4min	school PhysicsAgentABM：物理引导的生成式智能体建模 02-07 PhysicsAgentABM 生成式ABM 多主体系统
[自动] [ARXIV]	4min	school DyTopo：基于语义匹配的多智能体动态拓扑路由 02-07 DyTopo 多智能体动态拓扑
[自动] [ARXIV]	4min	school CommCP：基于共形预测的LLM通信提升多智能体协调效率 02-07 LLM Multi-Agent 共形预测
[自动] [ARXIV]	4min	school AP-OOD：基于注意力池化的分布外检测方法 02-07 OOD检测 NLP 注意力机制
[自动] [HACKER_NEWS]	4min	newspaper Waymo 世界模型：基于多传感器数据生成驾驶场景 02-07 Waymo 世界模型自动驾驶
[自动] [HACKER_NEWS]	5min	newspaper 基于人类反馈的强化学习：原理与应用 02-07 RLHF 强化学习人类反馈
[自动] [HACKER_NEWS]	6min	newspaper Waymo 世界模型：利用生成式世界模型提升自动驾驶决策能力 02-07 Waymo 世界模型自动驾驶
[自动] [HACKER_NEWS]	4min	newspaper Waymo 世界模型：自动驾驶场景生成与仿真应用 02-07 Waymo 世界模型自动驾驶
[自动] [HACKER_NEWS]	4min	newspaper Waymo 世界模型：利用生成式世界模拟提升自动驾驶决策 02-07 Waymo 世界模型自动驾驶
[自动] [HACKER_NEWS]	7min	newspaper 基于人类反馈的强化学习机制解析 02-07 RLHF 强化学习人类反馈
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理的可视化解析 02-07 神经网络可视化深度学习
[自动] [HACKER_NEWS]	3min	newspaper 从上下文学习比预期更难 02-07 LLM ICL 上下文学习
[自动] [HACKER_NEWS]	3min	newspaper 从上下文学习的难度超出预期 02-07 上下文学习 ICL LLM
[自动] [HACKER_NEWS]	6min	newspaper 神经网络可视化：直观理解深度学习原理 02-07 神经网络深度学习可视化
[自动] [HACKER_NEWS]	4min	newspaper 从上下文学习的难度超出预期 02-07 上下文学习 ICL LLM
[自动] [ARXIV]	3min	school 面向运行时智能体记忆的查询感知预算分层路由 02-06 Agent Memory RAG
[自动] [ARXIV]	3min	school 视觉语言模型能否通过交互学习直觉物理 02-06 VLM 直觉物理强化学习
[自动] [ARXIV]	3min	school 好奇心即知识：基于主动推理的自一致学习与无遗憾优化 02-06 主动推理探索与利用自由能
[自动] [ARXIV]	4min	school 共享 LoRA 子空间实现近乎严格的持续学习 02-06 LoRA 持续学习微调
[自动] [ARXIV]	4min	school 伪可逆神经网络：兼具可逆性与灵活性的新架构 02-06 神经网络可逆性伪逆
[自动] [HACKER_NEWS]	3min	newspaper 从上下文学习比预期更具挑战性 02-06 LLM ICL 上下文学习
[自动] [ARXIV]	4min	school PhysicsAgentABM：物理引导的生成式智能体建模 02-06 PhysicsAgentABM 多智能体系统 ABM
[自动] [BLOGS_PODCASTS]	2min	mic GPT-5结合自动化闭环实验降低无细胞蛋白合成成本40% 02-06 GPT-5 AI for Science 生物科技
[自动] [ARXIV]	3min	school DyTopo：基于语义匹配的多智能体动态拓扑路由 02-06 DyTopo 多智能体动态拓扑
[自动] [ARXIV]	5min	school DFlash：基于块扩散的Flash推测解码方法 02-06 LLM 推理加速推测解码
[自动] [ARXIV]	4min	school CommCP：基于LLM通信与共形预测的高效多智能体协调 02-06 LLM 多智能体具身智能
[自动] [ARXIV]	5min	school AP-OOD：基于注意力池化的分布外检测方法 02-06 OOD检测注意力机制 NLP
[自动] [HACKER_NEWS]	3min	newspaper 上下文学习难度超出原有认知 02-06 上下文学习 ICL 大模型
[自动] [HACKER_NEWS]	4min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	3min	newspaper 从上下文学习比预期更难 02-06 LLM 上下文学习 ICL
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	3min	newspaper 从上下文学习的难度超出原有认知 02-06 上下文学习 ICL LLM
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	6min	newspaper 神经网络原理的可视化解析 02-06 神经网络可视化深度学习
[自动] [HACKER_NEWS]	3min	newspaper 超网络：用于处理层级数据的神经网络架构 02-06 超网络层级数据神经网络架构
[自动] [HACKER_NEWS]	6min	newspaper 超网络：面向层级数据的神经网络架构 02-06 超网络 Hypernetworks 层级数据
[自动] [ARXIV]	4min	school 数据块模型中的精确恢复方法 02-06 社区检测随机块模型数据块模型
[自动] [ARXIV]	4min	school 受限群组相对策略优化 02-06 GRPO 强化学习策略优化
[自动] [ARXIV]	4min	school Wedge Sampling：实现近线性样本复杂度的张量补全算法 02-06 张量补全楔形采样低秩张量
[自动] [ARXIV]	5min	school RRAttention：基于轮询移位的动态块稀疏注意力机制 02-06 RRAttention 稀疏注意力长上下文
[自动] [ARXIV]	4min	school DLM-Scope：利用稀疏自编码器解析扩散语言模型 02-06 DLM SAE 稀疏自编码器
[自动] [ARXIV]	3min	school 面向物联网模型适应性的对比持续学习方法 02-06 持续学习对比学习物联网
[自动] [ARXIV]	4min	school 重新思考大模型强化学习中的信任区域机制 02-06 强化学习 LLM PPO
[自动] [ARXIV]	3min	school 蛋白质自回归建模：基于多尺度结构生成的方案 02-06 蛋白质生成自回归模型多尺度建模
[自动] [ARXIV]	4min	school 强化注意力学习：通过奖励机制优化视觉注意力模型 02-06 强化学习多模态注意力机制
[自动] [ARXIV]	4min	school 多层交叉注意力机制在多模态上下文学习中具有可证明的最优性 02-06 多模态上下文学习 ICL
[自动] [ARXIV]	5min	school 重新思考大模型强化学习中的信任区域 02-05 RLHF PPO 强化学习
[自动] [ARXIV]	3min	school 蛋白质多尺度结构生成的自回归建模方法 02-05 蛋白质生成自回归模型多尺度建模
[自动] [ARXIV]	4min	school 强化注意力学习：基于奖励反馈的注意力机制优化方法 02-05 强化学习注意力机制多模态
[自动] [ARXIV]	3min	school 多层交叉注意力被证明是多模态上下文学习的最优解 02-05 多模态上下文学习 ICL
[自动] [ARXIV]	5min	school Multi-Head LatentMoE与Head并行：通信高效且确定性的MoE方案 02-05 MoE 分布式训练通信优化
[自动] [ARXIV]	3min	school 面向物联网模型适应性的对比持续学习 02-05 持续学习对比学习物联网
[自动] [HACKER_NEWS]	4min	newspaper 超网络：面向层级数据的神经网络架构 02-05 超网络层级数据神经网络架构
[自动] [HACKER_NEWS]	6min	newspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制 02-05 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	6min	newspaper 对称感知泰勒近似实现恒定Token成本注意力机制 02-05 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]	4min	school 基于急停干预的鲁棒干预学习 02-05 干预学习自动驾驶鲁棒性
[自动] [ARXIV]	4min	school 加速科学研究：Gemini 案例研究与通用技术 02-05 Gemini 科学研究数学发现
[自动] [ARXIV]	4min	school 利用权重更新稀疏性提升分布式强化学习通信效率 02-05 分布式强化学习通信效率权重稀疏性
[自动] [ARXIV]	5min	school PrevizWhiz：结合粗略3D场景与2D视频引导生成式预演 02-05 AIGC 视频生成 3D场景
[自动] [ARXIV]	5min	school PLATE：用于几何感知持续学习的可塑性调谐高效适配器 02-05 持续学习 PLATE 模型适配
[自动] [ARXIV]	3min	school Parallel-Probe：通过二维探测实现高效并行思维 02-05 并行推理思维链 2D Probing
[自动] [ARXIV]	4min	school AutoFigure：自动生成与润色出版级科学插图 02-05 AutoFigure FigureBench 科学插图
[自动] [HACKER_NEWS]	6min	newspaper 基于对称性泰勒近似实现恒定Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]	4min	school 利用权重更新稀疏性的通信高效分布式强化学习 02-04 分布式训练强化学习通信优化
[自动] [ARXIV]	4min	school 利用 Gemini 加速科学研究：案例研究与通用技术 02-04 Gemini 科学研究数学证明
[自动] [ARXIV]	5min	school PrevizWhiz：结合粗略3D场景与2D视频引导生成视频预演 02-04 视频生成 3D视觉 PrevizWhiz
[自动] [ARXIV]	4min	school PLATE：面向几何感知持续学习的可塑性调谐高效适配器 02-04 持续学习 PLATE 高效适配器
[自动] [ARXIV]	4min	school Parallel-Probe：通过2D探测实现高效并行思维 02-04 LLM 并行推理思维链
[自动] [ARXIV]	4min	school AutoFigure：自动生成与优化出版级科学插图 02-04 AutoFigure FigureBench 科学插图
[自动] [HACKER_NEWS]	6min	newspaper 基于对称性泰勒近似实现恒定Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	5min	newspaper 基于对称性泰勒近似实现恒定每Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	7min	newspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制 02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]	7min	newspaper 基于对称泰勒近似实现恒定Token成本注意力机制 02-04 Attention机制 Taylor近似线性注意力
[自动] [HACKER_NEWS]	5min	newspaper 对称感知泰勒近似实现恒定Token成本注意力机制 02-04 Attention机制 Taylor近似 Token成本
[自动] [ARXIV]	4min	school 面向冲突目标的免奖励对齐方法 02-04 RACO 对齐多目标优化
[自动] [ARXIV]	4min	school 通过文本反馈扩展强化学习的能力边界 02-04 强化学习 RLHF 文本反馈
[自动] [ARXIV]	3min	school 训练LLM采用分治推理提升测试时扩展性 02-04 LLM 推理强化学习
[自动] [ARXIV]	5min	school 基于流策略梯度的机器人控制方法 02-04 机器人控制流匹配策略梯度
[自动] [ARXIV]	4min	school RE-TRAC：面向深度搜索智能体的递归轨迹压缩算法 02-04 Re-TRAC 深度搜索智能体 ReAct
[自动] [ARXIV]	5min	school PixelGen：像素扩散结合感知损失超越潜在扩散 02-04 PixelGen 扩散模型计算机视觉
[自动] [ARXIV]	4min	school MemSkill：面向自进化代理的记忆技能学习与演化框架 02-04 MemSkill 智能体 Agent
[自动] [ARXIV]	3min	school MEG-XL：长上下文预训练实现数据高效的脑电转文本 02-04 MEG-XL 脑机接口脑电转文本
[自动] [ARXIV]	3min	school 训练LLM采用分治推理提升测试时扩展性 02-03 LLM 推理强化学习
[自动] [ARXIV]	4min	school 无奖励对齐技术处理多目标冲突 02-03 RACO 对齐技术多目标优化
[自动] [ARXIV]	4min	school 基于流策略梯度的机器人控制方法 02-03 机器人控制流匹配策略梯度
[自动] [ARXIV]	4min	school 基于文本反馈扩展强化学习的能力 02-03 强化学习 RLHF 文本反馈
[自动] [ARXIV]	4min	school RLAnything：完全动态强化学习系统构建环境、策略与奖励模型 02-03 强化学习 RL LLM
[自动] [ARXIV]	4min	school RE-TRAC：面向深度搜索智能体的递归轨迹压缩方法 02-03 Re-TRAC 深度搜索智能体
[自动] [ARXIV]	4min	school PixelGen：引入感知损失的像素扩散模型性能超越潜在扩散 02-03 PixelGen 扩散模型计算机视觉
[自动] [ARXIV]	4min	school MemSkill：赋予自进化代理学习与演进记忆技能 02-03 MemSkill 智能体记忆机制
[自动] [ARXIV]	4min	school MEG-XL：基于长上下文预训练的高效脑电转文本模型 02-03 MEG-XL 脑机接口 BCI
[自动] [HACKER_NEWS]	3min	newspaper 模型对齐偏差如何随智能水平与任务复杂度演变 02-03 模型对齐智能水平任务复杂度
[自动] [HACKER_NEWS]	4min	newspaper 模型智能与任务复杂度如何影响对齐偏差 02-03 对齐模型智能任务复杂度
[自动] [HACKER_NEWS]	4min	newspaper 模型对齐问题如何随智能水平与任务复杂度演变 02-03 模型对齐智能水平任务复杂度
[自动] [HACKER_NEWS]	3min	newspaper 训练万亿参数模型以生成幽默内容 02-03 LLM 万亿参数幽默生成
[自动] [ARXIV]	3min	school 误差分类引导的提示词优化方法 02-03 提示词工程 ETGPO 自动优化
[自动] [HACKER_NEWS]	3min	newspaper 训练万亿参数模型使其具备幽默感 02-03 LLM 幽默感万亿参数
[自动] [ARXIV]	3min	school 研究揭示RLHF如何加剧大模型谄媚行为 02-03 RLHF 谄媚行为模型偏见
[自动] [ARXIV]	4min	school 智能体推理与工具使用的竞争：量化干扰与解调优 02-03 智能体强化学习工具使用
[自动] [ARXIV]	3min	school 大语言模型稀疏奖励子系统 02-03 LLM 稀疏奖励价值神经元
[自动] [ARXIV]	4min	school 基于预测集的最优决策方法 02-03 预测集最优决策决策理论
[自动] [ARXIV]	4min	school 基于资格推理与分节强化学习的引理可靠利用 02-03 数学推理引理应用 RULES
[自动] [ARXIV]	4min	school 可扩展随机小波特征：带收敛保证的高效非平稳核近似 02-03 机器学习非平稳核小波变换
[自动] [ARXIV]	3min	school HERMES：基于视觉语言模型的长尾自动驾驶端到端风险感知系统 02-03 自动驾驶 VLM 长尾场景
[自动] [ARXIV]	4min	school DeALOG：基于日志中介的去中心化多智能体推理框架 02-03 Multi-Agent 去中心化日志中介
[自动] [ARXIV]	3min	school 粒子引导扩散模型用于偏微分方程求解 02-03 扩散模型 PDE求解物理引导
[自动] [ARXIV]	5min	school 函数空间逆问题的解耦扩散采样方法 02-03 扩散模型逆问题 PDE
[自动] [ARXIV]	4min	school 共享 autonomy 范式下信念与策略学习的端到端优化 02-03 共享自主 BRACE 端到端优化
[自动] [ARXIV]	4min	school VideoGPA：提取几何先验实现三维一致性视频生成 02-03 VideoGPA 视频生成 3D一致性
[自动] [ARXIV]	4min	school UPA：基于树搜索与筛选的无监督提示代理 02-03 Prompt优化 UPA 无监督学习
[自动] [ARXIV]	5min	school TEON：张量化正交化方法优化大语言模型预训练 02-03 TEON 优化器预训练
[自动] [ARXIV]	5min	school PaperBanana：面向AI科研人员的学术绘图自动化工具 02-03 PaperBanana 学术绘图智能体框架
[自动] [ARXIV]	4min	school FOCUS：DLLMs 如何突破算力瓶颈 02-03 DLLMs 扩散模型推理加速
[自动] [ARXIV]	3min	school 粒子引导扩散模型求解偏微分方程 02-02 扩散模型偏微分方程 PDE
[自动] [ARXIV]	4min	school 函数空间逆问题的解耦扩散采样方法 02-02 扩散模型逆问题 PDE
[自动] [ARXIV]	4min	school 共享自治系统中信念与策略学习的端到端优化 02-02 共享自治 BRACE 贝叶斯推断
[自动] [ARXIV]	5min	school VideoGPA：提取几何先验实现三维一致视频生成 02-02 视频生成 3D一致性扩散模型
[自动] [ARXIV]	4min	school UPA：基于树搜索与筛选的无监督提示智能体 02-02 Prompt优化 LLM智能体无监督学习
[自动] [ARXIV]	5min	school TEON：张量化正交化技术优化大语言模型预训练 02-02 TEON 优化器 Muon
[自动] [ARXIV]	4min	school IRL-DAL：基于能量引导扩散模型的自动驾驶安全自适应轨迹规划 02-02 自动驾驶扩散模型逆向强化学习
[自动] [ARXIV]	4min	school FOCUS：DLLMs如何突破算力瓶颈 02-02 DLLMs 扩散模型算力优化
[自动] [ARXIV]	3min	school 基于输出监督学习的思维链混淆技术可泛化至未见任务 02-02 思维链 CoT 输出监督
[自动] [ARXIV]	4min	school SplineFlow：基于B样条插值的动力系统流匹配方法 02-02 流匹配 SplineFlow B样条
[自动] [ARXIV]	4min	school RN-D：基于正则化网络的离散分类演员与同策强化学习 02-02 强化学习 RL 连续控制
[自动] [ARXIV]	4min	school OrLog：结合大模型与概率推理解决复杂查询 02-02 神经符号AI 概率推理复杂查询
[自动] [ARXIV]	4min	school ExplainerPFN：面向表格数据的无模型零样本特征重要性估计 02-02 ExplainerPFN TabPFN 表格数据
[自动] [ARXIV]	4min	school CATTO：平衡语言模型偏好与置信度的方法 02-02 LLM CATTO 校准
[自动] [HACKER_NEWS]	7min	newspaper 迈向智能体系统规模化科学：探究其生效机制与适用场景 02-02 智能体 Agent系统规模化
[自动] [ARXIV]	3min	school 神经网络转逻辑流以优化边缘计算性能 02-02 边缘计算神经网络逻辑流
[自动] [ARXIV]	6min	school 混合线性注意力新架构：高效蒸馏与超长上下文处理 02-02 HALO HypeNet 混合架构
[自动] [ARXIV]	4min	school 推理大语言模型从被动求解到主动提问的转变 02-02 推理 CoT 主动交互
[自动] [ARXIV]	4min	school 探索面向智能体的推理奖励模型 02-02 Agentic RL Reward Model 推理奖励
[自动] [ARXIV]	4min	school UEval：统一多模态生成基准 02-02 UEval 多模态基准测试
[自动] [ARXIV]	3min	school Routing the Lottery: 面向异构数据的自适应子网络路由 02-02 模型剪枝彩票假设异构数据
[自动] [ARXIV]	5min	school DynaWeb：基于模型的强化学习网页智能体 02-02 DynaWeb Web Agent 强化学习
[自动] [ARXIV]	4min	school 神经网络转逻辑流以优化边缘计算性能 02-01 边缘计算神经网络模型优化
[自动] [ARXIV]	5min	school 混合线性注意力新架构：高效蒸馏与超长上下文处理 02-01 Transformer 混合架构线性注意力
[自动] [ARXIV]	3min	school 推理大语言模型从被动求解转向主动询问 02-01 推理交互式推理 PIR
[自动] [ARXIV]	4min	school 探索面向智能体的推理奖励模型 02-01 Agent RLHF 奖励模型
[自动] [ARXIV]	4min	school UEval：统一多模态生成基准评测 02-01 UEval 多模态基准评测
[自动] [ARXIV]	4min	school Routing the Lottery：面向异型数据的自适应子网络 02-01 模型剪枝彩票假说自适应路由
[自动] [ARXIV]	5min	school DynaWeb：基于模型的强化学习网页智能体 02-01 DynaWeb Web Agent 强化学习

2026年一月 119 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school 面向异构数据的自适应子网络路由方法 01-31 模型剪枝异构数据自适应子网络
[自动] [ARXIV]	4min	school 神经网络转逻辑流以优化边缘计算性能 01-31 边缘计算神经网络逻辑流
[自动] [ARXIV]	5min	school 混合线性注意力新架构：高效蒸馏与超长上下文建模 01-31 线性注意力长上下文混合架构
[自动] [ARXIV]	4min	school 推理大语言模型从被动求解转向主动询问 01-31 LLM 推理模型主动询问
[自动] [ARXIV]	5min	school 探索面向智能体的推理奖励模型 01-31 Agent 强化学习奖励模型
[自动] [ARXIV]	4min	school 发现模型仓库中的隐藏价值 01-31 模型评估 Llama 多臂老虎机
[自动] [ARXIV]	4min	school UEval：统一多模态生成基准 01-31 多模态 UEval 基准测试
[自动] [ARXIV]	5min	school DynaWeb：基于模型的强化学习网页智能体框架 01-31 DynaWeb Web Agent 强化学习
[自动] [HACKER_NEWS]	5min	newspaper Kimi k2.5 技术报告发布：长上下文与推理能力详解 01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：模型架构与性能评估 01-31 Kimi K2.5 技术报告模型架构
[自动] [HACKER_NEWS]	5min	newspaper Kimi K2.5 技术报告发布：模型架构与训练细节 01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：架构与性能细节 01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：模型架构与性能评估 01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：长上下文与多模态推理能力详解 01-31 Kimi K2.5 技术报告长上下文
[自动] [HACKER_NEWS]	4min	newspaper Kimi k2.5 技术报告发布 01-31 Kimi K2.5 技术报告
[自动] [HACKER_NEWS]	7min	newspaper Kimi K2.5 技术报告发布：长上下文与推理能力升级 01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]	7min	newspaper 月之暗面发布 Kimi k2.5 技术报告 01-31 月之暗面 Kimi K2.5
[自动] [HACKER_NEWS]	6min	newspaper Kimi K2.5 技术报告发布：模型架构与性能评估 01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [ARXIV]	4min	school 面向异构数据的自适应子网络路由机制 01-30 模型剪枝异构数据子网络
[自动] [ARXIV]	4min	school 神经网络转逻辑流以优化边缘计算 01-30 边缘计算神经网络模型优化
[自动] [ARXIV]	5min	school 混合线性注意力新架构：高效蒸馏与极长上下文处理 01-30 HALO HypeNet 长上下文
[自动] [ARXIV]	4min	school 推理大模型从被动求解转向主动提问 01-30 推理模型主动交互思维链
[自动] [ARXIV]	5min	school 探索面向智能体的推理奖励模型 01-30 Agent 强化学习推理奖励模型
[自动] [ARXIV]	3min	school 发现模型仓库中被忽视的高质量模型 01-30 模型评估 Llama-3.1 微调
[自动] [ARXIV]	3min	school UEval：统一多模态生成基准 01-30 UEval 多模态统一模型
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：强化学习与长上下文能力升级 01-30 Kimi K2.5 强化学习
[自动] [ARXIV]	4min	school FineInstructions：将合成指令数据扩展至预训练规模 01-30 LLM 预训练指令微调
[自动] [ARXIV]	5min	school DynaWeb：基于模型的强化学习网页智能体 01-30 DynaWeb Web Agent 强化学习
[自动] [HACKER_NEWS]	7min	newspaper 月之暗面发布Kimi K2.5技术报告 01-30 Kimi K2.5 月之暗面
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：长上下文与推理能力升级 01-30 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]	6min	newspaper Kimi K2.5 技术报告发布：长上下文与推理能力升级 01-30 Kimi K2.5 技术报告长上下文
[自动] [ARXIV]	4min	school 面向文本检索器域适应的影响引导采样方法 01-30 文本检索域适应密集检索
[自动] [ARXIV]	3min	school 面向大语言模型的时间引导机制 01-30 LLM 对比解码时间引导
[自动] [ARXIV]	4min	school 基于认知上下文学习构建大模型多智能体系统的信任机制 01-30 多智能体信任机制 ECL
[自动] [ARXIV]	3min	school 基于经验的试错算法超越语言模型 01-30 LLM SCOUT 探索与利用
[自动] [ARXIV]	6min	school 为何Adam在$β_1=β_2$时更优：缺失的梯度尺度不变性原理 01-30 Adam优化器梯度尺度不变性深度学习
[自动] [ARXIV]	4min	school FISMO：基于Fisher结构的动量正交化优化器 01-30 FISMO 优化器深度学习
[自动] [ARXIV]	4min	school 进化策略导致大语言模型出现灾难性遗忘 01-30 进化策略灾难性遗忘持续学习
[自动] [ARXIV]	4min	school 机器翻译评估中的跨向污染问题研究 01-30 机器翻译数据污染 FLORES-200
[自动] [ARXIV]	4min	school 探索Transformer在表格数据变分自编码器中的位置 01-30 Transformer VAE 表格数据
[自动] [ARXIV]	4min	school SokoBench：评估大模型长周期规划与推理能力 01-30 SokoBench 长周期规划推理能力
[自动] [ARXIV]	4min	school R^{2k}维度理论上足以支持基于嵌入的Top-k检索 01-30 向量检索嵌入维度 Top-k检索
[自动] [ARXIV]	3min	school PatchFormer：基于分层掩码重建的零样本多步预测时序基础模型 01-30 时间序列 PatchFormer 零样本预测
[自动] [ARXIV]	4min	school Deep Researcher：结合序列规划反思与候选交叉的深度研究框架 01-30 Deep Researcher AI Agent 智能体架构
[自动] [ARXIV]	4min	school C3Box：基于CLIP的类增量学习工具箱 01-30 CLIP 类增量学习 CIL
[自动] [ARXIV]	4min	school 进化策略导致大语言模型出现灾难性遗忘 01-29 进化策略灾难性遗忘持续学习
[自动] [ARXIV]	3min	school 机器翻译评估中的跨向污染问题研究 01-29 机器翻译数据污染 FLORES
[自动] [ARXIV]	4min	school 探索Transformer在表格数据变分自编码器中的位置 01-29 Transformer VAE 表格数据
[自动] [ARXIV]	3min	school 基于嵌入的Top-$k$检索：理论上$\mathbb{R}^{2k}$维空间已足够 01-29 向量检索嵌入 Top-k
[自动] [ARXIV]	4min	school 后训练公平性控制：推荐系统动态公平性单训练框架 01-29 推荐系统公平性 Cofair
[自动] [ARXIV]	4min	school SokoBench：评估大模型长程规划与推理能力 01-29 SokoBench 长程规划推理能力
[自动] [ARXIV]	5min	school PatchFormer：基于分层掩码重建的零样本多步预测时序基础模型 01-29 时序预测 PatchFormer 零样本学习
[自动] [ARXIV]	3min	school Deep Researcher：序列规划反思与候选交叉 01-29 Deep Researcher AI Agent 反思机制
[自动] [ARXIV]	4min	school C3Box：基于CLIP的类增量学习工具箱 01-29 CLIP 增量学习 CIL
[自动] [BLOGS_PODCASTS]	2min	mic Alyah：评估阿拉伯语大模型阿联酋方言能力 01-29 LLM 阿拉伯语方言评估
[自动] [BLOGS_PODCASTS]	2min	mic Alyah：评估阿拉伯语大模型阿联酋方言能力 01-29 LLM 模型评估阿拉伯语
[自动] [ARXIV]	4min	school 🧠RHSIA！非理想颅内动脉瘤实时血流替代技术，精准高效！ 01-28 RHSIA 血流动力学颅内动脉瘤
[自动] [ARXIV]	4min	school 无需真值！🔥颠覆性校准技术来了！🤯 01-28 模型校准无监督学习 LLM
[自动] [BLOGS_PODCASTS]	2min	mic Alyah ⭐️：阿拉伯语LLM方言鲁棒性评估！🔥 01-28 LLM 阿拉伯语方言评估
[自动] [ARXIV]	4min	school 🚀低资源机器翻译的救星！结构化自反思引领新突破✨ 01-28 机器翻译低资源语言自反思
[自动] [ARXIV]	5min	school 🚀SONIC: 颠覆频谱学习！神经网络不变性卷积的终极突破？ 01-28 SONIC 频谱学习神经网络
[自动] [ARXIV]	4min	school 🔥肿瘤会诊新革命！LLM系统Oncotimia惊艳亮相！ 01-28 LLM RAG 医疗AI
[自动] [ARXIV]	4min	school 🔥动态环境下的对抗约束：Bandits算法如何应对未知挑战？ 01-28 Bandits 对抗约束动态环境
[自动] [ARXIV]	6min	school 🔥Post-LayerNorm强势回归！稳定、高效、深度训练的新神器！ 01-28 Transformer Post-LayerNorm Keel
[自动] [ARXIV]	5min	school 🌍 M-SGWR: 多尺度相似+地理加权回归！空间建模神器🚀 01-28 M-SGWR 地理加权回归空间建模
[自动] [ARXIV]	5min	school ✨告别遗忘！Self-Distillation解锁持续学习新范式！ 01-28 持续学习 Self-Distillation 灾难性遗忘
[自动] [ARXIV]	4min	school MEG情绪分析新突破！🔬脑数据标注+情感计算，解锁大脑密码！🧠✨ 01-28 MEG 情绪分析脑机接口
[自动] [ARXIV]	4min	school 🚀复用FLOPs！RL突破性扩展：超离策略前缀如何解决硬难题？ 01-28 强化学习 RL LLM
[自动] [ARXIV]	4min	school 🔥模型自学革命！突破可学习性边界，推理能力暴涨！ 01-28 SOAR 强化学习推理能力
[自动] [ARXIV]	5min	school 🔥POPE：利用特权探索破解硬核难题！ 01-28 POPE 强化学习 LLM
[自动] [ARXIV]	5min	school 💥无需标注！基于核变化点检测的无监督文本分割！ 01-28 文本分割无监督学习核方法
[自动] [ARXIV]	4min	school 🌍 242种语言大比拼！Wikipedia数据揭秘跨语言比较语言学新突破！ 01-28 比较语言学 BPE 多语言
[自动] [BLOGS_PODCASTS]	3min	mic 🇦🇪 Alyah ⭐️：揭秘阿拉伯LLM方言鲁棒评估！ 01-28 LLM 阿拉伯语方言评估
[自动] [BLOGS_PODCASTS]	3min	mic 阿联酋方言评测新突破！Alyah让阿拉伯语大模型更鲁棒🚀 01-27 Alyah 阿拉伯语方言评测
[自动] [ARXIV]	4min	school 突破极限！AI如何教会自己推理？🤯 边缘学习性的惊天秘密！🚀 01-27 SOAR 强化学习元学习
[自动] [ARXIV]	5min	school ctELM：用LLM解码临床试验嵌入！解锁临床新价值🔥 01-27 ctELM 临床试验嵌入语言模型
[自动] [ARXIV]	5min	school 🚀RL新突破！复用FLOPs，硬难题上通过离线前缀扩展 01-27 PrefixRL 强化学习 LLM
[自动] [ARXIV]	5min	school 🔥无需标注！核变点检测+句嵌入实现超强文本分割🚀 01-27 文本分割无监督学习句嵌入
[自动] [ARXIV]	4min	school 🔥POPE：用特权探索让AI学会解决复杂难题！ 01-27 强化学习 LLM 推理能力
[自动] [ARXIV]	4min	school 🔍脑电+情感=超强分析！MEG数据解锁情绪新维度 01-27 MEG 情感分析脑机接口
[自动] [HACKER_NEWS]	2min	newspaper 🔥两个扭曲形状竟解开百年拓扑谜题？🧩 01-27 拓扑学海伍德猜想数学
[自动] [HACKER_NEWS]	2min	newspaper 数学、物理、生物的万能模式！🧪🧬2013年震撼发现 01-27 本福德定律统计学幂律分布
[自动] [BLOGS_PODCASTS]	3min	mic ⭐️Alyah：阿联酋方言能力评估！阿拉伯语LLM新突破！ 01-27 LLM 阿拉伯语方言评估
[自动] [HACKER_NEWS]	2min	newspaper 🔥 跨越数理化生！这个万能模式正在颠覆科学界！🤯 01-27 Scaling Laws 异速生长复杂系统
[自动] [HACKER_NEWS]	3min	newspaper 🧠炸裂！Gemini Flash在俄罗斯大战Opus胜率66%！🚀 01-27 Gemini Flash Claude Opus TetrisBench
[自动] [HACKER_NEWS]	3min	newspaper 阿里Qwen3-Max-Thinking深度思考模型！震撼发布🔥 01-27 Qwen3 通义千问深度思考
[自动] [BLOGS_PODCASTS]	3min	mic AssetOpsBench：填补AI基准与工业现实的鸿沟！🤖🏭🚀 01-27 AssetOpsBench AI Agent LLM
[自动] [ARXIV]	5min	school 🚀BONO-Bench：可追溯Pareto集的双目标优化基准测试！ 01-27 多目标优化基准测试 Pareto集
[自动] [ARXIV]	5min	school 🚀AnyView：动态场景任意新视角合成！开创性技术突破🔥 01-27 计算机视觉视频生成扩散模型
[自动] [ARXIV]	6min	school 🔥自回归+掩码扩散！下一代生成模型架构强势登场！ 01-27 扩散模型自回归语言建模
[自动] [ARXIV]	6min	school 🔥LLM训练动力学新突破！可扩展损失景观曲率度量！ 01-27 LLM 训练动力学损失景观
[自动] [ARXIV]	6min	school 🔥LLM序列标注新突破！揭秘高效策略，性能飙升！ 01-27 LLM 序列标注 NLP
[自动] [ARXIV]	5min	school 🌍Spatial-Agent：科学核心驱动的智能地理空间推理！🚀 01-27 Spatial-Agent Agent 地理空间推理
[自动] [HACKER_NEWS]	4min	newspaper ⚡️俄罗斯方块爆杀Opus！Gemini Flash胜率66%震撼实测🎮 01-27 LLM Gemini Flash Claude Opus
[自动] [ARXIV]	6min	school ⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成！🔥 01-27 分子生成 SE(3) 等变模型
[自动] [HACKER_NEWS]	3min	newspaper 震惊！Gemini Flash击败Opus！🎮Tetris胜率66%🚀 01-27 LLM Gemini Flash Claude 3 Opus
[自动] [ARXIV]	4min	school 🧬重磅！基于SE(3)流的刚体模态3D分子生成！ 01-26 3D分子生成 SE(3)流刚体模态
[自动] [BLOGS_PODCASTS]	3min	mic AssetOpsBench：打破AI Agent评测与工业现实的壁垒！🚀 01-26 AI Agent AssetOpsBench 工业智能
[自动] [ARXIV]	5min	school 🚀动态场景新视角合成！AnyView实现任意视角自由切换！🤯 01-26 动态场景新视角合成扩散模型
[自动] [ARXIV]	5min	school 🚀 自回归+掩码扩散：下一代生成式AI！🔥 01-26 扩散模型自回归生成式AI
[自动] [HACKER_NEWS]	3min	newspaper 🔥Qwen3-Max-Thinking！深度推理颠覆想象！ 01-26 Qwen 通义千问深度推理
[自动] [ARXIV]	5min	school 🔥LLM训练动力学新突破！可扩展损失景观曲率度量🚀 01-26 LLM 训练动力学损失景观
[自动] [ARXIV]	5min	school 🔥LLM序列标注新策略！突破性能天花板🚀 01-26 LLM 序列标注 NER
[自动] [ARXIV]	4min	school 🔥IoT攻击数据生成神器！Latent Diffusion让入侵检测更准！ 01-26 LDM 潜在扩散模型物联网
[自动] [ARXIV]	6min	school 🔥BONO-Bench震撼发布！首套可追溯Pareto集的双目标优化基准测试！ 01-26 BONO-Bench 双目标优化 Pareto集
[自动] [ARXIV]	5min	school 🌍 Spatial-Agent：具科学核心的智能体地理空间推理！ 01-26 Spatial-Agent 地理空间推理 GeoFlow Graphs
[自动] [HACKER_NEWS]	2min	newspaper 🧠科学家揭秘定义“你”边界的脑电波！灵魂的物理证据？ 01-26 脑科学神经科学脑电波
[自动] [HACKER_NEWS]	3min	newspaper 🔍 深度拆解：AI伪造数学证明的惊人真相！🚀 01-26 LLM 幻觉数学证明
[自动] [HACKER_NEWS]	2min	newspaper 🧠揭秘“你”的边界！科学家发现定义“自我”的关键脑波🚀 01-26 脑科学自我意识神经科学
[自动] [HACKER_NEWS]	3min	newspaper 🤖AI竟伪造数学证明？深扒“创意数学”背后的惊人真相！ 01-26 AI 数学证明形式化验证
[自动] [ARXIV]	6min	school 🤖抽屉打不开？揭秘零样本组合动作识别中的“物体捷径”！ 01-25 计算机视觉零样本学习动作识别
[自动] [ARXIV]	4min	school 🤖反事实训练！让模型学会靠谱又可落地的解释！ 01-25 反事实训练模型解释性可解释AI
[自动] [ARXIV]	7min	school 高效定理证明新突破！结构化提示实现少样本学习 🚀 01-25 定理证明 Lean DeepSeek-Prover
[自动] [ARXIV]	3min	school 超越预测不确定性！🚀结构约束下的可靠表征学习！🔥 01-25 表征学习不确定性结构约束
[自动] [ARXIV]	4min	school 测试时也能发现新规律？🤯AI解锁动态学习能力！ 01-25 TTT-Discover 测试时训练强化学习
[自动] [ARXIV]	5min	school Cosmos重磅：微调视频模型！解锁 visuomotor 控制与规划 🚀✨ 01-25 Cosmos 机器人视觉运动控制
[自动] [BLOGS_PODCASTS]	4min	mic AssetOpsBench：连接AI测评与工业现实！填补鸿沟🚀 01-25 AssetOpsBench AI Agent 工业运维
[自动] [ARXIV]	5min	school 🚀沙盒机制唤醒LLM智能体通用能力！AI Agent突破性架构！ 01-25 LLM AI Agent 沙盒机制
[自动] [ARXIV]	5min	school 🔥PyraTok！视频生成神器：语言对齐金字塔Tokenizer震撼来袭！ 01-25 PyraTok 视频生成视频理解