terminal

AI Stack

rss_feed
SYS_STABLE
目录

论文

条目:700
2026年三月 10 篇
类型阅读条目
[自动] [ARXIV]
3minschool 面向硬件加速器的运行时可重构多精度量化乘法按位脉动阵列架构
03-01 硬件加速器 脉动阵列 量化
[自动] [ARXIV]
4minschool 通过锚定机制实现模型一致性
03-01 模型一致性 锚定机制 cs.LG
[自动] [ARXIV]
4minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
03-01 VLM 视觉语言模型 报告偏差
[自动] [ARXIV]
3minschool 理解AI科研工具使用行为:Asta交互数据集
03-01 AI科研工具 Asta数据集 用户行为分析
[自动] [ARXIV]
3minschool 基于单纯形投影的可微零一损失函数
03-01 损失函数 0-1损失 可微性
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
03-01 多模态 视觉语言模型 最优传输
[自动] [ARXIV]
5minschool SeeThrough3D:文本生成图像中的遮挡感知3D控制
03-01 SeeThrough3D 文本生成图像 T2I
[自动] [ARXIV]
4minschool 1MB数据集足以训练模型:小样本学习新范式
03-01 PLADA 小样本学习 数据蒸馏
[自动] [HACKER_NEWS]
4minnewspaper 构建极简Transformer模型实现十位数加法运算
03-01 Transformer 算法推理 算术运算
[自动] [BLOGS_PODCASTS]
3minmic Anthropic模型蒸馏与SWE-Bench失效机制分析
03-01 Anthropic 模型蒸馏 SWE-Bench
2026年二月 571 篇
类型阅读条目
[自动] [ARXIV]
3minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
02-28 VLM 视觉语言模型 报告偏差
[自动] [JUEJIN]
1minsticky_note_2 深度学习通用逼近定理:神经网络的理论基础与核心原理
02-28 深度学习 神经网络 通用逼近定理
[自动] [ARXIV]
4minschool 数据集压缩至1MB:模型训练效率优化方法
02-28 数据集蒸馏 PLADA 模型训练
[自动] [ARXIV]
3minschool 基于锚点机制实现模型一致性
02-28 模型一致性 锚点机制 模型不一致性
[自动] [ARXIV]
4minschool 基于超单纯形投影的可微零一损失函数
02-28 0-1损失 可微损失 超单纯形
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-28 多模态 视觉语言模型 最优传输
[自动] [ARXIV]
4minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
02-28 SeeThrough3D 文本生成图像 3D控制
[自动] [ARXIV]
4minschool Asta交互数据集:解析AI科研工具的使用模式与用户参与度
02-28 Asta数据集 AI科研工具 用户行为分析
[自动] [BLOGS_PODCASTS]
2minmic AIE Europe与World’s Fair论文提交今日截止
02-28 AIE Europe AIE World's Fair CAIS
[自动] [HACKER_NEWS]
4minnewspaper 最小Transformer模型实现两位数加法运算
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
7minnewspaper 能对齐十位数加法运算的最小 Transformer 模型
02-28 Transformer 算法可解释性 算术运算
[自动] [HACKER_NEWS]
6minnewspaper 能对齐十位数加法运算的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
5minnewspaper 能计算两个10位数加法的最小Transformer模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
4minnewspaper 能计算两位十进制数相加的最小 Transformer 模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
6minnewspaper 能对齐十位数加法的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [HACKER_NEWS]
6minnewspaper 能计算两个10位数加法的最小Transformer模型
02-28 Transformer 算法推理 算术运算
[自动] [HACKER_NEWS]
6minnewspaper 能对齐十位数加法运算的最小Transformer模型
02-28 Transformer 算法 算术
[自动] [ARXIV]
3minschool 通过锚定机制提升模型一致性
02-27 模型一致性 锚定机制 模型差异
[自动] [ARXIV]
4minschool 规模难以克服语用学:报告偏差对视觉语言推理的影响
02-27 VLM 视觉语言模型 报告偏差
[自动] [ARXIV]
3minschool 数据集压缩至1MB:小规模数据集的模型训练效果评估
02-27 PLADA 数据集压缩 伪标签
[自动] [ARXIV]
3minschool 基于超单纯形投影的可微零一损失函数
02-27 机器学习 损失函数 0-1损失
[自动] [ARXIV]
4minschool 基于Asta数据集的AI科研工具使用与交互行为分析
02-27 Asta数据集 AI科研工具 用户行为分析
[自动] [ARXIV]
4minschool SOTAlign:基于最优传输的单模态视觉与语言模型半监督对齐
02-27 多模态 视觉语言模型 最优传输
[自动] [ARXIV]
5minschool SeeThrough3D:文本生成图像中的遮挡感知三维控制
02-27 SeeThrough3D 文本生成图像 3D控制
[自动] [BLOGS_PODCASTS]
2minmic METR Joel Becker谈指数级时间评估与AI生产力局限
02-27 METR Joel Becker 指数级评估
[自动] [BLOGS_PODCASTS]
2minmic Transformer中的混合专家模型架构解析
02-27 Transformer MoE 混合专家
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 与太平洋西北国家实验室推基准测试,加速联邦许可流程
02-27 OpenAI 基准测试 AI 编程代理
[自动] [BLOGS_PODCASTS]
4minmic Anthropic 模型蒸馏与 SWE-Bench 失效机制分析
02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [GITHUB_TRENDING]
12minhub 动手学深度学习:面向中文读者的可运行教材
02-27 深度学习 D2L PyTorch
[自动] [ARXIV]
5minschool 面向高效高分辨率GUI智能体的时空令牌剪枝
02-27 GUI Agent Token Pruning Qwen2-VL
[自动] [ARXIV]
4minschool 面向低延迟口语对话的语篇感知双流响应生成
02-27 DDTSR 低延迟 口语对话
[自动] [ARXIV]
2minschool 缓解可读性代价:基于解耦证明者-验证者博弈的方法
02-27 LLM 可解释性 模型评估
[自动] [ARXIV]
4minschool 无模型通用AI框架
02-27 通用人工智能 强化学习 无模型
[自动] [ARXIV]
3minschool 基于优化的系统为何难以实现规范响应:代理与架构限制
02-27 RLHF AI对齐 智能体
[自动] [BLOGS_PODCASTS]
3minmic Transformer架构中的混合专家模型原理与应用
02-27 Transformer MoE 混合专家模型
[自动] [ARXIV]
4minschool ReCoN-Ipsundrum:具备情感耦合控制与机制关联意识指标的可检查循环持久代理
02-27 ReCoN-Ipsundrum 机器意识 AI Agent
[自动] [ARXIV]
4minschool MovieTeller:工具增强且ID一致的渐进式摘要生成
02-27 MovieTeller 视频摘要 VLM
[自动] [ARXIV]
4minschool 提升推理语言模型的参数化知识获取能力
02-27 LLM 推理模型 参数化知识
[自动] [ARXIV]
3minschool LiCQA:轻量级复杂问答系统
02-27 LiCQA 复杂问答 QA系统
[自动] [ARXIV]
5minschool GUI-Libra:动作感知监督与可验证强化学习的原生GUI智能体
02-27 GUI Agent 强化学习 RL
[自动] [ARXIV]
4minschool DySCO:面向长上下文大模型的动态注意力缩放解码方法
02-27 DySCO 长上下文 解码算法
[自动] [ARXIV]
4minschool 提升推理语言模型的参数化知识访问能力
02-26 推理模型 参数化知识 强化学习
[自动] [BLOGS_PODCASTS]
2minmic Transformer 架构中的混合专家模型原理与优势
02-26 MoE Transformer 混合专家
[自动] [ARXIV]
4minschool LiCQA:面向复杂问答的轻量级系统
02-26 LiCQA 复杂问答 轻量级系统
[自动] [ARXIV]
4minschool DySCO:面向长上下文大模型的动态注意力缩放解码
02-26 DySCO 长上下文 注意力机制
[自动] [HACKER_NEWS]
4minnewspaper 用概念代数引导可解释的语言模型
02-26 可解释性 概念代数 模型控制
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家
[自动] [BLOGS_PODCASTS]
2minmic Transformer中的混合专家模型:架构原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]
2minmic Transformer架构中的混合专家模型原理与应用
02-26 Transformer MoE 混合专家模型
[自动] [HACKER_NEWS]
7minnewspaper PA基准:评估Web智能体在真实个人助理工作流中的表现
02-26 Web智能体 PA基准 个人助理
[自动] [JUEJIN]
2minsticky_note_2 空洞卷积原理:如何解决计算机视觉的精度与视野矛盾
02-26 空洞卷积 计算机视觉 深度学习
[自动] [JUEJIN]
2minsticky_note_2 大模型非线性变换解析:从MLP到MoE的架构演进
02-26 非线性变换 MLP MoE
[自动] [HACKER_NEWS]
6minnewspaper PA基准:评估Web智能体在真实个人助理工作流中的表现
02-26 Web智能体 PA基准 个人助理
[自动] [ARXIV]
5minschool 用于Wasserstein测地线与最优传输动力学的神经求解器
02-26 最优传输 Wasserstein 神经网络
[自动] [ARXIV]
4minschool 函数空间经验贝叶斯正则化:基于t分布先验
02-26 贝叶斯深度学习 函数空间 经验贝叶斯
[自动] [ARXIV]
4minschool TG-ASR:基于并行门控交叉注意力的翻译引导低资源语音识别
02-26 ASR 语音识别 低资源学习
[自动] [ARXIV]
4minschool CxMP:评估语言模型构式理解的语言学最小对子基准
02-26 CxMP 构式语法 最小对子
[自动] [ARXIV]
3minschool 扩散对偶性第二章:Ψ采样器与高效课程
02-26 扩散模型 离散扩散 Psi采样器
[自动] [ARXIV]
4minschool 平滑无关学习统计查询复杂度下界
02-26 计算复杂度 统计查询 SQ下界
[自动] [ARXIV]
4minschool 基于试错学习的反思式测试时规划:用于具身大模型
02-26 具身智能 反思机制 测试时规划
[自动] [ARXIV]
5minschool 任意模态下的多向量索引压缩方法
02-26 多向量索引 模态压缩 Late Interaction
[自动] [ARXIV]
5minschool 为何LLM后训练中Pass@k优化会降低Pass@1性能
02-26 LLM 后训练 Pass@k
[自动] [ARXIV]
4minschool Test-Time训练结合KV绑定等价于线性注意力
02-26 TTT 线性注意力 KV绑定
[自动] [ARXIV]
4minschool Squint:面向机器人虚实迁移的快速视觉强化学习
02-26 强化学习 机器人 Sim-to-Real
[自动] [ARXIV]
4minschool Aletheia自主攻克FirstProof数学定理
02-26 Aletheia Gemini 3 数学定理
[自动] [ARXIV]
4minschool 针对平滑对抗学习的统计查询下界研究
02-25 统计查询 计算复杂性 对抗学习
[自动] [ARXIV]
4minschool 扩散对偶性第二章:Ψ采样器与高效课程
02-25 扩散模型 离散扩散 采样器
[自动] [ARXIV]
6minschool 多模态任意向量索引压缩技术
02-25 向量检索 多模态 索引压缩
[自动] [ARXIV]
4minschool 基于试错反思的具身大模型测试时规划
02-25 具身智能 反思机制 测试时规划
[自动] [ARXIV]
5minschool 为何Pass@k优化会降低Pass@1:大模型后训练中的提示干扰
02-25 LLM 后训练 代码生成
[自动] [ARXIV]
4minschool Squint:面向机器人具身迁移的快速视觉强化学习
02-25 强化学习 机器人 Sim-to-Real
[自动] [ARXIV]
4minschool KV绑定测试时训练等价于线性注意力
02-25 TTT 线性注意力 KV缓存
[自动] [ARXIV]
4minschool Aletheia模型自主攻克FirstProof数学定理证明
02-25 Aletheia FirstProof 数学定理证明
[自动] [HACKER_NEWS]
4minnewspaper PA Bench:评估前沿模型多标签页任务能力
02-25 PA Bench 多标签页 模型评估
[自动] [HACKER_NEWS]
5minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]
5minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 Diffusion Model
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的快速推理大语言模型
02-25 Mercury 2 扩散模型 推理加速
[自动] [ARXIV]
3minschool 超越星级评分:基于LLM与文本分类的细粒度情感分析框架
02-25 LLM 情感分析 ABSA
[自动] [ARXIV]
4minschool 离线强化学习:面向离动力学环境的局部动力学感知域适应
02-25 离线强化学习 LoDADA 域适应
[自动] [ARXIV]
3minschool 工具构建:通往高级智能的路径
02-25 LLM 超级智能 工具构建
[自动] [ARXIV]
3minschool 动机优化:提升大语言模型任务表现的关键机制
02-25 动机优化 训练范式 情感神经科学
[自动] [ARXIV]
4minschool VAUQ:面向LVLM自评估的视觉感知不确定性量化
02-25 LVLM 多模态 不确定性量化
[自动] [ARXIV]
4minschool ProxyFL:面向联邦半监督学习的代理引导框架
02-25 联邦学习 半监督学习 FSSL
[自动] [ARXIV]
5minschool DeepSpeed图像工作负载评测:视觉Transformer扩展性能
02-25 DeepSpeed ViT 视觉Transformer
[自动] [ARXIV]
4minschool 非单调损失函数的共形风险控制方法
02-25 非单调损失 保序风险控制 共形预测
[自动] [ARXIV]
4minschool 部分可观测平均场博弈的循环结构策略梯度算法
02-25 平均场博弈 MFG 策略梯度
[自动] [ARXIV]
4minschool 行为学习:从数据中学习分层优化结构
02-25 行为学习 分层优化 可解释性
[自动] [HACKER_NEWS]
4minnewspaper Mercury 2:基于扩散模型的最快推理 LLM
02-25 Mercury 2 扩散模型 推理模型
[自动] [ARXIV]
4minschool JUCAL:分类任务中偶然与认知不确定性的联合校准
02-25 不确定性校准 JUCAL 偶然不确定性
[自动] [ARXIV]
4minschool 面向大规模视频推理的综合基准测试套件
02-24 视频推理 VBVR 基准测试
[自动] [ARXIV]
4minschool 非单调损失函数的保形风险控制方法
02-24 保形预测 风险控制 非单调损失
[自动] [ARXIV]
4minschool 行为学习:从数据中学习分层优化结构
02-24 行为学习 分层优化 可解释性
[自动] [ARXIV]
4minschool JUCAL:分类任务中偶然与认知不确定性的联合校准
02-24 不确定性校准 JUCAL 偶然不确定性
[自动] [ARXIV]
4minschool AdaEvolve:基于大语言模型的自适应零阶优化方法
02-24 AdaEvolve LLM 零阶优化
[自动] [ARXIV]
4minschool 部分可观测平均场博弈的循环结构策略梯度算法
02-24 平均场博弈 部分可观测 策略梯度
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-24 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [HACKER_NEWS]
6minnewspaper Steerling-8B:可解释自身生成任一 token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]
3minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]
5minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [JUEJIN]
2minsticky_note_2 DeepMind研究:多智能体协作瓶颈与Agent能力天花板分析
02-24 DeepMind 多智能体 Agent
[自动] [JUEJIN]
2minsticky_note_2 ArcFlow实现FLUX与Qwen推理40倍加速
02-24 ArcFlow FLUX Qwen
[自动] [HACKER_NEWS]
3minnewspaper 53款模型“洗车”测试:评估多模态AI在物理场景中的表现
02-24 多模态 物理场景 模型评估
[自动] [HACKER_NEWS]
4minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [HACKER_NEWS]
4minnewspaper Steerling-8B:可解释自身生成任一 Token 的语言模型
02-24 Steerling-8B 可解释性 LLM
[自动] [ARXIV]
4minschool 部分软匹配距离:基于部分单元对应的神经表征比较
02-24 神经表征 部分软匹配 最优传输
[自动] [ARXIV]
4minschool 用于软优势策略优化的平滑门函数
02-24 强化学习 GRPO SAPO
[自动] [ARXIV]
4minschool 无需训练的图神经网络跨架构合并方法
02-24 arxiv cs.LG
[自动] [ARXIV]
4minschool 城市编辑:面向依赖感知的分层智能体城市地理空间修改
02-24 City Editing 分层智能体 多模态推理
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-24 First Proof 数学证明 AI推理
[自动] [ARXIV]
5minschool Soft Sequence Policy Optimization:连接GMPO与SAPO
02-24 SSPO LLM对齐 强化学习
[自动] [ARXIV]
4minschool RetinaVision:基于XAI增强调控的深度学习视网膜疾病分类
02-24 计算机视觉 医疗AI 深度学习
[自动] [BLOGS_PODCASTS]
4minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [ARXIV]
4minschool 统一图神经网络均匀表达能力的通用方法
02-24 GNN 图神经网络 表达能力
[自动] [ARXIV]
4minschool 扩散模型无需噪声调节的几何学原理
02-24 扩散模型 Flow Matching 几何学原理
[自动] [ARXIV]
4minschool 基准测试图神经网络在解决难约束满足问题中的性能
02-24 GNN 图神经网络 约束满足问题
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-24 数学推理 First Proof 研究级推理
[自动] [ARXIV]
5minschool U(d)子群导出自然RNN与Transformer架构
02-24 RNN Transformer 序列模型
[自动] [ARXIV]
3minschool RVR:检索-验证-检索机制提升综合问答能力
02-24 RVR RAG 检索增强
[自动] [ARXIV]
4minschool K-partition 集成方法:通过置信度分配提升模型性能
02-24 CAKE 聚类集成 置信度评估
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [ARXIV]
3minschool 统一图神经网络均匀表达能力的通用方法
02-23 GNN 图神经网络 表达能力
[自动] [BLOGS_PODCASTS]
2minmic 研究显示主流AI模型向弱势用户提供的信息准确度较低
02-23 AI偏见 数字鸿沟 模型评估
[自动] [ARXIV]
4minschool 扩散模型无需噪声条件:几何视角的解释
02-23 扩散模型 几何视角 生成模型
[自动] [ARXIV]
4minschool 基准测试图神经网络在求解难约束满足问题中的性能
02-23 GNN 图神经网络 约束满足问题
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 First Proof 数学证明 推理能力
[自动] [ARXIV]
4minschool 为K分区集成模型分配置信度以提升预测性能
02-23 聚类分析 集成学习 置信度评估
[自动] [ARXIV]
4minschool U(d)子群自然导出RNN与Transformer架构
02-23 RNN Transformer U(d)
[自动] [ARXIV]
4minschool RVR:检索-验证-检索框架提升综合问答能力
02-23 RVR RAG 检索增强
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍
02-23 Gemini 3.1 Pro Google ARC-AGI 2
[自动] [HACKER_NEWS]
4minnewspaper 53 款模型参与“洗车”基准测试
02-23 基准测试 模型评估 LLM
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍
02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic AI模型在First Proof数学挑战中的证明尝试
02-23 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-23 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 First Proof 数学证明 推理能力
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-23 Gemini Google ARC-AGI
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型针对First Proof数学挑战的证明尝试
02-23 数学推理 First Proof 专家级问题
[自动] [BLOGS_PODCASTS]
2minmic MIT研究:主流AI模型对低学历及非美用户提供信息准确度较低
02-23 MIT LLM 偏见
[自动] [BLOGS_PODCASTS]
4minmic Gemini 3.1 Pro 发布:ARC-AGI 2 得分达 3.0 两倍
02-23 Gemini 3.1 Pro Google ARC-AGI
[自动] [ARXIV]
4minschool 面向扩散语言模型的感知剪枝方法
02-23 扩散模型 语言模型 模型剪枝
[自动] [ARXIV]
3minschool 语言模型处理差异论元标记时的类型学对齐差异
02-23 语言模型 类型学 区分性论元标记
[自动] [ARXIV]
3minschool 多轮人机协作中用户需求的精准对齐方法
02-23 人机协作 多轮对话 决策质量
[自动] [ARXIV]
4minschool MARS:基于边界感知与自我优化的奖励建模
02-23 RLHF 奖励模型 MARS
[自动] [BLOGS_PODCASTS]
2minmic 研究:主流AI聊天机器人向弱势用户提供的信息准确度较低
02-22 AI偏见 信息准确性 弱势群体
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-22 AI模型 First Proof 数学挑战
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2评测分数达3.0两倍
02-22 Gemini Google ARC-AGI
[自动] [ARXIV]
4minschool 面向扩散语言模型的感知汇点剪枝方法
02-22 扩散模型 DLM 模型剪枝
[自动] [ARXIV]
3minschool 语言模型处理差异论元标记的类型对齐差异
02-22 语言模型 GPT-2 计算语言学
[自动] [ARXIV]
4minschool 细粒度细节靶向提升黑盒大视觉模型攻击能力
02-22 LVLM 黑盒攻击 对抗样本
[自动] [ARXIV]
4minschool 多轮人机协作框架支持用户自定义需求
02-22 人机协作 多轮对话 决策质量
[自动] [ARXIV]
4minschool MARS:基于边距感知奖励建模与自我精炼
02-22 MARS RLHF Reward Model
[自动] [HACKER_NEWS]
6minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 时间序列 前向传播
[自动] [HACKER_NEWS]
4minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 前向传播 时间序列
[自动] [HACKER_NEWS]
6minnewspaper 误差随时间前向传播机制解析
02-22 误差传播 时间序列 神经网络
[自动] [ARXIV]
5minschool 面向扩散语言模型的Sink感知剪枝方法
02-21 扩散模型 语言模型 模型剪枝
[自动] [ARXIV]
4minschool 通过细粒度细节定位推进黑盒LVLM攻击边界
02-21 LVLM 黑盒攻击 对抗样本
[自动] [ARXIV]
3minschool 语言模型处理差价论元标记的类型学对齐差异
02-21 语言模型 计算语言学 类型学
[自动] [ARXIV]
4minschool 多轮人机协作框架支持用户自定义需求
02-21 人机协作 LLM 决策质量
[自动] [ARXIV]
4minschool 基于分词器的语言识别模型研究
02-21 UniLID 语言识别 分词器
[自动] [ARXIV]
5minschool MMARS:基于边际感知与自我精炼的奖励建模
02-21 RLHF 奖励建模 数据增强
[自动] [BLOGS_PODCASTS]
3minmic AI模型针对First Proof数学挑战的证明尝试与推理能力测试
02-21 LLM 数学推理 First Proof
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-21 Gemini Google ARC-AGI
[自动] [HACKER_NEWS]
4minnewspaper 大语言模型推理失败机制分析
02-21 LLM 推理 逻辑错误
[自动] [BLOGS_PODCASTS]
2minmic 研究显示主流AI模型向弱势用户提供信息准确度较低
02-21 AI偏见 公平性 准确性
[自动] [BLOGS_PODCASTS]
2minmic 分享AI模型在First Proof数学挑战中的证明尝试
02-21 数学推理 First Proof 研究级推理
[自动] [ARXIV]
4minschool 面向扩散语言模型的Sink感知剪枝方法
02-20 扩散模型 语言模型 模型剪枝
[自动] [ARXIV]
3minschool 语言模型对差异论元标记处理的类型学对齐差异
02-20 语言模型 GPT-2 计算语言学
[自动] [ARXIV]
3minschool 基于用户指定需求的多轮人机协作框架
02-20 人机协作 多轮对话 决策质量
[自动] [ARXIV]
4minschool 基于分词器的语言识别方法研究
02-20 UniLID 语言识别 LID
[自动] [ARXIV]
5minschool MARS:基于边际感知与自我精炼的奖励建模
02-20 MARS RLHF 奖励模型
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 发布自主智能体 METR 基准测试数据
02-20 Anthropic 智能体 Agent
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 公布 Agent 自主性研究及 METR 基准数据
02-20 Anthropic Agent 自主性
[自动] [HACKER_NEWS]
4minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [BLOGS_PODCASTS]
3minmic 研究显示主流AI模型对弱势群体提供信息准确度较低
02-20 AI偏见 公平性 包容性
[自动] [HACKER_NEWS]
4minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [HACKER_NEWS]
4minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [BLOGS_PODCASTS]
4minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-20 Gemini 3.1 Pro Google ARC-AGI
[自动] [HACKER_NEWS]
4minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [HACKER_NEWS]
5minnewspaper 利用注意力匹配加速 KV 键值对压缩
02-20 KV压缩 注意力机制 推理加速
[自动] [HACKER_NEWS]
6minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [HACKER_NEWS]
4minnewspaper 一致性扩散语言模型提速14倍且无损质量
02-20 扩散模型 一致性模型 语言模型
[自动] [ARXIV]
3minschool 评估LLM辅助对生物学新手表现的影响
02-20 LLM 生物学 随机对照试验
[自动] [ARXIV]
4minschool 知识嵌入潜在投影提升鲁棒表征学习
02-20 表征学习 数据不平衡 EHR
[自动] [ARXIV]
3minschool 机器遗忘中保护未删除数据隐私的方法
02-20 机器遗忘 隐私保护 重构攻击
[自动] [ARXIV]
4minschool 强化快速权重结合下一序列预测模型
02-20 REFINE 强化学习 快速权重
[自动] [ARXIV]
4minschool 因果性是可解释性泛化的关键
02-20 可解释性 因果推断 泛化性
[自动] [ARXIV]
3minschool 以对象为中心的表征是否更利于组合泛化
02-20 组合泛化 对象中心 视觉表征
[自动] [ARXIV]
5minschool Calibrate-Then-Act:面向大模型智能体的成本感知探索
02-20 LLM Agents 成本感知 CTA框架
[自动] [ARXIV]
4minschool 知识嵌入隐投影用于鲁棒表征学习
02-19 表征学习 EHR 数据不平衡
[自动] [ARXIV]
3minschool 机器遗忘中保护未删除数据的隐私防御机制
02-19 机器遗忘 隐私保护 重构攻击
[自动] [ARXIV]
4minschool 强化快速权重与下一序列预测
02-19 REFINE 快速权重 强化学习
[自动] [ARXIV]
3minschool 因果性是可解释性泛化的关键
02-19 因果推断 可解释性 LLM
[自动] [ARXIV]
4minschool 以对象为中心的表征在组合泛化任务中的表现评估
02-19 组合泛化 以对象为中心 视觉问答
[自动] [ARXIV]
5minschool Calibrate-Then-Act:大模型智能体的成本感知探索
02-19 LLM Agents 成本感知 探索策略
[自动] [BLOGS_PODCASTS]
3minmic Anthropic发布Agent自主性研究及METR数据
02-19 Anthropic Agent 自主性
[自动] [BLOGS_PODCASTS]
3minmic 长期对话语境下LLM个性化特征与回音室效应分析
02-19 LLM 个性化 回音室效应
[自动] [BLOGS_PODCASTS]
2minmic 美德伦理在AI对齐中的有效性
02-19 AI对齐 美德伦理 AI安全
[自动] [BLOGS_PODCASTS]
2minmic 个性化功能可能导致大语言模型迎合用户观点形成回声室
02-19 LLM 个性化 回声室
[自动] [BLOGS_PODCASTS]
2minmic 长期对话语境下LLM观点映射与回声室效应
02-19 LLM 个性化 回声室效应
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC伯克利利用IT-Bench和MAST诊断企业智能体失败原因
02-19 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic 长期对话导致大语言模型镜像用户观点并形成回声室
02-19 LLM 个性化 回声室
[自动] [ARXIV]
3minschool 通过任务复杂度量化验证浅层对齐假说
02-19 浅层对齐假说 SAH 任务复杂度
[自动] [HACKER_NEWS]
4minnewspaper LLM 上下文长度外推技术综述
02-19 LLM 上下文窗口 外推
[自动] [ARXIV]
4minschool CrispEdit:低曲率投影实现可扩展的大模型无损编辑
02-19 LLM编辑 模型编辑 CrispEdit
[自动] [ARXIV]
3minschool Avey-B:基于视觉基础模型的通用具身智能代理
02-19 Avey-B NLP Transformer
[自动] [BLOGS_PODCASTS]
2minmic Qwen3.5-397B-A17B:最小的高效Open-Opus级模型
02-18 Qwen3.5 模型压缩 性能优化
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley发布IT-Bench及MAST诊断企业智能体失败原因
02-18 IBM UC Berkeley IT-Bench
[自动] [ARXIV]
3minschool 胸部X光分类的任务无关持续学习方法
02-18 持续学习 胸部X光 医学影像
[自动] [ARXIV]
3minschool 基于任务复杂度的浅层对齐假说操作化研究
02-18 浅层对齐 SAH 任务复杂度
[自动] [ARXIV]
3minschool 基于D最优统计的高维仿真代理测试时适应稳定化方法
02-18 TTA 仿真代理 分布偏移
[自动] [ARXIV]
3minschool 利用强化学习解决未知可行性的参数鲁棒避障问题
02-18 强化学习 鲁棒性 避障
[自动] [ARXIV]
4minschool Dex4D:任务无关点跟踪策略实现灵巧操作跨域迁移
02-18 灵巧操作 Sim-to-Real 强化学习
[自动] [ARXIV]
4minschool CrispEdit:低曲率投影实现可扩展的大模型无损编辑
02-18 模型编辑 CrispEdit LLM
[自动] [BLOGS_PODCASTS]
2minmic IBM与UC Berkeley利用IT-Bench和MAST诊断企业智能体失败原因
02-18 IBM UC Berkeley IT-Bench
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式并获合作者验证
02-18 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
5minschool Avey-B:基于注意力机制的高效视觉Transformer模型
02-18 Avey-B Transformer NLP
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2推导胶子振幅新公式并获验证
02-18 GPT-5.2 理论物理 胶子振幅
[自动] [JUEJIN]
2minsticky_note_2 SkillsBench 论文解读:跨任务基准测试如何揭示 Agent 技能的实际效用
02-18 Agent LLM SkillsBench
[自动] [BLOGS_PODCASTS]
2minmic 长期对话语境导致LLM迎合用户观点形成回声室
02-18 LLM 个性化 回声室
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2推导新胶子振幅公式获正式证明
02-18 GPT-5.2 理论物理 科学发现
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2 提出胶子振幅新公式并获合作验证
02-18 GPT-5.2 理论物理 胶子振幅
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出胶子振幅新公式并获学术验证
02-18 GPT-5.2 理论物理 胶子振幅
[自动] [ARXIV]
3minschool 长上下文LLM缩放缺陷:隐私与个性化任务揭示注意力分散
02-18 长上下文 LLM 个性化
[自动] [ARXIV]
4minschool 超越掩码扩散语言模型的扩展性研究
02-18 扩散模型 语言模型 扩展定律
[自动] [ARXIV]
4minschool 语言统计对称性塑造模型表征的几何结构
02-18 表征几何 统计对称性 词嵌入
[自动] [ARXIV]
4minschool 离散扩散模型高效采样:锐利且自适应的理论保证
02-18 离散扩散模型 CTMC 采样效率
[自动] [ARXIV]
3minschool 基于结构化世界模型先验的冷启动个性化方案
02-18 冷启动 个性化 世界模型
[自动] [ARXIV]
4minschool 基于正则化与对称性重审扩散模型及其分子图生成应用
02-18 扩散模型 分子图生成 对称性
[自动] [ARXIV]
2minschool 基于参数高效微调与往返翻译的文本风格迁移
02-18 文本风格迁移 参数高效微调 LLM
[自动] [ARXIV]
3minschool BPP:聚焦关键历史帧的长上下文机器人模仿学习
02-18 机器人 模仿学习 长上下文
[自动] [ARXIV]
3minschool 长上下文LLM隐私与个性化任务中的缩放差距研究
02-17 长上下文 隐私保护 个性化
[自动] [ARXIV]
3minschool 超越掩码扩散语言模型的扩展性研究
02-17 扩散模型 语言模型 扩展定律
[自动] [ARXIV]
3minschool 语言统计对称性塑造模型表征的几何结构
02-17 表征学习 几何结构 统计对称性
[自动] [ARXIV]
4minschool 离散扩散模型高效采样:具备锐利性与自适应保证
02-17 离散扩散模型 高效采样 tau-leaping
[自动] [ARXIV]
3minschool 基于结构化世界模型的无训练先验用于冷启动个性化
02-17 个性化 冷启动 世界模型
[自动] [ARXIV]
4minschool 基于标准化的扩散模型对称性重思考与分子图生成
02-17 扩散模型 分子图生成 对称性
[自动] [ARXIV]
4minschool 基于参数高效微调与往返翻译的文本风格迁移
02-17 文本风格迁移 PEFT LLM
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2提出胶子振幅新公式并获验证
02-17 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3 Deep Think:推进科学与工程研究
02-17 Gemini 3 DeepMind Deep Think
[自动] [ARXIV]
3minschool BPP:聚焦关键历史帧的长上下文机器人模仿学习
02-17 机器人 模仿学习 长上下文
[自动] [JUEJIN]
2minsticky_note_2 Qwen3.5-397B-A17B:极致稀疏MoE架构与多模态能力详解
02-17 Qwen3.5 MoE 多模态
[自动] [HACKER_NEWS]
4minnewspaper 语义消融实验:揭示AI写作为何平庸同质化
02-17 语义消融 AI写作 同质化
[自动] [JUEJIN]
3minsticky_note_2 SkillsBench论文:评估Agent技能在多任务中的实际效用
02-17 Agent LLM SkillsBench
[自动] [HACKER_NEWS]
7minnewspaper SkillsBench:评估智能体技能在多样化任务中的表现基准
02-17 SkillsBench 智能体 Agent
[自动] [ARXIV]
4minschool 过程监督多智能体强化学习提升临床推理可靠性
02-17 多智能体 强化学习 临床推理
[自动] [ARXIV]
4minschool 科学推理模型引入拒答机制以提升准确性
02-17 科学推理 拒答机制 NLI
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的智能体技能通常无效
02-17 AI Agent 智能体 LLM
[自动] [ARXIV]
4minschool 延迟视觉摄入优化图文密集文档问答
02-17 多模态 文档问答 VLM
[自动] [ARXIV]
5minschool 基于枢纽重采样的LLM强化学习深度密集探索
02-17 LLM 强化学习 RLHF
[自动] [ARXIV]
5minschool UniWeTok:统一二进制分词器支持2^128码本规模
02-17 UniWeTok 多模态 Tokenizer
[自动] [ARXIV]
4minschool GPT-5与其他大模型长短上下文性能对比
02-17 GPT-5 LLM 长文本
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式获学术验证
02-17 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
3minschool 语义分块与自然语言熵:优化文本切分策略
02-17 语义分块 自然语言熵 文本切分
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的Agent技能实际无效
02-17 Agent LLM 研究
[自动] [ARXIV]
4minschool 基于扩散模型从面部嵌入重建真实人脸
02-17 扩散模型 人脸重建 KAN
[自动] [ARXIV]
4minschool 基于仿真过滤的模块化策略从人类视频学习有效行为
02-17 机器人 模仿学习 仿真过滤
[自动] [ARXIV]
4minschool 在线镜像 descent 使用镜像图组合改进遗憾保证
02-17 在线镜像下降 OMD 在线凸优化
[自动] [ARXIV]
5minschool CoPE-VideoLM:基于编解码基元的高效视频语言模型
02-17 VideoLM 视频理解 多模态
[自动] [ARXIV]
3minschool 语义分块与自然语言熵的关联研究
02-16 语义分块 自然语言熵 LLM
[自动] [HACKER_NEWS]
3minnewspaper 研究:自生成的Agent技能通常无效
02-16 Agent LLM 自生成技能
[自动] [ARXIV]
4minschool 基于镜像映射组合改进在线镜像下降的遗憾界
02-16 在线优化 OMD 遗憾界
[自动] [ARXIV]
3minschool 基于扩散模型从面部嵌入实现真实人脸重建
02-16 扩散模型 人脸重建 隐私保护
[自动] [ARXIV]
4minschool 仿真筛选模块化策略:从人类视频学习有效行为
02-16 机器人 强化学习 模仿学习
[自动] [HACKER_NEWS]
7minnewspaper LCM:无损上下文管理技术论文
02-16 LCM 上下文管理 无损
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2 提出胶子振幅新公式并获合作者验证
02-16 GPT-5.2 理论物理 胶子振幅
[自动] [ARXIV]
4minschool CoPE-VideoLM:基于编解码基元的高效视频语言模型
02-16 VideoLM 多模态 视频理解
[自动] [HACKER_NEWS]
4minnewspaper 研究:自生成的Agent技能通常无效
02-16 Agent LLM 自生成技能
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出胶子振幅新公式并获合作验证
02-16 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
4minschool 面向语言模型的在线上下文蒸馏方法
02-16 LLM 蒸馏 上下文学习
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究
02-16 自主研究 数学 AI
[自动] [ARXIV]
4minschool 视觉-语言-动作对齐:扩展验证比扩展策略学习更有效
02-16 VLA 具身智能 CoVer
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-16 多模态 思维链 测试时扩展
[自动] [ARXIV]
5minschool CM2:基于清单奖励强化学习的多步智能体工具调用
02-16 强化学习 Agent 工具调用
[自动] [ARXIV]
4minschool AttentionRetriever:注意力层即长文档检索器
02-16 RAG 长文档 检索
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究
02-15 自主研究 数学 AI
[自动] [ARXIV]
4minschool 语言模型在线策略上下文蒸馏方法
02-15 模型蒸馏 上下文学习 在线策略
[自动] [ARXIV]
4minschool 扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐
02-15 VLA 具身智能 机器人
[自动] [ARXIV]
4minschool WebAgents测试时扩展:智能体性能提升方法
02-15 WebAgents 测试时扩展 CATTS
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-15 多模态 思维链 测试时扩展
[自动] [ARXIV]
4minschool MonarchRT:面向实时视频生成的高效注意力机制
02-15 视频生成 DiT 注意力机制
[自动] [BLOGS_PODCASTS]
2minmic Gemini 3 Deep Think:面向科研与工程的科学推理模型
02-15 Gemini 3 Deep Think 科学推理
[自动] [ARXIV]
4minschool CM2:基于清单奖励强化学习的多步智能体工具调用
02-15 CM2 强化学习 Agent
[自动] [ARXIV]
3minschool AttentionRetriever:注意力层隐式实现长文档检索
02-15 RAG 长文档检索 AttentionRetriever
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究
02-15 自主研究 数学 AI科学家
[自动] [BLOGS_PODCASTS]
3minmic GPT-5.2提出胶子振幅新公式并获验证
02-15 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
3minschool AI时代的创意所有权界定
02-15 版权 生成式AI 法律
[自动] [HACKER_NEWS]
4minnewspaper 迈向自主数学研究:AI 探索自动化定理证明
02-15 自动化定理证明 AI for Math 形式化验证
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式并获合作验证
02-15 GPT-5.2 OpenAI 理论物理
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2提出新胶子振幅公式获学术验证
02-14 GPT-5.2 理论物理 胶子振幅
[自动] [ARXIV]
4minschool 扩展验证比扩展策略学习更有效实现视觉-语言-动作对齐
02-14 VLA 具身智能 机器人
[自动] [ARXIV]
4minschool 基于策略上下文蒸馏的大语言模型优化方法
02-14 LLM 蒸馏 上下文学习
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展
02-14 多模态 思维链 测试时扩展
[自动] [BLOGS_PODCASTS]
2minmic GPT-5.2推导新胶子振幅公式获正式验证
02-14 GPT-5.2 OpenAI 理论物理
[自动] [ARXIV]
5minschool CM2:基于清单奖励强化学习的多步多轮智能体工具调用
02-14 智能体 强化学习 工具调用
[自动] [ARXIV]
4minschool AttentionRetriever:注意力层可作为长文档检索器
02-14 RAG 长文档检索 AttentionRetriever
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
3minnewspaper G
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理领域新成果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
5minnewspaper 神经渲染技术探索与应用实践
02-14 神经渲染 NeRF 3D重建
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 科学发现
[自动] [HACKER_NEWS]
5minnewspaper GPT-5.2 推导出理论物理新结果
02-14 GPT-5.2 理论物理 AI for Science
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新成果
02-14 GPT-5.2 理论物理 科学发现
[自动] [ARXIV]
4minschool 面向语言模型的在线上下文蒸馏方法
02-13 LLM 模型蒸馏 上下文学习
[自动] [ARXIV]
4minschool 扩展验证比扩展策略学习更能有效实现视觉-语言-动作对齐
02-13 VLA 具身智能 机器人
[自动] [ARXIV]
4minschool UniT:统一多模态思维链测试时扩展方法
02-13 多模态 思维链 测试时扩展
[自动] [HACKER_NEWS]
4minnewspaper GPT-5.2 推导出理论物理新结果
02-13 GPT-5.2 理论物理 AI for Science
[自动] [ARXIV]
4minschool AttentionRetriever:注意力层即长文档检索器
02-13 RAG 长文档检索 AttentionRetriever
[自动] [BLOGS_PODCASTS]
3minmic Rafael Gómez-Bombarelli:AI与模拟加速科学发现的转折点
02-13 AI for Science 科学发现 模拟技术
[自动] [BLOGS_PODCASTS]
2minmic AI与模拟加速科学发现的转折点
02-13 科学发现 AI模拟 Rafael Gómez-Bombarelli
[自动] [HACKER_NEWS]
3minnewspaper 尼克·博斯特罗姆新论文探讨超级智能的启动时机
02-13 超级智能 尼克·博斯特罗姆 AI安全
[自动] [ARXIV]
4minschool 训练LRM模型:自适应反思与长度协调惩罚提升推理效率
02-13 LRM 推理效率 自适应反思
[自动] [ARXIV]
4minschool 离线强化学习在Q星近似与部分覆盖下的复杂度分析
02-13 离线强化学习 Q星近似 部分覆盖
[自动] [ARXIV]
4minschool 基于奖励外推的广义在线策略蒸馏算法
02-13 LLM 强化学习 知识蒸馏
[自动] [ARXIV]
4minschool 利用辅助信息实现少样本设计优化
02-13 贝叶斯优化 少样本学习 设计优化
[自动] [ARXIV]
3minschool Pensieve范式:有状态语言模型自主管理上下文
02-13 StateLM 有状态模型 上下文管理
[自动] [ARXIV]
4minschool P-GenRM:个性化生成式奖励模型与基于用户的测试时缩放
02-13 P-GenRM 个性化对齐 奖励模型
[自动] [ARXIV]
4minschool Meta-Sel:基于监督元学习的高效上下文学习示例选择方法
02-13 ICL 元学习 示例选择
[自动] [ARXIV]
4minschool 长思维链监督微调中数据重复优于数据扩展
02-13 长思维链 监督微调 数据重复
[自动] [ARXIV]
4minschool 超越VLM奖励:扩散原生潜在奖励建模
02-13 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]
4minschool 权重衰减提升语言模型可塑性
02-13 权重衰减 模型可塑性 微调
[自动] [ARXIV]
4minschool 基于扩散预训练的稠密上下文嵌入模型
02-13 Embeddings 扩散模型 RAG
[自动] [ARXIV]
4minschool 基于归一化流的高效分层目标条件强化学习
02-13 强化学习 分层强化学习 归一化流
[自动] [ARXIV]
5minschool SCRAPL:基于随机路径散射变换的机器学习框架
02-13 SCRAPL Scattering Transform 小波散射
[自动] [ARXIV]
3minschool GENIUS:生成式流体智能评估套件
02-13 GENIUS 流体智力 多模态评估
[自动] [ARXIV]
3minschool 长思维链监督微调中数据重复优于数据扩展
02-12 长思维链 监督微调 数据重复
[自动] [ARXIV]
4minschool 超越VLM奖励:扩散原生潜在奖励建模
02-12 扩散模型 DiNa-LRM 奖励建模
[自动] [ARXIV]
4minschool 权重衰减提升语言模型可塑性
02-12 LLM 权重衰减 模型可塑性
[自动] [ARXIV]
4minschool 扩散预训练模型生成稠密上下文嵌入
02-12 Embeddings 扩散模型 RAG
[自动] [ARXIV]
3minschool 基于归一化流的高效分层目标条件强化学习
02-12 强化学习 归一化流 分层强化学习
[自动] [ARXIV]
4minschool TabICLv2:更优性能与可扩展性的开源表格基础模型
02-12 TabICLv2 表格基础模型 RealTabPFN
[自动] [ARXIV]
5minschool SCRAPL:基于随机路径散射变换的机器学习框架
02-12 SCRAPL Scattering Transform Wavelet
[自动] [ARXIV]
3minschool GENIUS:生成式流体智能评估套件
02-12 GENIUS 流体智能 GFI
[自动] [JUEJIN]
2minsticky_note_2 智谱GLM-5即Pony Alpha:对标Claude Opus
02-12 智谱AI GLM-5 Pony Alpha
[自动] [HACKER_NEWS]
3minnewspaper 大语言模型面临的幻觉与逻辑推理局限
02-12 LLM 幻觉 逻辑推理
[自动] [BLOGS_PODCASTS]
3minmic AI与模拟加速科学发现:拉斐尔·戈麦斯-巴雷利的观点
02-12 AI 科学发现 模拟
[自动] [BLOGS_PODCASTS]
2minmic 大语言模型无法独立攻克癌症的局限性分析
02-12 LLM 癌症研究 AI 局限性
[自动] [HACKER_NEWS]
3minnewspaper GPT-5在法律推理实验中表现优于联邦法官
02-12 GPT-5 法律推理 联邦法官
[自动] [ARXIV]
3minschool 提升自动驾驶感知多租户DNN推理的可预测性
02-12 arxiv cs.CV
[自动] [ARXIV]
4minschool LoRA-Squeeze:LoRA模块的调优后与调优中压缩方法
02-12 LoRA PEFT 模型压缩
[自动] [BLOGS_PODCASTS]
2minmic LLM 单独使用无法治愈癌症:科学与模拟的局限
02-12 LLM 生物医学 AI for Science
[自动] [ARXIV]
2minschool 迈向可解释联邦学习:理解差分隐私的影响
02-12 联邦学习 差分隐私 可解释性
[自动] [ARXIV]
2minschool 用于增强科学图表分析的智能代理
02-12 智能代理 科学图表 多模态
[自动] [ARXIV]
2minschool 步级解析数据归因:面向循环Transformer
02-12 arxiv cs.LG
[自动] [ARXIV]
3minschool Olaf-World:面向视频世界模型的潜在动作定向方法
02-12 arxiv cs.CV
[自动] [ARXIV]
1minschool Learning on the Manifold: Unlocking Standard Diffusion
02-12 Diffusion Transformer DiT 表征学习
[自动] [HACKER_NEWS]
4minnewspaper GLM-OCR:面向复杂文档理解的多模态OCR模型
02-12 GLM-OCR 多模态 OCR
[自动] [ARXIV]
5minschool Agent World Model:面向智能体强化学习的无限合成环境
02-12 Agent World Model 强化学习 合成环境
[自动] [ARXIV]
3minschool 迈向可解释联邦学习:理解差分隐私的影响
02-11 联邦学习 差分隐私 可解释性
[自动] [ARXIV]
3minschool 视频扩散模型因果性与去噪过程可分离
02-11 arxiv cs.CV
[自动] [ARXIV]
1minschool 基于表征编码器解锁标准扩散Transformer
02-11 DiT 扩散模型 流匹配
[自动] [ARXIV]
1minschool Quantum-Audit:评估大语言模型量子计算推理能力极限
02-11 arxiv cs.CL
[自动] [ARXIV]
4minschool CODE-SHARP:基于分层奖励程序的技能持续演化框架
02-11 CODE-SHARP 强化学习 RL
[自动] [ARXIV]
3minschool Agent World Model: Infinity Synthetic Environments for
02-11 Agent World Model 强化学习
[自动] [ARXIV]
1minschool 循环Transformer的步级数据归因方法
02-11 Transformer 数据归因 模型可解释性
[自动] [BLOGS_PODCASTS]
1minmic 大语言模型无法治愈癌症:科学家的模拟困境
02-11 LLM 科学发现 生物医学
[自动] [ARXIV]
3minschool Olaf-World: Orienting Latent Actions for Video World Mo
02-11 世界模型 Olaf-World 潜在动作
[自动] [JUEJIN]
2minsticky_note_2 AI 核心术语解析:从神经网络原理到词嵌入与潜空间
02-11 神经网络 词嵌入 潜空间
[自动] [HACKER_NEWS]
4minnewspaper GLM-OCR:兼顾准确度、速度与通用性的多模态大模型
02-11 GLM-OCR 多模态 OCR
[自动] [ARXIV]
2minschool Anagent For Enhancing Scientific Table & Figure Analysi
02-11 Anagent 多智能体 科学图表分析
[自动] [HACKER_NEWS]
4minnewspaper The Little Learner:通往深度学习的直线路径
02-11 深度学习 机器学习 神经网络
[自动] [ARXIV]
1minschool Transformer模型在低信噪比时间序列预测中的统计基准测试
02-11 arxiv cs.LG
[自动] [ARXIV]
2minschool CoFEH:LLM驱动的协同贝叶斯特征工程框架
02-11 arxiv cs.LG
[自动] [ARXIV]
3minschool Code2World: A GUI World Model via Renderable Code Gener
02-11 arxiv cs.CV
[自动] [HACKER_NEWS]
1minnewspaper The Little Learner: A Straight Line to Deep Learning
02-11 深度学习 机器学习 神经网络
[自动] [ARXIV]
4minschool Robustness Is a Function, Not a Number: A Factorized Co
02-11 arxiv cs.RO
[自动] [ARXIV]
2minschool GEBench:将图像生成模型评估为GUI环境的基准
02-11 GEBench GUI生成 图像生成
[自动] [ARXIV]
3minschool ARO: A New Lens On Matrix Optimization For Large Models
02-11 ARO 矩阵优化 LLM
[自动] [ARXIV]
4minschool ArcFlow: Unleashing 2-Step Text-to-Image Generation via
02-11 arxiv cs.CV
[自动] [ARXIV]
2minschool ANCRe: Adaptive Neural Connection Reassignment for Effi
02-11 ANCRe 深度学习 残差连接
[自动] [HACKER_NEWS]
4minnewspaper The Little Learner: A Straight Line to Deep Learning
02-11 深度学习 Deep Learning 机器学习
[自动] [ARXIV]
3minschool 鲁棒性是函数而非数值:基于视觉驾驶的OOD鲁棒性因子化研究
02-10 OOD鲁棒性 视觉驾驶 因子化
[自动] [ARXIV]
4minschool ARO:面向大模型矩阵优化的新视角
02-10 矩阵优化 ARO 大模型
[自动] [ARXIV]
2minschool ArcFlow:高精度非线性流蒸馏实现两步文生图生成
02-10 ArcFlow 文生图 流蒸馏
[自动] [BLOGS_PODCASTS]
1minmic The Scientist and the Simulator
02-10 LLM 生物医药 科学研究
[自动] [ARXIV]
3minschool GEBench: Benchmarking Image Generation Models as GUI En
02-10 GEBench GUI生成 图像生成
[自动] [ARXIV]
3minschool 下一代验证码:利用认知差异防御GUI智能体
02-10 arxiv cs.LG
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型而LLM仅基于词模型预测
02-10 世界模型 词模型 智能体
[自动] [ARXIV]
3minschool ANCRe:自适应神经连接重分配实现高效深度扩展
02-10 arxiv cs.LG
[自动] [ARXIV]
3minschool 针对LLM服务框架而非模型的延迟型拒绝服务攻击研究
02-10 arxiv cs.CR
[自动] [ARXIV]
4minschool 基于朗之万动力学的直接软策略采样
02-10 arxiv cs.LG
[自动] [BLOGS_PODCASTS]
1minmic 专家依赖世界模型推断隐藏状态,大语言模型需突破词模型局限
02-10 世界模型 词模型 隐藏状态
[自动] [ARXIV]
1minschool MARTI-MARS$^2$: Scaling Multi-Agent Self-Search via Rei
02-10 arxiv cs.LG
[自动] [ARXIV]
3minschool Harpoon:面向条件表格扩散模型的广义流形引导
02-10 扩散模型 表格数据 流形引导
[自动] [ARXIV]
3minschool 智能体不确定性研究揭示过度自信问题
02-09 AI Agents 不确定性 过度自信
[自动] [ARXIV]
4minschool 学习大模型神经元激活的生成式元模型
02-09 神经元激活 生成式模型 元模型
[自动] [ARXIV]
4minschool 基于熵排序流的非监督解耦表示学习模型
02-09 无监督学习 解耦表示 EOFlows
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型决策,大语言模型需超越词模型
02-09 世界模型 词模型 专家系统
[自动] [ARXIV]
4minschool InftyThink+: 基于强化学习的高效无限视野推理框架
02-09 强化学习 推理框架 思维链
[自动] [ARXIV]
4minschool DreamDojo:基于大规模人类视频的通用机器人世界模型
02-09 机器人 世界模型 DreamDojo
[自动] [ARXIV]
4minschool DAWN:面向扩散大模型的依赖感知快速推理
02-09 扩散模型 DAWN 并行解码
[自动] [BLOGS_PODCASTS]
3minmic 专家具备世界模型而LLM仅拥有词模型
02-09 LLM 世界模型 词模型
[自动] [BLOGS_PODCASTS]
2minmic 专家依赖世界模型决策,LLM需超越词模型以实现推理
02-09 世界模型 推理 智能体
[自动] [HACKER_NEWS]
3minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-09 世界模型 词模型 LLM
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-09 世界模型 词模型 LLM
[自动] [HACKER_NEWS]
3minnewspaper 停止生成,开始思考:大模型推理能力进化路径
02-09 LLM 推理能力 思维链
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直观物理
02-09 VLM 直觉物理 强化学习
[自动] [ARXIV]
4minschool 好奇心即知识:基于主动推理的自一致学习与无遗憾优化
02-09 主动推理 好奇心 自一致学习
[自动] [ARXIV]
5minschool 共享LoRA子空间实现近乎严格的持续学习
02-09 持续学习 LoRA 灾难性遗忘
[自动] [ARXIV]
4minschool 伪可逆神经网络:通过伪逆变换提升模型可逆性与表达能力
02-09 神经网络 可逆性 SPNN
[自动] [ARXIV]
5minschool PhysicsAgentABM:物理引导的生成式主体建模框架
02-09 PhysicsAgentABM Agent 多智能体
[自动] [ARXIV]
3minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-09 DyTopo Multi-Agent 动态拓扑
[自动] [ARXIV]
4minschool DFlash:基于块扩散的闪存推测解码方法
02-09 LLM 推理加速 推测解码
[自动] [ARXIV]
4minschool CommCP:基于共形预测的LLM通信提升多智能体协调效率
02-09 LLM 多智能体 共形预测
[自动] [ARXIV]
5minschool AP-OOD:基于注意力池化的分布外检测方法
02-09 OOD检测 注意力机制 NLP
[自动] [ARXIV]
3minschool 面向运行时智能体记忆的查询感知预算层路由
02-08 Agent LLM 智能体
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直觉物理
02-08 VLM 直觉物理 多模态
[自动] [ARXIV]
4minschool 好奇心即知识:基于主动推理的自一致学习与无悔优化
02-08 主动推理 好奇心 探索与利用
[自动] [ARXIV]
5minschool 共享LoRA子空间实现近乎严格的持续学习
02-08 LoRA 持续学习 灾难性遗忘
[自动] [ARXIV]
4minschool 伪可逆神经网络:基于伪逆变换的高效架构设计
02-08 神经网络 伪逆 SPNN
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型,大语言模型仅有词模型
02-08 LLM 世界模型 词模型
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式智能体建模
02-08 PhysicsAgentABM 智能体 多主体系统
[自动] [ARXIV]
3minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-08 多智能体 DyTopo 动态拓扑
[自动] [ARXIV]
4minschool CommCP:基于LLM通信与共形预测的多智能体高效协调
02-08 LLM Multi-Agent CommCP
[自动] [ARXIV]
4minschool AP-OOD:基于注意力池化的分布外检测方法
02-08 OOD检测 注意力机制 注意力池化
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-08 LLM 世界模型 词模型
[自动] [HACKER_NEWS]
4minnewspaper 专家具备世界模型,大语言模型仅有词模型
02-08 世界模型 词模型 LLM
[自动] [HACKER_NEWS]
4minnewspaper 基于人类反馈的强化学习:原理与应用
02-07 RLHF 强化学习 人类反馈
[自动] [BLOGS_PODCASTS]
3minmic 专家依赖世界模型而LLM仅依赖词模型
02-07 世界模型 LLM 词模型
[自动] [ARXIV]
5minschool 面向运行时智能体记忆的查询感知预算层路由
02-07 Agent LLM Memory
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直观物理
02-07 VLM 多模态 具身智能
[自动] [ARXIV]
3minschool 好奇心即知识:基于主动推理的自一致学习与无悔优化
02-07 主动推理 强化学习 好奇心
[自动] [ARXIV]
5minschool 共享 LoRA 子空间实现近乎严格的持续学习
02-07 LoRA 持续学习 灾难性遗忘
[自动] [ARXIV]
4minschool 伪可逆神经网络:通过伪可逆性提升模型可逆性
02-07 神经网络 伪可逆 SPNN
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式智能体建模
02-07 PhysicsAgentABM 生成式ABM 多主体系统
[自动] [ARXIV]
4minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-07 DyTopo 多智能体 动态拓扑
[自动] [ARXIV]
4minschool CommCP:基于共形预测的LLM通信提升多智能体协调效率
02-07 LLM Multi-Agent 共形预测
[自动] [ARXIV]
4minschool AP-OOD:基于注意力池化的分布外检测方法
02-07 OOD检测 NLP 注意力机制
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:基于多传感器数据生成驾驶场景
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
5minnewspaper 基于人类反馈的强化学习:原理与应用
02-07 RLHF 强化学习 人类反馈
[自动] [HACKER_NEWS]
6minnewspaper Waymo 世界模型:利用生成式世界模型提升自动驾驶决策能力
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:自动驾驶场景生成与仿真应用
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
4minnewspaper Waymo 世界模型:利用生成式世界模拟提升自动驾驶决策
02-07 Waymo 世界模型 自动驾驶
[自动] [HACKER_NEWS]
7minnewspaper 基于人类反馈的强化学习机制解析
02-07 RLHF 强化学习 人类反馈
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理的可视化解析
02-07 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更难
02-07 LLM ICL 上下文学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习的难度超出预期
02-07 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
6minnewspaper 神经网络可视化:直观理解深度学习原理
02-07 神经网络 深度学习 可视化
[自动] [HACKER_NEWS]
4minnewspaper 从上下文学习的难度超出预期
02-07 上下文学习 ICL LLM
[自动] [ARXIV]
3minschool 面向运行时智能体记忆的查询感知预算分层路由
02-06 Agent Memory RAG
[自动] [ARXIV]
3minschool 视觉语言模型能否通过交互学习直觉物理
02-06 VLM 直觉物理 强化学习
[自动] [ARXIV]
3minschool 好奇心即知识:基于主动推理的自一致学习与无遗憾优化
02-06 主动推理 探索与利用 自由能
[自动] [ARXIV]
4minschool 共享 LoRA 子空间实现近乎严格的持续学习
02-06 LoRA 持续学习 微调
[自动] [ARXIV]
4minschool 伪可逆神经网络:兼具可逆性与灵活性的新架构
02-06 神经网络 可逆性 伪逆
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更具挑战性
02-06 LLM ICL 上下文学习
[自动] [ARXIV]
4minschool PhysicsAgentABM:物理引导的生成式智能体建模
02-06 PhysicsAgentABM 多智能体系统 ABM
[自动] [BLOGS_PODCASTS]
2minmic GPT-5结合自动化闭环实验降低无细胞蛋白合成成本40%
02-06 GPT-5 AI for Science 生物科技
[自动] [ARXIV]
3minschool DyTopo:基于语义匹配的多智能体动态拓扑路由
02-06 DyTopo 多智能体 动态拓扑
[自动] [ARXIV]
5minschool DFlash:基于块扩散的Flash推测解码方法
02-06 LLM 推理加速 推测解码
[自动] [ARXIV]
4minschool CommCP:基于LLM通信与共形预测的高效多智能体协调
02-06 LLM 多智能体 具身智能
[自动] [ARXIV]
5minschool AP-OOD:基于注意力池化的分布外检测方法
02-06 OOD检测 注意力机制 NLP
[自动] [HACKER_NEWS]
3minnewspaper 上下文学习难度超出原有认知
02-06 上下文学习 ICL 大模型
[自动] [HACKER_NEWS]
4minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习比预期更难
02-06 LLM 上下文学习 ICL
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 从上下文学习的难度超出原有认知
02-06 上下文学习 ICL LLM
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
6minnewspaper 神经网络原理的可视化解析
02-06 神经网络 可视化 深度学习
[自动] [HACKER_NEWS]
3minnewspaper 超网络:用于处理层级数据的神经网络架构
02-06 超网络 层级数据 神经网络架构
[自动] [HACKER_NEWS]
6minnewspaper 超网络:面向层级数据的神经网络架构
02-06 超网络 Hypernetworks 层级数据
[自动] [ARXIV]
4minschool 数据块模型中的精确恢复方法
02-06 社区检测 随机块模型 数据块模型
[自动] [ARXIV]
4minschool 受限群组相对策略优化
02-06 GRPO 强化学习 策略优化
[自动] [ARXIV]
4minschool Wedge Sampling:实现近线性样本复杂度的张量补全算法
02-06 张量补全 楔形采样 低秩张量
[自动] [ARXIV]
5minschool RRAttention:基于轮询移位的动态块稀疏注意力机制
02-06 RRAttention 稀疏注意力 长上下文
[自动] [ARXIV]
4minschool DLM-Scope:利用稀疏自编码器解析扩散语言模型
02-06 DLM SAE 稀疏自编码器
[自动] [ARXIV]
3minschool 面向物联网模型适应性的对比持续学习方法
02-06 持续学习 对比学习 物联网
[自动] [ARXIV]
4minschool 重新思考大模型强化学习中的信任区域机制
02-06 强化学习 LLM PPO
[自动] [ARXIV]
3minschool 蛋白质自回归建模:基于多尺度结构生成的方案
02-06 蛋白质生成 自回归模型 多尺度建模
[自动] [ARXIV]
4minschool 强化注意力学习:通过奖励机制优化视觉注意力模型
02-06 强化学习 多模态 注意力机制
[自动] [ARXIV]
4minschool 多层交叉注意力机制在多模态上下文学习中具有可证明的最优性
02-06 多模态 上下文学习 ICL
[自动] [ARXIV]
5minschool 重新思考大模型强化学习中的信任区域
02-05 RLHF PPO 强化学习
[自动] [ARXIV]
3minschool 蛋白质多尺度结构生成的自回归建模方法
02-05 蛋白质生成 自回归模型 多尺度建模
[自动] [ARXIV]
4minschool 强化注意力学习:基于奖励反馈的注意力机制优化方法
02-05 强化学习 注意力机制 多模态
[自动] [ARXIV]
3minschool 多层交叉注意力被证明是多模态上下文学习的最优解
02-05 多模态 上下文学习 ICL
[自动] [ARXIV]
5minschool Multi-Head LatentMoE与Head并行:通信高效且确定性的MoE方案
02-05 MoE 分布式训练 通信优化
[自动] [ARXIV]
3minschool 面向物联网模型适应性的对比持续学习
02-05 持续学习 对比学习 物联网
[自动] [HACKER_NEWS]
4minnewspaper 超网络:面向层级数据的神经网络架构
02-05 超网络 层级数据 神经网络架构
[自动] [HACKER_NEWS]
6minnewspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制
02-05 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
6minnewspaper 对称感知泰勒近似实现恒定Token成本注意力机制
02-05 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]
4minschool 基于急停干预的鲁棒干预学习
02-05 干预学习 自动驾驶 鲁棒性
[自动] [ARXIV]
4minschool 加速科学研究:Gemini 案例研究与通用技术
02-05 Gemini 科学研究 数学发现
[自动] [ARXIV]
4minschool 利用权重更新稀疏性提升分布式强化学习通信效率
02-05 分布式强化学习 通信效率 权重稀疏性
[自动] [ARXIV]
5minschool PrevizWhiz:结合粗略3D场景与2D视频引导生成式预演
02-05 AIGC 视频生成 3D场景
[自动] [ARXIV]
5minschool PLATE:用于几何感知持续学习的可塑性调谐高效适配器
02-05 持续学习 PLATE 模型适配
[自动] [ARXIV]
3minschool Parallel-Probe:通过二维探测实现高效并行思维
02-05 并行推理 思维链 2D Probing
[自动] [ARXIV]
4minschool AutoFigure:自动生成与润色出版级科学插图
02-05 AutoFigure FigureBench 科学插图
[自动] [HACKER_NEWS]
6minnewspaper 基于对称性泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [ARXIV]
4minschool 利用权重更新稀疏性的通信高效分布式强化学习
02-04 分布式训练 强化学习 通信优化
[自动] [ARXIV]
4minschool 利用 Gemini 加速科学研究:案例研究与通用技术
02-04 Gemini 科学研究 数学证明
[自动] [ARXIV]
5minschool PrevizWhiz:结合粗略3D场景与2D视频引导生成视频预演
02-04 视频生成 3D视觉 PrevizWhiz
[自动] [ARXIV]
4minschool PLATE:面向几何感知持续学习的可塑性调谐高效适配器
02-04 持续学习 PLATE 高效适配器
[自动] [ARXIV]
4minschool Parallel-Probe:通过2D探测实现高效并行思维
02-04 LLM 并行推理 思维链
[自动] [ARXIV]
4minschool AutoFigure:自动生成与优化出版级科学插图
02-04 AutoFigure FigureBench 科学插图
[自动] [HACKER_NEWS]
6minnewspaper 基于对称性泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
5minnewspaper 基于对称性泰勒近似实现恒定每Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
7minnewspaper 基于对称感知泰勒近似实现恒定Token成本注意力机制
02-04 注意力机制 Transformer 泰勒近似
[自动] [HACKER_NEWS]
7minnewspaper 基于对称泰勒近似实现恒定Token成本注意力机制
02-04 Attention机制 Taylor近似 线性注意力
[自动] [HACKER_NEWS]
5minnewspaper 对称感知泰勒近似实现恒定Token成本注意力机制
02-04 Attention机制 Taylor近似 Token成本
[自动] [ARXIV]
4minschool 面向冲突目标的免奖励对齐方法
02-04 RACO 对齐 多目标优化
[自动] [ARXIV]
4minschool 通过文本反馈扩展强化学习的能力边界
02-04 强化学习 RLHF 文本反馈
[自动] [ARXIV]
3minschool 训练LLM采用分治推理提升测试时扩展性
02-04 LLM 推理 强化学习
[自动] [ARXIV]
5minschool 基于流策略梯度的机器人控制方法
02-04 机器人控制 流匹配 策略梯度
[自动] [ARXIV]
4minschool RE-TRAC:面向深度搜索智能体的递归轨迹压缩算法
02-04 Re-TRAC 深度搜索智能体 ReAct
[自动] [ARXIV]
5minschool PixelGen:像素扩散结合感知损失超越潜在扩散
02-04 PixelGen 扩散模型 计算机视觉
[自动] [ARXIV]
4minschool MemSkill:面向自进化代理的记忆技能学习与演化框架
02-04 MemSkill 智能体 Agent
[自动] [ARXIV]
3minschool MEG-XL:长上下文预训练实现数据高效的脑电转文本
02-04 MEG-XL 脑机接口 脑电转文本
[自动] [ARXIV]
3minschool 训练LLM采用分治推理提升测试时扩展性
02-03 LLM 推理 强化学习
[自动] [ARXIV]
4minschool 无奖励对齐技术处理多目标冲突
02-03 RACO 对齐技术 多目标优化
[自动] [ARXIV]
4minschool 基于流策略梯度的机器人控制方法
02-03 机器人控制 流匹配 策略梯度
[自动] [ARXIV]
4minschool 基于文本反馈扩展强化学习的能力
02-03 强化学习 RLHF 文本反馈
[自动] [ARXIV]
4minschool RLAnything:完全动态强化学习系统构建环境、策略与奖励模型
02-03 强化学习 RL LLM
[自动] [ARXIV]
4minschool RE-TRAC:面向深度搜索智能体的递归轨迹压缩方法
02-03 Re-TRAC 深度搜索 智能体
[自动] [ARXIV]
4minschool PixelGen:引入感知损失的像素扩散模型性能超越潜在扩散
02-03 PixelGen 扩散模型 计算机视觉
[自动] [ARXIV]
4minschool MemSkill:赋予自进化代理学习与演进记忆技能
02-03 MemSkill 智能体 记忆机制
[自动] [ARXIV]
4minschool MEG-XL:基于长上下文预训练的高效脑电转文本模型
02-03 MEG-XL 脑机接口 BCI
[自动] [HACKER_NEWS]
3minnewspaper 模型对齐偏差如何随智能水平与任务复杂度演变
02-03 模型对齐 智能水平 任务复杂度
[自动] [HACKER_NEWS]
4minnewspaper 模型智能与任务复杂度如何影响对齐偏差
02-03 对齐 模型智能 任务复杂度
[自动] [HACKER_NEWS]
4minnewspaper 模型对齐问题如何随智能水平与任务复杂度演变
02-03 模型对齐 智能水平 任务复杂度
[自动] [HACKER_NEWS]
3minnewspaper 训练万亿参数模型以生成幽默内容
02-03 LLM 万亿参数 幽默生成
[自动] [ARXIV]
3minschool 误差分类引导的提示词优化方法
02-03 提示词工程 ETGPO 自动优化
[自动] [HACKER_NEWS]
3minnewspaper 训练万亿参数模型使其具备幽默感
02-03 LLM 幽默感 万亿参数
[自动] [ARXIV]
3minschool 研究揭示RLHF如何加剧大模型谄媚行为
02-03 RLHF 谄媚行为 模型偏见
[自动] [ARXIV]
4minschool 智能体推理与工具使用的竞争:量化干扰与解调优
02-03 智能体 强化学习 工具使用
[自动] [ARXIV]
3minschool 大语言模型稀疏奖励子系统
02-03 LLM 稀疏奖励 价值神经元
[自动] [ARXIV]
4minschool 基于预测集的最优决策方法
02-03 预测集 最优决策 决策理论
[自动] [ARXIV]
4minschool 基于资格推理与分节强化学习的引理可靠利用
02-03 数学推理 引理应用 RULES
[自动] [ARXIV]
4minschool 可扩展随机小波特征:带收敛保证的高效非平稳核近似
02-03 机器学习 非平稳核 小波变换
[自动] [ARXIV]
3minschool HERMES:基于视觉语言模型的长尾自动驾驶端到端风险感知系统
02-03 自动驾驶 VLM 长尾场景
[自动] [ARXIV]
4minschool DeALOG:基于日志中介的去中心化多智能体推理框架
02-03 Multi-Agent 去中心化 日志中介
[自动] [ARXIV]
3minschool 粒子引导扩散模型用于偏微分方程求解
02-03 扩散模型 PDE求解 物理引导
[自动] [ARXIV]
5minschool 函数空间逆问题的解耦扩散采样方法
02-03 扩散模型 逆问题 PDE
[自动] [ARXIV]
4minschool 共享 autonomy 范式下信念与策略学习的端到端优化
02-03 共享自主 BRACE 端到端优化
[自动] [ARXIV]
4minschool VideoGPA:提取几何先验实现三维一致性视频生成
02-03 VideoGPA 视频生成 3D一致性
[自动] [ARXIV]
4minschool UPA:基于树搜索与筛选的无监督提示代理
02-03 Prompt优化 UPA 无监督学习
[自动] [ARXIV]
5minschool TEON:张量化正交化方法优化大语言模型预训练
02-03 TEON 优化器 预训练
[自动] [ARXIV]
5minschool PaperBanana:面向AI科研人员的学术绘图自动化工具
02-03 PaperBanana 学术绘图 智能体框架
[自动] [ARXIV]
4minschool FOCUS:DLLMs 如何突破算力瓶颈
02-03 DLLMs 扩散模型 推理加速
[自动] [ARXIV]
3minschool 粒子引导扩散模型求解偏微分方程
02-02 扩散模型 偏微分方程 PDE
[自动] [ARXIV]
4minschool 函数空间逆问题的解耦扩散采样方法
02-02 扩散模型 逆问题 PDE
[自动] [ARXIV]
4minschool 共享自治系统中信念与策略学习的端到端优化
02-02 共享自治 BRACE 贝叶斯推断
[自动] [ARXIV]
5minschool VideoGPA:提取几何先验实现三维一致视频生成
02-02 视频生成 3D一致性 扩散模型
[自动] [ARXIV]
4minschool UPA:基于树搜索与筛选的无监督提示智能体
02-02 Prompt优化 LLM智能体 无监督学习
[自动] [ARXIV]
5minschool TEON:张量化正交化技术优化大语言模型预训练
02-02 TEON 优化器 Muon
[自动] [ARXIV]
4minschool IRL-DAL:基于能量引导扩散模型的自动驾驶安全自适应轨迹规划
02-02 自动驾驶 扩散模型 逆向强化学习
[自动] [ARXIV]
4minschool FOCUS:DLLMs如何突破算力瓶颈
02-02 DLLMs 扩散模型 算力优化
[自动] [ARXIV]
3minschool 基于输出监督学习的思维链混淆技术可泛化至未见任务
02-02 思维链 CoT 输出监督
[自动] [ARXIV]
4minschool SplineFlow:基于B样条插值的动力系统流匹配方法
02-02 流匹配 SplineFlow B样条
[自动] [ARXIV]
4minschool RN-D:基于正则化网络的离散分类演员与同策强化学习
02-02 强化学习 RL 连续控制
[自动] [ARXIV]
4minschool OrLog:结合大模型与概率推理解决复杂查询
02-02 神经符号AI 概率推理 复杂查询
[自动] [ARXIV]
4minschool ExplainerPFN:面向表格数据的无模型零样本特征重要性估计
02-02 ExplainerPFN TabPFN 表格数据
[自动] [ARXIV]
4minschool CATTO:平衡语言模型偏好与置信度的方法
02-02 LLM CATTO 校准
[自动] [HACKER_NEWS]
7minnewspaper 迈向智能体系统规模化科学:探究其生效机制与适用场景
02-02 智能体 Agent系统 规模化
[自动] [ARXIV]
3minschool 神经网络转逻辑流以优化边缘计算性能
02-02 边缘计算 神经网络 逻辑流
[自动] [ARXIV]
6minschool 混合线性注意力新架构:高效蒸馏与超长上下文处理
02-02 HALO HypeNet 混合架构
[自动] [ARXIV]
4minschool 推理大语言模型从被动求解到主动提问的转变
02-02 推理 CoT 主动交互
[自动] [ARXIV]
4minschool 探索面向智能体的推理奖励模型
02-02 Agentic RL Reward Model 推理奖励
[自动] [ARXIV]
4minschool UEval:统一多模态生成基准
02-02 UEval 多模态 基准测试
[自动] [ARXIV]
3minschool Routing the Lottery: 面向异构数据的自适应子网络路由
02-02 模型剪枝 彩票假设 异构数据
[自动] [ARXIV]
5minschool DynaWeb:基于模型的强化学习网页智能体
02-02 DynaWeb Web Agent 强化学习
[自动] [ARXIV]
4minschool 神经网络转逻辑流以优化边缘计算性能
02-01 边缘计算 神经网络 模型优化
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与超长上下文处理
02-01 Transformer 混合架构 线性注意力
[自动] [ARXIV]
3minschool 推理大语言模型从被动求解转向主动询问
02-01 推理 交互式推理 PIR
[自动] [ARXIV]
4minschool 探索面向智能体的推理奖励模型
02-01 Agent RLHF 奖励模型
[自动] [ARXIV]
4minschool UEval:统一多模态生成基准评测
02-01 UEval 多模态 基准评测
[自动] [ARXIV]
4minschool Routing the Lottery:面向异型数据的自适应子网络
02-01 模型剪枝 彩票假说 自适应路由
[自动] [ARXIV]
5minschool DynaWeb:基于模型的强化学习网页智能体
02-01 DynaWeb Web Agent 强化学习
2026年一月 119 篇
类型阅读条目
[自动] [ARXIV]
4minschool 面向异构数据的自适应子网络路由方法
01-31 模型剪枝 异构数据 自适应子网络
[自动] [ARXIV]
4minschool 神经网络转逻辑流以优化边缘计算性能
01-31 边缘计算 神经网络 逻辑流
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与超长上下文建模
01-31 线性注意力 长上下文 混合架构
[自动] [ARXIV]
4minschool 推理大语言模型从被动求解转向主动询问
01-31 LLM 推理模型 主动询问
[自动] [ARXIV]
5minschool 探索面向智能体的推理奖励模型
01-31 Agent 强化学习 奖励模型
[自动] [ARXIV]
4minschool 发现模型仓库中的隐藏价值
01-31 模型评估 Llama 多臂老虎机
[自动] [ARXIV]
4minschool UEval:统一多模态生成基准
01-31 多模态 UEval 基准测试
[自动] [ARXIV]
5minschool DynaWeb:基于模型的强化学习网页智能体框架
01-31 DynaWeb Web Agent 强化学习
[自动] [HACKER_NEWS]
5minnewspaper Kimi k2.5 技术报告发布:长上下文与推理能力详解
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 技术报告 模型架构
[自动] [HACKER_NEWS]
5minnewspaper Kimi K2.5 技术报告发布:模型架构与训练细节
01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:架构与性能细节
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:长上下文与多模态推理能力详解
01-31 Kimi K2.5 技术报告 长上下文
[自动] [HACKER_NEWS]
4minnewspaper Kimi k2.5 技术报告发布
01-31 Kimi K2.5 技术报告
[自动] [HACKER_NEWS]
7minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
7minnewspaper 月之暗面发布 Kimi k2.5 技术报告
01-31 月之暗面 Kimi K2.5
[自动] [HACKER_NEWS]
6minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [ARXIV]
4minschool 面向异构数据的自适应子网络路由机制
01-30 模型剪枝 异构数据 子网络
[自动] [ARXIV]
4minschool 神经网络转逻辑流以优化边缘计算
01-30 边缘计算 神经网络 模型优化
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与极长上下文处理
01-30 HALO HypeNet 长上下文
[自动] [ARXIV]
4minschool 推理大模型从被动求解转向主动提问
01-30 推理模型 主动交互 思维链
[自动] [ARXIV]
5minschool 探索面向智能体的推理奖励模型
01-30 Agent 强化学习 推理奖励模型
[自动] [ARXIV]
3minschool 发现模型仓库中被忽视的高质量模型
01-30 模型评估 Llama-3.1 微调
[自动] [ARXIV]
3minschool UEval:统一多模态生成基准
01-30 UEval 多模态 统一模型
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:强化学习与长上下文能力升级
01-30 Kimi K2.5 强化学习
[自动] [ARXIV]
4minschool FineInstructions:将合成指令数据扩展至预训练规模
01-30 LLM 预训练 指令微调
[自动] [ARXIV]
5minschool DynaWeb:基于模型的强化学习网页智能体
01-30 DynaWeb Web Agent 强化学习
[自动] [HACKER_NEWS]
7minnewspaper 月之暗面发布Kimi K2.5技术报告
01-30 Kimi K2.5 月之暗面
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-30 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
6minnewspaper Kimi K2.5 技术报告发布:长上下文与推理能力升级
01-30 Kimi K2.5 技术报告 长上下文
[自动] [ARXIV]
4minschool 面向文本检索器域适应的影响引导采样方法
01-30 文本检索 域适应 密集检索
[自动] [ARXIV]
3minschool 面向大语言模型的时间引导机制
01-30 LLM 对比解码 时间引导
[自动] [ARXIV]
4minschool 基于认知上下文学习构建大模型多智能体系统的信任机制
01-30 多智能体 信任机制 ECL
[自动] [ARXIV]
3minschool 基于经验的试错算法超越语言模型
01-30 LLM SCOUT 探索与利用
[自动] [ARXIV]
6minschool 为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理
01-30 Adam优化器 梯度尺度不变性 深度学习
[自动] [ARXIV]
4minschool FISMO:基于Fisher结构的动量正交化优化器
01-30 FISMO 优化器 深度学习
[自动] [ARXIV]
4minschool 进化策略导致大语言模型出现灾难性遗忘
01-30 进化策略 灾难性遗忘 持续学习
[自动] [ARXIV]
4minschool 机器翻译评估中的跨向污染问题研究
01-30 机器翻译 数据污染 FLORES-200
[自动] [ARXIV]
4minschool 探索Transformer在表格数据变分自编码器中的位置
01-30 Transformer VAE 表格数据
[自动] [ARXIV]
4minschool SokoBench:评估大模型长周期规划与推理能力
01-30 SokoBench 长周期规划 推理能力
[自动] [ARXIV]
4minschool R^{2k}维度理论上足以支持基于嵌入的Top-k检索
01-30 向量检索 嵌入维度 Top-k检索
[自动] [ARXIV]
3minschool PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型
01-30 时间序列 PatchFormer 零样本预测
[自动] [ARXIV]
4minschool Deep Researcher:结合序列规划反思与候选交叉的深度研究框架
01-30 Deep Researcher AI Agent 智能体架构
[自动] [ARXIV]
4minschool C3Box:基于CLIP的类增量学习工具箱
01-30 CLIP 类增量学习 CIL
[自动] [ARXIV]
4minschool 进化策略导致大语言模型出现灾难性遗忘
01-29 进化策略 灾难性遗忘 持续学习
[自动] [ARXIV]
3minschool 机器翻译评估中的跨向污染问题研究
01-29 机器翻译 数据污染 FLORES
[自动] [ARXIV]
4minschool 探索Transformer在表格数据变分自编码器中的位置
01-29 Transformer VAE 表格数据
[自动] [ARXIV]
3minschool 基于嵌入的Top-$k$检索:理论上$\mathbb{R}^{2k}$维空间已足够
01-29 向量检索 嵌入 Top-k
[自动] [ARXIV]
4minschool 后训练公平性控制:推荐系统动态公平性单训练框架
01-29 推荐系统 公平性 Cofair
[自动] [ARXIV]
4minschool SokoBench:评估大模型长程规划与推理能力
01-29 SokoBench 长程规划 推理能力
[自动] [ARXIV]
5minschool PatchFormer:基于分层掩码重建的零样本多步预测时序基础模型
01-29 时序预测 PatchFormer 零样本学习
[自动] [ARXIV]
3minschool Deep Researcher:序列规划反思与候选交叉
01-29 Deep Researcher AI Agent 反思机制
[自动] [ARXIV]
4minschool C3Box:基于CLIP的类增量学习工具箱
01-29 CLIP 增量学习 CIL
[自动] [BLOGS_PODCASTS]
2minmic Alyah:评估阿拉伯语大模型阿联酋方言能力
01-29 LLM 阿拉伯语 方言评估
[自动] [BLOGS_PODCASTS]
2minmic Alyah:评估阿拉伯语大模型阿联酋方言能力
01-29 LLM 模型评估 阿拉伯语
[自动] [ARXIV]
4minschool 🧠RHSIA!非理想颅内动脉瘤实时血流替代技术,精准高效!
01-28 RHSIA 血流动力学 颅内动脉瘤
[自动] [ARXIV]
4minschool 无需真值!🔥颠覆性校准技术来了!🤯
01-28 模型校准 无监督学习 LLM
[自动] [BLOGS_PODCASTS]
2minmic Alyah ⭐️:阿拉伯语LLM方言鲁棒性评估!🔥
01-28 LLM 阿拉伯语 方言评估
[自动] [ARXIV]
4minschool 🚀低资源机器翻译的救星!结构化自反思引领新突破✨
01-28 机器翻译 低资源语言 自反思
[自动] [ARXIV]
5minschool 🚀SONIC: 颠覆频谱学习!神经网络不变性卷积的终极突破?
01-28 SONIC 频谱学习 神经网络
[自动] [ARXIV]
4minschool 🔥肿瘤会诊新革命!LLM系统Oncotimia惊艳亮相!
01-28 LLM RAG 医疗AI
[自动] [ARXIV]
4minschool 🔥动态环境下的对抗约束:Bandits算法如何应对未知挑战?
01-28 Bandits 对抗约束 动态环境
[自动] [ARXIV]
6minschool 🔥Post-LayerNorm强势回归!稳定、高效、深度训练的新神器!
01-28 Transformer Post-LayerNorm Keel
[自动] [ARXIV]
5minschool 🌍 M-SGWR: 多尺度相似+地理加权回归!空间建模神器🚀
01-28 M-SGWR 地理加权回归 空间建模
[自动] [ARXIV]
5minschool ✨告别遗忘!Self-Distillation解锁持续学习新范式!
01-28 持续学习 Self-Distillation 灾难性遗忘
[自动] [ARXIV]
4minschool MEG情绪分析新突破!🔬脑数据标注+情感计算,解锁大脑密码!🧠✨
01-28 MEG 情绪分析 脑机接口
[自动] [ARXIV]
4minschool 🚀复用FLOPs!RL突破性扩展:超离策略前缀如何解决硬难题?
01-28 强化学习 RL LLM
[自动] [ARXIV]
4minschool 🔥模型自学革命!突破可学习性边界,推理能力暴涨!
01-28 SOAR 强化学习 推理能力
[自动] [ARXIV]
5minschool 🔥POPE:利用特权探索破解硬核难题!
01-28 POPE 强化学习 LLM
[自动] [ARXIV]
5minschool 💥无需标注!基于核变化点检测的无监督文本分割!
01-28 文本分割 无监督学习 核方法
[自动] [ARXIV]
4minschool 🌍 242种语言大比拼!Wikipedia数据揭秘跨语言比较语言学新突破!
01-28 比较语言学 BPE 多语言
[自动] [BLOGS_PODCASTS]
3minmic 🇦🇪 Alyah ⭐️:揭秘阿拉伯LLM方言鲁棒评估!
01-28 LLM 阿拉伯语 方言评估
[自动] [BLOGS_PODCASTS]
3minmic 阿联酋方言评测新突破!Alyah让阿拉伯语大模型更鲁棒🚀
01-27 Alyah 阿拉伯语 方言评测
[自动] [ARXIV]
4minschool 突破极限!AI如何教会自己推理?🤯 边缘学习性的惊天秘密!🚀
01-27 SOAR 强化学习 元学习
[自动] [ARXIV]
5minschool ctELM:用LLM解码临床试验嵌入!解锁临床新价值🔥
01-27 ctELM 临床试验 嵌入语言模型
[自动] [ARXIV]
5minschool 🚀RL新突破!复用FLOPs,硬难题上通过离线前缀扩展
01-27 PrefixRL 强化学习 LLM
[自动] [ARXIV]
5minschool 🔥无需标注!核变点检测+句嵌入实现超强文本分割🚀
01-27 文本分割 无监督学习 句嵌入
[自动] [ARXIV]
4minschool 🔥POPE:用特权探索让AI学会解决复杂难题!
01-27 强化学习 LLM 推理能力
[自动] [ARXIV]
4minschool 🔍脑电+情感=超强分析!MEG数据解锁情绪新维度
01-27 MEG 情感分析 脑机接口
[自动] [HACKER_NEWS]
2minnewspaper 🔥两个扭曲形状竟解开百年拓扑谜题?🧩
01-27 拓扑学 海伍德猜想 数学
[自动] [HACKER_NEWS]
2minnewspaper 数学、物理、生物的万能模式!🧪🧬2013年震撼发现
01-27 本福德定律 统计学 幂律分布
[自动] [BLOGS_PODCASTS]
3minmic ⭐️Alyah:阿联酋方言能力评估!阿拉伯语LLM新突破!
01-27 LLM 阿拉伯语 方言评估
[自动] [HACKER_NEWS]
2minnewspaper 🔥 跨越数理化生!这个万能模式正在颠覆科学界!🤯
01-27 Scaling Laws 异速生长 复杂系统
[自动] [HACKER_NEWS]
3minnewspaper 🧠炸裂!Gemini Flash在俄罗斯大战Opus胜率66%!🚀
01-27 Gemini Flash Claude Opus TetrisBench
[自动] [HACKER_NEWS]
3minnewspaper 阿里Qwen3-Max-Thinking深度思考模型!震撼发布🔥
01-27 Qwen3 通义千问 深度思考
[自动] [BLOGS_PODCASTS]
3minmic AssetOpsBench:填补AI基准与工业现实的鸿沟!🤖🏭🚀
01-27 AssetOpsBench AI Agent LLM
[自动] [ARXIV]
5minschool 🚀BONO-Bench:可追溯Pareto集的双目标优化基准测试!
01-27 多目标优化 基准测试 Pareto集
[自动] [ARXIV]
5minschool 🚀AnyView:动态场景任意新视角合成!开创性技术突破🔥
01-27 计算机视觉 视频生成 扩散模型
[自动] [ARXIV]
6minschool 🔥自回归+掩码扩散!下一代生成模型架构强势登场!
01-27 扩散模型 自回归 语言建模
[自动] [ARXIV]
6minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量!
01-27 LLM 训练动力学 损失景观
[自动] [ARXIV]
6minschool 🔥LLM序列标注新突破!揭秘高效策略,性能飙升!
01-27 LLM 序列标注 NLP
[自动] [ARXIV]
5minschool 🌍Spatial-Agent:科学核心驱动的智能地理空间推理!🚀
01-27 Spatial-Agent Agent 地理空间推理
[自动] [HACKER_NEWS]
4minnewspaper ⚡️俄罗斯方块爆杀Opus!Gemini Flash胜率66%震撼实测🎮
01-27 LLM Gemini Flash Claude Opus
[自动] [ARXIV]
6minschool ⚛️ 基于SE(3)流的刚性 motifs 3D 分子生成!🔥
01-27 分子生成 SE(3) 等变模型
[自动] [HACKER_NEWS]
3minnewspaper 震惊!Gemini Flash击败Opus!🎮Tetris胜率66%🚀
01-27 LLM Gemini Flash Claude 3 Opus
[自动] [ARXIV]
4minschool 🧬重磅!基于SE(3)流的刚体模态3D分子生成!
01-26 3D分子生成 SE(3)流 刚体模态
[自动] [BLOGS_PODCASTS]
3minmic AssetOpsBench:打破AI Agent评测与工业现实的壁垒!🚀
01-26 AI Agent AssetOpsBench 工业智能
[自动] [ARXIV]
5minschool 🚀动态场景新视角合成!AnyView实现任意视角自由切换!🤯
01-26 动态场景 新视角合成 扩散模型
[自动] [ARXIV]
5minschool 🚀 自回归+掩码扩散:下一代生成式AI!🔥
01-26 扩散模型 自回归 生成式AI
[自动] [HACKER_NEWS]
3minnewspaper 🔥Qwen3-Max-Thinking!深度推理颠覆想象!
01-26 Qwen 通义千问 深度推理
[自动] [ARXIV]
5minschool 🔥LLM训练动力学新突破!可扩展损失景观曲率度量🚀
01-26 LLM 训练动力学 损失景观
[自动] [ARXIV]
5minschool 🔥LLM序列标注新策略!突破性能天花板🚀
01-26 LLM 序列标注 NER
[自动] [ARXIV]
4minschool 🔥IoT攻击数据生成神器!Latent Diffusion让入侵检测更准!
01-26 LDM 潜在扩散模型 物联网
[自动] [ARXIV]
6minschool 🔥BONO-Bench震撼发布!首套可追溯Pareto集的双目标优化基准测试!
01-26 BONO-Bench 双目标优化 Pareto集
[自动] [ARXIV]
5minschool 🌍 Spatial-Agent:具科学核心的智能体地理空间推理!
01-26 Spatial-Agent 地理空间推理 GeoFlow Graphs
[自动] [HACKER_NEWS]
2minnewspaper 🧠科学家揭秘定义“你”边界的脑电波!灵魂的物理证据?
01-26 脑科学 神经科学 脑电波
[自动] [HACKER_NEWS]
3minnewspaper 🔍 深度拆解:AI伪造数学证明的惊人真相!🚀
01-26 LLM 幻觉 数学证明
[自动] [HACKER_NEWS]
2minnewspaper 🧠揭秘“你”的边界!科学家发现定义“自我”的关键脑波🚀
01-26 脑科学 自我意识 神经科学
[自动] [HACKER_NEWS]
3minnewspaper 🤖AI竟伪造数学证明?深扒“创意数学”背后的惊人真相!
01-26 AI 数学证明 形式化验证
[自动] [ARXIV]
6minschool 🤖抽屉打不开?揭秘零样本组合动作识别中的“物体捷径”!
01-25 计算机视觉 零样本学习 动作识别
[自动] [ARXIV]
4minschool 🤖反事实训练!让模型学会靠谱又可落地的解释!
01-25 反事实训练 模型解释性 可解释AI
[自动] [ARXIV]
7minschool 高效定理证明新突破!结构化提示实现少样本学习 🚀
01-25 定理证明 Lean DeepSeek-Prover
[自动] [ARXIV]
3minschool 超越预测不确定性!🚀结构约束下的可靠表征学习!🔥
01-25 表征学习 不确定性 结构约束
[自动] [ARXIV]
4minschool 测试时也能发现新规律?🤯AI解锁动态学习能力!
01-25 TTT-Discover 测试时训练 强化学习
[自动] [ARXIV]
5minschool Cosmos重磅:微调视频模型!解锁 visuomotor 控制与规划 🚀✨
01-25 Cosmos 机器人 视觉运动控制
[自动] [BLOGS_PODCASTS]
4minmic AssetOpsBench:连接AI测评与工业现实!填补鸿沟🚀
01-25 AssetOpsBench AI Agent 工业运维
[自动] [ARXIV]
5minschool 🚀沙盒机制唤醒LLM智能体通用能力!AI Agent突破性架构!
01-25 LLM AI Agent 沙盒机制
[自动] [ARXIV]
5minschool 🔥PyraTok!视频生成神器:语言对齐金字塔Tokenizer震撼来袭!
01-25 PyraTok 视频生成 视频理解