LINK_STATUS: STABLE // ENCODING: UTF-8

SECTOR_ID: AI_STACK // MODE: LIST

terminal

AI Stack

时间 --:--:--

安全连接 rss_feed

SYS_STABLE

目录

数学推理

条目：20

2026年二月 19 篇

类型	阅读	条目
[自动] [ARXIV]	5min	school 为何LLM后训练中Pass@k优化会降低Pass@1性能 02-26 LLM 后训练 Pass@k
[自动] [ARXIV]	5min	school 为何Pass@k优化会降低Pass@1：大模型后训练中的提示干扰 02-25 LLM 后训练代码生成
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型在First Proof数学挑战中的证明尝试 02-24 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型针对First Proof数学挑战的证明尝试 02-24 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]	2min	mic AI模型在First Proof数学挑战中的证明尝试 02-23 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型在First Proof数学挑战中的证明尝试 02-23 数学推理 First Proof 研究级推理
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型针对First Proof数学挑战的证明尝试 02-23 数学推理 First Proof 专家级问题
[自动] [BLOGS_PODCASTS]	3min	mic AI模型针对First Proof数学挑战的证明尝试与推理能力测试 02-21 LLM 数学推理 First Proof
[自动] [HACKER_NEWS]	5min	newspaper Lean 4 定理证明器工作原理及其在 AI 领域的竞争优势 02-21 Lean 4 定理证明器形式化验证
[自动] [BLOGS_PODCASTS]	2min	mic 分享AI模型在First Proof数学挑战中的证明尝试 02-21 数学推理 First Proof 研究级推理
[自动] [ARXIV]	3min	school 基于任务复杂度的浅层对齐假说操作化研究 02-18 浅层对齐 SAH 任务复杂度
[自动] [BLOGS_PODCASTS]	3min	mic GPT-5.2推导新胶子振幅公式获正式证明 02-18 GPT-5.2 理论物理科学发现
[自动] [ARXIV]	5min	school 基于枢纽重采样的LLM强化学习深度密集探索 02-17 LLM 强化学习 RLHF
[自动] [ARXIV]	4min	school 语言模型在线策略上下文蒸馏方法 02-15 模型蒸馏上下文学习在线策略
[自动] [ARXIV]	4min	school 面向语言模型的在线上下文蒸馏方法 02-13 LLM 模型蒸馏上下文学习
[自动] [BLOGS_PODCASTS]	3min	mic Z.ai GLM-5开源：新SOTA级开放权重大模型 02-13 GLM-5 Z.ai SOTA
[自动] [ARXIV]	4min	school DyTopo：基于语义匹配的多智能体动态拓扑路由 02-07 DyTopo 多智能体动态拓扑
[自动] [ARXIV]	3min	school DyTopo：基于语义匹配的多智能体动态拓扑路由 02-06 DyTopo 多智能体动态拓扑
[自动] [ARXIV]	4min	school 基于资格推理与分节强化学习的引理可靠利用 02-03 数学推理引理应用 RULES

2026年一月 1 篇

类型	阅读	条目
[自动] [ARXIV]	4min	school 推理大模型从被动求解转向主动提问 01-30 推理模型主动交互思维链