目录
数学推理
条目:20
2026年二月
19 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 5min | school
为何LLM后训练中Pass@k优化会降低Pass@1性能 02-26
LLM
后训练
Pass@k |
[自动]
[ARXIV] | 5min | school
为何Pass@k优化会降低Pass@1:大模型后训练中的提示干扰 02-25
LLM
后训练
代码生成 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-24
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-24
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
AI模型在First Proof数学挑战中的证明尝试 02-23
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-23
数学推理
First Proof
研究级推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型针对First Proof数学挑战的证明尝试 02-23
数学推理
First Proof
专家级问题 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI模型针对First Proof数学挑战的证明尝试与推理能力测试 02-21
LLM
数学推理
First Proof |
[自动]
[HACKER_NEWS] | 5min | newspaper
Lean 4 定理证明器工作原理及其在 AI 领域的竞争优势 02-21
Lean 4
定理证明器
形式化验证 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
分享AI模型在First Proof数学挑战中的证明尝试 02-21
数学推理
First Proof
研究级推理 |
[自动]
[ARXIV] | 3min | school
基于任务复杂度的浅层对齐假说操作化研究 02-18
浅层对齐
SAH
任务复杂度 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
GPT-5.2推导新胶子振幅公式获正式证明 02-18
GPT-5.2
理论物理
科学发现 |
[自动]
[ARXIV] | 5min | school
基于枢纽重采样的LLM强化学习深度密集探索 02-17
LLM
强化学习
RLHF |
[自动]
[ARXIV] | 4min | school
语言模型在线策略上下文蒸馏方法 02-15
模型蒸馏
上下文学习
在线策略 |
[自动]
[ARXIV] | 4min | school
面向语言模型的在线上下文蒸馏方法 02-13
LLM
模型蒸馏
上下文学习 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Z.ai GLM-5开源:新SOTA级开放权重大模型 02-13
GLM-5
Z.ai
SOTA |
[自动]
[ARXIV] | 4min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-07
DyTopo
多智能体
动态拓扑 |
[自动]
[ARXIV] | 3min | school
DyTopo:基于语义匹配的多智能体动态拓扑路由 02-06
DyTopo
多智能体
动态拓扑 |
[自动]
[ARXIV] | 4min | school
基于资格推理与分节强化学习的引理可靠利用 02-03
数学推理
引理应用
RULES |
2026年一月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
推理大模型从被动求解转向主动提问 01-30
推理模型
主动交互
思维链 |
无匹配条目