目录
CoT
条目:17
2026年二月
14 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 5min | school
GUI-Libra:动作感知监督与可验证强化学习的原生GUI智能体 02-27
GUI Agent
强化学习
RL |
[自动]
[ARXIV] | 4min | school
提升推理语言模型的参数化知识访问能力 02-26
推理模型
参数化知识
强化学习 |
[自动]
[ARXIV] | 4min | school
GUI-Libra:动作感知监督与可验证RL训练原生GUI智能体 02-26
GUI Agent
RL
CoT |
[自动]
[ARXIV] | 4min | school
训练LRM模型:自适应反思与长度协调惩罚提升推理效率 02-13
LRM
推理效率
自适应反思 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Gemini 3 Deep Think 推出长思维链推理模式 02-12
Gemini 3
Deep Think
长思维链 |
[自动]
[HACKER_NEWS] | 3min | newspaper
停止生成开始思考:大模型推理范式转变 02-09
推理范式
思维链
CoT |
[自动]
[HACKER_NEWS] | 3min | newspaper
停止生成,开始思考:大模型推理能力进化路径 02-09
LLM
推理能力
思维链 |
[自动]
[ARXIV] | 4min | school
研究揭示推理大模型生成虚假新闻的内在机制 02-06
LLM
CoT
虚假新闻 |
[自动]
[ARXIV] | 3min | school
CoT非真理链:推理LLM生成假新闻的实证内部分析 02-05
LLM
CoT
假新闻 |
[自动]
[ARXIV] | 3min | school
训练LLM采用分治推理提升测试时扩展性 02-04
LLM
推理
强化学习 |
[自动]
[ARXIV] | 3min | school
训练LLM采用分治推理提升测试时扩展性 02-03
LLM
推理
强化学习 |
[自动]
[ARXIV] | 3min | school
基于输出监督学习的思维链混淆技术可泛化至未见任务 02-02
思维链
CoT
输出监督 |
[自动]
[ARXIV] | 4min | school
推理大语言模型从被动求解到主动提问的转变 02-02
推理
CoT
主动交互 |
[自动]
[ARXIV] | 3min | school
推理大语言模型从被动求解转向主动询问 02-01
推理
交互式推理
PIR |
2026年一月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 3min | newspaper
阿里Qwen3-Max-Thinking深度思考模型!震撼发布🔥 01-27
Qwen3
通义千问
深度思考 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🚀Qwen3-Max-Thinking发布!AI推理能力炸裂升级! 01-27
Qwen3
通义千问
思维链 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔥Qwen3-Max-Thinking!深度推理颠覆想象! 01-26
Qwen
通义千问
深度推理 |
无匹配条目