目录
CoT
条目:38
2026年三月
21 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
EndoCoT:扩散模型内生思维链推理扩展方法 03-14
扩散模型
EndoCoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出CoT-Control:强化推理模型思维链的可监控性 03-09
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI发现推理模型难以控制思维链凸显可监控性安全价值 03-09
OpenAI
思维链
CoT |
[自动]
[ARXIV] | 3min | school
Reasoning Theater:解耦模型信念与思维链 03-09
CoT
模型推理
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出CoT-Control:强化推理模型可监控性 03-08
OpenAI
CoT
思维链 |
[自动]
[ARXIV] | 3min | school
Reasoning Theater:解耦模型信念与思维链 03-08
思维链
CoT
模型推理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型难控思维链凸显可监控性价值 03-08
OpenAI
推理模型
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出CoT-Control:强化推理模型思维链的可监控性 03-08
OpenAI
CoT
思维链 |
[自动]
[ARXIV] | 2min | school
Reasoning Theater:解耦模型信念与思维链 03-07
CoT
思维链
模型信念 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型思维链难控强化可监控安全性 03-07
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究揭示推理模型思维链难以控制凸显可监控性重要性 03-07
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型思维链难控强化可监控性 03-07
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型难以控制思维链,强化可监控性安全价值 03-07
OpenAI
CoT
思维链 |
[自动]
[ARXIV] | 3min | school
Reasoning Theater:解耦模型信念与思维链 03-06
CoT
思维链
推理模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型难以控制思维链凸显可监控性价值 03-06
OpenAI
思维链
CoT |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出CoT-Control:强化推理模型思维链监控 03-06
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
OpenAI推CoT-Control:验证思维链可监控性对AI安全的重要性 03-06
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型思维链难以控制凸显可监控性重要性 03-06
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI推出CoT-Control:思维链难控凸显可监控性安全价值 03-06
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI研究:推理模型难以掌控思维链强化AI安全 03-06
OpenAI
CoT
思维链 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 推出 CoT-Control 并强调思维链监控的重要性 03-05
OpenAI
CoT
思维链 |
2026年二月
14 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
GUI-Libra:动作感知监督与可验证强化学习的原生GUI智能体 02-27
GUI Agent
强化学习
RL |
[自动]
[ARXIV] | 3min | school
提升推理语言模型的参数化知识访问能力 02-26
推理模型
参数化知识
强化学习 |
[自动]
[ARXIV] | 4min | school
GUI-Libra:动作感知监督与可验证RL训练原生GUI智能体 02-26
GUI Agent
RL
CoT |
[自动]
[ARXIV] | 4min | school
训练LRM模型:自适应反思与长度协调惩罚提升推理效率 02-13
LRM
推理效率
自适应反思 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Gemini 3 Deep Think 推出长思维链推理模式 02-12
Gemini 3
Deep Think
长思维链 |
[自动]
[HACKER_NEWS] | 3min | newspaper
停止生成开始思考:大模型推理范式转变 02-09
推理范式
思维链
CoT |
[自动]
[HACKER_NEWS] | 3min | newspaper
停止生成,开始思考:大模型推理能力进化路径 02-09
LLM
推理能力
思维链 |
[自动]
[ARXIV] | 4min | school
研究揭示推理大模型生成虚假新闻的内在机制 02-06
LLM
CoT
虚假新闻 |
[自动]
[ARXIV] | 3min | school
CoT非真理链:推理LLM生成假新闻的实证内部分析 02-05
LLM
CoT
假新闻 |
[自动]
[ARXIV] | 3min | school
训练LLM采用分治推理提升测试时扩展性 02-04
LLM
推理
强化学习 |
[自动]
[ARXIV] | 3min | school
训练LLM采用分治推理提升测试时扩展性 02-03
LLM
推理
强化学习 |
[自动]
[ARXIV] | 3min | school
基于输出监督学习的思维链混淆技术可泛化至未见任务 02-02
思维链
CoT
输出监督 |
[自动]
[ARXIV] | 4min | school
推理大语言模型从被动求解到主动提问的转变 02-02
推理
CoT
主动交互 |
[自动]
[ARXIV] | 3min | school
推理大语言模型从被动求解转向主动询问 02-01
推理
交互式推理
PIR |
2026年一月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 3min | newspaper
阿里Qwen3-Max-Thinking深度思考模型!震撼发布🔥 01-27
Qwen3
通义千问
深度思考 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🚀Qwen3-Max-Thinking发布!AI推理能力炸裂升级! 01-27
Qwen3
通义千问
思维链 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔥Qwen3-Max-Thinking!深度推理颠覆想象! 01-26
Qwen
通义千问
深度推理 |
无匹配条目