terminal

AI Stack

rss_feed
SYS_STABLE
目录

CoT

条目:17
2026年二月 14 篇
类型阅读条目
[自动] [ARXIV]
5minschool GUI-Libra:动作感知监督与可验证强化学习的原生GUI智能体
02-27 GUI Agent 强化学习 RL
[自动] [ARXIV]
4minschool 提升推理语言模型的参数化知识访问能力
02-26 推理模型 参数化知识 强化学习
[自动] [ARXIV]
4minschool GUI-Libra:动作感知监督与可验证RL训练原生GUI智能体
02-26 GUI Agent RL CoT
[自动] [ARXIV]
4minschool 训练LRM模型:自适应反思与长度协调惩罚提升推理效率
02-13 LRM 推理效率 自适应反思
[自动] [HACKER_NEWS]
7minnewspaper Gemini 3 Deep Think 推出长思维链推理模式
02-12 Gemini 3 Deep Think 长思维链
[自动] [HACKER_NEWS]
3minnewspaper 停止生成开始思考:大模型推理范式转变
02-09 推理范式 思维链 CoT
[自动] [HACKER_NEWS]
3minnewspaper 停止生成,开始思考:大模型推理能力进化路径
02-09 LLM 推理能力 思维链
[自动] [ARXIV]
4minschool 研究揭示推理大模型生成虚假新闻的内在机制
02-06 LLM CoT 虚假新闻
[自动] [ARXIV]
3minschool CoT非真理链:推理LLM生成假新闻的实证内部分析
02-05 LLM CoT 假新闻
[自动] [ARXIV]
3minschool 训练LLM采用分治推理提升测试时扩展性
02-04 LLM 推理 强化学习
[自动] [ARXIV]
3minschool 训练LLM采用分治推理提升测试时扩展性
02-03 LLM 推理 强化学习
[自动] [ARXIV]
3minschool 基于输出监督学习的思维链混淆技术可泛化至未见任务
02-02 思维链 CoT 输出监督
[自动] [ARXIV]
4minschool 推理大语言模型从被动求解到主动提问的转变
02-02 推理 CoT 主动交互
[自动] [ARXIV]
3minschool 推理大语言模型从被动求解转向主动询问
02-01 推理 交互式推理 PIR
2026年一月 3 篇
类型阅读条目
[自动] [HACKER_NEWS]
3minnewspaper 阿里Qwen3-Max-Thinking深度思考模型!震撼发布🔥
01-27 Qwen3 通义千问 深度思考
[自动] [HACKER_NEWS]
3minnewspaper 🚀Qwen3-Max-Thinking发布!AI推理能力炸裂升级!
01-27 Qwen3 通义千问 思维链
[自动] [HACKER_NEWS]
3minnewspaper 🔥Qwen3-Max-Thinking!深度推理颠覆想象!
01-26 Qwen 通义千问 深度推理