LINK_STATUS: STABLE // ENCODING: UTF-8

SECTOR_ID: AI_STACK // MODE: LIST

terminal

AI Stack

时间 --:--:--

安全连接 rss_feed

SYS_STABLE

目录

CoT

条目：17

2026年二月 14 篇

类型	阅读	条目
[自动] [ARXIV]	5min	school GUI-Libra：动作感知监督与可验证强化学习的原生GUI智能体 02-27 GUI Agent 强化学习 RL
[自动] [ARXIV]	4min	school 提升推理语言模型的参数化知识访问能力 02-26 推理模型参数化知识强化学习
[自动] [ARXIV]	4min	school GUI-Libra：动作感知监督与可验证RL训练原生GUI智能体 02-26 GUI Agent RL CoT
[自动] [ARXIV]	4min	school 训练LRM模型：自适应反思与长度协调惩罚提升推理效率 02-13 LRM 推理效率自适应反思
[自动] [HACKER_NEWS]	7min	newspaper Gemini 3 Deep Think 推出长思维链推理模式 02-12 Gemini 3 Deep Think 长思维链
[自动] [HACKER_NEWS]	3min	newspaper 停止生成开始思考：大模型推理范式转变 02-09 推理范式思维链 CoT
[自动] [HACKER_NEWS]	3min	newspaper 停止生成，开始思考：大模型推理能力进化路径 02-09 LLM 推理能力思维链
[自动] [ARXIV]	4min	school 研究揭示推理大模型生成虚假新闻的内在机制 02-06 LLM CoT 虚假新闻
[自动] [ARXIV]	3min	school CoT非真理链：推理LLM生成假新闻的实证内部分析 02-05 LLM CoT 假新闻
[自动] [ARXIV]	3min	school 训练LLM采用分治推理提升测试时扩展性 02-04 LLM 推理强化学习
[自动] [ARXIV]	3min	school 训练LLM采用分治推理提升测试时扩展性 02-03 LLM 推理强化学习
[自动] [ARXIV]	3min	school 基于输出监督学习的思维链混淆技术可泛化至未见任务 02-02 思维链 CoT 输出监督
[自动] [ARXIV]	4min	school 推理大语言模型从被动求解到主动提问的转变 02-02 推理 CoT 主动交互
[自动] [ARXIV]	3min	school 推理大语言模型从被动求解转向主动询问 02-01 推理交互式推理 PIR

2026年一月 3 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	3min	newspaper 阿里Qwen3-Max-Thinking深度思考模型！震撼发布🔥 01-27 Qwen3 通义千问深度思考
[自动] [HACKER_NEWS]	3min	newspaper 🚀Qwen3-Max-Thinking发布！AI推理能力炸裂升级！ 01-27 Qwen3 通义千问思维链
[自动] [HACKER_NEWS]	3min	newspaper 🔥Qwen3-Max-Thinking！深度推理颠覆想象！ 01-26 Qwen 通义千问深度推理