AI Stack 探索 AI 技术前沿，分享深度思考与实践

条目: 1989
延迟: —
最新内容: 2026-07-15 20:45; 非站点部署时间
当前时间: --:--:--

首页归档搜索标签 AI史塔克关于

TAGS / TERM

CoT

共 10 篇

EndoCoT：扩散模型内生思维链推理扩展方法 2026-03-13 · ARXIV
Reasoning Theater：解耦模型信念与思维链 2026-03-06 · ARXIV
OpenAI推出CoT-Control：强化推理模型思维链的可监控性 2026-03-05 · BLOGS_PODCASTS
GUI-Libra：动作感知监督与可验证RL训练原生GUI智能体 2026-02-26 · ARXIV
训练LRM模型：自适应反思与长度协调惩罚提升推理效率 2026-02-13 · ARXIV
停止生成，开始思考：大模型推理能力进化路径 2026-02-09 · HACKER_NEWS
CoT非真理链：推理LLM生成假新闻的实证内部分析 2026-02-05 · ARXIV
训练LLM采用分治推理提升测试时扩展性 2026-02-03 · ARXIV
基于输出监督学习的思维链混淆技术可泛化至未见任务 2026-02-02 · ARXIV
🔥Qwen3-Max-Thinking！深度推理颠覆想象！ 2026-01-26 · HACKER_NEWS