terminal AI Stack

首页归档搜索标签 AI史塔克关于

TAGS / TERM

推理模型

共 69 篇

OpenAI推理模型辅助医师诊断儿童罕见遗传病 2026-06-18 · BLOGS_PODCASTS
探究推理模型作为裁判在非可验证LLM后训练中的作用 2026-03-16 · ARXIV
探究推理模型作为裁判在非可验证LLM后训练中的表现 2026-03-15 · ARXIV
探究非可验证LLM后训练中的推理模型评判机制 2026-03-14 · ARXIV
探究推理LLM作为非可验证后训练评估器的有效性 2026-03-13 · ARXIV
GPT-5.4 Thinking 系统卡发布：技术原理与安全机制详解 2026-03-09 · BLOGS_PODCASTS
OpenAI推出CoT-Control：强化推理模型思维链的可监控性 2026-03-09 · BLOGS_PODCASTS
OpenAI发现推理模型难以控制思维链凸显可监控性安全价值 2026-03-09 · BLOGS_PODCASTS
OpenAI推出CoT-Control：强化推理模型可监控性 2026-03-08 · BLOGS_PODCASTS
GPT-5.4 Thinking系统卡发布：技术机制与安全评估 2026-03-08 · BLOGS_PODCASTS
Phi-4多模态推理模型训练经验与技术解析 2026-03-08 · HACKER_NEWS
Phi-4多模态推理模型的训练经验与技术解析 2026-03-08 · HACKER_NEWS
OpenAI研究：推理模型难控思维链凸显可监控性价值 2026-03-08 · BLOGS_PODCASTS
GPT-5.4 Thinking 系统卡发布：技术架构与安全策略详解 2026-03-08 · BLOGS_PODCASTS
OpenAI推出CoT-Control：强化推理模型思维链的可监控性 2026-03-08 · BLOGS_PODCASTS
GPT-5.4 Thinking 系统卡发布：技术原理与安全机制详解 2026-03-07 · BLOGS_PODCASTS
Reasoning Theater：解耦模型信念与思维链 2026-03-07 · ARXIV
OpenAI研究：推理模型思维链难控强化可监控安全性 2026-03-07 · BLOGS_PODCASTS
OpenAI研究揭示推理模型思维链难以控制凸显可监控性重要性 2026-03-07 · BLOGS_PODCASTS
OpenAI研究：推理模型思维链难控强化可监控性 2026-03-07 · BLOGS_PODCASTS
OpenAI研究：推理模型难以控制思维链，强化可监控性安全价值 2026-03-07 · BLOGS_PODCASTS
Reasoning Theater：解耦模型信念与思维链 2026-03-06 · ARXIV
OpenAI研究：推理模型难以控制思维链凸显可监控性价值 2026-03-06 · BLOGS_PODCASTS
OpenAI推出CoT-Control：强化推理模型思维链监控 2026-03-06 · BLOGS_PODCASTS
OpenAI推CoT-Control：验证思维链可监控性对AI安全的重要性 2026-03-06 · BLOGS_PODCASTS
OpenAI研究：推理模型思维链难以控制凸显可监控性重要性 2026-03-06 · BLOGS_PODCASTS
GPT-5.4 Thinking 系统卡发布：技术原理与安全机制详解 2026-03-06 · BLOGS_PODCASTS
OpenAI推出CoT-Control：思维链难控凸显可监控性安全价值 2026-03-06 · BLOGS_PODCASTS
OpenAI研究：推理模型难以掌控思维链强化AI安全 2026-03-06 · BLOGS_PODCASTS
GPT-5.4 Thinking 推理模型技术报告发布 2026-03-06 · BLOGS_PODCASTS
OpenAI 推出 CoT-Control 并强调思维链监控的重要性 2026-03-05 · BLOGS_PODCASTS
GPT-5.4 Thinking 系统卡发布：技术原理与安全机制详解 2026-03-05 · BLOGS_PODCASTS
测试时强化学习的工具验证方法 2026-03-04 · ARXIV
提升推理语言模型的参数化知识获取能力 2026-02-27 · ARXIV
提升推理语言模型的参数化知识访问能力 2026-02-26 · ARXIV
Mercury 2：基于扩散模型的最快推理 LLM 2026-02-25 · HACKER_NEWS
Step 3.5 Flash：速度足以思考，可靠性足以行动 2026-02-19 · HACKER_NEWS
Step 3.5 Flash：快速思考与可靠执行 2026-02-19 · HACKER_NEWS
Step 3.5 Flash：快到能思考，稳到可执行 2026-02-19 · HACKER_NEWS
Gemini 3 Deep Think：升级推理模式以解决科研与工程挑战 2026-02-17 · BLOGS_PODCASTS
Gemini 3 Deep Think：强化推理能力以应对科研与工程挑战 2026-02-15 · BLOGS_PODCASTS
Gemini 3 Deep Think：面向科研与工程的推理模型 2026-02-14 · BLOGS_PODCASTS
Gemini 3 Deep Think：升级推理模式以解决科研与工程挑战 2026-02-14 · BLOGS_PODCASTS
Gemini 3 Deep Think：强化推理能力以解决科研与工程挑战 2026-02-14 · BLOGS_PODCASTS
Gemini 3 Deep Think：升级推理模式以应对科研与工程挑战 2026-02-13 · BLOGS_PODCASTS
Gemini 3 Deep Think 推理模型发布 2026-02-13 · HACKER_NEWS
Gemini 3 Deep Think：强化推理模式以应对科研与工程挑战 2026-02-13 · BLOGS_PODCASTS
Gemini 3 Deep Think 模式发布：支持长链思考推理 2026-02-13 · HACKER_NEWS
Gemini 3 Deep Think：升级推理模式以应对科研与工程挑战 2026-02-13 · BLOGS_PODCASTS
Gemini 3 Deep Think 模式发布：支持长链思考 2026-02-13 · HACKER_NEWS