terminal AI Stack

首页归档搜索标签 AI史塔克关于

TAGS / TERM

后训练

共 13 篇

探究推理模型作为裁判在非可验证LLM后训练中的作用 2026-03-16 · ARXIV
探究推理模型作为裁判在非可验证LLM后训练中的表现 2026-03-15 · ARXIV
探究非可验证LLM后训练中的推理模型评判机制 2026-03-14 · ARXIV
探究推理LLM作为非可验证后训练评估器的有效性 2026-03-13 · ARXIV
CHIMERA：用于提升大模型推理泛化能力的紧凑合成数据 2026-03-03 · ARXIV
为何LLM后训练中Pass@k优化会降低Pass@1性能 2026-02-26 · ARXIV
为何Pass@k优化会降低Pass@1：大模型后训练中的提示干扰 2026-02-25 · ARXIV
2026年AI趋势展望：LLM、智能体、算力与AGI发展路径 2026-02-04 · BLOGS_PODCASTS
2026年AI展望：LLM、智能体、扩展定律与中国角色 2026-02-03 · BLOGS_PODCASTS
2026年AI展望：LLM、智能体、算力与Scaling Laws 2026-02-02 · BLOGS_PODCASTS
2026年AI展望：LLM、智能体、扩展定律与中国角色 2026-02-02 · BLOGS_PODCASTS
后训练公平性控制：推荐系统动态公平性单训练框架 2026-01-30 · ARXIV
后训练公平性控制：推荐系统动态公平性单训练框架 2026-01-29 · ARXIV