terminal AI Stack

首页归档搜索标签 AI史塔克关于

TAGS / TERM

Reward Hacking

共 3 篇

探究推理LLM作为非可验证后训练评估器的有效性 2026-03-13 · ARXIV
基于内部激活监测生成过程中的突发奖励黑客行为 2026-03-05 · ARXIV
揭秘Agentic RL训练！GPT-OSS实战回顾，核心干货🔥 2026-01-27 · BLOGS_PODCASTS