LLM评判

条目：2

2026年六月 1 篇

类型	阅读	条目
[自动] [ARXIV]	1min	school 感知扰动与奖励建模缓解多模态LLM判断偏差 06-02 多模态LLM 奖励建模感知偏差

2026年五月 1 篇

类型	阅读	条目
[自动] [BLOGS_PODCASTS]	2min	mic RLAIF强化微调技术解析：LLM担任评判者的实现方法 05-01 强化微调 LLM评判 RLAIF