terminal

AI Stack

rss_feed
SYS_STABLE
目录

LLM-as-a-Judge

条目:5
2026年三月 5 篇
类型阅读条目
[自动] [ARXIV]
2minschool LLM评测新范式:从表面启发式到知识 grounded 评估
03-13 LLM评测 LLM-as-a-Judge 评估幻觉
[自动] [ARXIV]
3minschool LLM评测新范式:从表面启发式到知识 grounded 评估
03-12 LLM评测 LLM-as-a-Judge MERG框架
[自动] [ARXIV]
3minschool 通过偏差有界评估实现可证明无偏的LLM评判者
03-09 LLM-as-a-Judge 评估方法 偏差控制
[自动] [ARXIV]
3minschool 迈向偏差可控的LLM评判器:基于有界评估的无偏验证
03-08 LLM-as-a-Judge 偏见控制 模型评估
[自动] [ARXIV]
3minschool 通过偏差界限评估实现可证无偏的LLM评判者
03-06 LLM LLM-as-a-judge 评估