目录
Ground Truth
条目:2
2026年三月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
通过偏差界限评估实现可证无偏的LLM评判者 03-06
LLM
LLM-as-a-judge
评估 |
[自动]
[ARXIV] | 4min | school
DARE-bench:评估大模型数据科学建模与指令遵循能力 03-02
DARE-bench
LLM评估
数据科学 |
无匹配条目
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
通过偏差界限评估实现可证无偏的LLM评判者 03-06
LLM
LLM-as-a-judge
评估 |
[自动]
[ARXIV] | 4min | school
DARE-bench:评估大模型数据科学建模与指令遵循能力 03-02
DARE-bench
LLM评估
数据科学 |