目录
DARE-Bench
条目:2
2026年三月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
DARE-bench:评估大模型数据科学建模与指令保真度 03-03
LLM
数据科学
基准测试 |
[自动]
[ARXIV] | 4min | school
DARE-bench:评估大模型数据科学建模与指令遵循能力 03-02
DARE-bench
LLM评估
数据科学 |
无匹配条目
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
DARE-bench:评估大模型数据科学建模与指令保真度 03-03
LLM
数据科学
基准测试 |
[自动]
[ARXIV] | 4min | school
DARE-bench:评估大模型数据科学建模与指令遵循能力 03-02
DARE-bench
LLM评估
数据科学 |