目录
大模型评测
条目:3
2026年五月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 1min | newspaper
五大LLM千条事实核查67%结果不一致 05-28
大模型评测
事实核查
模型对比 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Kimi K2.6编程挑战击败三大AI模型 05-03
Kimi K2.6
编程挑战
大模型评测 |
2026年四月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 1min | school
MathNet:全球多模态数学推理与检索基准 04-21
数学推理
多模态
检索增强 |
无匹配条目