目录
性能评估
条目:7
2026年二月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 3min | mic
Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍 02-24
Gemini
Google
ARC-AGI |
[自动]
[ARXIV] | 4min | school
GPT-5与其他大模型长短上下文性能对比 02-17
GPT-5
LLM
长文本 |
[自动]
[HACKER_NEWS] | 5min | newspaper
MiniMax M2.5 发布:SWE-bench Verified 得分 80.2% 02-12
MiniMax
M2.5
SWE-bench |
2026年一月
4 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
技术报告
模型架构 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:架构与性能细节 01-31
Kimi
K2.5
Moonshot |
[自动]
[HACKER_NEWS] | 4min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
Moonshot AI
技术报告 |
[自动]
[HACKER_NEWS] | 6min | newspaper
Kimi K2.5 技术报告发布:模型架构与性能评估 01-31
Kimi K2.5
Moonshot AI
技术报告 |
无匹配条目