terminal

AI Stack

rss_feed
SYS_STABLE
目录

性能评估

条目:7
2026年二月 3 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
3minmic Gemini 3.1 Pro发布:ARC-AGI 2得分达3.0两倍
02-24 Gemini Google ARC-AGI
[自动] [ARXIV]
4minschool GPT-5与其他大模型长短上下文性能对比
02-17 GPT-5 LLM 长文本
[自动] [HACKER_NEWS]
5minnewspaper MiniMax M2.5 发布:SWE-bench Verified 得分 80.2%
02-12 MiniMax M2.5 SWE-bench
2026年一月 4 篇
类型阅读条目
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 技术报告 模型架构
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:架构与性能细节
01-31 Kimi K2.5 Moonshot
[自动] [HACKER_NEWS]
4minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 Moonshot AI 技术报告
[自动] [HACKER_NEWS]
6minnewspaper Kimi K2.5 技术报告发布:模型架构与性能评估
01-31 Kimi K2.5 Moonshot AI 技术报告