terminal

AI Stack

rss_feed
SYS_STABLE
目录

AI评估

条目:5
2026年三月 2 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
2minmic METR Joel Becker谈指数级时间视野评估与AI生产力边界
03-01 METR Joel Becker AI评估
[自动] [BLOGS_PODCASTS]
2minmic METR Joel Becker谈指数级时间视野评估与AI生产力极限
03-01 AI评估 METR 时间视野
2026年二月 3 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
2minmic METR探讨指数级时间跨度评估、威胁模型与AI生产力边界
02-28 METR AI评估 威胁模型
[自动] [ARXIV]
3minschool 评估2025年中期LLM辅助对生物学初学者表现的影响
02-19 LLM 生物安全 AI评估
[自动] [JUEJIN]
3minsticky_note_2 SkillsBench论文:评估Agent技能在多任务中的实际效用
02-17 Agent LLM SkillsBench