目录
SkillsBench
条目:3
2026年二月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[JUEJIN] | 2min | sticky_note_2
SkillsBench 论文解读:跨任务基准测试如何揭示 Agent 技能的实际效用 02-18
Agent
LLM
SkillsBench |
[自动]
[JUEJIN] | 3min | sticky_note_2
SkillsBench论文:评估Agent技能在多任务中的实际效用 02-17
Agent
LLM
SkillsBench |
[自动]
[HACKER_NEWS] | 7min | newspaper
SkillsBench:评估智能体技能在多样化任务中的表现基准 02-17
SkillsBench
智能体
Agent |
无匹配条目