terminal

AI Stack

rss_feed
SYS_STABLE
目录

多模态评估

条目:5
2026年三月 1 篇
类型阅读条目
[自动] [ARXIV]
2minschool SocialOmni:全模态模型视听社交交互基准测试
03-18 SocialOmni 全模态 OLM
2026年二月 4 篇
类型阅读条目
[自动] [ARXIV]
3minschool GENIUS:生成式流体智能评估套件
02-13 GENIUS 流体智力 多模态评估
[自动] [ARXIV]
3minschool GENIUS:生成式流体智能评估套件
02-12 GENIUS 流体智能 GFI
[自动] [ARXIV]
2minschool GEBench:将图像生成模型评估为GUI环境的基准
02-11 GEBench GUI生成 图像生成
[自动] [ARXIV]
3minschool GEBench: Benchmarking Image Generation Models as GUI En
02-10 GEBench GUI生成 图像生成