terminal AI Stack

首页归档搜索标签 AI史塔克关于

TAGS / TERM

评估指标

共 7 篇

反事实解释指标与用户感知的一致性研究 2026-03-17 · ARXIV
LLM效果优化：用户预先定义验收标准 2026-03-07 · HACKER_NEWS
LLM 效果优化：用户需预先定义验收标准 2026-03-07 · HACKER_NEWS
LLM效果优化：用户预先定义验收标准 2026-03-07 · HACKER_NEWS
评估学习表征可识别性的挑战与难点 2026-03-03 · ARXIV
AI智能体自主性的实践测量方法 2026-02-19 · HACKER_NEWS
AI智能体自主性评估的实践方法与指标 2026-02-19 · HACKER_NEWS