terminal

AI Stack

rss_feed
SYS_STABLE
目录

评估指标

条目:7
2026年三月 5 篇
类型阅读条目
[自动] [ARXIV]
3minschool 反事实解释指标与用户感知的一致性研究
03-17 可解释性 反事实解释 用户感知
[自动] [HACKER_NEWS]
1minnewspaper LLM效果优化:用户预先定义验收标准
03-07 LLM 效果优化 验收标准
[自动] [HACKER_NEWS]
1minnewspaper LLM 效果优化:用户需预先定义验收标准
03-07 LLM 效果优化 验收标准
[自动] [HACKER_NEWS]
1minnewspaper LLM效果优化:用户预先定义验收标准
03-07 LLM 效果优化 验收标准
[自动] [ARXIV]
3minschool 评估学习表征可识别性的挑战与难点
03-03 表征学习 可识别性 评估指标
2026年二月 2 篇
类型阅读条目
[自动] [HACKER_NEWS]
1minnewspaper AI智能体自主性的实践测量方法
02-19 AI Agent 自主性 评估指标
[自动] [HACKER_NEWS]
1minnewspaper AI智能体自主性评估的实践方法与指标
02-19 AI Agent 自主性 评估指标