目录
置信度
条目:7
2026年三月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 2min | mic
新指标识别大型语言模型过度自信问题 03-20
大语言模型
过度自信
不确定性量化 |
[自动]
[ARXIV] | 3min | school
自适应置信度正则化用于多模态失效检测 03-04
多模态
失效检测
置信度 |
2026年二月
5 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
WebAgent 智能体测试时计算扩展方法 02-16
WebAgent
Test-Time Scaling
CATTS |
[自动]
[ARXIV] | 4min | school
WebAgents测试时扩展:智能体性能提升方法 02-15
WebAgents
测试时扩展
CATTS |
[自动]
[ARXIV] | 4min | school
Agentic测试时扩展技术提升WebAgent性能 02-14
WebAgent
测试时扩展
CATTS |
[自动]
[ARXIV] | 3min | school
智能体不确定性研究揭示过度自信问题 02-09
AI Agents
不确定性
过度自信 |
[自动]
[ARXIV] | 4min | school
CATTO:平衡语言模型偏好与置信度的方法 02-02
LLM
CATTO
校准 |
无匹配条目