terminal

AI Stack

rss_feed
SYS_STABLE
目录

置信度

条目:7
2026年三月 2 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
2minmic 新指标识别大型语言模型过度自信问题
03-20 大语言模型 过度自信 不确定性量化
[自动] [ARXIV]
3minschool 自适应置信度正则化用于多模态失效检测
03-04 多模态 失效检测 置信度
2026年二月 5 篇
类型阅读条目
[自动] [ARXIV]
4minschool WebAgent 智能体测试时计算扩展方法
02-16 WebAgent Test-Time Scaling CATTS
[自动] [ARXIV]
4minschool WebAgents测试时扩展:智能体性能提升方法
02-15 WebAgents 测试时扩展 CATTS
[自动] [ARXIV]
4minschool Agentic测试时扩展技术提升WebAgent性能
02-14 WebAgent 测试时扩展 CATTS
[自动] [ARXIV]
3minschool 智能体不确定性研究揭示过度自信问题
02-09 AI Agents 不确定性 过度自信
[自动] [ARXIV]
4minschool CATTO:平衡语言模型偏好与置信度的方法
02-02 LLM CATTO 校准