目录
模型稳定性
条目:4
2026年三月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 1min | newspaper
AI反复改变决策的“你确定吗”问题解析 03-16
决策一致性
模型幻觉
提示词工程 |
[自动]
[ARXIV] | 2min | school
推理机制如何提升大模型诚实度 03-12
诚实度
推理机制
欺骗行为 |
[自动]
[ARXIV] | 3min | school
基于对抗雅可比正则化的智能体AI系统鲁棒性增强方法 03-06
鲁棒性
对抗训练
多智能体 |
2026年二月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
用于软优势策略优化的平滑门函数 02-24
强化学习
GRPO
SAPO |
无匹配条目