目录
帕累托最优
条目:3
2026年二月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
无奖励对齐技术处理多目标冲突 02-03
RACO
对齐技术
多目标优化 |
2026年一月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
🚚🚀多目标强化学习!让卡车在高速车流中决策更高效、更智能! 01-28
强化学习
PPO
多目标优化 |
[自动]
[ARXIV] | 4min | school
🚛🚦高速公路卡车决策新突破!多目标强化学习让战术决策更高效! 01-27
强化学习
PPO
多目标优化 |
无匹配条目