目录
长程任务
条目:4
2026年二月
4 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 5min | school
GUI-Libra:动作感知监督与可验证强化学习的原生GUI智能体 02-27
GUI Agent
强化学习
RL |
[自动]
[ARXIV] | 4min | school
GUI-Libra:动作感知监督与可验证RL训练原生GUI智能体 02-26
GUI Agent
RL
CoT |
[自动]
[ARXIV] | 4min | school
WebAgents测试时扩展:智能体性能提升方法 02-15
WebAgents
测试时扩展
CATTS |
[自动]
[ARXIV] | 3min | school
基于归一化流的高效分层目标条件强化学习 02-12
强化学习
归一化流
分层强化学习 |
无匹配条目