目录
PrefixRL
条目:2
2026年一月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
🚀复用FLOPs!RL突破性扩展:超离策略前缀如何解决硬难题? 01-28
强化学习
RL
LLM |
[自动]
[ARXIV] | 5min | school
🚀RL新突破!复用FLOPs,硬难题上通过离线前缀扩展 01-27
PrefixRL
强化学习
LLM |
无匹配条目
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
🚀复用FLOPs!RL突破性扩展:超离策略前缀如何解决硬难题? 01-28
强化学习
RL
LLM |
[自动]
[ARXIV] | 5min | school
🚀RL新突破!复用FLOPs,硬难题上通过离线前缀扩展 01-27
PrefixRL
强化学习
LLM |