目录
AI 训练
条目:4
2026年三月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 2min | mic
16个开源RL库的经验总结:保持Token流动 03-11
RLHF
强化学习
开源库 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
16个开源强化学习库的实践经验与启示 03-11
强化学习
RL
开源库 |
2026年二月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 1min | newspaper
Hugging Face Skills:基于技能的模型微调框架 02-25
Hugging Face
模型微调
Skills |
[自动]
[HACKER_NEWS] | 4min | newspaper
基于人类反馈的强化学习原理与应用 02-07
RLHF
强化学习
人类反馈 |
无匹配条目