AI 训练

条目：2

2026年二月 2 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	5min	newspaper Hugging Face Skills：基于技能的模型微调框架 02-25 Hugging Face 模型微调 Skills
[自动] [HACKER_NEWS]	5min	newspaper 基于人类反馈的强化学习原理与应用 02-07 RLHF 强化学习人类反馈