微调

条目：38

2026年二月 34 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	6min	newspaper Unsloth Dynamic 2.0 发布：支持 GGUF 格式 02-28 Unsloth GGUF LLM
[自动] [BLOGS_PODCASTS]	5min	mic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-24 Unsloth Hugging Face LLM
[自动] [BLOGS_PODCASTS]	4min	mic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-23 Unsloth Hugging Face LLM
[自动] [BLOGS_PODCASTS]	3min	mic 使用Unsloth与Hugging Face Jobs免费训练AI模型 02-23 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]	3min	mic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-23 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]	4min	mic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-23 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]	4min	mic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-22 Unsloth Hugging Face LLM
[自动] [BLOGS_PODCASTS]	4min	mic 使用Unsloth和Hugging Face Jobs免费训练AI模型 02-21 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]	5min	mic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-21 Unsloth Hugging Face 模型训练
[自动] [BLOGS_PODCASTS]	4min	mic 使用Unsloth和Hugging Face Jobs免费训练AI模型 02-20 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]	3min	mic 使用Unsloth与Hugging Face Jobs免费训练AI模型 02-20 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]	5min	mic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-20 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]	3min	mic 使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-20 Unsloth Hugging Face 免费训练
[自动] [BLOGS_PODCASTS]	3min	mic 使用 Unsloth 与 Hugging Face Jobs 免费训练大模型 02-20 Unsloth Hugging Face 免费训练
[自动] [ARXIV]	3min	school 通过任务复杂度量化验证浅层对齐假说 02-19 浅层对齐假说 SAH 任务复杂度
[自动] [ARXIV]	3min	school 基于任务复杂度的浅层对齐假说操作化研究 02-18 浅层对齐 SAH 任务复杂度
[自动] [HACKER_NEWS]	4min	newspaper LLM 数据集构建与模型训练优化指南 02-18 LLM 数据集构建模型训练
[自动] [ARXIV]	4min	school 基于参数高效微调与往返翻译的文本风格迁移 02-17 文本风格迁移 PEFT LLM
[自动] [JUEJIN]	2min	sticky_note_2 大模型行为塑造：SFT与LoRA深度解析 02-15 SFT LoRA 微调
[自动] [ARXIV]	4min	school 权重衰减提升语言模型可塑性 02-13 权重衰减模型可塑性微调
[自动] [ARXIV]	4min	school 权重衰减提升语言模型可塑性 02-12 LLM 权重衰减模型可塑性
[自动] [BLOGS_PODCASTS]	3min	mic Scale LLM fine-tuning with Hugging Face and Amazon Sage 02-11 LLM 微调 Hugging Face
[自动] [BLOGS_PODCASTS]	4min	mic 利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调 02-10 LLM 微调 Hugging Face
[自动] [ARXIV]	3min	school 大模型涌现性错位易修复，窄错位难修正 02-10 LLM 对齐微调
[自动] [HACKER_NEWS]	5min	newspaper 微调Qwen2.5-7B模型基于百部电影构建概率故事图 02-08 Qwen2.5 微调故事图
[自动] [HACKER_NEWS]	4min	newspaper 基于百部电影微调的 Qwen2.5-7B 概率故事图模型 02-08 Qwen2.5 微调故事图
[自动] [ARXIV]	4min	school 共享 LoRA 子空间实现近乎严格的持续学习 02-06 LoRA 持续学习微调
[自动] [ARXIV]	4min	school 重新思考大模型强化学习中的信任区域机制 02-06 强化学习 LLM PPO
[自动] [ARXIV]	4min	school 基于急停干预的鲁棒干预学习 02-05 干预学习自动驾驶鲁棒性
[自动] [HACKER_NEWS]	5min	newspaper Agent Skills：AI 智能体技能框架与训练方法 02-04 Agent 智能体技能框架
[自动] [HACKER_NEWS]	3min	newspaper 训练万亿参数模型使其具备幽默感 02-03 LLM 幽默感万亿参数
[自动] [ARXIV]	3min	school 大语言模型中角色作为潜变量：机制视角下的错位与安全失效 02-02 LLM 对齐角色扮演
[自动] [ARXIV]	3min	school 发现模型仓库中的隐藏价值 02-02 模型评估 Llama-3.1 多臂老虎机
[自动] [ARXIV]	3min	school 挖掘模型仓库中的隐藏价值 02-01 模型评估 Llama 微调

2026年一月 4 篇

类型	阅读	条目
[自动] [ARXIV]	3min	school 发现模型仓库中被忽视的高质量模型 01-30 模型评估 Llama-3.1 微调
[自动] [BLOGS_PODCASTS]	3min	mic 让 Claude 编写 CUDA 内核并指导开源模型 01-29 Claude 3.5 CUDA 微调
[自动] [HACKER_NEWS]	4min	newspaper 🔥Model Market Fit！PMF的终极解法？你的模型真的适配市场吗？ 01-27 Model Market Fit PMF LLM
[自动] [ARXIV]	5min	school Cosmos重磅：微调视频模型！解锁 visuomotor 控制与规划 🚀✨ 01-25 Cosmos 机器人视觉运动控制