目录
微调
条目:38
2026年二月
34 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 6min | newspaper
Unsloth Dynamic 2.0 发布:支持 GGUF 格式 02-28
Unsloth
GGUF
LLM |
[自动]
[BLOGS_PODCASTS] | 5min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-24
Unsloth
Hugging Face
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-23
Unsloth
Hugging Face
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用Unsloth与Hugging Face Jobs免费训练AI模型 02-23
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-23
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-23
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-22
Unsloth
Hugging Face
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用Unsloth和Hugging Face Jobs免费训练AI模型 02-21
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-21
Unsloth
Hugging Face
模型训练 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用Unsloth和Hugging Face Jobs免费训练AI模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用Unsloth与Hugging Face Jobs免费训练AI模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练大模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[ARXIV] | 3min | school
通过任务复杂度量化验证浅层对齐假说 02-19
浅层对齐假说
SAH
任务复杂度 |
[自动]
[ARXIV] | 3min | school
基于任务复杂度的浅层对齐假说操作化研究 02-18
浅层对齐
SAH
任务复杂度 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM 数据集构建与模型训练优化指南 02-18
LLM
数据集构建
模型训练 |
[自动]
[ARXIV] | 4min | school
基于参数高效微调与往返翻译的文本风格迁移 02-17
文本风格迁移
PEFT
LLM |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型行为塑造:SFT与LoRA深度解析 02-15
SFT
LoRA
微调 |
[自动]
[ARXIV] | 4min | school
权重衰减提升语言模型可塑性 02-13
权重衰减
模型可塑性
微调 |
[自动]
[ARXIV] | 4min | school
权重衰减提升语言模型可塑性 02-12
LLM
权重衰减
模型可塑性 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Scale LLM fine-tuning with Hugging Face and Amazon Sage 02-11
LLM
微调
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 4min | mic
利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调 02-10
LLM
微调
Hugging Face |
[自动]
[ARXIV] | 3min | school
大模型涌现性错位易修复,窄错位难修正 02-10
LLM
对齐
微调 |
[自动]
[HACKER_NEWS] | 5min | newspaper
微调Qwen2.5-7B模型基于百部电影构建概率故事图 02-08
Qwen2.5
微调
故事图 |
[自动]
[HACKER_NEWS] | 4min | newspaper
基于百部电影微调的 Qwen2.5-7B 概率故事图模型 02-08
Qwen2.5
微调
故事图 |
[自动]
[ARXIV] | 4min | school
共享 LoRA 子空间实现近乎严格的持续学习 02-06
LoRA
持续学习
微调 |
[自动]
[ARXIV] | 4min | school
重新思考大模型强化学习中的信任区域机制 02-06
强化学习
LLM
PPO |
[自动]
[ARXIV] | 4min | school
基于急停干预的鲁棒干预学习 02-05
干预学习
自动驾驶
鲁棒性 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent Skills:AI 智能体技能框架与训练方法 02-04
Agent
智能体
技能框架 |
[自动]
[HACKER_NEWS] | 3min | newspaper
训练万亿参数模型使其具备幽默感 02-03
LLM
幽默感
万亿参数 |
[自动]
[ARXIV] | 3min | school
大语言模型中角色作为潜变量:机制视角下的错位与安全失效 02-02
LLM
对齐
角色扮演 |
[自动]
[ARXIV] | 3min | school
发现模型仓库中的隐藏价值 02-02
模型评估
Llama-3.1
多臂老虎机 |
[自动]
[ARXIV] | 3min | school
挖掘模型仓库中的隐藏价值 02-01
模型评估
Llama
微调 |
2026年一月
4 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
发现模型仓库中被忽视的高质量模型 01-30
模型评估
Llama-3.1
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
让 Claude 编写 CUDA 内核并指导开源模型 01-29
Claude 3.5
CUDA
微调 |
[自动]
[HACKER_NEWS] | 4min | newspaper
🔥Model Market Fit!PMF的终极解法?你的模型真的适配市场吗? 01-27
Model Market Fit
PMF
LLM |
[自动]
[ARXIV] | 5min | school
Cosmos重磅:微调视频模型!解锁 visuomotor 控制与规划 🚀✨ 01-25
Cosmos
机器人
视觉运动控制 |
无匹配条目