目录
微调
条目:87
2026年四月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 1min | mic
Amazon Nova模型Bedrock微调完整指南 04-08
Nova
Bedrock
微调 |
2026年三月
48 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Studio 03-18
Unsloth
LLM
微调 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Studio:基于浏览器的AI模型微调与部署平台 03-18
Unsloth
微调
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Studio 03-18
Unsloth
LLM
微调 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Studio 03-17
Unsloth
LLM
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-16
ASR
NVIDIA
微调 |
[自动]
[ARXIV] | 3min | school
基于能量函数的语言模型特征匹配微调方法 03-16
LLM
微调
能量函数 |
[自动]
[ARXIV] | 3min | school
基于能量的语言模型微调:匹配特征而非词元 03-15
微调
能量模型
特征匹配 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-15
ASR
NVIDIA
Nemotron |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-14
ASR
NVIDIA
微调 |
[自动]
[ARXIV] | 3min | school
基于能量函数的语言模型特征级微调方法 03-14
LLM
微调
EBFT |
[自动]
[BLOGS_PODCASTS] | 4min | mic
基于EC2微调NVIDIA Nemotron ASR模型实现领域适配 03-14
ASR
NVIDIA
NeMo |
[自动]
[BLOGS_PODCASTS] | 2min | mic
在EC2上微调NVIDIA Nemotron ASR模型实现领域适配 03-14
ASR
NVIDIA
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
微调NVIDIA Nemotron ASR模型:基于AWS EC2的领域适配实践 03-13
ASR
NVIDIA
Nemotron |
[自动]
[ARXIV] | 3min | school
基于能量函数的语言模型特征匹配微调方法 03-13
微调
SFT
能量函数 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-13
ASR
NVIDIA
Nemotron |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-13
ASR
NVIDIA
微调 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-13
ASR
NVIDIA
Nemotron |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-13
ASR
NVIDIA
微调 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-12
ASR
NVIDIA
Nemotron |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上微调 NVIDIA Nemotron ASR 模型实现领域适配 03-12
ASR
微调
NVIDIA |
[自动]
[JUEJIN] | 1min | sticky_note_2
大模型垂直领域微调系列:认识微调 03-12
微调
LLM
垂直领域 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 EC2 上使用 Oumi 微调 Llama 并将其部署至 Amazon Bedrock 03-12
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上使用 Oumi 微调 Llama 并将其部署至 Amazon Bedrock 03-11
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
在 EC2 上使用 Oumi 微调并部署 Llama 至 Amazon Bedrock 03-11
LLM
Llama
Oumi |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 EC2 上使用 Oumi 微调并部署 Llama 至 Amazon Bedrock 03-11
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-11
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
LLM
Llama
微调 |
[自动]
[HACKER_NEWS] | 2min | newspaper
双游戏GPU登顶HuggingFace开源LLM榜单的实现方法 03-10
LLM
HuggingFace
GPU |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
LLM
Llama
Oumi |
[自动]
[HACKER_NEWS] | 1min | newspaper
双游戏显卡登顶HuggingFace开源大模型榜单的方法 03-10
HuggingFace
LLM
排行榜 |
[自动]
[HACKER_NEWS] | 1min | newspaper
双游戏显卡登顶HuggingFace开源大模型排行榜 03-10
HuggingFace
LLM
排行榜 |
[自动]
[HACKER_NEWS] | 1min | newspaper
如何用两张游戏显卡登顶HuggingFace开源大模型榜单 03-10
HuggingFace
开源榜单
显卡 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
将机器人AI引入嵌入式平台:数据采集、VLA微调与端侧优化 03-09
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据集录制、VLA微调与端侧优化 03-09
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据集记录、VLA微调与端侧优化 03-08
机器人
VLA
嵌入式 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Autoresearch:单GPU自动训练NanoChat的研究Agent 03-08
AutoResearch
Agent
NanoChat |
[自动]
[HACKER_NEWS] | 1min | newspaper
单GPU微调NanoChat:自动Agent实现端到端训练研究 03-08
微调
Agent
单GPU |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据采集、VLA微调与端侧优化 03-07
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据集录制、VLA微调与端侧优化 03-06
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 1min | mic
将机器人AI引入嵌入式平台:数据采集、VLA微调与端侧优化 03-06
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 2min | mic
将机器人AI引入嵌入式平台:数据集录制、VLA微调与端侧优化 03-06
机器人
嵌入式
VLA |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AI工程核心辩论:Harness Engineering是否成立 03-06
AI工程
模型挑选
LLM |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen3.5 微调指南 03-05
Qwen3.5
微调
Fine-tuning |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen3.5 微调指南:基于 Unsloth 文档 03-04
Qwen3.5
Unsloth
微调 |
[自动]
[HACKER_NEWS] | 1min | newspaper
Qwen3.5微调指南:Unsloth文档与实现流程 03-04
Qwen3.5
Unsloth
微调 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Qwen3.5 微调指南:基于 Unsloth 的高效训练流程 03-04
Qwen3.5
Unsloth
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Nova Forge 数据混合技术评估:在专业 AI 任务中保持智能水准 03-04
Nova Forge
数据混合
模型评估 |
[自动]
[ARXIV] | 5min | school
通过低秩近似优化大模型动量状态以降低显存占用 03-02
LoRA-Pre
低秩近似
优化器 |
2026年二月
34 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 1min | newspaper
Unsloth Dynamic 2.0 发布:支持 GGUF 格式 02-28
Unsloth
GGUF
LLM |
[自动]
[BLOGS_PODCASTS] | 5min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-24
Unsloth
Hugging Face
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-23
Unsloth
Hugging Face
LLM |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用Unsloth与Hugging Face Jobs免费训练AI模型 02-23
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-23
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-23
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-22
Unsloth
Hugging Face
LLM |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用Unsloth和Hugging Face Jobs免费训练AI模型 02-21
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-21
Unsloth
Hugging Face
模型训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用Unsloth和Hugging Face Jobs免费训练AI模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用Unsloth与Hugging Face Jobs免费训练AI模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 5min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练 AI 模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
使用 Unsloth 与 Hugging Face Jobs 免费训练大模型 02-20
Unsloth
Hugging Face
免费训练 |
[自动]
[ARXIV] | 3min | school
通过任务复杂度量化验证浅层对齐假说 02-19
浅层对齐假说
SAH
任务复杂度 |
[自动]
[ARXIV] | 3min | school
基于任务复杂度的浅层对齐假说操作化研究 02-18
浅层对齐
SAH
任务复杂度 |
[自动]
[HACKER_NEWS] | 4min | newspaper
LLM 数据集构建与模型训练优化指南 02-18
LLM
数据集构建
模型训练 |
[自动]
[ARXIV] | 4min | school
基于参数高效微调与往返翻译的文本风格迁移 02-17
文本风格迁移
PEFT
LLM |
[自动]
[JUEJIN] | 2min | sticky_note_2
大模型行为塑造:SFT与LoRA深度解析 02-15
SFT
LoRA
微调 |
[自动]
[ARXIV] | 4min | school
权重衰减提升语言模型可塑性 02-13
权重衰减
模型可塑性
微调 |
[自动]
[ARXIV] | 3min | school
权重衰减提升语言模型可塑性 02-12
LLM
权重衰减
模型可塑性 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Scale LLM fine-tuning with Hugging Face and Amazon Sage 02-11
LLM
微调
Hugging Face |
[自动]
[BLOGS_PODCASTS] | 4min | mic
利用 Hugging Face 与 SageMaker 扩展企业级 LLM 微调 02-10
LLM
微调
Hugging Face |
[自动]
[ARXIV] | 3min | school
大模型涌现性错位易修复,窄错位难修正 02-10
LLM
对齐
微调 |
[自动]
[HACKER_NEWS] | 4min | newspaper
微调Qwen2.5-7B模型基于百部电影构建概率故事图 02-08
Qwen2.5
微调
故事图 |
[自动]
[HACKER_NEWS] | 4min | newspaper
基于百部电影微调的 Qwen2.5-7B 概率故事图模型 02-08
Qwen2.5
微调
故事图 |
[自动]
[ARXIV] | 3min | school
共享 LoRA 子空间实现近乎严格的持续学习 02-06
LoRA
持续学习
微调 |
[自动]
[ARXIV] | 4min | school
重新思考大模型强化学习中的信任区域机制 02-06
强化学习
LLM
PPO |
[自动]
[ARXIV] | 4min | school
基于急停干预的鲁棒干预学习 02-05
干预学习
自动驾驶
鲁棒性 |
[自动]
[HACKER_NEWS] | 5min | newspaper
Agent Skills:AI 智能体技能框架与训练方法 02-04
Agent
智能体
技能框架 |
[自动]
[HACKER_NEWS] | 3min | newspaper
训练万亿参数模型使其具备幽默感 02-03
LLM
幽默感
万亿参数 |
[自动]
[ARXIV] | 3min | school
大语言模型中角色作为潜变量:机制视角下的错位与安全失效 02-02
LLM
对齐
角色扮演 |
[自动]
[ARXIV] | 3min | school
发现模型仓库中的隐藏价值 02-02
模型评估
Llama-3.1
多臂老虎机 |
[自动]
[ARXIV] | 3min | school
挖掘模型仓库中的隐藏价值 02-01
模型评估
Llama
微调 |
2026年一月
4 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
发现模型仓库中被忽视的高质量模型 01-30
模型评估
Llama-3.1
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
让 Claude 编写 CUDA 内核并指导开源模型 01-29
Claude 3.5
CUDA
微调 |
[自动]
[HACKER_NEWS] | 3min | newspaper
🔥Model Market Fit!PMF的终极解法?你的模型真的适配市场吗? 01-27
Model Market Fit
PMF
LLM |
[自动]
[ARXIV] | 5min | school
Cosmos重磅:微调视频模型!解锁 visuomotor 控制与规划 🚀✨ 01-25
Cosmos
机器人
视觉运动控制 |
无匹配条目