模型蒸馏

条目：27

2026年三月 3 篇

类型	阅读	条目
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 03-01 模型蒸馏合成数据 SWE-Bench
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic模型蒸馏与SWE-Bench失效机制分析 03-01 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic模型蒸馏与SWE-Bench失效机制分析 03-01 Anthropic 模型蒸馏 SWE-Bench

2026年二月 21 篇

类型	阅读	条目
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-28 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic模型蒸馏与SWE-Bench失效机制分析 02-28 模型蒸馏 SWE-Bench Anthropic
[自动] [BLOGS_PODCASTS]	2min	mic Anthropic蒸馏与模型作弊机制：SWE-Bench失效分析 02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]	2min	mic Anthropic蒸馏与模型作弊机制：SWE-Bench失效分析 02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic蒸馏与模型作弊机制：SWE-Bench失效分析 02-27 Anthropic 模型蒸馏宪法AI
[自动] [BLOGS_PODCASTS]	4min	mic Anthropic 模型蒸馏与 SWE-Bench 失效机制分析 02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]	2min	mic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-27 模型蒸馏 SWE-bench 奖励黑客
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-26 Anthropic 模型蒸馏 SWE-Bench
[自动] [HACKER_NEWS]	5min	newspaper Ferret-UI Lite：端侧轻量级GUI Agent构建经验 02-26 Ferret-UI GUI Agent 端侧模型
[自动] [BLOGS_PODCASTS]	2min	mic Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]	2min	mic Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]	3min	mic Anthropic指控DeepSeek等三家中国公司超1600万次蒸馏攻击 02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]	2min	mic Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-24 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]	2min	mic Anthropic指控DeepSeek等遭超1600万次蒸馏攻击 02-24 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]	2min	mic Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-24 Anthropic DeepSeek 模型蒸馏
[自动] [ARXIV]	4min	school 语言模型在线策略上下文蒸馏方法 02-15 模型蒸馏上下文学习在线策略
[自动] [ARXIV]	4min	school 面向语言模型的在线上下文蒸馏方法 02-13 LLM 模型蒸馏上下文学习
[自动] [ARXIV]	4min	school DreamDojo：基于大规模人类视频的通用机器人世界模型 02-09 机器人世界模型 DreamDojo
[自动] [ARXIV]	4min	school Routing the Lottery：面向异型数据的自适应子网络 02-01 模型剪枝彩票假说自适应路由

2026年一月 3 篇

类型	阅读	条目
[自动] [ARXIV]	5min	school 混合线性注意力新架构：高效蒸馏与极长上下文处理 01-30 HALO HypeNet 长上下文
[自动] [BLOGS_PODCASTS]	3min	mic 让 Claude 编写 CUDA 内核并指导开源模型 01-29 Claude 3.5 CUDA 微调
[自动] [BLOGS_PODCASTS]	4min	mic 实战复盘：解锁GPT-OSS智能体强化训练！🚀 01-27 强化学习智能体模型蒸馏