目录
模型蒸馏
条目:27
2026年三月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 03-01
模型蒸馏
合成数据
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic模型蒸馏与SWE-Bench失效机制分析 03-01
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic模型蒸馏与SWE-Bench失效机制分析 03-01
Anthropic
模型蒸馏
SWE-Bench |
2026年二月
21 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-28
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic模型蒸馏与SWE-Bench失效机制分析 02-28
模型蒸馏
SWE-Bench
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析 02-27
Anthropic
模型蒸馏
宪法AI |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Anthropic 模型蒸馏与 SWE-Bench 失效机制分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-27
模型蒸馏
SWE-bench
奖励黑客 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-26
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[HACKER_NEWS] | 5min | newspaper
Ferret-UI Lite:端侧轻量级GUI Agent构建经验 02-26
Ferret-UI
GUI Agent
端侧模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic指控DeepSeek等三家中国公司超1600万次蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-24
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次蒸馏攻击 02-24
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-24
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[ARXIV] | 4min | school
语言模型在线策略上下文蒸馏方法 02-15
模型蒸馏
上下文学习
在线策略 |
[自动]
[ARXIV] | 4min | school
面向语言模型的在线上下文蒸馏方法 02-13
LLM
模型蒸馏
上下文学习 |
[自动]
[ARXIV] | 4min | school
DreamDojo:基于大规模人类视频的通用机器人世界模型 02-09
机器人
世界模型
DreamDojo |
[自动]
[ARXIV] | 4min | school
Routing the Lottery:面向异型数据的自适应子网络 02-01
模型剪枝
彩票假说
自适应路由 |
2026年一月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与极长上下文处理 01-30
HALO
HypeNet
长上下文 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
让 Claude 编写 CUDA 内核并指导开源模型 01-29
Claude 3.5
CUDA
微调 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
实战复盘:解锁GPT-OSS智能体强化训练!🚀 01-27
强化学习
智能体
模型蒸馏 |
无匹配条目