目录
模型蒸馏
条目:35
2026年三月
11 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏优化语言模型 03-15
PPO
强化学习
模型蒸馏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏技术优化语言模型 03-15
PPO
树搜索
模型蒸馏 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏优化语言模型 03-15
PPO
强化学习
树搜索 |
[自动]
[HACKER_NEWS] | 1min | newspaper
基于PPO的树搜索蒸馏技术优化语言模型 03-15
PPO
强化学习
树搜索 |
[自动]
[ARXIV] | 3min | school
审查大模型作为秘密知识提取的自然测试床 03-09
大模型安全
知识提取
审查机制 |
[自动]
[ARXIV] | 2min | school
审查大模型作为秘密知识提取的自然测试床 03-08
审查
知识提取
越狱 |
[自动]
[JUEJIN] | 2min | sticky_note_2
Anthropic指控三家中国公司大规模蒸馏模型 03-06
Anthropic
模型蒸馏
数据安全 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic模型蒸馏与SWE-Bench失效机制分析直播 03-02
模型蒸馏
SWE-Bench
基准测试 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制解析 03-01
模型蒸馏
SWE-Bench
数据污染 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 模型蒸馏与 SWE-Bench 失效机制探讨 03-01
模型蒸馏
SWE-bench
数据污染 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic模型蒸馏与SWE-Bench失效机制分析 03-01
Anthropic
模型蒸馏
SWE-Bench |
2026年二月
21 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-28
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic模型蒸馏与SWE-Bench失效机制分析 02-28
模型蒸馏
SWE-Bench
Anthropic |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析 02-27
Anthropic
模型蒸馏
宪法AI |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 模型蒸馏与 SWE-Bench 失效机制分析 02-27
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-27
模型蒸馏
SWE-bench
奖励黑客 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析 02-26
Anthropic
模型蒸馏
SWE-Bench |
[自动]
[HACKER_NEWS] | 1min | newspaper
Ferret-UI Lite:端侧轻量级GUI Agent构建经验 02-26
Ferret-UI
GUI Agent
端侧模型 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Anthropic指控DeepSeek等三家中国公司超1600万次蒸馏攻击 02-25
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击 02-24
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次蒸馏攻击 02-24
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击 02-24
Anthropic
DeepSeek
模型蒸馏 |
[自动]
[ARXIV] | 4min | school
语言模型在线策略上下文蒸馏方法 02-15
模型蒸馏
上下文学习
在线策略 |
[自动]
[ARXIV] | 4min | school
面向语言模型的在线上下文蒸馏方法 02-13
LLM
模型蒸馏
上下文学习 |
[自动]
[ARXIV] | 4min | school
DreamDojo:基于大规模人类视频的通用机器人世界模型 02-09
机器人
世界模型
DreamDojo |
[自动]
[ARXIV] | 4min | school
Routing the Lottery:面向异型数据的自适应子网络 02-01
模型剪枝
彩票假说
自适应路由 |
2026年一月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与极长上下文处理 01-30
HALO
HypeNet
长上下文 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
让 Claude 编写 CUDA 内核并指导开源模型 01-29
Claude 3.5
CUDA
微调 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
实战复盘:解锁GPT-OSS智能体强化训练!🚀 01-27
强化学习
智能体
模型蒸馏 |
无匹配条目