terminal

AI Stack

rss_feed
SYS_STABLE
目录

模型蒸馏

条目:35
2026年三月 11 篇
类型阅读条目
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏优化语言模型
03-15 PPO 强化学习 模型蒸馏
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏技术优化语言模型
03-15 PPO 树搜索 模型蒸馏
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏优化语言模型
03-15 PPO 强化学习 树搜索
[自动] [HACKER_NEWS]
1minnewspaper 基于PPO的树搜索蒸馏技术优化语言模型
03-15 PPO 强化学习 树搜索
[自动] [ARXIV]
3minschool 审查大模型作为秘密知识提取的自然测试床
03-09 大模型安全 知识提取 审查机制
[自动] [ARXIV]
2minschool 审查大模型作为秘密知识提取的自然测试床
03-08 审查 知识提取 越狱
[自动] [JUEJIN]
2minsticky_note_2 Anthropic指控三家中国公司大规模蒸馏模型
03-06 Anthropic 模型蒸馏 数据安全
[自动] [BLOGS_PODCASTS]
3minmic Anthropic模型蒸馏与SWE-Bench失效机制分析直播
03-02 模型蒸馏 SWE-Bench 基准测试
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 模型蒸馏与 SWE-Bench 作弊机制解析
03-01 模型蒸馏 SWE-Bench 数据污染
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 模型蒸馏与 SWE-Bench 失效机制探讨
03-01 模型蒸馏 SWE-bench 数据污染
[自动] [BLOGS_PODCASTS]
3minmic Anthropic模型蒸馏与SWE-Bench失效机制分析
03-01 Anthropic 模型蒸馏 SWE-Bench
2026年二月 21 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析
02-28 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]
3minmic Anthropic模型蒸馏与SWE-Bench失效机制分析
02-28 模型蒸馏 SWE-Bench Anthropic
[自动] [BLOGS_PODCASTS]
2minmic Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析
02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]
2minmic Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析
02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]
3minmic Anthropic蒸馏与模型作弊机制:SWE-Bench失效分析
02-27 Anthropic 模型蒸馏 宪法AI
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 模型蒸馏与 SWE-Bench 失效机制分析
02-27 Anthropic 模型蒸馏 SWE-Bench
[自动] [BLOGS_PODCASTS]
2minmic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析
02-27 模型蒸馏 SWE-bench 奖励黑客
[自动] [BLOGS_PODCASTS]
3minmic Anthropic 模型蒸馏与 SWE-Bench 作弊机制分析
02-26 Anthropic 模型蒸馏 SWE-Bench
[自动] [HACKER_NEWS]
1minnewspaper Ferret-UI Lite:端侧轻量级GUI Agent构建经验
02-26 Ferret-UI GUI Agent 端侧模型
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击
02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击
02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击
02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
3minmic Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击
02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
3minmic Anthropic指控DeepSeek等三家中国公司超1600万次蒸馏攻击
02-25 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等三家中国公司遭超1600万次蒸馏攻击
02-24 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等遭超1600万次蒸馏攻击
02-24 Anthropic DeepSeek 模型蒸馏
[自动] [BLOGS_PODCASTS]
2minmic Anthropic指控DeepSeek等遭超1600万次工业级蒸馏攻击
02-24 Anthropic DeepSeek 模型蒸馏
[自动] [ARXIV]
4minschool 语言模型在线策略上下文蒸馏方法
02-15 模型蒸馏 上下文学习 在线策略
[自动] [ARXIV]
4minschool 面向语言模型的在线上下文蒸馏方法
02-13 LLM 模型蒸馏 上下文学习
[自动] [ARXIV]
4minschool DreamDojo:基于大规模人类视频的通用机器人世界模型
02-09 机器人 世界模型 DreamDojo
[自动] [ARXIV]
4minschool Routing the Lottery:面向异型数据的自适应子网络
02-01 模型剪枝 彩票假说 自适应路由
2026年一月 3 篇
类型阅读条目
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与极长上下文处理
01-30 HALO HypeNet 长上下文
[自动] [BLOGS_PODCASTS]
3minmic 让 Claude 编写 CUDA 内核并指导开源模型
01-29 Claude 3.5 CUDA 微调
[自动] [BLOGS_PODCASTS]
4minmic 实战复盘:解锁GPT-OSS智能体强化训练!🚀
01-27 强化学习 智能体 模型蒸馏