terminal

AI Stack

rss_feed
SYS_STABLE
目录

知识蒸馏

条目:7
2026年二月 6 篇
类型阅读条目
[自动] [ARXIV]
4minschool 数据集压缩至1MB:模型训练效率优化方法
02-28 数据集蒸馏 PLADA 模型训练
[自动] [ARXIV]
4minschool 基于奖励外推的广义在线策略蒸馏算法
02-13 LLM 强化学习 知识蒸馏
[自动] [ARXIV]
2minschool ArcFlow:高精度非线性流蒸馏实现两步文生图生成
02-10 ArcFlow 文生图 流蒸馏
[自动] [ARXIV]
4minschool 强化注意力学习:通过奖励机制优化视觉注意力模型
02-06 强化学习 多模态 注意力机制
[自动] [ARXIV]
6minschool 混合线性注意力新架构:高效蒸馏与超长上下文处理
02-02 HALO HypeNet 混合架构
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与超长上下文处理
02-01 Transformer 混合架构 线性注意力
2026年一月 1 篇
类型阅读条目
[自动] [ARXIV]
5minschool 混合线性注意力新架构:高效蒸馏与超长上下文建模
01-31 线性注意力 长上下文 混合架构