terminal AI Stack

首页归档搜索标签 AI史塔克关于

TAGS / TERM

知识蒸馏

共 12 篇

DanceOPD：在线策略生成式领域蒸馏方法 2026-06-26 · ARXIV
TIDE：扩散大语言模型的跨架构蒸馏方法 2026-05-01 · ARXIV
大语言模型的在线体验学习框架 2026-03-18 · ARXIV
BEVLM：将LLM语义知识蒸馏至鸟瞰图表示 2026-03-10 · ARXIV
BEVLM：将LLM语义知识蒸馏至鸟瞰图表征 2026-03-09 · ARXIV
数据集压缩至1MB：模型训练效率优化方法 2026-02-28 · ARXIV
基于奖励外推的广义在线策略蒸馏算法 2026-02-13 · ARXIV
ArcFlow：高精度非线性流蒸馏实现两步文生图生成 2026-02-10 · ARXIV
强化注意力学习：通过奖励机制优化视觉注意力模型 2026-02-06 · ARXIV
混合线性注意力新架构：高效蒸馏与超长上下文处理 2026-02-02 · ARXIV
混合线性注意力新架构：高效蒸馏与超长上下文处理 2026-02-01 · ARXIV
混合线性注意力新架构：高效蒸馏与超长上下文建模 2026-01-31 · ARXIV