目录
知识蒸馏
条目:10
2026年三月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
大语言模型的在线体验学习框架 03-18
LLM
OEL
在线学习 |
[自动]
[ARXIV] | 1min | school
BEVLM:将LLM语义知识蒸馏至鸟瞰图表示 03-10
BEVLM
自动驾驶
LLM |
[自动]
[ARXIV] | 4min | school
BEVLM:将LLM语义知识蒸馏至鸟瞰图表征 03-09
BEVLM
自动驾驶
LLM |
2026年二月
6 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
数据集压缩至1MB:模型训练效率优化方法 02-28
数据集蒸馏
PLADA
模型训练 |
[自动]
[ARXIV] | 4min | school
基于奖励外推的广义在线策略蒸馏算法 02-13
LLM
强化学习
知识蒸馏 |
[自动]
[ARXIV] | 2min | school
ArcFlow:高精度非线性流蒸馏实现两步文生图生成 02-10
ArcFlow
文生图
流蒸馏 |
[自动]
[ARXIV] | 4min | school
强化注意力学习:通过奖励机制优化视觉注意力模型 02-06
强化学习
多模态
注意力机制 |
[自动]
[ARXIV] | 6min | school
混合线性注意力新架构:高效蒸馏与超长上下文处理 02-02
HALO
HypeNet
混合架构 |
[自动]
[ARXIV] | 4min | school
混合线性注意力新架构:高效蒸馏与超长上下文处理 02-01
Transformer
混合架构
线性注意力 |
2026年一月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 5min | school
混合线性注意力新架构:高效蒸馏与超长上下文建模 01-31
线性注意力
长上下文
混合架构 |
无匹配条目