terminal

AI Stack

rss_feed
SYS_STABLE
目录

KL散度

条目:6
2026年二月 6 篇
类型阅读条目
[自动] [ARXIV]
4minschool 离散扩散模型高效采样:锐利且自适应的理论保证
02-18 离散扩散模型 CTMC 采样效率
[自动] [ARXIV]
4minschool 面向语言模型的在线上下文蒸馏方法
02-16 LLM 蒸馏 上下文学习
[自动] [ARXIV]
4minschool 语言模型在线策略上下文蒸馏方法
02-15 模型蒸馏 上下文学习 在线策略
[自动] [ARXIV]
4minschool 基于策略上下文蒸馏的大语言模型优化方法
02-14 LLM 蒸馏 上下文学习
[自动] [ARXIV]
4minschool 面向语言模型的在线上下文蒸馏方法
02-13 LLM 模型蒸馏 上下文学习
[自动] [ARXIV]
3minschool 研究揭示RLHF如何加剧大模型谄媚行为
02-03 RLHF 谄媚行为 模型偏见