terminal

AI Stack

rss_feed
SYS_STABLE
目录

训练优化

条目:5
2026年五月 1 篇
类型阅读条目
[自动] [ARXIV]
1minschool TIDE:扩散大语言模型的跨架构蒸馏方法
05-01 扩散模型 知识蒸馏 跨架构
2026年四月 1 篇
类型阅读条目
[自动] [BLOGS_PODCASTS]
1minmic AI模型训练中复杂性削减技术
04-09 模型压缩 在线剪枝 控制理论
2026年三月 3 篇
类型阅读条目
[自动] [HACKER_NEWS]
1minnewspaper NanoGPT慢速运行实现10倍数据效率方案
03-20 NanoGPT 大模型 训练优化
[自动] [ARXIV]
4minschool POET-X:基于正交变换缩放的内存高效LLM训练方法
03-09 LLM 训练优化 内存优化
[自动] [ARXIV]
4minschool POET-X:通过正交变换扩展实现LLM高效训练
03-07 LLM 训练优化 内存优化