terminal

AI Stack

rss_feed
SYS_STABLE
目录

GPU优化

条目:4
2026年三月 2 篇
类型阅读条目
[自动] [ARXIV]
3minschool MUD优化器通过动量去相关加速Transformer训练
03-19 优化器 动量去相关 白化
[自动] [ARXIV]
4minschool CUDA Agent:面向高性能内核生成的大规模智能体强化学习框架
03-02 CUDA Agent 强化学习 内核生成
2026年二月 1 篇
类型阅读条目
[自动] [HACKER_NEWS]
1minnewspaper 单张RTX 3090利用NVMe直通运行Llama 3.1 70B
02-22 Llama 3.1 RTX 3090 NVMe
2026年一月 1 篇
类型阅读条目
[自动] [HACKER_NEWS]
4minnewspaper 🔥编译模型到Megakernels!揭秘AI性能飞跃的核心黑科技!
01-26 Megakernels 算子融合 CUDA