terminal

AI Stack

rss_feed
SYS_STABLE
目录

算子优化

条目:5
2026年三月 2 篇
类型阅读条目
[自动] [ARXIV]
5minschool MXNorm:复用MXFP块缩放实现高效张量归一化
03-16 MXNorm MXFP 低精度计算
[自动] [ARXIV]
3minschool 面向硬件加速器的位级脉动阵列架构支持运行时可重构多精度量化乘法
03-01 硬件加速器 脉动阵列 量化
2026年二月 3 篇
类型阅读条目
[自动] [ARXIV]
3minschool 面向硬件加速器的运行时可重构多精度量化乘法按位脉动阵列架构
02-27 硬件加速器 脉动阵列 量化
[自动] [ARXIV]
5minschool RRAttention:基于轮询移位的动态块稀疏注意力机制
02-06 RRAttention 稀疏注意力 长上下文
[自动] [HACKER_NEWS]
6minnewspaper FlashAttention-T:张量化注意力机制优化方案
02-03 FlashAttention 注意力机制 张量化