目录
算子优化
条目:5
2026年三月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 5min | school
MXNorm:复用MXFP块缩放实现高效张量归一化 03-16
MXNorm
MXFP
低精度计算 |
[自动]
[ARXIV] | 3min | school
面向硬件加速器的位级脉动阵列架构支持运行时可重构多精度量化乘法 03-01
硬件加速器
脉动阵列
量化 |
2026年二月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
面向硬件加速器的运行时可重构多精度量化乘法按位脉动阵列架构 02-27
硬件加速器
脉动阵列
量化 |
[自动]
[ARXIV] | 5min | school
RRAttention:基于轮询移位的动态块稀疏注意力机制 02-06
RRAttention
稀疏注意力
长上下文 |
[自动]
[HACKER_NEWS] | 6min | newspaper
FlashAttention-T:张量化注意力机制优化方案 02-03
FlashAttention
注意力机制
张量化 |
无匹配条目