目录
算法创新
条目:4
2026年二月
4 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 2min | mic
利用闲置算力将大模型训练速度提高一倍且保持精度 02-27
LLM
训练加速
算力优化 |
[自动]
[HACKER_NEWS] | 3min | newspaper
停止生成开始思考:大模型推理范式转变 02-09
推理范式
思维链
CoT |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称性泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
[自动]
[HACKER_NEWS] | 6min | newspaper
基于对称性泰勒近似实现恒定Token成本注意力机制 02-04
注意力机制
Transformer
泰勒近似 |
无匹配条目