目录
专家并行
条目:5
2026年三月
4 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS 解耦式推理技术解析:基于 SageMaker HyperPod 的性能优化实践 03-17
AWS
SageMaker
推理优化 |
[自动]
[BLOGS_PODCASTS] | 1min | mic
AWS 解耦式推理技术解析:解耦服务、智能调度与专家并行 03-17
AWS
LLM
推理优化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS 推出基于 LLM-d 的分离式推理技术及 SageMaker HyperPod 实践 03-16
AWS
LLM
推理优化 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
AWS 解耦式推理技术解析:服务解耦、智能调度与专家并行 03-16
AWS
推理优化
解耦式服务 |
2026年二月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 5min | school
Multi-Head LatentMoE 与 Head 并行:通信高效的确定性 MoE 并行策略 02-06
MoE
分布式训练
通信优化 |
无匹配条目