TAGS / TERM

分布式训练

共 49 篇

SageMaker无服务器定制：微调NVIDIA Nemotron 3模型 2026-07-11 · BLOGS_PODCASTS
使用Amazon SageMaker AI和NVIDIA Isaac Lab训练Unitree H1人形机器人 2026-06-10 · BLOGS_PODCASTS
AWS与Azercell合作基于SageMaker训练阿塞拜疆语大语言模型 2026-05-28 · BLOGS_PODCASTS
如何进入前沿AI实验室从事预训练工作 2026-05-19 · BLOGS_PODCASTS
DeepSeek-V4开源超越GPT-5.5 2026-04-25 · JUEJIN
Nova Forge SDK 训练 Amazon Nova 模型教程 2026-03-19 · BLOGS_PODCASTS
Autoresearch_at_home：类SETI项目利用闲置资源训练LLM 2026-03-12 · HACKER_NEWS
如何用两张游戏显卡登顶HuggingFace开源大模型榜单 2026-03-10 · HACKER_NEWS
Ulysses序列并行：实现百万级Token上下文训练 2026-03-10 · BLOGS_PODCASTS
Ulysses序列并行：实现百万级Token上下文训练 2026-03-10 · BLOGS_PODCASTS
Ulysses序列并行技术支持百万级Token上下文训练 2026-03-10 · BLOGS_PODCASTS
Ulysses序列并行技术实现百万Token上下文训练 2026-03-10 · BLOGS_PODCASTS
Ulysses序列并行：支持百万Token上下文训练 2026-03-09 · BLOGS_PODCASTS
Ulysses序列并行技术实现百万Token上下文训练 2026-03-09 · BLOGS_PODCASTS
数据集压缩至1MB：小规模数据集的模型训练效果评估 2026-02-27 · ARXIV
基于 veRL 与 Ray 在 SageMaker 上训练 CodeFu-7B 模型 2026-02-26 · BLOGS_PODCASTS
Meta 开源 RCCLX：优化 AMD GPU 通信并集成 Torchcomms 2026-02-26 · BLOGS_PODCASTS
在 Amazon SageMaker 上使用 veRL 与 Ray 训练 CodeFu-7B 模型 2026-02-26 · BLOGS_PODCASTS
Meta 开源 RCCLX：优化 AMD 平台 GPU 通信性能 2026-02-26 · BLOGS_PODCASTS
在 Amazon SageMaker 上使用 veRL 与 Ray 训练 CodeFu-7B 模型 2026-02-26 · BLOGS_PODCASTS
Untied Ulysses：基于分头切分的高效上下文并行方案 2026-02-26 · ARXIV
基于 veRL 在 SageMaker 与 Ray 上训练 CodeFu-7B 模型 2026-02-25 · BLOGS_PODCASTS
Meta 开源 RCCLX：优化 AMD GPU 通信并集成 Torchcomms 2026-02-25 · BLOGS_PODCASTS
Headwise Chunking：面向上下文并行的内存高效方案 2026-02-25 · ARXIV
使用 veRL 和 Ray 在 SageMaker 上训练 CodeFu-7B 模型 2026-02-25 · BLOGS_PODCASTS
Meta 开源 RCCLX：优化 AMD GPU 通信并集成 Torchcomms 2026-02-25 · BLOGS_PODCASTS
基于veRL与Ray在SageMaker上训练CodeFu-7B模型 2026-02-25 · BLOGS_PODCASTS
Meta 开源 RCCLX：优化 AMD GPU 通信并集成 Torchcomms 2026-02-25 · BLOGS_PODCASTS
在 Amazon SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 模型 2026-02-25 · BLOGS_PODCASTS
Meta 开源 RCCLX：优化 AMD 平台 GPU 通信 2026-02-25 · BLOGS_PODCASTS
使用 veRL 和 Ray 在 SageMaker 上训练 CodeFu-7B 模型 2026-02-25 · BLOGS_PODCASTS
Meta 开源 RCCLX：优化 AMD GPU 通信并集成 Torchcomms 2026-02-25 · BLOGS_PODCASTS
在 SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 2026-02-25 · BLOGS_PODCASTS
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 2026-02-25 · BLOGS_PODCASTS
在 Amazon SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 模型 2026-02-25 · BLOGS_PODCASTS
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 2026-02-25 · BLOGS_PODCASTS
DeepSpeed图像工作负载评测：视觉Transformer扩展性能 2026-02-25 · ARXIV
在 Amazon SageMaker 上使用 veRL 和 Ray 训练 CodeFu-7B 模型 2026-02-24 · BLOGS_PODCASTS
Meta 开源 RCCLX：优化 AMD GPU 通信并集成 Torchcomms 2026-02-24 · BLOGS_PODCASTS
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 2026-02-24 · BLOGS_PODCASTS
在 SageMaker 上利用 veRL 与 Ray 训练 CodeFu-7B 2026-02-24 · BLOGS_PODCASTS
使用veRL和Ray在SageMaker上训练CodeFu-7B模型 2026-02-24 · BLOGS_PODCASTS
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 2026-02-24 · BLOGS_PODCASTS
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 2026-02-24 · BLOGS_PODCASTS
Hexagon 利用 SageMaker HyperPod 规模化生产分割模型 2026-02-24 · BLOGS_PODCASTS
Hexagon 利用 SageMaker HyperPod 加速分割模型预训练 2026-02-24 · BLOGS_PODCASTS
Multi-Head LatentMoE 与 Head 并行：通信高效的确定性 MoE 并行策略 2026-02-06 · ARXIV
Multi-Head LatentMoE与Head并行：通信高效且确定性的MoE方案 2026-02-05 · ARXIV
利用权重更新稀疏性的通信高效分布式强化学习 2026-02-04 · ARXIV