MoE

条目：58

2026年二月 45 篇

类型	阅读	条目
[自动] [BLOGS_PODCASTS]	2min	mic Transformer中的混合专家模型架构解析 02-27 Transformer MoE 混合专家
[自动] [BLOGS_PODCASTS]	5min	mic 利用 vLLM 在 SageMaker 与 Bedrock 上高效托管多 LoRA 模型 02-27 vLLM LoRA SageMaker
[自动] [BLOGS_PODCASTS]	3min	mic Transformer架构中的混合专家模型原理与应用 02-27 Transformer MoE 混合专家模型
[自动] [BLOGS_PODCASTS]	5min	mic 在 SageMaker 与 Bedrock 上利用 vLLM 部署多 LoRA 推理 02-26 vLLM LoRA SageMaker
[自动] [BLOGS_PODCASTS]	2min	mic Transformer 架构中的混合专家模型原理与优势 02-26 MoE Transformer 混合专家
[自动] [BLOGS_PODCASTS]	5min	mic 利用vLLM在SageMaker AI与Bedrock上高效托管多LoRA模型 02-26 vLLM LoRA SageMaker
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家
[自动] [BLOGS_PODCASTS]	4min	mic 在 SageMaker 与 Bedrock 上利用 vLLM 实现多 LoRA 推理及内核优化 02-26 vLLM LoRA SageMaker
[自动] [BLOGS_PODCASTS]	2min	mic Transformer中的混合专家模型：架构原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	4min	mic 在 SageMaker AI 与 Bedrock 上高效部署多 LoRA 模型 02-26 vLLM LoRA SageMaker
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	5min	mic 在 SageMaker AI 与 Amazon Bedrock 上使用 vLLM 高效部署多 LoRA 模型 02-26 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 MoE Transformer 混合专家模型
[自动] [BLOGS_PODCASTS]	5min	mic 在SageMaker AI与Bedrock上利用vLLM高效部署多LoRA及MoE模型 02-26 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]	2min	mic Transformer架构中的混合专家模型原理与应用 02-26 Transformer MoE 混合专家模型
[自动] [BLOGS_PODCASTS]	5min	mic 在 SageMaker AI 与 Bedrock 上使用 vLLM 高效服务多 LoRA 模型 02-26 vLLM LoRA MoE
[自动] [JUEJIN]	2min	sticky_note_2 大模型非线性变换解析：从MLP到MoE的架构演进 02-26 非线性变换 MLP MoE
[自动] [BLOGS_PODCASTS]	5min	mic 利用vLLM在SageMaker与Bedrock上高效部署多LoRA及MoE模型 02-26 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]	5min	mic 在 SageMaker AI 与 Bedrock 上利用 vLLM 高效部署多 LoRA 模型 02-25 vLLM LoRA MoE
[自动] [BLOGS_PODCASTS]	2min	mic Qwen3.5-397B-A17B：最小Open-Opus级高效模型 02-19 Qwen3.5 Qwen MoE
[自动] [BLOGS_PODCASTS]	3min	mic Qwen3.5-397B-A17B：最小Open-Opus级高效模型 02-19 Qwen3.5 MoE 稀疏模型
[自动] [BLOGS_PODCASTS]	2min	mic Qwen3.5-397B-A17B：最小Open-Opus级高效模型 02-18 Qwen3.5 通义千问 Open-Opus
[自动] [BLOGS_PODCASTS]	3min	mic Qwen3.5-397B-A17B：最小Open-Opus级高效模型 02-18 Qwen3.5 Qwen MoE
[自动] [BLOGS_PODCASTS]	2min	mic Qwen3.5-397B-A17B：最小Open-Opus级高效模型 02-18 Qwen3.5 Qwen MoE
[自动] [BLOGS_PODCASTS]	2min	mic Jeff Dean：重写搜索栈、复兴稀疏模型与TPU协同设计 02-18 Jeff Dean TPU 稀疏模型
[自动] [BLOGS_PODCASTS]	2min	mic Qwen3.5-397B-A17B：最小Open-Opus级高效模型 02-18 Qwen3.5 Qwen MoE
[自动] [BLOGS_PODCASTS]	2min	mic Qwen3.5-397B-A17B：最小的高效Open-Opus级模型 02-17 Qwen3.5 Qwen MoE
[自动] [JUEJIN]	2min	sticky_note_2 Qwen3.5-397B-A17B：极致稀疏MoE架构与多模态能力详解 02-17 Qwen3.5 MoE 多模态
[自动] [BLOGS_PODCASTS]	3min	mic Jeff Dean：重塑搜索架构、复兴稀疏模型与设计TPU 02-17 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]	2min	mic Z.ai GLM-5开源：Opus 4.5级性能的新SOTA模型 02-15 GLM-5 Z.ai SOTA
[自动] [BLOGS_PODCASTS]	3min	mic Jeff Dean：重写搜索栈、复兴稀疏模型与设计TPU 02-15 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]	2min	mic Jeff Dean：重塑Google搜索栈与TPU联合设计之路 02-14 Jeff Dean TPU 稀疏模型
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS 02-13 NVIDIA Nemotron SageMaker
[自动] [BLOGS_PODCASTS]	3min	mic Jeff Dean：重塑谷歌搜索架构与TPU及稀疏模型的技术演进 02-13 Jeff Dean Google TPU
[自动] [BLOGS_PODCASTS]	3min	mic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-13 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]	5min	mic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 现已在 Amazon SageMaker JumpSta 02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12 NVIDIA AWS SageMaker
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]	4min	mic NVIDIA Nemotron 3 Nano 30B 模型现已在 Amazon SageMaker JumpS 02-12 NVIDIA Nemotron AWS
[自动] [BLOGS_PODCASTS]	3min	mic NVIDIA Nemotron 3 Nano 30B 现已登陆 Amazon SageMaker JumpSt 02-12 NVIDIA Nemotron AWS
[自动] [ARXIV]	5min	school Multi-Head LatentMoE 与 Head 并行：通信高效的确定性 MoE 并行策略 02-06 MoE 分布式训练通信优化
[自动] [ARXIV]	5min	school Multi-Head LatentMoE与Head并行：通信高效且确定性的MoE方案 02-05 MoE 分布式训练通信优化

2026年一月 13 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	4min	newspaper Kimi K2.5 技术报告发布：模型架构与性能评估 01-31 Kimi K2.5 技术报告模型架构
[自动] [HACKER_NEWS]	7min	newspaper 月之暗面发布Kimi K2.5技术报告 01-30 Kimi K2.5 月之暗面
[自动] [HACKER_NEWS]	5min	newspaper Trinity Large：开源4000亿稀疏MoE模型 01-29 MoE 稀疏模型 Trinity
[自动] [HACKER_NEWS]	4min	newspaper Trinity Large：开源4000亿稀疏MoE模型 01-29 MoE 稀疏模型 Trinity
[自动] [HACKER_NEWS]	4min	newspaper Trinity Large：开源4000亿稀疏MoE模型 01-29 MoE 稀疏模型 Trinity
[自动] [HACKER_NEWS]	4min	newspaper Trinity Large：开源4000亿稀疏MoE模型 01-29 MoE 稀疏模型 Trinity
[自动] [HACKER_NEWS]	7min	newspaper Trinity Large：开源4000亿稀疏MoE模型 01-29 MoE 稀疏模型 Trinity
[自动] [HACKER_NEWS]	5min	newspaper Trinity Large：开源4000亿参数稀疏MoE模型 01-29 MoE 稀疏模型 Trinity
[自动] [BLOGS_PODCASTS]	2min	mic 中国开源AI生态架构选择：DeepSeek之外的路径 01-29 DeepSeek MoE 混合专家模型
[自动] [HACKER_NEWS]	5min	newspaper Trinity Large：开源4000亿稀疏MoE模型 01-29 MoE 稀疏模型 Trinity
[自动] [BLOGS_PODCASTS]	3min	mic 中国开源AI生态：超越DeepSeek的架构突围！🏗️🔥 01-28 DeepSeek MoE 架构设计
[自动] [BLOGS_PODCASTS]	3min	mic 🇨🇳中国开源AI生态：破局DeepSeek！架构选择的深层洞察 01-28 DeepSeek Qwen MoE
[自动] [BLOGS_PODCASTS]	4min	mic 🇨🇳中国开源AI生态：深求之外，架构如何突围？🚀 01-27 DeepSeek 架构设计 MoE