TAGS / TERM

Llama

共 23 篇

LLM 架构画廊：主流大语言模型结构概览 2026-03-16 · HACKER_NEWS
Untitled 2026-03-12 · BLOGS_PODCASTS
在 EC2 上使用 Oumi 微调 Llama 并将其部署至 Amazon Bedrock 2026-03-12 · BLOGS_PODCASTS
在 EC2 上使用 Oumi 微调 Llama 并将其部署至 Amazon Bedrock 2026-03-11 · BLOGS_PODCASTS
利用Oumi在EC2微调Llama并导入Bedrock部署 2026-03-11 · BLOGS_PODCASTS
在 EC2 上使用 Oumi 微调并部署 Llama 至 Amazon Bedrock 2026-03-11 · BLOGS_PODCASTS
在 EC2 上使用 Oumi 微调并部署 Llama 至 Amazon Bedrock 2026-03-11 · BLOGS_PODCASTS
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 2026-03-11 · BLOGS_PODCASTS
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 2026-03-10 · BLOGS_PODCASTS
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 2026-03-10 · BLOGS_PODCASTS
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 2026-03-10 · BLOGS_PODCASTS
双游戏显卡登顶HuggingFace开源大模型排行榜 2026-03-10 · HACKER_NEWS
Ulysses序列并行技术实现百万Token上下文训练 2026-03-10 · BLOGS_PODCASTS
通过低秩近似优化大模型动量状态以降低显存占用 2026-03-03 · ARXIV
通过低秩近似优化大模型动量状态以降低显存占用 2026-03-02 · ARXIV
FlashOptim：面向大模型内存高效训练的优化器 2026-03-02 · ARXIV
土耳其语子词策略大规模评估：数据、词表与形态交互 2026-02-09 · ARXIV
挖掘模型仓库中的隐藏价值 2026-02-01 · ARXIV
发现模型仓库中的隐藏价值 2026-01-31 · ARXIV
机器翻译评估中的跨向污染问题研究 2026-01-29 · ARXIV
中国开源AI生态：超越DeepSeek的架构突围！🏗️🔥 2026-01-28 · BLOGS_PODCASTS
🔥实战复盘：解锁GPT-OSS的智能体RL训练秘籍！ 2026-01-28 · BLOGS_PODCASTS
💥MortalMATH：当推理目标遇上紧急场景，AI会“翻车”吗？ 2026-01-28 · ARXIV