terminal

AI Stack

rss_feed
SYS_STABLE
目录

Llama

条目:23
2026年三月 16 篇
类型阅读条目
[自动] [HACKER_NEWS]
1minnewspaper LLM 架构画廊:主流大语言模型结构概览
03-16 LLM Transformer 模型架构
[自动] [BLOGS_PODCASTS]
3minmic Untitled
03-12 LLM Llama Oumi
[自动] [BLOGS_PODCASTS]
5minmic 在 EC2 上使用 Oumi 微调 Llama 并将其部署至 Amazon Bedrock
03-12 LLM Llama 微调
[自动] [BLOGS_PODCASTS]
3minmic 在 EC2 上使用 Oumi 微调 Llama 并将其部署至 Amazon Bedrock
03-11 LLM Llama 微调
[自动] [BLOGS_PODCASTS]
3minmic 利用Oumi在EC2微调Llama并导入Bedrock部署
03-11 Llama Oumi Amazon Bedrock
[自动] [BLOGS_PODCASTS]
2minmic 在 EC2 上使用 Oumi 微调并部署 Llama 至 Amazon Bedrock
03-11 LLM Llama Oumi
[自动] [BLOGS_PODCASTS]
5minmic 在 EC2 上使用 Oumi 微调并部署 Llama 至 Amazon Bedrock
03-11 LLM Llama 微调
[自动] [BLOGS_PODCASTS]
4minmic 在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock
03-11 LLM Llama 微调
[自动] [BLOGS_PODCASTS]
3minmic 在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock
03-10 LLM Llama 微调
[自动] [BLOGS_PODCASTS]
4minmic 在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock
03-10 LLM Llama Oumi
[自动] [BLOGS_PODCASTS]
4minmic 在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock
03-10 Oumi Llama Amazon Bedrock
[自动] [HACKER_NEWS]
1minnewspaper 双游戏显卡登顶HuggingFace开源大模型排行榜
03-10 HuggingFace LLM 排行榜
[自动] [BLOGS_PODCASTS]
4minmic Ulysses序列并行技术实现百万Token上下文训练
03-10 Ulysses 序列并行 长上下文
[自动] [ARXIV]
4minschool 通过低秩近似优化大模型动量状态以降低显存占用
03-03 LoRA-Pre 低秩近似 优化器
[自动] [ARXIV]
5minschool 通过低秩近似优化大模型动量状态以降低显存占用
03-02 LoRA-Pre 低秩近似 优化器
[自动] [ARXIV]
5minschool FlashOptim:面向大模型内存高效训练的优化器
03-02 FlashOptim 显存优化 训练优化器
2026年二月 2 篇
类型阅读条目
[自动] [ARXIV]
3minschool 土耳其语子词策略大规模评估:数据、词表与形态交互
02-09 Subword Tokenization 土耳其语
[自动] [ARXIV]
3minschool 挖掘模型仓库中的隐藏价值
02-01 模型评估 Llama 微调
2026年一月 5 篇
类型阅读条目
[自动] [ARXIV]
4minschool 发现模型仓库中的隐藏价值
01-31 模型评估 Llama 多臂老虎机
[自动] [ARXIV]
3minschool 机器翻译评估中的跨向污染问题研究
01-29 机器翻译 数据污染 FLORES
[自动] [BLOGS_PODCASTS]
3minmic 中国开源AI生态:超越DeepSeek的架构突围!🏗️🔥
01-28 DeepSeek MoE 架构设计
[自动] [BLOGS_PODCASTS]
3minmic 🔥实战复盘:解锁GPT-OSS的智能体RL训练秘籍!
01-28 强化学习 智能体 Llama
[自动] [ARXIV]
4minschool 💥MortalMATH:当推理目标遇上紧急场景,AI会“翻车”吗?
01-28 LLM 推理模型 MortalMATH