目录
Llama
条目:23
2026年三月
16 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 1min | newspaper
LLM 架构画廊:主流大语言模型结构概览 03-16
LLM
Transformer
模型架构 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
Untitled 03-12
LLM
Llama
Oumi |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 EC2 上使用 Oumi 微调 Llama 并将其部署至 Amazon Bedrock 03-12
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上使用 Oumi 微调 Llama 并将其部署至 Amazon Bedrock 03-11
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
利用Oumi在EC2微调Llama并导入Bedrock部署 03-11
Llama
Oumi
Amazon Bedrock |
[自动]
[BLOGS_PODCASTS] | 2min | mic
在 EC2 上使用 Oumi 微调并部署 Llama 至 Amazon Bedrock 03-11
LLM
Llama
Oumi |
[自动]
[BLOGS_PODCASTS] | 5min | mic
在 EC2 上使用 Oumi 微调并部署 Llama 至 Amazon Bedrock 03-11
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-11
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
LLM
Llama
微调 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
LLM
Llama
Oumi |
[自动]
[BLOGS_PODCASTS] | 4min | mic
在 EC2 上使用 Oumi 微调 Llama 并部署至 Amazon Bedrock 03-10
Oumi
Llama
Amazon Bedrock |
[自动]
[HACKER_NEWS] | 1min | newspaper
双游戏显卡登顶HuggingFace开源大模型排行榜 03-10
HuggingFace
LLM
排行榜 |
[自动]
[BLOGS_PODCASTS] | 4min | mic
Ulysses序列并行技术实现百万Token上下文训练 03-10
Ulysses
序列并行
长上下文 |
[自动]
[ARXIV] | 4min | school
通过低秩近似优化大模型动量状态以降低显存占用 03-03
LoRA-Pre
低秩近似
优化器 |
[自动]
[ARXIV] | 5min | school
通过低秩近似优化大模型动量状态以降低显存占用 03-02
LoRA-Pre
低秩近似
优化器 |
[自动]
[ARXIV] | 5min | school
FlashOptim:面向大模型内存高效训练的优化器 03-02
FlashOptim
显存优化
训练优化器 |
2026年二月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
土耳其语子词策略大规模评估:数据、词表与形态交互 02-09
Subword
Tokenization
土耳其语 |
[自动]
[ARXIV] | 3min | school
挖掘模型仓库中的隐藏价值 02-01
模型评估
Llama
微调 |
2026年一月
5 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
发现模型仓库中的隐藏价值 01-31
模型评估
Llama
多臂老虎机 |
[自动]
[ARXIV] | 3min | school
机器翻译评估中的跨向污染问题研究 01-29
机器翻译
数据污染
FLORES |
[自动]
[BLOGS_PODCASTS] | 3min | mic
中国开源AI生态:超越DeepSeek的架构突围!🏗️🔥 01-28
DeepSeek
MoE
架构设计 |
[自动]
[BLOGS_PODCASTS] | 3min | mic
🔥实战复盘:解锁GPT-OSS的智能体RL训练秘籍! 01-28
强化学习
智能体
Llama |
[自动]
[ARXIV] | 4min | school
💥MortalMATH:当推理目标遇上紧急场景,AI会“翻车”吗? 01-28
LLM
推理模型
MortalMATH |
无匹配条目