目录
内存优化
条目:10
2026年三月
6 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
POET-X:基于正交变换缩放的内存高效LLM训练方法 03-09
LLM
训练优化
内存优化 |
[自动]
[ARXIV] | 4min | school
POET-X:通过正交变换扩展实现LLM高效训练 03-08
LLM
POET-X
模型训练 |
[自动]
[ARXIV] | 4min | school
POET-X:通过正交变换扩展实现LLM高效训练 03-07
LLM
训练优化
内存优化 |
[自动]
[ARXIV] | 4min | school
POET-X:通过正交变换扩展实现大模型高效训练 03-06
POET-X
LLM训练
正交变换 |
[自动]
[HACKER_NEWS] | 1min | newspaper
根据系统硬件配置动态调整LLM模型规模 03-02
LLM
模型压缩
硬件适配 |
[自动]
[ARXIV] | 4min | school
FlashOptim:面向内存高效训练的优化器 03-01
FlashOptim
内存优化
训练优化器 |
2026年二月
4 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
FlashOptim:面向内存高效训练的优化器 02-27
FlashOptim
内存优化
训练优化器 |
[自动]
[ARXIV] | 5min | school
Headwise Chunking:面向上下文并行的内存高效方案 02-25
上下文并行
长文本训练
内存优化 |
[自动]
[HACKER_NEWS] | 1min | newspaper
单张RTX 3090利用NVMe直通运行Llama 3.1 70B 02-22
Llama 3.1
RTX 3090
NVMe |
[自动]
[HACKER_NEWS] | 1min | newspaper
单张RTX 3090运行Llama 3.1 70B:NVMe直通GPU方案 02-22
Llama 3.1
RTX 3090
NVMe |
无匹配条目