目录
优化算法
条目:2
2026年三月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
Adam为何优于SGD:二阶矩归一化产生更尖锐的尾部 03-04
优化算法
Adam
SGD |
2026年一月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 6min | school
为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理 01-30
Adam优化器
梯度尺度不变性
深度学习 |
无匹配条目
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
Adam为何优于SGD:二阶矩归一化产生更尖锐的尾部 03-04
优化算法
Adam
SGD |
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 6min | school
为何Adam在$β_1=β_2$时更优:缺失的梯度尺度不变性原理 01-30
Adam优化器
梯度尺度不变性
深度学习 |