目录
模型可解释性
条目:8
2026年四月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 1min | school
大语言模型生成有害内容的统一机制 04-13
大语言模型
有害内容
权重剪枝 |
2026年三月
3 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 2min | school
潜在色彩子空间:高维混沌中的涌现秩序 03-14
FLUX.1
文生图
VAE |
[自动]
[HACKER_NEWS] | 1min | newspaper
决策树:嵌套决策规则的非凡效能 03-01
决策树
机器学习
算法 |
[自动]
[HACKER_NEWS] | 1min | newspaper
决策树:嵌套决策规则的强大效能 03-01
决策树
机器学习
算法 |
2026年二月
4 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[BLOGS_PODCASTS] | 2min | mic
麻省理工学院新方法根除漏洞并提升大语言模型安全性 02-20
MIT
LLM
模型安全 |
[自动]
[HACKER_NEWS] | 4min | newspaper
Anthropic 试图隐藏 Claude AI 行为引发开发者不满 02-16
Anthropic
Claude
开发者 |
[自动]
[ARXIV] | 1min | school
循环Transformer的步级数据归因方法 02-11
Transformer
数据归因
模型可解释性 |
[自动]
[ARXIV] | 3min | school
大语言模型稀疏奖励子系统 02-03
LLM
稀疏奖励
价值神经元 |
无匹配条目