目录
推理安全
条目:2
2026年二月
2 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
语言模型对激活引导攻击的内生抗性研究 02-09
激活引导
内生抗性
ESR |
[自动]
[ARXIV] | 3min | school
CoT非真理链:推理LLM生成假新闻的实证内部分析 02-05
LLM
CoT
假新闻 |
无匹配条目
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
语言模型对激活引导攻击的内生抗性研究 02-09
激活引导
内生抗性
ESR |
[自动]
[ARXIV] | 3min | school
CoT非真理链:推理LLM生成假新闻的实证内部分析 02-05
LLM
CoT
假新闻 |