目录
AI对齐
条目:13
2026年二月
12 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 3min | school
基于优化的系统为何难以实现规范响应:代理与架构限制 02-27
RLHF
AI对齐
智能体 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 承诺 750 万美元资助独立 AI 对齐研究 02-21
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 投入 750 万美元资助独立 AI 对齐研究 02-20
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 投入 750 万美元资助独立 AI 对齐研究 02-20
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 投入750万美元资助独立AI对齐研究 02-20
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 投 750 万美元资助独立 AI 对齐研究 02-20
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI 投 750 万美元资助独立 AI 对齐研究 02-19
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
理性人无目标论:AI对齐应基于实践协调而非终极目的 02-19
AI对齐
正交性论题
美德伦理 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
OpenAI出资750万美元资助独立AI对齐研究 02-19
OpenAI
AI对齐
AGI安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
美德伦理在AI对齐中的有效性 02-19
AI对齐
美德伦理
AI安全 |
[自动]
[ARXIV] | 3min | school
能力导向训练引发大模型对齐风险研究 02-13
AI对齐
强化学习
奖励黑客 |
[自动]
[ARXIV] | 4min | school
基于文本反馈扩展强化学习的能力 02-03
强化学习
RLHF
文本反馈 |
2026年一月
1 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[ARXIV] | 4min | school
🔥模型自学革命!突破可学习性边界,推理能力暴涨! 01-28
SOAR
强化学习
推理能力 |
无匹配条目