terminal

AI Stack

rss_feed
SYS_STABLE
目录

AI对齐

条目:13
2026年二月 12 篇
类型阅读条目
[自动] [ARXIV]
3minschool 基于优化的系统为何难以实现规范响应:代理与架构限制
02-27 RLHF AI对齐 智能体
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 承诺 750 万美元资助独立 AI 对齐研究
02-21 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投入 750 万美元资助独立 AI 对齐研究
02-20 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投入 750 万美元资助独立 AI 对齐研究
02-20 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投入750万美元资助独立AI对齐研究
02-20 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投 750 万美元资助独立 AI 对齐研究
02-20 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投 750 万美元资助独立 AI 对齐研究
02-19 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic 理性人无目标论:AI对齐应基于实践协调而非终极目的
02-19 AI对齐 正交性论题 美德伦理
[自动] [BLOGS_PODCASTS]
2minmic OpenAI出资750万美元资助独立AI对齐研究
02-19 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic 美德伦理在AI对齐中的有效性
02-19 AI对齐 美德伦理 AI安全
[自动] [ARXIV]
3minschool 能力导向训练引发大模型对齐风险研究
02-13 AI对齐 强化学习 奖励黑客
[自动] [ARXIV]
4minschool 基于文本反馈扩展强化学习的能力
02-03 强化学习 RLHF 文本反馈
2026年一月 1 篇
类型阅读条目
[自动] [ARXIV]
4minschool 🔥模型自学革命!突破可学习性边界,推理能力暴涨!
01-28 SOAR 强化学习 推理能力