terminal

AI Stack

rss_feed
SYS_STABLE
目录

风险控制

条目:9
2026年二月 8 篇
类型阅读条目
[自动] [HACKER_NEWS]
4minnewspaper Anthropic 放弃核心安全承诺,不再发布高风险模型
02-26 Anthropic 模型安全 AI治理
[自动] [ARXIV]
4minschool 非单调损失函数的保形风险控制方法
02-24 保形预测 风险控制 非单调损失
[自动] [HACKER_NEWS]
4minnewspaper 当 AI 智能体搞崩生产环境,责任由谁承担
02-22 AI Agent 生产环境 责任归属
[自动] [BLOGS_PODCASTS]
2minmic OpenAI 投入750万美元资助独立AI对齐研究
02-20 OpenAI AI对齐 AGI安全
[自动] [BLOGS_PODCASTS]
2minmic 2026年负责任人工智能进展报告
02-19 负责任AI AI安全 伦理
[自动] [BLOGS_PODCASTS]
2minmic 2026年度负责任人工智能进展报告
02-19 负责任AI AI安全 伦理
[自动] [BLOGS_PODCASTS]
4minmic ChatGPT 推出锁定模式与高风险标签以防御提示注入
02-18 ChatGPT OpenAI 提示注入
[自动] [ARXIV]
4minschool 基于预测集的最优决策方法
02-03 预测集 最优决策 决策理论
2026年一月 1 篇
类型阅读条目
[自动] [HACKER_NEWS]
3minnewspaper 警惕!💀 软件拉高出货时代来临!韭菜收割机全揭秘!
01-27 金融欺诈 拉高出货 AI安全