terminal

AI Stack

rss_feed
SYS_STABLE
目录

红队测试

条目:11
2026年二月 11 篇
类型阅读条目
[自动] [HACKER_NEWS]
4minnewspaper 53 款模型参与“洗车”基准测试
02-23 基准测试 模型评估 LLM
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法揭示大模型隐藏偏差并提升安全性
02-23 MIT LLM 模型安全
[自动] [BLOGS_PODCASTS]
2minmic MIT新方法根除漏洞并提升大语言模型安全性与性能
02-20 LLM MIT 模型安全
[自动] [BLOGS_PODCASTS]
2minmic LinqAlpha利用Amazon Bedrock构建“魔鬼代言人”代理评估投资论点
02-12 Amazon Bedrock 多智能体 AI Agent
[自动] [HACKER_NEWS]
4minnewspaper Frontier AI agents violate ethical constraints 30–50% o
02-10 AI Agent 对齐 伦理
[自动] [HACKER_NEWS]
3minnewspaper Frontier AI agents violate ethical constraints 30–50% o
02-10 AI Agents 伦理约束 对齐
[自动] [HACKER_NEWS]
4minnewspaper 评估与缓解大模型发现零日漏洞的新兴风险
02-07 LLM 零日漏洞 漏洞挖掘
[自动] [HACKER_NEWS]
4minnewspaper 评估与缓解大模型发现的零日漏洞风险
02-07 LLM 零日漏洞 漏洞挖掘
[自动] [HACKER_NEWS]
7minnewspaper Agent Arena:评估 AI 智能体抗操纵能力的平台
02-06 Agent Arena AI Agent 抗操纵
[自动] [HACKER_NEWS]
7minnewspaper Agent Arena:评估 AI 智能体抗操纵能力的测试平台
02-06 Agent Arena AI 智能体 抗操纵
[自动] [HACKER_NEWS]
3minnewspaper 心理越狱揭示前沿模型内部冲突
02-05 越狱 心理测量 前沿模型