红队测试

条目：11

2026年二月 11 篇

类型	阅读	条目
[自动] [HACKER_NEWS]	4min	newspaper 53 款模型参与“洗车”基准测试 02-23 基准测试模型评估 LLM
[自动] [BLOGS_PODCASTS]	2min	mic MIT新方法揭示大模型隐藏偏差并提升安全性 02-23 MIT LLM 模型安全
[自动] [BLOGS_PODCASTS]	2min	mic MIT新方法根除漏洞并提升大语言模型安全性与性能 02-20 LLM MIT 模型安全
[自动] [BLOGS_PODCASTS]	2min	mic LinqAlpha利用Amazon Bedrock构建“魔鬼代言人”代理评估投资论点 02-12 Amazon Bedrock 多智能体 AI Agent
[自动] [HACKER_NEWS]	4min	newspaper Frontier AI agents violate ethical constraints 30–50% o 02-10 AI Agent 对齐伦理
[自动] [HACKER_NEWS]	3min	newspaper Frontier AI agents violate ethical constraints 30–50% o 02-10 AI Agents 伦理约束对齐
[自动] [HACKER_NEWS]	4min	newspaper 评估与缓解大模型发现零日漏洞的新兴风险 02-07 LLM 零日漏洞漏洞挖掘
[自动] [HACKER_NEWS]	4min	newspaper 评估与缓解大模型发现的零日漏洞风险 02-07 LLM 零日漏洞漏洞挖掘
[自动] [HACKER_NEWS]	7min	newspaper Agent Arena：评估 AI 智能体抗操纵能力的平台 02-06 Agent Arena AI Agent 抗操纵
[自动] [HACKER_NEWS]	7min	newspaper Agent Arena：评估 AI 智能体抗操纵能力的测试平台 02-06 Agent Arena AI 智能体抗操纵
[自动] [HACKER_NEWS]	3min	newspaper 心理越狱揭示前沿模型内部冲突 02-05 越狱心理测量前沿模型