TAGS / TERM

红队测试

共 29 篇

Zico Kolter等解读AI安全：超越网络安全视角 2026-06-23 · BLOGS_PODCASTS
ASMR-Bench：机器学习研究破坏行为审计基准 2026-04-20 · ARXIV
开源红队测试平台：针对AI智能体的漏洞利用与评估 2026-03-16 · HACKER_NEWS
OpenAI收购AI安全平台Promptfoo以修复系统漏洞 2026-03-10 · BLOGS_PODCASTS
审查大模型作为秘密知识提取的自然测试床 2026-03-08 · ARXIV
OpenAI推出CoT-Control：强化推理模型可监控性 2026-03-08 · BLOGS_PODCASTS
GPT-5.4 Thinking系统卡发布：技术机制与安全评估 2026-03-08 · BLOGS_PODCASTS
GPT-5.4 Thinking 系统卡发布：技术架构与安全策略详解 2026-03-08 · BLOGS_PODCASTS
GPT-5.4 Thinking 系统卡发布：技术原理与安全机制详解 2026-03-07 · BLOGS_PODCASTS
审查版大模型作为秘密知识提取的自然测试床 2026-03-07 · ARXIV
审查大模型作为秘密知识提取的自然测试床 2026-03-06 · ARXIV
GPT-5.3 Instant 系统卡发布：技术规格与安全机制详解 2026-03-04 · BLOGS_PODCASTS
GPT-5.3 Instant 系统卡发布：模型规格与安全策略详解 2026-03-04 · BLOGS_PODCASTS
GPT-5.3 Instant 系统卡发布：性能与安全机制详解 2026-03-04 · BLOGS_PODCASTS
GPT-5.3 Instant 系统卡发布：模型规格与安全策略详解 2026-03-04 · BLOGS_PODCASTS
GPT-5.3 即时版系统卡发布：性能与安全机制详解 2026-03-04 · BLOGS_PODCASTS
前沿模型低概率行动能力研究 2026-03-03 · ARXIV
GPT-5.3 Instant 系统卡发布：性能与安全机制详解 2026-03-03 · BLOGS_PODCASTS
53 款模型参与“洗车”基准测试 2026-02-23 · HACKER_NEWS
MIT新方法揭示大模型隐藏偏差并提升安全性 2026-02-23 · BLOGS_PODCASTS
MIT新方法根除漏洞并提升大语言模型安全性与性能 2026-02-20 · BLOGS_PODCASTS
LinqAlpha利用Amazon Bedrock构建“魔鬼代言人”代理评估投资论点 2026-02-12 · BLOGS_PODCASTS
Frontier AI agents violate ethical constraints 30–50% o 2026-02-10 · HACKER_NEWS
Frontier AI agents violate ethical constraints 30–50% o 2026-02-10 · HACKER_NEWS
评估与缓解大模型发现零日漏洞的新兴风险 2026-02-07 · HACKER_NEWS
评估与缓解大模型发现的零日漏洞风险 2026-02-07 · HACKER_NEWS
Agent Arena：评估 AI 智能体抗操纵能力的平台 2026-02-06 · HACKER_NEWS
Agent Arena：评估 AI 智能体抗操纵能力的测试平台 2026-02-06 · HACKER_NEWS
心理越狱揭示前沿模型内部冲突 2026-02-05 · HACKER_NEWS