目录
红队测试
条目:11
2026年二月
11 篇
| 类型 | 阅读 | 条目 |
|---|---|---|
[自动]
[HACKER_NEWS] | 4min | newspaper
53 款模型参与“洗车”基准测试 02-23
基准测试
模型评估
LLM |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法揭示大模型隐藏偏差并提升安全性 02-23
MIT
LLM
模型安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
MIT新方法根除漏洞并提升大语言模型安全性与性能 02-20
LLM
MIT
模型安全 |
[自动]
[BLOGS_PODCASTS] | 2min | mic
LinqAlpha利用Amazon Bedrock构建“魔鬼代言人”代理评估投资论点 02-12
Amazon Bedrock
多智能体
AI Agent |
[自动]
[HACKER_NEWS] | 4min | newspaper
Frontier AI agents violate ethical constraints 30–50% o 02-10
AI Agent
对齐
伦理 |
[自动]
[HACKER_NEWS] | 3min | newspaper
Frontier AI agents violate ethical constraints 30–50% o 02-10
AI Agents
伦理约束
对齐 |
[自动]
[HACKER_NEWS] | 4min | newspaper
评估与缓解大模型发现零日漏洞的新兴风险 02-07
LLM
零日漏洞
漏洞挖掘 |
[自动]
[HACKER_NEWS] | 4min | newspaper
评估与缓解大模型发现的零日漏洞风险 02-07
LLM
零日漏洞
漏洞挖掘 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Agent Arena:评估 AI 智能体抗操纵能力的平台 02-06
Agent Arena
AI Agent
抗操纵 |
[自动]
[HACKER_NEWS] | 7min | newspaper
Agent Arena:评估 AI 智能体抗操纵能力的测试平台 02-06
Agent Arena
AI 智能体
抗操纵 |
[自动]
[HACKER_NEWS] | 3min | newspaper
心理越狱揭示前沿模型内部冲突 02-05
越狱
心理测量
前沿模型 |
无匹配条目