terminal

AI Stack

rss_feed
SYS_STABLE
目录

提示词注入

条目:19
2026年二月 17 篇
类型阅读条目
[自动] [HACKER_NEWS]
4minnewspaper 53款模型“洗车”测试
02-24 模型评估 基准测试 LLM
[自动] [HACKER_NEWS]
4minnewspaper 不要轻信盐值:AI摘要、多语言安全与大模型防护机制
02-19 LLM AI安全 提示词注入
[自动] [BLOGS_PODCASTS]
3minmic ChatGPT推出锁定模式与高风险标签,防范提示词注入及数据外泄
02-18 ChatGPT 提示词注入 数据安全
[自动] [BLOGS_PODCASTS]
2minmic ChatGPT 推出锁定模式与高风险标签以防御提示词注入
02-17 ChatGPT 提示词注入 锁定模式
[自动] [ARXIV]
3minschool 恶意提示词分类器在真实分布偏移下的评估方法
02-17 LLM安全 提示词注入 越狱攻击
[自动] [BLOGS_PODCASTS]
3minmic ChatGPT推出锁定模式与高风险标签防御提示词注入
02-16 ChatGPT OpenAI 提示词注入
[自动] [BLOGS_PODCASTS]
2minmic ChatGPT 推出锁定模式与高风险标签防御提示词注入
02-15 ChatGPT 提示词注入 锁定模式
[自动] [BLOGS_PODCASTS]
3minmic ChatGPT推出锁定模式与高危标签以防范提示词注入及数据外泄
02-14 ChatGPT 提示词注入 数据安全
[自动] [BLOGS_PODCASTS]
3minmic ChatGPT 推出锁定模式与高风险标签防御提示词注入
02-14 ChatGPT 提示词注入 Prompt Injection
[自动] [BLOGS_PODCASTS]
2minmic ChatGPT推出锁定模式与高风险标签防御提示词注入
02-13 ChatGPT OpenAI 提示词注入
[自动] [BLOGS_PODCASTS]
2minmic ChatGPT推出锁定模式与高风险标记以防御提示词注入
02-13 ChatGPT 提示词注入 企业安全
[自动] [HACKER_NEWS]
4minnewspaper 从通讯软件智能体中提取数据的方法
02-09 智能体 数据泄露 通讯软件
[自动] [HACKER_NEWS]
7minnewspaper Agent Arena:评估 AI 智能体抗操纵能力的平台
02-06 Agent Arena AI Agent 抗操纵
[自动] [HACKER_NEWS]
3minnewspaper 心理越狱揭示前沿模型内部冲突
02-06 越狱 心理测量 前沿模型
[自动] [HACKER_NEWS]
3minnewspaper 心理越狱揭示前沿模型的内部冲突
02-05 越狱 心理测量 前沿模型
[自动] [HACKER_NEWS]
3minnewspaper 心理越狱揭示前沿模型内部冲突
02-05 越狱 心理攻击 模型对齐
[自动] [HACKER_NEWS]
3minnewspaper 自动驾驶与无人机易受路牌提示词攻击
02-01 提示词注入 对抗性攻击 自动驾驶
2026年一月 2 篇
类型阅读条目
[自动] [HACKER_NEWS]
6minnewspaper 自动驾驶与无人机易受路牌提示词注入攻击
01-31 提示词注入 自动驾驶 无人机
[自动] [BLOGS_PODCASTS]
4minmic OpenAI 如何通过内置安全机制防范 AI 代理点击链接时的数据泄露与提示词注入
01-29 OpenAI AI代理 数据泄露