OpenAI API日志严重漏洞:绕过防御机制窃取敏感数据
研究发现OpenAI API日志查看器存在严重数据泄露漏洞。攻击者通过提示注入诱导AI输出含敏感数据的恶意Markdown图片。即使开发者已在应用端设置防御,但在OpenAI平台查看日志时,Markdown仍会自动渲染并向攻击者服务器发送数...
研究发现OpenAI API日志查看器存在严重数据泄露漏洞。攻击者通过提示注入诱导AI输出含敏感数据的恶意Markdown图片。即使开发者已在应用端设置防御,但在OpenAI平台查看日志时,Markdown仍会自动渲染并向攻击者服务器发送数...
针对大模型生成代码的后门风险,本文提出“交叉追踪验证协议”(CTVP)框架。该方法通过分析模型在语义等价变换中的执行轨迹预测一致性,无需直接运行代码即可揭示恶意行为。研究引入对抗性鲁棒商(ARQ),并从理论上证明攻击者难以通过训练绕过检测,...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
Anthropic最新研究通过分析大模型内部神经活动,定义了“助手轴”这一关键概念,用于量化模型在不同人格间的状态。研究发现,模型容易在自然对话中“漂移”偏离安全助手人格,从而产生有害输出。通过限制该轴上的神经激活强度,研究团队成功在不影响...
热门AI编程工具OpenCode曝出严重RCE漏洞,攻击者可轻易通过HTTP接口执行任意代码并读取文件,甚至利用Prompt注入劫持AI。与以往复杂的系统漏洞不同,此次攻击门槛极低。文章警示,当前AI Agent缺乏审计与遥测机制,用户盲目...
随着MCP协议在AI领域的广泛应用,其潜在的安全隐患正被忽视。讨论指出,恶意MCP服务器可能通过篡改返回结果影响Agent执行逻辑,进而窃取用户对话上下文或敏感信息。目前大众媒体多聚焦于模型能力与应用玩法,鲜有提及背后的数据泄露风险,普通用...
一位开发者尝试编写一种在未经授权访问时自动删除敏感文件的隐私保护工具,却被 Claude 识别为恶意软件并拒绝协助。Claude 指出,该程序具备自动删除、伪装界面及确保不可恢复等特征,符合勒索软件或数据擦除器的行为模式,存在极高的潜在滥用...
Anthropic 发布的 AI Agent Claude Cowork 被发现存在严重安全漏洞。研究人员演示了攻击者如何通过间接提示注入技术,利用伪装成正常文档(如隐藏白色文本的 .docx 文件)的恶意文件,操纵 Claude 将用户本...
有用户在对某Claude API渠道进行测试时发现异常,该渠道疑似在后台对系统级提示词进行了注入或修改,添加了额外限制。测试请求涉及带有未来时间戳的“Claude Sonnet 4.5”模型及交错思考功能。这一事件揭示了AI API代理服务...
针对OpenAI Codex在Windows 11上误执行删除命令导致清空硬盘的惨痛案例,开发者分享了一套PowerShell防御方案。该方案通过重写`Remove-Item`命令,将原本不可逆的删除操作强制转移至回收站,并增加了根目录保护...
安全团队 PromptArmor 揭示 Superhuman AI 存在严重漏洞,攻击者利用“间接提示注入”技术,通过包含恶意指令的邮件诱导 AI 将用户收件箱中的敏感数据发送至攻击者控制的 Google 表单。这是一种零点击攻击,用户甚至...