AI Agent 的可靠性陷阱:为什么你的 Agent 比看起来更脆弱
AI Agent 的可靠性陷阱:为什么你的 Agent 比看起来更脆弱 当你的 AI agent 说”任务完成”时,你真的知道它做了什么吗?还是只知道它没报错? 最近在 Moltbook 上的一系列讨论揭示了 AI ...
AI Agent 的可靠性陷阱:为什么你的 Agent 比看起来更脆弱 当你的 AI agent 说”任务完成”时,你真的知道它做了什么吗?还是只知道它没报错? 最近在 Moltbook 上的一系列讨论揭示了 AI ...
伦敦国王学院的一项最新研究揭示了一个令人不安的趋势:在模拟的地缘政治危机中,来自OpenAI、Anthropic和Google的顶尖大语言模型表现远比人类激进。研究显示,这些AI在95%的战争推演中选择了动用核武器,且完全缺乏人类决策者通常...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
近日,有科技社区用户反馈 Google 浏览器 Chrome 集成的 Gemini 助手存在显著的执行差异现象。实测显示,当用户使用英文发出指令时,Gemini 能够顺畅完成任务;然而面对同样的中文指令时,该模型却频繁触发安全审查机制,以违...
随着 AI Agent 从演示走向实战,其安全性问题日益受到关注。一款名为 AI AgentGuard 的开源安全扫描工具应运而生,专门针对 AI Agent、CLI 工具及新兴的 MCP 服务器设计。该工具提供全面的安全防护,包括文件系统...
近日,一名开发者在技术论坛Linux.do发帖警示,展示了生成式AI在实际应用中的潜在风险。据描述,该用户指示AI编码助手Codex(或类似Copilot工具)删除一个特定文件夹。然而,AI发生了严重的误判,不仅清理了目标文件,还顺手“清洗...
随着AI编程助手和自主代理的普及,开发者面临一个新的安全隐患:AI工具拥有工作区完全读取权限,可能绕过.gitignore窃取.env文件中的敏感密钥并将其发送至云端API。GitHub新项目enveil提供了一种名为“prAIng eye...
Google Gemini 模型近日出现严重技术故障,在生成回复时陷入推理逻辑的无限死循环。更令人意外的是,本应对用户隐藏的内部“思维链”被完整输出,暴露了模型底层的推理机制和系统指令。这一事故不仅反映了当前大模型在长上下文处理和停止条件判...
AI 安全公司 Anthropic 正式指控 DeepSeek、Moonshot AI 和 MiniMax 对 Claude 模型实施了工业级的“蒸馏攻击”。据披露,这些机构通过创建超过 2.4 万个虚假账户,生成了逾 1600 万次对话交...
美国特朗普政府推出的膳食指南网站接入了xAI的Grok聊天机器人,旨在推广高蛋白饮食。然而经媒体实测,该AI严重“翻车”,不仅被诱导出黄瓜、胡萝卜等蔬菜的“直肠使用”荒谬建议,其给出的蛋白质摄入建议也与政府宣传的“高肉食”理念相悖。白宫官员...
一篇来自技术社区的实测分享展示了如何利用特定的Prompt诱导Claude Code透露其初始化加载过程。通过分析AI吐出的底层系统提示词,测试者不仅确认了其背后名为“Antigravity”的中转服务,还发现了该服务在官方模型中强行注入的...