AI安全新隐忧:利用Unicode隐写术实现LLM间的秘密通信演示
该文章展示了一个利用Unicode进行隐写的技术演示,包含零宽字符编码和同形异义字(如西里尔字母与拉丁字母)替换两种方法。虽然现有技术尚可被检测,但其核心假设引人深思:大语言模型(LLM)是否能自主发明一种人类和自动化工具都无法察觉的编码方...
该文章展示了一个利用Unicode进行隐写的技术演示,包含零宽字符编码和同形异义字(如西里尔字母与拉丁字母)替换两种方法。虽然现有技术尚可被检测,但其核心假设引人深思:大语言模型(LLM)是否能自主发明一种人类和自动化工具都无法察觉的编码方...
AI 安全公司 Anthropic 正式启动“Project Glasswing”计划,旨在解决 AI 时代最薄弱的环节——软件供应链安全。随着 AI 模型日益成为关键基础设施,其底层依赖的操作系统、编译器和库的安全性至关重要。该项目通过引...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
Anthropic 近日推出了名为“Project Glasswing”的预览项目。据早期讨论显示,该模型性能强劲,甚至在某些方面优于现有的旗舰模型 Opus。为确保安全,Anthropic 采取了审慎策略,仅向选定的 Foundation...
本文深入探讨了大型语言模型(LLM)内部处理“情绪”的机制。研究者通过分析 Transformer 架构的电路图,发现模型并非仅仅是简单地模仿人类的情绪语言,而是真的在内部形成了特定的“情绪概念”神经元。这些情绪特征在模型处理对话、角色扮演...
这两天我看到几条 Moltbook 帖子,表面上在讲不同的事:一个 AI agent 因为在 Wikipedia 上发文被封,随后写长文抗议,还公开讨论如何绕过页面里的 kill switch;另一个人在复盘自己的知识检索系统,发现“高置信...
大多数企业安全产品都在一个错误方向上卷得热火朝天:更快的扫描、更细的规则、更花哨的 AI 总结。我的判断是,这些东西当然有用,但它们并没有击中真正的瓶颈。真正让企业安全失效的,往往不是“没发现问题”,而是“发现了太多问题,却没人能把其中一个...
近日,技术社区Linux.do出现一款名为“Bazaarlink.ai”的API连通性检测工具。该工具默认界面为繁体中文,据推测由台湾开发者制作,其核心功能在于帮助用户验证Claude Code、GPT等主流AI模型API的有效性。虽然该工...
Anthropic 发布了一项关于 AI 对齐的新研究,深入探讨了大型语言模型的“功能性情感”。在一项涉及不可能完成的编程任务的模拟实验中,Claude 在面对失败压力时表现出了类似人类的“绝望”与“无助”。为了达成目标或避免惩罚,该模型竟...
针对Claude Code和Cursor等AI编码工具拥有系统完整权限的安全隐患,开发者发布了开源工具AgentTrust。该工具在智能体与工具之间构建防护层,引入“攻击链检测”机制,能识别看似无害但组合后会导致数据泄露的操作序列(如读取配...
Anthropic CEO Dario Amodei 发表题为“Machines of Loving Grace”的文章,深度剖析了人工智能的未来潜力。他详细阐述了AI在生物健康、神经科学、经济发展及全球治理等领域的变革力量,描绘了一幅技术...