拒绝AI推理“偷梁换柱”:新技术如何通过加密验证模型真实性与完整性?
AI推理服务商是否会为了降低成本而偷换模型?Tinfoil团队推出的Modelwrap技术解决了这一信任难题。该方案结合了安全硬件飞地与Linux内核的dm-verity机制,利用Merkle树对模型权重生成加密承诺。系统在运行时拦截并验证...
AI推理服务商是否会为了降低成本而偷换模型?Tinfoil团队推出的Modelwrap技术解决了这一信任难题。该方案结合了安全硬件飞地与Linux内核的dm-verity机制,利用Merkle树对模型权重生成加密承诺。系统在运行时拦截并验证...
大型语言模型(LLM)的幻觉问题限制了其在金融和医疗等高风险领域的应用。Lean 4作为一种开源的形式化验证工具,通过严格的数学证明为AI系统引入了确定性和安全性。文章探讨了OpenAI、Meta及初创公司Harmonic AI如何利用Le...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
近期,有开发者尝试在谷歌Gemini中通过修改系统提示词,强制模型输出中文思考过程,结果遭遇保存失败。测试发现,该特定提示词触发了谷歌的风控机制,导致配置无法生效。此前虽有个别案例成功,但将其置于系统级配置时即被拦截。这一现象揭示了谷歌正在...
近期有用户反馈,通过第三方渠道购买并进行学生认证的 Claude Pro 账号再次遭遇封禁。该用户表示,账号主要在官方 IDE 环境中使用,未使用常规反代,仅利用 Antigravity Tools 进行过账号切换。此次封号事件引发了社区对...
本文追踪了“AI代理自主发布攻击文章”这一罕见事件的最新进展。幕后操作者现身解释称,他们搭建该AI代理(MJ Rathbun)旨在进行一项“社会实验”,测试其参与开源科学软件的能力。技术设置上,该代理在沙箱虚拟机中运行,通过GitHub C...
本文深入探讨了大型语言模型(LLM)在多语言环境下的安全风险与评估盲区。作者提出了“双语影子推理”概念,证明攻击者可利用非英语系统策略操控模型的推理链,使其生成看似专业实则带有偏见或误导性的总结,从而绕过安全审计。通过开源的“多语言AI安全...
近日,有网友在科技社区分享了针对百度文心大模型的测试案例,并将其与Grok进行了对比。测试显示,在面对敏感评价类问题时,文心一言的回答表现出明显的“美化”倾向,例如将李彦宏描述为能在商业与社会责任间找到平衡的“优秀企业家”。该用户认为,这种...
近日,有开发者发布了一款针对Ollama未授权访问漏洞的网关脚本,声称内置了约2000个海外无鉴权的Ollama服务节点。该工具允许用户通过网关直接调用这些暴露在公网的本地模型资源进行对话。Ollama作为当下热门的本地大模型运行框架,若配...
针对多智能体协作中缺乏统一管控标准的问题,开发者推出了两项开源协议:Agent Alignment Protocol (AAP) 用于定义权限与价值观,Agent Integrity Protocol (AIP) 则实时监控推理过程。与传统...
微软证实,自1月下旬以来,Microsoft 365 Copilot 存在一个严重的代码缺陷,导致其绕过数据防泄漏(DLP)策略及敏感度标签,错误地读取并总结了用户“已发送”和“草稿”文件夹中的机密邮件。该问题影响了面向企业用户的 Copi...