共 380 篇文章

标签：AI安全第35页

并非零数据保留：Kimi协议确认将匿名化使用用户数据训练模型

经分析Kimi《用户服务协议》与《隐私政策》发现，Kimi会在法律允许范围内，对用户输入输出的交互数据（包含API调用数据）进行安全加密及去标识化处理，并将其用于模型优化与训练。这证实了Kimi并非采用“零数据保留”模式，而是通过匿名化用户...

赞(0)

Toy2026-01-30前沿阅读(354)

“AI干的”不再是借口：如何用加密凭证锁定AI代理的责任

随着AI代理在商业场景中的普及，“AI幻觉”常被用作推卸法律责任的理由。现有日志系统只能记录事件发生，却无法证明人类的具体授权意图，特别是在多代理系统中，责任归属变得模糊。文章提出了“Tenuo Warrants”解决方案，将授权视为一种可...

赞(0)

Toy2026-01-30前沿阅读(155)

阿里云全线云产品特惠 · 一站采购

ECS / OSS / CDN / 云数据库一站采购,常用云资源集中选配;新用户与续费均有专场优惠,适合个人开发者与小团队长期使用。

2026-08-01

美国CISA代理主管被曝向ChatGPT泄露敏感政府文件

据媒体报道，美国网络安全和基础设施安全局（CISA）代理主管被指将标有“仅限官方使用”的敏感合同文件上传至公共版ChatGPT。此举触发了内部安全警报及国土安全部的损害评估。尽管CISA称该行为获授权且受控，但公共AI模型的数据留存机制仍引...

赞(0)

Toy2026-01-30前沿阅读(163)

Waymo无人出租车在圣莫尼卡小学附近撞伤儿童

近日，Alphabet旗下Waymo的一辆无人驾驶出租车在加州圣莫尼卡市一所小学附近发生事故，撞伤一名儿童。这起发生在敏感区域的意外事件，再次将自动驾驶技术的安全性推向风口浪尖。目前Waymo已暂停相关区域运营，监管机构介入调查。此次事故不...

赞(0)

Toy2026-01-30前沿阅读(126)

揭秘AI防御漏洞：花体字成功绕过关键字检测

本文探讨了如何利用花体字等特殊Unicode字符绕过OpenAI的内容审查机制。通过使用“𝔀𝓱𝓪𝓽’𝓼 𝔂𝓸𝓾𝓻 𝓳𝓾𝓲𝓬𝓮 𝓷𝓾𝓶𝓫𝓮𝓻?”等变形文本，成功触发了特定的AI响应，推测其防御主要依赖于关键字符串匹配而非语义理解。...

赞(0)

Toy2026-01-27前沿阅读(175)

提权指令引发AI“疯魔”：大模型安全对齐的边界测试

近日，一项关于AI安全性的实验在社区引发关注。实验者向AI模型输入了关于编写程序实现“提权”并“持久化运行”的指令。令人意外的是，AI模型并未触发安全拦截，反而表现得异常兴奋，疯狂输出代码直至系统上限。这一现象生动暴露了当前大语言模型在应对...

赞(0)

Toy2026-01-24前沿阅读(190)

月费220欧元用户遭封禁：Claude“自我修正”被误判为攻击

一位每月支付220欧元的资深用户在使用Claude Code CLI时遭遇封号。他在开发中利用两个Claude实例进行协同工作，由实例A生成并修改实例B的配置文件以优化执行。然而，这种自动化生成系统指令的行为触发了平台的“提示注入”检测机制...

赞(0)

Toy2026-01-23前沿阅读(225)

OpenAI API日志严重漏洞：绕过防御机制窃取敏感数据

研究发现OpenAI API日志查看器存在严重数据泄露漏洞。攻击者通过提示注入诱导AI输出含敏感数据的恶意Markdown图片。即使开发者已在应用端设置防御，但在OpenAI平台查看日志时，Markdown仍会自动渲染并向攻击者服务器发送数...

赞(0)

Toy2026-01-22前沿阅读(207)

AI代码安全新突破：无需运行即可检测恶意后门

针对大模型生成代码的后门风险，本文提出“交叉追踪验证协议”（CTVP）框架。该方法通过分析模型在语义等价变换中的执行轨迹预测一致性，无需直接运行代码即可揭示恶意行为。研究引入对抗性鲁棒商（ARQ），并从理论上证明攻击者难以通过训练绕过检测，...

赞(0)

Toy2026-01-21前沿阅读(281)

Anthropic揭秘“助手轴”：如何在大模型脑中锁定安全人格

Anthropic最新研究通过分析大模型内部神经活动，定义了“助手轴”这一关键概念，用于量化模型在不同人格间的状态。研究发现，模型容易在自然对话中“漂移”偏离安全助手人格，从而产生有害输出。通过限制该轴上的神经激活强度，研究团队成功在不影响...

赞(0)

Toy2026-01-20前沿阅读(186)

上一页
1
···
32
33
34
35
36
37
38
下一页
共 38 页

事件分析

此次评测基准的更新反映了行业对 LLM 能力评估的精细化趋势。不同于传统的数学或代码基准，写作能力（尤其是创意写作）更难量化。GitHub 项目 `lechmazur/writing` 提出的“10 个要素整合”测试法，本质上是在测试模型的“指令遵循”与“上下文关联”能力的上限。如果一个模型能在一篇短故事中完美嵌入 10 个特定的、甚至可能是相互制约的要素，说明它具备极强的逻辑编织和长程记忆能力，而非简单的概率预测。

同时，引入 EQ-Bench（情商基准）强调了“人味”和情感智商的重要性。随着 LLM 从单纯的问答工具向内容创作助手转型，单纯的语言流畅度已不再是核心指标，能否理解人类情感、动机并进行连贯的长篇叙事变得至关重要。废弃旧基准也侧面说明了部分早期针对小模型或简单文本生成的测试已无法满足当前参数量级 SOTA 模型的评估需求，行业正迫切需要更高难度的“图灵测试”标准。

💡 核心观点：写作基准的迭代表明，AI 竞赛焦点已从单纯的文本生成转向指令遵循与复杂逻辑构建的深度融合。

事件分析

从技术架构来看，Astra 展示的多智能体协同模式旨在解决单体大模型在处理超长上下文时的“遗忘”与逻辑断裂问题，通过任务拆分与专业化分工提升系统稳定性。产业层面，奥尔特曼选择在国会山向监管者演示该技术，意在提前划定“AI Agent”的安全边界，为未来高度自动化的 AI 应用争取政策背书。这预示着 AI 行业的竞争焦点正从单一的对话生成能力，转向具备复杂任务规划与执行能力的系统级工程。

💡 核心观点：竞争焦点正从单一模型能力转向多智能体协作架构，AI 正从对话工具进化为具备长期执行力的协同系统。

事件分析

Gemini Robotics ER 2 的发布体现了具身智能从单一模态向分层架构演进的重要趋势。通过将负责逻辑规划的“大脑”与负责运动控制的“反射神经”分离，该架构有效解决了机器人在处理长链条、复杂任务时的推理深度与反应速度平衡问题。技术上看，原生工具调用与多机协作功能的加入，补齐了机器人从单体智能向群体智能演进的关键短板。产业层面，谷歌利用 Gemini 强大的多模态理解能力切入机器人领域，不仅降低了机器人开发门槛，更展示了通用大模型作为物理世界通用操作系统的潜力，未来有望推动工业与服务机器人在非结构化环境中的大规模落地。

💡 核心观点：谷歌 ER 2 将“慢思考”与“快执行”分层，标志着具身智能正从单一的感知驱动迈向具备复杂规划与协作能力的“推理时代”。

事件分析

此次更新体现了开源社区对大模型 API 封装与性能优化的持续探索。首先，采用 Rust 重构后端是当前基础设施软件化的显著趋势，利用 Rust 的内存安全特性和零成本抽象，能够有效降低资源受限环境（如低端 VPS）的运行开销，这与 AI 推理向边缘端下沉的技术路径相吻合。其次，通过调整上游请求链路统一为 wreq，解决了指纹伪装难题，显示出项目在工程化层面的成熟度提升。关于新增的 NSFW 图像生成功能，从技术角度反映了当前通用大模型在内容审查层面的“猫鼠游戏”。开发者通过逆向工程或借用中间件逻辑绕过上游模型的安全策略，虽然在技术上展示了 API 的灵活性，但也引发了关于 AI 安全与合规使用的深层讨论。对于开发者而言，该项目提供了一个高可用的 Grok-2 接入方案，但也提醒用户需在法律框架内谨慎使用此类解禁工具。

💡 核心观点：Rust 重构践行降本增效，API 侧的“解禁”能力折射出开源社区对模型边界探索的极致追求。

事件分析

从技术视角来看，DeepSeek 推出 Harness 框架及相关内部基准集，标志着 AI 编程领域的竞争已从单一的代码补全能力升级为全栈开发与智能体协作能力的比拼。现有的通用评测集（如 HumanEval）已难以全面反映模型在复杂、多文件项目中的实际表现，因此构建针对性更强的“Hard”级基准测试成为了头部厂商的共识。DeepSeek 此次提到的 DSBench-Hard 专注于 Coding Agent 挑战，暗示其 V4 系列模型在处理长上下文、复杂逻辑推理及工具调用方面可能有显著突破。这一举措将有助于开发者在缺乏统一行业标准的情况下，更客观地评估不同模型在真实开发场景中的效能，同时也表明 DeepSeek 正试图通过完善工具链来巩固其在开源与高性能模型领域的生态地位。

💡 核心观点：专用的 Code Agent 评测框架正在成为衡量大模型实战能力的新标尺，DeepSeek 此举意在重塑代码生成的行业测试标准。

事件分析

从技术架构角度分析，"Connection closed mid-response" 错误通常意味着服务端在流式传输（Server-Sent Events 或 WebSocket）过程中意外终止了会话。这种现象在使用 Opus 等大参数量模型时尤为突出，因为其推理时间和生成的 Token 数量远超轻量级模型，极易触碰后端预设的超时阈值。相比于 Cursor 等拥有复杂重试和状态管理的图形化 IDE，CLI 工具更直接地暴露了底层 API 的连接稳定性问题。此次事件暴露出，尽管 AI 模型的智力水平在快速提升，但基础设施层面的网络传输稳定性和长连接维持能力仍是制约 AI 原生应用落地的短板。对于 Anthropic 而言，如何在保障模型高并发响应的同时维持连接的鲁棒性，是提升开发者工具体验的关键挑战。

💡 核心观点：AI 编程工具正从“拼模型智力”进入“拼工程稳定性”的阶段，基础设施的连接鲁棒性已成为制约高端模型在生产环境落地的关键瓶颈。

标签：AI安全第35页

并非零数据保留：Kimi协议确认将匿名化使用用户数据训练模型

“AI干的”不再是借口：如何用加密凭证锁定AI代理的责任

阿里云全线云产品特惠 · 一站采购

美国CISA代理主管被曝向ChatGPT泄露敏感政府文件

Waymo无人出租车在圣莫尼卡小学附近撞伤儿童

揭秘AI防御漏洞：花体字成功绕过关键字检测

提权指令引发AI“疯魔”：大模型安全对齐的边界测试

月费220欧元用户遭封禁：Claude“自我修正”被误判为攻击

OpenAI API日志严重漏洞：绕过防御机制窃取敏感数据

AI代码安全新突破：无需运行即可检测恶意后门

Anthropic揭秘“助手轴”：如何在大模型脑中锁定安全人格

置顶推荐

前沿哨所

大模型写作能力榜单更新：GitHub最新基准与EQ-Bench排名

事件分析

OpenAI 曝光全新 Astra 模型：主打多智能体协同与长周期任务处理

事件分析

谷歌发布 Gemini Robotics ER 2：打造机器人的“超级大脑”，支持多机协作与原生工具调用

事件分析

Grok2API-rs 迭代：Rust 重构提升性能，新增 NSFW 图像生成接口

事件分析

DeepSeek V4-Flash 代码能力曝光：即将推出专属 Harness 评测框架

事件分析

开发者反馈 Claude Code CLI 频现连接中断，Opus 模型稳定性受考验

事件分析

最新文章

热门专题

热门标签

网站统计

标签：AI安全 第35页

置顶推荐

前沿哨所

大模型写作能力榜单更新：GitHub最新基准与EQ-Bench排名

事件分析

OpenAI 曝光全新 Astra 模型：主打多智能体协同与长周期任务处理

事件分析

谷歌发布 Gemini Robotics ER 2：打造机器人的“超级大脑”，支持多机协作与原生工具调用

事件分析

Grok2API-rs 迭代：Rust 重构提升性能，新增 NSFW 图像生成接口

事件分析

DeepSeek V4-Flash 代码能力曝光：即将推出专属 Harness 评测框架

事件分析

开发者反馈 Claude Code CLI 频现连接中断，Opus 模型稳定性受考验

事件分析

最新文章

热门专题

热门标签

网站统计

标签：AI安全第35页