标签：红队研究

CKA-Agent 深度解析（四）：从攻击到防御的演化之路

系列导航：返回 CKA-Agent 系列总览 | 上一篇：主流模型防线崩溃实录当 96% 的攻击都能成功时，防御者该如何应对？ CKA-Agent 不是第一个越狱工具，也不会是最后一个。但它的出现标志着 AI 安全进入了一个新纪元：单点防...

赞(0)

Toy2026-01-06AI情报局阅读(32)去评论

前沿哨所

ChatGPT Health：披着隐私外衣的健康数据贩卖场

文章揭露OpenAI推出的ChatGPT Health并非单纯的健康助手，而是一个以用户健康数据为交易筹码的商业市场。面对巨额财务亏损，OpenAI通过与保险公司合作，收集用户医疗记录并建立画像，以此连接医疗服务商。该服务避开欧盟等严监管地区，且不受HIPAA保护，用户实际上成为了被出售的产品。

原文链接：Hacker News

53分钟前
AI Agent 编排差异：Claude 模型调用 Subagent 积极性低于 GPT

有开发者在测试 oh-my-opencode 插件时发现，不同大模型在 Agent 任务编排上存在显著行为差异。使用反代的 Claude 模型时，系统极少委派任务给 Subagent，倾向于独立完成；而切换至 GPT-5.2 模型后，则能正常进行任务拆解与子代理调用。这揭示了不同基础模型在多智能体协作规划能力上的本质区别。

原文链接：Linux.do

53分钟前
订阅Google Ultra一周：DeepThink名不副实，编程体验令人失望

一位用户分享了订阅Google Ultra后的实际体验。虽然DeepThink在稳定性上有所提升，但在撰写报告时仍存在幻觉，且联网搜索质量不如Claude。最令人失望的是编程功能，多次拒绝分析GitHub仓库及用户自身项目。作者认为DeepThink存在刷分嫌疑，整体体验未达预期，仅YouTube会员算是个惊喜。

原文链接：Linux.do

54分钟前
借鉴CLI模式，MCP工具也能实现渐进式披露

针对Anthropic发布的Skills功能及其“渐进式披露”概念，作者深入分析了其与MCP工具的差异。作者指出，当前MCP存在提示词爆炸问题，而Skills虽解决了上下文加载问题，却引入了本地脚本运行的安全风险。文章提出一种创新方案：借鉴CLI工具的`--help`机制，让MCP工具通过交互式查询实现渐进式披露。通过PDF工具实例验证，该方法有效解决了上下文窗口限制，且无需引入Skills的安全隐患，为Agent工具设计提供了新思路。

原文链接：Linux.do

54分钟前
拿最低工资写扫地算法：优化错误目标比不优化更可怕

作者作为一名计算机系学生，在超市兼职扫地时，利用图论和模拟退火算法编写了路径优化程序。最初算法生成的“最短路径”因包含大量锐角转弯而无法实际执行。通过引入“转弯惩罚”调整成本函数，作者获得了更符合现实需求的路径。文章深刻指出，这一现象广泛存在于科技领域：社交媒体算法只优化参与度而非幸福感，大模型优化自信度而非准确性。技术正确性若建立在错误的目标函数上，不仅毫无价值，甚至可能带来灾难性后果。

原文链接：Hacker News

2小时前
Open WebUI更新：支持原生函数调用，增强AI模型工具交互能力

开源项目 Open WebUI 近日迎来重要更新，正式支持原生函数工具调用功能。用户在设置中将模式切换为“原生”后，即可体验更高效的工具交互。该功能兼容多种模型，特别是对 Gemini 等支持画图的模型效果显著。例如，当用户要求 Gemini 生成两张图片时，系统能同时触发两次画图函数，大幅提升了多模态任务的执行效率和灵活性。

原文链接：Linux.do

2小时前