DeepSeek 联网搜索现“幻觉”：被低质网页误导，混淆分钟与秒

近日，有用户在技术社区 Linux.do 发帖反馈，国产大模型 DeepSeek 在处理特定查询时出现了严重的逻辑与事实偏差。该用户在 DeepSeek 网页版的“快速”模式下，同时开启了备受关注的“深度思考”与“联网搜索”功能。在询问关于游戏《我的世界》速通记录的问题时，模型给出了“7秒速通”的回答，并将一个名为“雷霆”的博主作为依据。然而事实是，该视频内容为“7分钟速通”，DeepSeek 错误地将时间单位从分钟变成了秒。经用户复盘发现，DeepSeek 的联网爬虫抓取了一批为了 SEO 优化而刻意制作的“标题党”文章——这些文章的标题赫然写着“7秒”，但正文内容却明确记载着“7分钟”。令人关注的是，即便是在拥有“深度思考”能力的加持下，DeepSeek 初期依然未能识别出标题与正文的矛盾，而是直接采信了错误的标题信息，直到用户多次明确指正后才承认错误。这一案例不仅引发了关于模型“粗心”的讨论，更揭示了 AI 搜索领域在信源清洗与内容校验方面面临的严峻挑战。

事件分析

该事件从技术侧面深刻反映了 RAG（检索增强生成）架构在处理非结构化网络数据时的局限性。当大模型接入联网搜索以增强时效性时，其训练数据的纯净度与检索源的质量成为了决定回答准确性的关键变量。DeepSeek 此次“翻车”，本质上暴露了搜索引擎与 AI 推理模块在信息校验层面的脱节。模型似乎对网页标题赋予了极高的注意力权重，导致在处理“标题党”内容时，未能有效对正文进行细粒度的语义比对。这表明，单纯增加模型的参数规模或推理链长度，无法完全根除幻觉问题。对于 AI 搜索产品而言，引入更高级的网页信源评级机制、以及强化模型对检索结果的多轮交叉验证能力，将成为后续技术迭代的重要方向。

💡 核心观点：联网搜索非万能药，AI 只有建立起对低质数据的“免疫力”，才能真正解决检索增强中的“幻觉”顽疾。

原文链接：Linux.do

事件分析

从技术实现角度看，该项目采用了“视觉重构”的思路，利用模型能力解构AI生成的图像并将其还原为结构化的文档对象，打破了非结构化图像与可编辑文档之间的壁垒。这标志着AIGC在办公领域的应用正从单纯的内容生成向“工程化落地”迈进，解决了AI生成内容难以集成到现有工作流中的痛点。其“先生成效果图、后逆向还原”的策略，平衡了生成质量与编辑灵活性，为AI Agent在复杂文档处理任务中的落地提供了极具价值的参考范式。

💡 核心观点：突破视觉美感与编辑性的矛盾，该项目展示了AI办公工具从“生成图片”向“还原工程文件”进化的关键路径。

事件分析

SharkTTY 的出现反映了移动办公场景下对“沉浸式远程体验”的特定需求，尤其是针对 Apple 生态内部的互联优化。现有的 iOS 远程桌面方案大多是对传统 PC 逻辑的直接移植，未能有效解决触摸屏与高精度 GUI 操作之间的割裂感。该项目通过重构鼠标放大机制和软键盘布局，展示了在非原生输入设备上进行精细化操作的可能性。从技术架构看，其基于 iCloud Keychain 的本地化凭证存储策略符合零信任安全趋势，有效规避了云端数据泄露风险。同时，该产品契合了“Vibe Coding”这一新兴趋势，即追求随时随地、低负担的编程状态，将 iPad 从单纯的消费内容设备转变为具备实际生产力属性的临时工作站。尽管其生态目前主要局限于 Apple 设备间互联，但这种针对垂直场景的深度体验优化，对于提升移动端开发工具的可用性具有积极示范意义。

💡 核心观点：SharkTTY 填补了 iPad 生产力短板，将触控设备转化为高效的移动开发终端。

事件分析

该开源项目展示了大模型在个人知识管理领域的典型应用范式，即从单纯的“信息搬运”转向“信息提炼”。技术上，它结合了传统的 RSS 爬虫技术与 LLM 的自然语言处理能力，构建了一套低成本的内容生成管线。这种架构有效降低了海量信息筛选的认知负荷，标志着个人助手类工具正从简单的列表罗列进化为具备归纳能力的智能体。对于开发者社区而言，此类工具的普及反映了“AI 原生”应用的一种趋势：利用模型能力重塑传统工作流。该项目采用 Docker 部署并适配常见邮箱服务，降低了部署门槛，有利于在技术圈子内传播，为个人打造私有的 AI 信息中台提供了可落地的参考模板。

💡 核心观点：利用大模型对传统RSS流进行二次清洗与提炼，标志着个人情报获取方式正从被动接收向智能聚合的“AI流”进化。

事件分析

该案例生动展示了AI智能体在处理复杂C++遗留代码时的辅助效能。通过自然语言交互，开发者无需深入阅读全部源码即可定位到PeerData等关键逻辑层级，这显著降低了客户端逆向工程和二次开发的门槛。这种“描述需求-代码分析-测试反馈”的闭环开发模式，体现了AI编程工具从简单的代码补全向逻辑推理与系统分析方向的进化。对于开源社区而言，这意味未来将有更多非专业开发者能够利用AI对现有软件进行个性化改造，从而推动开源生态的多样化和定制化发展。

💡 核心观点：AI智能体正将普通用户转化为具备定制能力的开发者，大幅降低了客户端软件个性化修改的技术门槛。

事件分析

从技术架构与风控层面分析，该事件揭示了 SaaS 服务的“状态一致性”问题。OpenAI 的订阅验证可能采用了软状态机制，即后端扣费失败或订阅到期时，前端的鉴权系统并未立即阻断服务访问，从而产生了“宽限期”。这种设计通常是为了避免因网络抖动或支付延迟导致的误伤，但显然被灰产利用。对于通过“成品号”获客的用户，这往往是 OpenAI 批量清理行动前的静默期。长期来看，OpenAI 极大概率会通过账期校验进行回溯封禁。该事件不仅体现了大模型服务在商业化过程中的计费鲁棒性问题，也折射出当前 AI 付费市场中，官方高价与灰产低价之间的博弈现状。

💡 核心观点：ChatGPT 计费系统存在鉴权滞后，'逾期未停' 现象暴露了 SaaS 服务在灰产对抗中的缓冲漏洞。

事件分析

该讨论折射出当前AI编程工具市场的分层现状。一方面，以DeepSeek、GLM为代表的国产大模型凭借极致的性价比和本地化部署优势，正在大规模渗透开发者市场，缓解了因海外模型API高额费用及账号封禁风险带来的焦虑。另一方面，在IDE深度集成、复杂逻辑推理及精准代码修正等高阶场景中，Claude Code和OpenAI o1/Claude 3.5 Sonnet等模型仍凭借强大的基座能力占据统治地位。技术上的差距可能源于训练数据中代码语料的质量与占比、模型对上下文窗口的利用效率以及工具调用的稳定性。随着国产模型在DeepSeek-R1等推理模型上的突破，这种差距正在迅速缩小，但短期内“高端自用、低端降本”或将成为开发者的常态策略。

💡 核心观点：国产大模型在通用能力上已大幅追赶，但在复杂代码生成与IDE深度交互场景下，与Claude等顶尖模型仍存在显著体验代差，成本倒逼开发者寻找替代方案成为当前常态。

DeepSeek 联网搜索现“幻觉”：被低质网页误导，混淆分钟与秒

事件分析

相关推荐

作者介绍

Toy

文章目录

置顶推荐

前沿哨所

开源新方案：将AI生成的图片型PPT转化为可编辑文档

事件分析

SharkTTY：让 iPad 变身高效远程开发终端，支持多屏与 Vibe Coding

事件分析

开源项目利用大模型将每日RSS与GitHub热点自动投递至邮箱

事件分析

开发者实战：利用AI智能体修改Telegram源码，屏蔽“辣眼睛”头像

事件分析

ChatGPT Plus订阅过期仍可用？计费系统现漏洞，灰产账号获额外延长

事件分析

开发者实测：国产大模型能否替代Claude Code？编程场景下的体验差距探讨

事件分析

最新文章

热门专题

热门标签

网站统计

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC，封号还得自己重新折腾？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。