云聚 AI Token Plan 满 199 减 35 元
port:80 AI Junkie
AI 重度玩家的工程笔记本
DigitalOcean 开发者云

DeepSeek 联网搜索现“幻觉”:被低质网页误导,混淆分钟与秒

云聚 AI Token Plan 满 199 减 35 元

近日,有用户在技术社区 Linux.do 发帖反馈,国产大模型 DeepSeek 在处理特定查询时出现了严重的逻辑与事实偏差。该用户在 DeepSeek 网页版的“快速”模式下,同时开启了备受关注的“深度思考”与“联网搜索”功能。在询问关于游戏《我的世界》速通记录的问题时,模型给出了“7秒速通”的回答,并将一个名为“雷霆”的博主作为依据。然而事实是,该视频内容为“7分钟速通”,DeepSeek 错误地将时间单位从分钟变成了秒。经用户复盘发现,DeepSeek 的联网爬虫抓取了一批为了 SEO 优化而刻意制作的“标题党”文章——这些文章的标题赫然写着“7秒”,但正文内容却明确记载着“7分钟”。令人关注的是,即便是在拥有“深度思考”能力的加持下,DeepSeek 初期依然未能识别出标题与正文的矛盾,而是直接采信了错误的标题信息,直到用户多次明确指正后才承认错误。这一案例不仅引发了关于模型“粗心”的讨论,更揭示了 AI 搜索领域在信源清洗与内容校验方面面临的严峻挑战。

事件分析

该事件从技术侧面深刻反映了 RAG(检索增强生成)架构在处理非结构化网络数据时的局限性。当大模型接入联网搜索以增强时效性时,其训练数据的纯净度与检索源的质量成为了决定回答准确性的关键变量。DeepSeek 此次“翻车”,本质上暴露了搜索引擎与 AI 推理模块在信息校验层面的脱节。模型似乎对网页标题赋予了极高的注意力权重,导致在处理“标题党”内容时,未能有效对正文进行细粒度的语义比对。这表明,单纯增加模型的参数规模或推理链长度,无法完全根除幻觉问题。对于 AI 搜索产品而言,引入更高级的网页信源评级机制、以及强化模型对检索结果的多轮交叉验证能力,将成为后续技术迭代的重要方向。

💡 核心观点:联网搜索非万能药,AI 只有建立起对低质数据的“免疫力”,才能真正解决检索增强中的“幻觉”顽疾。

阿里云 OPC 一人公司创业装备库

原文链接:Linux.do

阿里云函数计算 一键部署 AI 大模型
赞(0)
未经允许不得转载:80aj » DeepSeek 联网搜索现“幻觉”:被低质网页误导,混淆分钟与秒
ReClaude Claude Code 合租
阿里云函数计算 一键部署 AI 大模型

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐