云聚 AI Token Plan 满 199 减 35 元
AI编程 · 架构思考 · 技术人生
DigitalOcean 开发者云

超市实测豆包遭遇“噪音危机”:为何AI大模型还学不会只听主人的话?

云聚 AI Token Plan 满 199 减 35 元

近期有用户在真实场景下测试字节跳动旗下“豆包”的AI视频通话功能时发现,在超市等嘈杂环境中,AI极易被周围人声干扰,无法像Siri那样通过声纹精准锁定主人指令。这一“翻车”经历暴露了当前多模态大模型在物理世界听觉交互上的短板。相比于安静的测试环境,现实世界的背景噪音极为复杂,如何实现精准的声纹识别与声源分离,是AI Agent走向智能化助理必须跨越的技术门槛。

原文链接:Linux.do

阿里云 OPC 一人公司创业装备库
阿里云函数计算 一键部署 AI 大模型
赞(0)
未经允许不得转载:Toy's Tech Notes » 超市实测豆包遭遇“噪音危机”:为何AI大模型还学不会只听主人的话?
ReClaude Claude Code 合租
阿里云函数计算 一键部署 AI 大模型

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐