AI编程 · 架构思考 · 技术人生

Meta发布SAM Audio:AI驱动的音频精准分割技术

智谱 GLM,支持多语言、多任务推理。从写作到代码生成,从搜索到知识问答,AI 生产力的中国解法。

Meta今日推出革命性AI音频分割模型SAM Audio,作为其Segment Anything系列的新成员。该模型通过文本、视觉和时间跨度三种提示方式,使用户能够从复杂音频混合中精准分离出特定声音,如视频中的人声、乐器声或环境噪音。SAM Audio首次支持与人类自然思维匹配的音频编辑方式,实现了前所未有的直观操作。用户只需输入’狗叫声’或’歌唱声’等文字提示,或点击视频中发声对象,或标记时间片段,即可完成音频分离。这项技术将彻底改变音频和视频编辑流程,广泛应用于音乐制作、播客制作、影视后期、科研和辅助技术等领域。Meta已开放SAM Audio在Segment Anything Playground平台上的试用,并提供模型下载。这一突破性技术标志着音频处理领域进入智能化、一体化新阶段。

原文链接:Hacker News

赞(0)
未经允许不得转载:Toy's Tech Notes » Meta发布SAM Audio:AI驱动的音频精准分割技术
免费、开放、可编程的智能路由方案,让你的服务随时随地在线。

评论 抢沙发

十年稳如初 — LocVPS,用时间证明实力

10+ 年老牌云主机服务商,全球机房覆盖,性能稳定、价格厚道。

老品牌,更懂稳定的价值你的第一台云服务器,从 LocVPS 开始