 

Meta发布SAM Audio：AI驱动的音频精准分割技术

2025-12-23 分类：前沿哨所阅读(23) 评论(0) 赞(0)

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

Meta今日推出革命性AI音频分割模型SAM Audio，作为其Segment Anything系列的新成员。该模型通过文本、视觉和时间跨度三种提示方式，使用户能够从复杂音频混合中精准分离出特定声音，如视频中的人声、乐器声或环境噪音。SAM Audio首次支持与人类自然思维匹配的音频编辑方式，实现了前所未有的直观操作。用户只需输入’狗叫声’或’歌唱声’等文字提示，或点击视频中发声对象，或标记时间片段，即可完成音频分离。这项技术将彻底改变音频和视频编辑流程，广泛应用于音乐制作、播客制作、影视后期、科研和辅助技术等领域。Meta已开放SAM Audio在Segment Anything Playground平台上的试用，并提供模型下载。这一突破性技术标志着音频处理领域进入智能化、一体化新阶段。

原文链接：Hacker News

赞(0)

未经允许不得转载：Toy's Tech Notes » Meta发布SAM Audio：AI驱动的音频精准分割技术

分享到

评论抢沙发

前沿哨所

Toolify新增自动重试功能，显著提升AI函数调用稳定性

AI工具Toolify发布更新，引入了函数调用自动重试机制。当大模型输出的工具调用解析失败时，系统会将错误信息反馈给模型以自动修正，从而提升容错率。该功能对客户端透明，虽可能增加延迟，但有效解决了模型偶尔犯蠢导致的调用失败问题。此外，作者对比发现，部分模型在原生工具调用上表现不佳，而通过Toolify的提示词调用方式成功率更高。新版本已提供GHCR镜像支持。

原文链接：Linux.do

2小时前
Linux 之父点赞 Google AI 编程：代码质量超越手写

Linux 之父 Linus Torvalds 在其 GitHub 仓库 AudioNoise 中合并了来自 Google “Antigravity” 的分支。据悉，该代码由 Google 的 AI 编程工具生成，主要用于修复并优化可视化工具。更新内容包括实现了自定义矩形选择器、缩放功能、键盘导航以及内存优化等。尽管过程中遇到了一些内置功能的冲突，但 Linus 对最终成果给予了高度评价，直言其代码质量远超自己手写的水平，标志着 AI 辅助编程能力的重大突破。

原文链接：Linux.do

2小时前
CC-Switch CLI v4.1.0 发布：支持交互式管理 AI 配置

CC-Switch CLI v4.1.0 正式发布，重点升级交互式体验。新版支持在 TUI 界面直接添加和编辑 Provider，新增端口连通性与延迟测试，并引入环境变量冲突检测以解决配置失效问题。此外，优化了中英文多语言支持，让开发者管理 Claude/Gemini 配置更高效。

原文链接：Linux.do

2小时前
马来西亚宣布封禁马斯克旗下Grok服务，跟进印尼监管举措

马来西亚通讯及多媒体委员会（MCMC）发布通告，宣布即日起暂时封禁埃隆·马斯克旗下的人工智能服务Grok。此举被视为跟进印尼近期的监管措施，封禁原因主要涉及NSFW（不适宜工作场所）内容的安全问题。目前尚不清楚禁令将持续多久，部分运营商可能尚未完全落实封锁。这一事件凸显了东南亚国家对AI内容合规性的监管正在迅速趋严。

原文链接：Linux.do

2小时前
AI 编程引发代码膨胀：项目验收是否该抛弃“代码行数”指标？

随着人工智能编程工具的普及，软件开发效率大幅提升，但也带来了新的挑战。近期有观点指出，乙方利用 AI 快速生成数十万行代码，虽功能正常，但代码量远超传统预期。这一现象引发了行业对项目验收标准的深刻反思：在 AI 时代，单纯依赖代码行数来衡量工作量或质量已不再适用，甚至可能导致维护成本激增。行业亟需建立更科学的代码质量评估体系，以应对 AI 带来的技术变革。

原文链接：V2EX 分享发现

2小时前
物理级防删！基于Svelte 5与Arbitrum的去中心化论坛Chain Talk开源

开发者推出基于 Svelte 5 和 Arbitrum One 构建的去中心化论坛 Chain Talk。该项目无传统后端，所有内容直接上链，实现“物理级防删”。得益于 L2 技术，发帖成本仅约 0.005 美元。项目采用 Svelte 5 Runes 模式和 Solidity 智能合约，旨在构建一个“永不塌陷”的内容避难所，目前代码已开源。

原文链接：V2EX 分享发现

2小时前