 

阿里开源Qwen3-TTS：97ms低延迟，支持自然语言“设计”人声

2026-01-22 分类：前沿阅读(2) 评论(0) 赞(0)

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

阿里巴巴通义千问团队正式发布新一代开源语音合成模型Qwen3-TTS，涵盖0.6B至1.8B参数规模。该模型支持10种主流语言，不仅能实现3秒音频高保真克隆，更创新支持通过自然语言指令“设计”人声。技术上采用12Hz高压缩率Tokenizer及双轨混合流式架构，端到端合成延迟仅97毫秒，极大提升了人机对话的自然感。

原文链接：Linux.do

赞(0)

未经允许不得转载：Toy's Tech Notes » 阿里开源Qwen3-TTS：97ms低延迟，支持自然语言“设计”人声

分享到

开源模型语音合成通义千问

评论抢沙发

前沿哨所

iOS相册管理工具雪花相册清理：终身会员限时免费

独立开发者推出的 iOS 相册管理应用“雪花相册清理”宣布限时福利，截至 1 月 26 日可终身免费解锁专业版。该应用通过 AI 智能识别重复、模糊照片，并提供高达 80% 的无损压缩功能，有效解决 iPhone 存储焦虑。其核心特色在于流畅的滑动手势整理和 100% 本地化隐私保护，无需联网即可处理数据。经过两个月迭代，应用体验已趋成熟，适合急需清理相册的 iOS 用户尝试。

原文链接：V2EX 分享发现

34分钟前
为抗议AI“吞噬”人类艺术，一名大学生吃掉AI画作被捕

阿拉斯加大学一名学生因撕毁并吞食校园画廊中的AI生成艺术作品而被捕。该学生将这一行为定义为抗议与行为艺术，旨在表达对AI艺术缺乏人类心血及“吞噬”他人作品的不满。虽然创作者最终放弃指控，但检方仍继续推进案件。此事引发了关于AI在艺术领域角色的激烈伦理讨论，揭示了技术进步与传统艺术价值观之间的深层冲突。

原文链接：Hacker News

34分钟前
美国陆军任命OpenAI、Meta及Palantir高管为陆军中校

美国陆军宣布正式任命Palantir、Meta和OpenAI的高管为陆军中校。这一举措表明美国军方正加速与顶级科技公司的深度融合，通过吸纳硅谷技术领袖直接进入军事指挥体系，旨在强化人工智能等前沿技术在国防领域的应用与战略优势。

原文链接：Hacker News

34分钟前
Google One家庭组注意：Flow AI点数共享，视频生成需谨慎

Google旗下的Flow工具（用于生成Veo视频）消耗AI Credits，且其规则与网页版Gemini不同。Flow的AI Credits与Google One订阅等级挂钩，并在家庭组成员之间共享。这意味着一旦加入家庭组，你的点数可能被他人消耗，导致自己无法生成视频。建议计划大量使用该功能的用户，避免开启家庭组共享，以确保资源专享。

原文链接：Linux.do

34分钟前
Mistral CEO驳斥“中国AI落后论”：美企实则是感受到了开源压力

针对DeepMind和Anthropic高管关于“中国AI落后6个月”的观点，Mistral AI CEO在达沃斯论坛予以反驳，称其是“无稽之谈”。他指出，美企言论实则是因中国强大的开源技术能力感到压力。作为欧洲AI独角兽，Mistral获光刻机巨头ASML领投13亿欧元，正积极拓展企业市场，并设定了10亿美元的年营收目标。

原文链接：Linux.do

34分钟前
AIGC全能教程：ChatGPT与MJ/SD从入门到商业落地实战

这是一份涵盖AIGC人工智能从零基础到进阶的全套训练资源。内容深度整合了ChatGPT、Midjourney（MJ）及Stable Diffusion（SD）三大主流工具。课程不仅包含基础操作、插件安装与云端部署，更侧重于商业落地应用，如电商主图设计、室内场景延展、老照片修复、GPTs开发及Office办公自动化等。无论是技术从业者还是内容创作者，均可通过这套教程掌握AI辅助设计与高效工作的核心技能，实现技术变现。

原文链接：Linux.do

35分钟前