AI编程 · 架构思考 · 技术人生

vget v0.12.1 上线AI语音转文字功能,支持大模型识别

智谱 GLM,支持多语言、多任务推理。从写作到代码生成,从搜索到知识问答,AI 生产力的中国解法。

vget v0.12.1 版本正式发布,引入革命性的AI语音转文字功能。该功能基于Whisper大模型,支持tiny到large-v3多种模型,推荐使用whisper-large-v3-turbo以平衡速度和准确率。用户可通过命令行或Docker Web界面轻松转写音频/视频文件,支持MP3、MP4等多种格式,输出带时间戳的文本或字幕。结合OpenAI API,可实现内容自动总结,极大提升播客、视频等内容的处理效率。

原文链接:V2EX 分享发现

赞(0)
未经允许不得转载:Toy's Tech Notes » vget v0.12.1 上线AI语音转文字功能,支持大模型识别
免费、开放、可编程的智能路由方案,让你的服务随时随地在线。

评论 抢沙发

十年稳如初 — LocVPS,用时间证明实力

10+ 年老牌云主机服务商,全球机房覆盖,性能稳定、价格厚道。

老品牌,更懂稳定的价值你的第一台云服务器,从 LocVPS 开始