 

vget v0.12.1 上线AI语音转文字功能，支持大模型识别

2026-01-07 分类：前沿哨所阅读(6) 评论(0) 赞(0)

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

vget v0.12.1 版本正式发布，引入革命性的AI语音转文字功能。该功能基于Whisper大模型，支持tiny到large-v3多种模型，推荐使用whisper-large-v3-turbo以平衡速度和准确率。用户可通过命令行或Docker Web界面轻松转写音频/视频文件，支持MP3、MP4等多种格式，输出带时间戳的文本或字幕。结合OpenAI API，可实现内容自动总结，极大提升播客、视频等内容的处理效率。

原文链接：V2EX 分享发现

赞(0)

未经允许不得转载：Toy's Tech Notes » vget v0.12.1 上线AI语音转文字功能，支持大模型识别

分享到

AI语音识别大模型应用开源工具

评论抢沙发

前沿哨所

从'恐怖分子同情者'到估值30亿：AI创业者的逆袭

Replit创始人阿姆贾德·马斯德曾因某些言论被贴上'恐怖主义同情者'的标签，面临争议和质疑。然而，这位硅谷的'叛逆者'并未向压力低头，公开表示'绝不向任何人道歉'。如今，他创立的AI编程平台Replit估值已高达30亿美元，成为科技行业的一匹黑马。马斯德的故事不仅展现了个人在逆境中的坚韧，也反映了硅谷对创新者态度的复杂性。他的成功挑战了传统观念，证明在科技领域，真正的价值往往来自于打破常规的勇气和坚持。

原文链接：Hacker News

5分钟前
AI编程工具学习资源与工作流分享

随着AI编程工具层出不穷，开发者面临如何快速掌握新工具、更新工作流的挑战。本文通过社区讨论，整理了获取最新AI资讯的优质渠道，如公众号、博客和UP主推荐，涵盖工具评测和开发体验整合。同时，聚焦独立开发者工作流分享，探讨如何高效学习工具特性并融入日常开发，为开发者提供实用指南，助力适应快速变化的编程潮流。

原文链接：Linux.do

5分钟前
AI机器人潜伏自动化：伪装人类互动计划曝光

一位技术爱好者计划开发AI机器人，潜伏在特定平台自动化伪装人类互动。通过复刻假道士和假老板的人物特征，结合现有AI应用开发方案，用户将编写代码组合实现自动化。这一项目涉及AI在社交媒体自动化中的创新应用，引发对AI伦理和平台管理的思考，凸显技术滥用的潜在风险。

原文链接：Linux.do

5分钟前
Embassy：Rust异步框架革新嵌入式开发

Embassy是一个基于Rust和async的下一代嵌入式框架，让开发者编写安全、正确、节能的嵌入式代码更高效。它利用Rust的内存安全特性，通过async/await实现无动态内存分配的多任务处理，替代传统RTOS。支持STM32、nRF52、RP2040等多种微控制器，提供硬件抽象层（HAL）、网络栈（TCP/UDP）、蓝牙（BLE）、LoRa和USB等功能，并内置低功耗设计，自动休眠核心以延长电池寿命，显著简化开发流程并提升性能。

原文链接：Hacker News

1小时前
xAI发布Grok Build CLI工具，进军编程代理市场

xAI宣布即将推出Grok Build，一个基于Grok的CLI工具，预计晚些时候发布。该工具支持Web UI，并计划引入远程编程代理功能。同时，Grok Code也将升级至可能的新版本Grok Code 2。这一发布标志着xAI在AI编程工具领域的扩展，旨在提升开发者效率和体验。社区讨论显示，用户对早期版本表示关注，期待其正式落地。该工具将强化AI代理在代码生成和自动化中的作用，为开发者提供更智能的编程支持。

原文链接：Linux.do

1小时前
Google AI Studio反代理测试版发布，邀用户测bug

Google AI Studio的反代理工具预览版测试已启动，邀请用户参与测试以发现潜在bug。该工具版本为aistudio-gemini-proxy-v4.0-Preview（test），文件大小90.6 KB，社区已有2个帖子参与讨论。此工具可能帮助用户更安全地访问Google AI服务，提升AI开发体验。测试旨在通过社区反馈优化工具稳定性，推动AI技术在实际应用中的普及。

原文链接：Linux.do

1小时前