HeyGem是一款基于生成式AI与深度学习推理服务的开源数字人视频创作平台,采用FastAPI+React前后端分离架构,支持通过Docker完整部署。平台集成了语音克隆、数字人驱动、文本生成口播视频等核心功能,包括Fish-Speech TTS文本转语音、Face2Face嘴型驱动、FunASR音频转文本等AI服务。用户可上传音频或视频创建个人声音模型和数字人形象,通过任务队列系统生成高质量数字人口播视频。该平台适用于教育行业自动生成课程视频、企业制作代言内容、内容创作虚拟主播视频以及AI研发测试等场景。项目提供完整部署方案,支持NVIDIA GPU加速,本地化存储保障数据安全。GitHub开源地址为kele-tao/HeyGemWeb,是搭建AI视频生成平台的理想解决方案。
原文链接:Linux.do
最新评论
照片令人惊艳。万分感谢 温暖。
氛围绝佳。由衷感谢 感受。 你的博客让人一口气读完。敬意 真诚。
实用的 杂志! 越来越好!
又到年底了,真快!
研究你的文章, 我体会到美好的心情。
感谢激励。由衷感谢
好久没见过, 如此温暖又有信息量的博客。敬意。
很稀有, 这么鲜明的文字。谢谢。