开源语音识别模型GLM-ASR测试:为何不如B站AI字幕?
作者在实际测试中发现,开源语音识别模型GLM-ASR-Nano-2512在词汇覆盖上存在不足,如未能识别“职务类犯罪”等术语,而B站自带的AI语音字幕系统则表现更优。作者分享了使用glm-4.6模型的个人经验,认为其代码知识库更丰富,并推荐...
作者在实际测试中发现,开源语音识别模型GLM-ASR-Nano-2512在词汇覆盖上存在不足,如未能识别“职务类犯罪”等术语,而B站自带的AI语音字幕系统则表现更优。作者分享了使用glm-4.6模型的个人经验,认为其代码知识库更丰富,并推荐...