如果只需要简单的文本合成语音，可以吗？ #131

bk111 · 2024-12-11T01:26:52Z

如果只需要简单的文本合成语音，可以吗？该怎么做？
如果只需要简单的文本合成语音并生成srt，可以吗？该怎么做？

baiyin · 2024-12-11T04:22:02Z

glm-4-voice 的 audio decoder 是 token-to-speech （token 是 audio token）, 而不是 text-to-speech
所以直接用来做文本到语音感觉不太适合。
只是个人理解，不一定正确

bk111 · 2024-12-11T05:00:26Z

glm-4-voice 的 audio decoder 是 token-to-speech （token 是 audio token）, 而不是 text-to-speech 所以直接用来做文本到语音感觉不太适合。只是个人理解，不一定正确

它可能用的是cosyvoice来文本生语音的，但我直接用cosyvoice的演示，效果却很差。就想着谁能把text_input直接送给它的cosyvoice模块。只要后半截文本转语音部分。

Provide feedback