GLM-TTSは、高品質な音声合成を実現するテキストから音声への変換システムです。大規模言語モデルを基にしたこのシステムは、ゼロショット音声クローンとストリーミング推論をサポートしており、ユーザーはわずか3〜10秒の音声から任意の話者の声を再現できます。また、マルチリワード強化学習を活用することで、より自然で感情豊かな
コンテンツを見る