GLM-ASRは、1.5Bパラメータを持つオープンソースの音声認識モデルです。特に広東語や他の方言に最適化されており、非常に低音量の音声でも正確に認識します。このモデルは、OpenAIのWhisper V3を上回る性能を持ち、実際の複雑な環境でも優れた結果を示します。多言語対応で、会議や雑音の中でも高い認識率を誇ります
コンテンツを見る