AI
fish-speechのロゴ

fish-speech

AIチャット
31k

多言語対応の高品質テキスト読み上げ

Fish Speechは、最高水準(SOTA)の品質をうたうオープンソースのテキスト読み上げ(TTS)モデルです。日本語・英語・中国語など多言語に対応し、10〜30秒程度の音声サンプルから高品質なゼロショット・few-shot音声クローニングが可能です。書記素音素変換に依存しないアーキテクチャにより、多様なテキスト表記に強いのも特徴です。WebUIが提供されており、学習済みモデルを使ってすぐに音声生成を試せます。動画制作やゲーム開発で自然な音声ナレーションが必要なクリエイター、音声対話システムを開発する企業に向いています。商用TTSサービスのコストを抑えたい場合の選択肢ですが、ライセンス条件(Other)は利用前に確認が必要です。

関連トピック

llamatransformerttsvallevitsvqganvqvae

コメント(0

コメントするにはログインしてください。

同じカテゴリのOSS

Let's Build Together

OSS導入、自社だけで悩まない。

ツール選定から構築・運用・AI活用まで、オープンソースラボ運営元のClasslessが伴走します。初回のご相談は無料です。