
fish-speech
AIチャット多言語対応の高品質テキスト読み上げ
Fish Speechは、最高水準(SOTA)の品質をうたうオープンソースのテキスト読み上げ(TTS)モデルです。日本語・英語・中国語など多言語に対応し、10〜30秒程度の音声サンプルから高品質なゼロショット・few-shot音声クローニングが可能です。書記素音素変換に依存しないアーキテクチャにより、多様なテキスト表記に強いのも特徴です。WebUIが提供されており、学習済みモデルを使ってすぐに音声生成を試せます。動画制作やゲーム開発で自然な音声ナレーションが必要なクリエイター、音声対話システムを開発する企業に向いています。商用TTSサービスのコストを抑えたい場合の選択肢ですが、ライセンス条件(Other)は利用前に確認が必要です。
関連トピック
llamatransformerttsvallevitsvqganvqvae
コメント(0)
コメントするにはログインしてください。
同じカテゴリのOSS

ollama
ローカルでLLMを動かすための定番ツール
AIチャットMITGo

open-webui
セルフホストできる高機能AIチャットUIの決定版
AIチャットOtherPython

whisper
OpenAI製の高精度音声認識モデル
AIチャットMITPython

NextChat
ワンクリックでデプロイできる軽量ChatGPTクライアント
AIチャットMITTypeScript

lobehub
プラグイン対応のモダンなAIチャットフレームワーク
AIチャットOtherTypeScript

gpt4all
ローカルPCでプライベートにLLMを実行
AIチャットMITC++