fish-speech

★ 31k

多言語対応の高品質テキスト読み上げ

Fish Speechは、最高水準（SOTA）の品質をうたうオープンソースのテキスト読み上げ（TTS）モデルです。日本語・英語・中国語など多言語に対応し、10〜30秒程度の音声サンプルから高品質なゼロショット・few-shot音声クローニングが可能です。書記素音素変換に依存しないアーキテクチャにより、多様なテキスト表記に強いのも特徴です。WebUIが提供されており、学習済みモデルを使ってすぐに音声生成を試せます。動画制作やゲーム開発で自然な音声ナレーションが必要なクリエイター、音声対話システムを開発する企業に向いています。商用TTSサービスのコストを抑えたい場合の選択肢ですが、ライセンス条件（Other）は利用前に確認が必要です。

GitHubで見る公式サイト

コメント（0）

コメントするにはログインしてください。

同じカテゴリのOSS

ollama

★ 177k

ローカルでLLMを動かすための定番ツール

AIチャットMITGo

prompts.chat

★ 166k

プロンプトを共有・収集できるコミュニティ（旧Awesome ChatGPT Prompts）

AIチャットHTML

open-webui

★ 147k

セルフホストできる高機能AIチャットUIの決定版

AIチャットOtherPython

whisper

★ 106k

OpenAI製の高精度音声認識モデル

AIチャットMITPython

MoneyPrinterTurbo

★ 99k

AIでワンクリック短尺動画を自動生成

AIチャットMITPython

NextChat

★ 89k

ワンクリックでデプロイできる軽量ChatGPTクライアント

AIチャットMITTypeScript