AI
37k

声のクローンを実現するボイス生成AI

OpenVoiceは、MITとMyShellが共同開発した即時音声クローニング技術です。短い音声サンプルから話者の声色を抽出し、その声で任意のテキストを読み上げられます。声色の再現だけでなく、感情やアクセント、リズム、抑揚といったスタイルを細かく制御できる点と、学習データにない言語でも声を再現できるゼロショットのクロスリンガル対応が特徴です。バージョン2では音質が向上し、MITライセンスで商用利用も無料になりました。多言語コンテンツのナレーション制作や音声アシスタント開発を行う企業・クリエイターに向いています。ElevenLabsのような商用音声クローンサービスのオープンソース代替として利用できます。

関連トピック

text-to-speechttsvoice-clonezero-shot-tts

コメント(0

コメントするにはログインしてください。

同じカテゴリのOSS

Let's Build Together

OSS導入、自社だけで悩まない。

ツール選定から構築・運用・AI活用まで、オープンソースラボ運営元のClasslessが伴走します。初回のご相談は無料です。