AI
faster-whisperのロゴ

faster-whisper

AIチャット
24k

高速化されたWhisper音声認識

faster-whisperは、OpenAIの音声認識モデルWhisperをCTranslate2という推論エンジンで再実装した高速な文字起こしライブラリです。オリジナルのWhisperと同等の精度を保ちながら、最大4倍の速度とより少ないメモリ使用量で動作します。8bit量子化にも対応しており、GPUはもちろんCPUのみの環境でも実用的な速度で音声をテキストに変換できます。会議の文字起こしや字幕生成など、音声認識を自社システムに組み込みたい開発者や、大量の音声データを低コストで処理したい企業に向いています。クラウドの音声認識APIに音声データを送信したくない場合の、セルフホスト型の選択肢としても有力です。MIT ライセンスで提供されています。

関連トピック

deep-learninginferenceopenaiquantizationspeech-recognitionspeech-to-texttransformerwhisper

コメント(0

コメントするにはログインしてください。

同じカテゴリのOSS

Let's Build Together

OSS導入、自社だけで悩まない。

ツール選定から構築・運用・AI活用まで、オープンソースラボ運営元のClasslessが伴走します。初回のご相談は無料です。