
faster-whisper
AIチャット高速化されたWhisper音声認識
faster-whisperは、OpenAIの音声認識モデルWhisperをCTranslate2という推論エンジンで再実装した高速な文字起こしライブラリです。オリジナルのWhisperと同等の精度を保ちながら、最大4倍の速度とより少ないメモリ使用量で動作します。8bit量子化にも対応しており、GPUはもちろんCPUのみの環境でも実用的な速度で音声をテキストに変換できます。会議の文字起こしや字幕生成など、音声認識を自社システムに組み込みたい開発者や、大量の音声データを低コストで処理したい企業に向いています。クラウドの音声認識APIに音声データを送信したくない場合の、セルフホスト型の選択肢としても有力です。MIT ライセンスで提供されています。
関連トピック
deep-learninginferenceopenaiquantizationspeech-recognitionspeech-to-texttransformerwhisper
コメント(0)
コメントするにはログインしてください。
同じカテゴリのOSS

ollama
ローカルでLLMを動かすための定番ツール
AIチャットMITGo

open-webui
セルフホストできる高機能AIチャットUIの決定版
AIチャットOtherPython

whisper
OpenAI製の高精度音声認識モデル
AIチャットMITPython

NextChat
ワンクリックでデプロイできる軽量ChatGPTクライアント
AIチャットMITTypeScript

lobehub
プラグイン対応のモダンなAIチャットフレームワーク
AIチャットOtherTypeScript

gpt4all
ローカルPCでプライベートにLLMを実行
AIチャットMITC++