AI
PaddleOCRのロゴ

PaddleOCR

その他
82k

多言語対応の高精度OCRツールキット

PaddleOCRは、Baiduが開発する多言語対応の高精度OCRツールキットです。100以上の言語に対応し、テキスト検出・認識に加えて、レイアウト解析や表認識、文書構造の解析(PP-Structure)まで行えます。画像やPDFをLLMで扱いやすい構造化データやMarkdownに変換できるため、RAGやAIエージェントの前処理としての利用が近年特に注目されています。軽量モデルによりエッジ環境でも動作可能です。帳票や文書のデータ化を自動化したい企業や、日本語・中国語を含む多言語文書を扱う開発者、文書AIパイプラインを構築するチームに向いています。商用OCR APIをセルフホストで代替できる有力な選択肢です。

関連トピック

ai4sciencechineseocrdocument-parsingdocument-translationkieocrpaddleocr-vlpdf-extractor-ragpdf-parserpdf2markdownpp-ocrpp-structurerag

PaddleOCRの解説記事

コメント(0

コメントするにはログインしてください。

同じカテゴリのOSS

Let's Build Together

OSS導入、自社だけで悩まない。

ツール選定から構築・運用・AI活用まで、オープンソースラボ運営元のClasslessが伴走します。初回のご相談は無料です。