
marker
その他PDFをMarkdownへ高精度変換
markerは、PDFをMarkdownやJSONへ高速・高精度に変換するオープンソースツールです。ディープラーニングモデルの組み合わせにより、本文だけでなく表・数式・コードブロック・画像の抽出やレイアウトの認識に対応し、学術論文や書籍のような複雑な文書でも構造を保った変換ができます。GPUを使った高速なバッチ処理が可能で、多言語の文書にも対応しています。論文や技術文書をLLMで処理するためのRAGパイプラインを構築する開発者や、大量のPDF資産をテキストデータ化したい企業・研究機関に向いています。商用のドキュメント解析APIをセルフホストで代替したい場合の有力候補です。
コメント(0)
コメントするにはログインしてください。





