PaddlePaddle、OCR ライブラリ PaddleOCR 3.5 を公開──Transformers バックエンド対応で HuggingFace 環境への統合を強化

PaddleOCR の推論エンジンに Transformers が追加され、PyTorch ベースの既存スタックで OCR・文書解析パイプラインを直接呼び出し可能になった。

リリース: 2026-05-18 · 読了 3
何が起きた
  • PaddleOCR 3.5 は推論エンジンとして新たに transformers バックエンドをサポートした

  • engine_config を通じて dtype、デバイス配置、attn_implementation の指定が可能

  • PP-OCRv5 や PaddleOCR-VL 1.5 などの主要モデルを Transformers 経由で実行可能

  • HuggingFace Spaces にて PaddleOCR 3.5 の動作デモが公開されている

なぜ重要
  • PyTorch / Transformers 中心のエコシステムで開発しているチームにとって、OCR 処理を別環境(PaddlePaddle)に切り出す必要がなくなり、管理コストが大幅に削減される。

  • RAG 構築時の文書前処理において、データパイプラインを HuggingFace のモデル管理と統合できるため、推論環境の統一とデプロイの自動化が容易になる。

👁️ 開発者

HuggingFace のモデル管理基盤を利用している開発者は、既存の PyTorch 環境に PaddleOCR を組み込む際の依存関係の衝突や実装コストを低減できる。

🇯🇵 日本

国内の金融・物流系 Vertical SaaS 事業者は、帳票読み取りから LLM によるデータ抽出までを同一の Transformers ベースの推論パイプラインで構築でき、運用保守の属人化を防げる。