PaddlePaddle、OCR ライブラリ PaddleOCR 3.5 を公開──Transformers バックエンド対応で HuggingFace 環境への統合を強化
PaddleOCR の推論エンジンに Transformers が追加され、PyTorch ベースの既存スタックで OCR・文書解析パイプラインを直接呼び出し可能になった。
リリース: 2026-05-18 · 読了 3 分記事の要約
1. 核心(What)
- PaddleOCR 3.5 は推論エンジンとして新たに transformers バックエンドをサポートした
- engine_config を通じて dtype、デバイス配置、attn_implementation の指定が可能
- PP-OCRv5 や PaddleOCR-VL 1.5 などの主要モデルを Transformers 経由で実行可能
- HuggingFace Spaces にて PaddleOCR 3.5 の動作デモが公開されている
2. 影響(Why)
- PyTorch / Transformers 中心のエコシステムで開発しているチームにとって、OCR 処理を別環境(PaddlePaddle)に切り出す必要がなくなり、管理コストが大幅に削減される。
- RAG 構築時の文書前処理において、データパイプラインを HuggingFace のモデル管理と統合できるため、推論環境の統一とデプロイの自動化が容易になる。
- 開発者への影響: HuggingFace のモデル管理基盤を利用している開発者は、既存の PyTorch 環境に PaddleOCR を組み込む際の依存関係の衝突や実装コストを低減できる。
- 日本への影響: 国内の金融・物流系 Vertical SaaS 事業者は、帳票読み取りから LLM によるデータ抽出までを同一の Transformers ベースの推論パイプラインで構築でき、運用保守の属人化を防げる。
3. 根拠・詳細(How)
- PaddleOCR 3.5: Running OCR and Document Parsing Tasks with a Transformers Backend (2026-05-18 公開)