DharmaOCR 発表──3BパラメータのオープンソースSLMでOCR特化の推論性能を最適化
汎用LLMを凌駕するコストパフォーマンスを実現し、特定のドキュメント読解タスクにおいて軽量モデルながら高い精度を達成した(原題: DharmaOCR: Open-Source Specialized SLM (3B) + Cost–Performance Benchmark against LLMs and other open-sourced models)
リリース: 2026-04-25 · 読了 3 分何が起きた
DharmaOCRはパラメータ数3Bの小型言語モデル(SLM)として構築
汎用的なLLMと比較してOCR特化型の推論コストとパフォーマンスを最適化
オープンソースとして公開され、既存のオープンソースOCRモデルとの比較ベンチマークを提示
なぜ重要
巨大なLLMを動かす必要がないため、エッジデバイスや低リソース環境でのOCR実装が現実的になる
特定のドキュメント読解タスクにおいて、モデルサイズを抑えつつ高い精度を維持できることを証明した
👁️ 開発者
OCRパイプラインの軽量化が可能となり、推論サーバーのコスト削減やレイテンシ改善に寄与する。
🇯🇵 日本
日本語を含む複雑な文字認識が必要な国内の業務自動化において、オンプレミス環境での低コストなAI導入が進む可能性がある。