腫瘍学の意思決定支援を 2 段構えのマルチエージェントで高度化──プライバシー保護と根拠性を両立
9B/27B モデルを使い分ける 2 層構造と LangGraph による 8 つの専門エージェントを統合。NCCN 等のガイドラインに基づく Corrective RAG で、オンプレミス環境での安全な臨床支援を実現。(原題: OncoAgent: A Dual-Tier Multi-Agent Framework for Privacy-Preserving Oncology Clinical Decision Support)
リリース: 2026-05-09 · 読了 4 分266,854 件の臨床症例データを用いて、9B(速度優先)と 27B(推論優先)の 2 モデルを QLoRA で微調整し、クエリの難易度に応じて動的にルーティングする。
AMD Instinct MI300X を活用したシーケンスパッキングにより、データセット全体の学習を約 50 分で完了し、API 経由の生成と比較して 56 倍のスループット向上を達成した。
70 以上の NCCN および ESMO ガイドラインを参照する 4 段階の Corrective RAG(CRAG)を採用し、ドキュメント格付けにおいて 100% の成功率を記録した。
LangGraph による 8 つの専門ノード構成と、Zero-PHI(個人健康情報ゼロ)ポリシーを強制する 3 層の安全検証機能を備え、オンプレミスでのデプロイが可能。
医療 AI における「クラウドへのデータ流出」と「根拠のないハルシネーション」という 2 大障壁を、オンプレミス運用と厳格な Corrective RAG の組み合わせで解消している。
単一の巨大モデルに頼らず、軽量モデルと重量モデルを使い分ける Dual-Tier 設計により、計算リソースの最適化と専門的な推論能力を両立させる具体的な構成案を提示している。
AMD ROCm 環境と Unsloth フレームワークを用いた高速な微調整パイプラインは、特定ドメインの専門知識を LLM に短時間で注入する実務的な指針となる。
高度な専門知識とプライバシーが要求される RAG システムを構築する開発者は、本論文の「推論プロセスの LangGraph による分解」と「難易度ベースのモデルルーティング」を実装パターンとして採用すべき。特に機密データを扱う現場では、API 依存を脱却したオンプレミス微調整のワークフローが極めて有用。
国内固有の追加文脈は限定的(汎用的に有用)。
| Metric | Score | Δ |
|---|---|---|
| CRAG document grading success rate | 100 | |
| Throughput acceleration vs API | 56 | +55.0 |