Claude Code、DICOM 画像解析ツールとしての実用性を検証──MRI 診断のセカンドオピニオン生成
Claude Code (Opus 4.8) を用いて 266MB の DICOM データを解析し、医師の診断結果との乖離を検証した個人の実験事例。
リリース: 2026-06-28 · 読了 5 分記事の要約
1. 核心(What)
- ユーザーが右肩の MRI データ(DICOM 形式、約 266MB)を Claude Code (Opus 4.8) に読み込ませ、医師の診断に対するセカンドオピニオンを生成。
- Claude Code は pydicom や関連ライブラリをインストールし、複数のサブエージェントを用いて解析計画を立案・実行。
- 医師の「腱断裂(Grade III)」という診断に対し、Claude Code は「断裂なし(腱鞘炎の疑い)」という異なる結論を提示。
- GPT-5.5 Pro との対話ログを併せて比較検証させた結果、AI は医師の診断を過剰介入と判断するに至った。
2. 影響(Why)
- 医療診断のブラックボックス化への対抗: 専門医の診断根拠を AI で再検証することで、過剰な介入や治療方針の妥当性を患者自身が評価できる可能性を示唆している。
- 国内医療・ヘルスケアテックへの示唆: 国内の医療機関やヘルスケア系 SaaS 企業は、AI による画像解析がセカンドオピニオンの補助ツールとして活用される未来を見据え、説明可能な診断支援プロセスの構築が求められる。
3. 根拠・詳細(How)
- Claude Code の自律的解析環境: Claude Code 上で pydicom ライブラリを動的にインストールし、DICOM ファイル群を Python スクリプトで読み込み解析。Claude.ai のチャット UI と異なり、ローカル環境でコード実行とパッケージ管理を完結させた。
- マルチエージェントによる比較検証: 複数のサブエージェントを並列稼働させ、医師の診断レポートと GPT-5.5 Pro の推論結果を比較。バイアスを排除した「アービター(仲裁者)」エージェントを設計し、最終的な診断の整合性を精査した。
4. 展望・課題(Next)
- 医療用途における信頼性の限界: 現時点では AI の診断結果が医師と大きく乖離するケースが存在し、医療現場での実運用には厳格な検証と専門医の監修が不可欠である。