🧠Research🔥🔥🔥

Proteo-R1、タンパク質設計の推論基盤モデルを公開──MLLMと拡散モデルを統合

DeepSeek-R1 的な推論プロセスをタンパク質設計に導入し、MLLM が特定した生物学的制約を拡散モデルの生成プロセスへ物理的に結合することで、設計の解釈性と制御性を両立した。

リリース: 2026-05-01 · 読了 4
何が起きた
  • MLLM(理解エキスパート)と拡散モデル(生成エキスパート)を分離した「デュアルエキスパート」アーキテクチャを提案。

  • MLLM がタンパク質配列や構造を分析し、結合や特異性に不可欠な「機能残基」を特定して拡散モデルへのハード制約として渡す。

  • 推論結果を単なるテキストではなく「残基レベルの固定アンカー」として運用することで、生成の安定性と生物学的妥当性を確保。

  • 実装コード、学習データ、およびデモサイトが公開されており、研究コミュニティでの再現が可能。

なぜ重要
  • 幾何構造の生成を拡散モデルに丸投げせず、MLLM が『どの残基が結合に必須か』を論理的に特定してから生成に移るため、設計の失敗率を物理的に抑制できる。

  • 従来の拡散モデル単体では制御が難しかった、特定の機能部位を維持したままの周辺最適化(Co-design)が、自然言語の指示ベースで実現する。

👁️ 開発者

バイオインフォマティクス領域のエンジニアは、従来の予測のみのパイプラインから、LLM の推論を制約条件として拡散モデルに注入する「Reasoning-guided Design」へ実装を移行させる必要がある。

🇯🇵 日本

国内の製薬大手や創薬スタートアップ(東証プライム上場クラスの規模感)は、熟練研究者の暗黙知を MLLM のプロンプトとして注入することで、抗体設計や酵素改変の試行回数を大幅に削減できる。