🛠Tools🔥🔥

3D 評価ベンチマーク OpenSCAD で Antigravity 2.0 が首位──建築コード生成で GPT-4o を凌駕

建築設計の OpenSCAD コード生成精度を競うベンチマークで、Antigravity 2.0 が商用モデルを抑えて 1 位となり、3D 形状理解における特化型モデルの優位性を示した。

リリース: 2026-05-23 · 読了 3
何が起きた
  • OpenSCAD Architectural 3D LLM Benchmark において、Antigravity 2.0 が総合スコアで首位を獲得した。

  • 比較対象となった GPT-4o や Claude 3.5 Sonnet などの主要な商用 LLM を、建築コードの整合性において上回る数値を記録した。

  • 評価項目には、OpenSCAD コードのコンパイル成功率、形状の幾何学的正確性、および建築物としての構造的整合性が含まれる。

なぜ重要
  • 3D 形状という空間的制約が強いコード生成タスクでは、汎用的な推論能力よりも、特定のドメイン(OpenSCAD)への最適化が精度に直結することが証明された。

  • CAD 自動化において、GPT-4o 等の汎用モデルをそのまま使うよりも、本ベンチマーク上位の特化型モデルを採用する方が、物理的な破綻による手戻りを大幅に削減できる。

👁️ 開発者

3D モデリングや CAD 自動化アプリを開発するエンジニアは、バックエンドを汎用 API に固定せず、Antigravity 2.0 のようなドメイン特化型モデルを Few-shot や RAG のベースに据えるべき。OpenSCAD はテキストベースのため、既存のコード資産を学習させた特化モデルの効果が顕著に出る。

🇯🇵 日本

国内の中堅ゼネコンや住宅メーカーの設計支援ツール開発チームは、BIM 連携のプロトタイプ作成において、本ベンチマーク結果をモデル選定の定量的根拠として利用できる。汎用 LLM では困難だった「破綻のない 3D 形状コード生成」の現実的な選択肢が提示された。