3D 評価ベンチマーク OpenSCAD で Antigravity 2.0 が首位──建築コード生成で GPT-4o を凌駕
建築設計の OpenSCAD コード生成精度を競うベンチマークで、Antigravity 2.0 が商用モデルを抑えて 1 位となり、3D 形状理解における特化型モデルの優位性を示した。
リリース: 2026-05-23 · 読了 3 分OpenSCAD Architectural 3D LLM Benchmark において、Antigravity 2.0 が総合スコアで首位を獲得した。
比較対象となった GPT-4o や Claude 3.5 Sonnet などの主要な商用 LLM を、建築コードの整合性において上回る数値を記録した。
評価項目には、OpenSCAD コードのコンパイル成功率、形状の幾何学的正確性、および建築物としての構造的整合性が含まれる。
3D 形状という空間的制約が強いコード生成タスクでは、汎用的な推論能力よりも、特定のドメイン(OpenSCAD)への最適化が精度に直結することが証明された。
CAD 自動化において、GPT-4o 等の汎用モデルをそのまま使うよりも、本ベンチマーク上位の特化型モデルを採用する方が、物理的な破綻による手戻りを大幅に削減できる。
3D モデリングや CAD 自動化アプリを開発するエンジニアは、バックエンドを汎用 API に固定せず、Antigravity 2.0 のようなドメイン特化型モデルを Few-shot や RAG のベースに据えるべき。OpenSCAD はテキストベースのため、既存のコード資産を学習させた特化モデルの効果が顕著に出る。
国内の中堅ゼネコンや住宅メーカーの設計支援ツール開発チームは、BIM 連携のプロトタイプ作成において、本ベンチマーク結果をモデル選定の定量的根拠として利用できる。汎用 LLM では困難だった「破綻のない 3D 形状コード生成」の現実的な選択肢が提示された。