3D 評価ベンチマーク OpenSCAD で Antigravity 2.0 が首位──建築コード生成で GPT-4o を凌駕

🛠Tools🔥🔥

LLM OpenSCAD 3D Modeling

3D 評価ベンチマーク OpenSCAD で Antigravity 2.0 が首位──建築コード生成で GPT-4o を凌駕

建築設計の OpenSCAD コード生成精度を競うベンチマークで、Antigravity 2.0 が商用モデルを抑えて 1 位となり、3D 形状理解における特化型モデルの優位性を示した。

リリース: 2026-05-23 · 読了 3 分

何が起きた

OpenSCAD Architectural 3D LLM Benchmark において、Antigravity 2.0 が総合スコアで首位を獲得した。
比較対象となった GPT-4o や Claude 3.5 Sonnet などの主要な商用 LLM を、建築コードの整合性において上回る数値を記録した。
評価項目には、OpenSCAD コードのコンパイル成功率、形状の幾何学的正確性、および建築物としての構造的整合性が含まれる。

なぜ重要

3D 形状という空間的制約が強いコード生成タスクでは、汎用的な推論能力よりも、特定のドメイン（OpenSCAD）への最適化が精度に直結することが証明された。
CAD 自動化において、GPT-4o 等の汎用モデルをそのまま使うよりも、本ベンチマーク上位の特化型モデルを採用する方が、物理的な破綻による手戻りを大幅に削減できる。

👁️ 開発者

3D モデリングや CAD 自動化アプリを開発するエンジニアは、バックエンドを汎用 API に固定せず、Antigravity 2.0 のようなドメイン特化型モデルを Few-shot や RAG のベースに据えるべき。OpenSCAD はテキストベースのため、既存のコード資産を学習させた特化モデルの効果が顕著に出る。

🇯🇵 日本

国内の中堅ゼネコンや住宅メーカーの設計支援ツール開発チームは、BIM 連携のプロトタイプ作成において、本ベンチマーク結果をモデル選定の定量的根拠として利用できる。汎用 LLM では困難だった「破綻のない 3D 形状コード生成」の現実的な選択肢が提示された。

T2ModelRift 公式ブログ (2026-05-23 公開)

← 日別ページに戻るカテゴリ一覧 (tools)