TabPFN-3 発表──100 万行の表形式データに対応する基盤モデル、AutoGluon 超えの精度と 10 倍の速度を両立
The Facts
- 100 万行の学習データと 200 個の特徴量までスケールし、従来の TabPFN-2.5 比で最大 20 倍高速化された。
- 標準ベンチマーク TabArena において、8 時間チューニングした GBDT ベースラインを上回り、AutoGluon 1.5 extreme より 10 倍高速である。
- テスト時計算量のスケーリング(Thinking 機能)を導入し、非 TabPFN モデルに対し 200 Elo 以上の精度差を記録した。
- SHAP 値の計算速度を最大 120 倍に改善し、リレーショナルデータやテキスト混在の表形式データでも SOTA を達成した。
Why It Matters
- 「表形式データは GBDT が最強」という定説が、チューニング不要な基盤モデルによって 1M 行規模の実務領域まで覆された。
- SHAP 計算の 120 倍高速化により、金融や医療など説明可能性が必須な現場でのモデル解釈待ち時間がほぼゼロになる。
For Developers
データサイエンティストは、数時間のハイパーパラメータ探索を待つ代わりに、TabPFN-3 の 1 パス推論で即座に高精度なベースラインを得られるようになる。
For Japan
[国内 金融・広告・製造業] のデータ分析チームは、数千個のタスクが並走する環境において、計算リソースをハイパーパラメータ探索ではなく TabPFN-3 による即時デプロイへ振り向けることが可能になる。