🧠 research
2026-05-19 · 4 topics
Transformer スケーラビリティ調査──2048 トークン時の成功率 0% を 118 モデルで特定
🔥🔥🔥7 種のアーキテクチャを 128 から 2048 トークンで検証し、理論上の計算量が実運用で致命的なデプロイ制約となる「パフォーマンスの壁」を定量化した。
NVIDIA と Dell、次世代「Vera Rubin」搭載サーバー発表──推論コストを Blackwell 比 1/10 に削減
🔥🔥🔥エージェント型 AI の爆発的普及を見据え、オンプレミスで商用級モデルを安全に動かす「Dell AI Factory」を大幅強化。
NVIDIA、韓国語特化のペルソナデータセット Nemotron-Personas-Korea を公開──地域文化を反映した LLM 合成データ生成を支援
🔥🔥🔥韓国独自の社会的背景や職業、興味関心を反映したペルソナ定義を提供し、地域性に最適化された高品質な合成データ生成を可能にする。
Alibaba、新世代 LLM「Qwen 3.7」を Qwen Chat で公開──推論能力と多言語対応を大幅強化
🔥🔥🔥Qwen 2.5 からのメジャーアップデートとして、推論・コーディング・数学のベンチマークで Llama 3 級を超える性能を Qwen Chat 上でプレビュー提供開始。