🧠 research
2026-06-26 · 4 topics
OpenAI、初となる推論専用AIチップ「Jalapeño」を発表──Broadcomと共同開発
🔥🔥🔥Nvidia BlackwellやGoogle TPUと同等の性能を標榜し、2026年末までに自社サーバーへの導入を目指す。
AllenAI、ハイブリッドモデルとTransformerのトークン予測性能を比較分析──内容語の予測精度で優位性を確認
🔥🔥Olmo 3とOlmo Hybridの比較を通じ、RNN層を含むハイブリッドアーキテクチャが名詞や動詞など意味を持つトークンの予測に長ける一方、逐語的な繰り返し処理にはAttentionが適することを示した。
NVIDIA、MoE モデル高速化ライブラリ NeMo AutoModel を公開──Transformers v5 比で最大 3.7 倍の学習スループットを実現
🔥🔥HuggingFace Transformers と API 互換を維持しつつ、Expert Parallelism や DeepEP 統合により MoE モデルの学習効率を大幅に改善した。
Microsoft Research、脳活動予測モデルを理論へ変換する手法「GCT」を公開──LLMで神経科学の仮説を自動生成・検証
🔥🔥ブラックボックス化していた脳活動予測モデルを、LLMを用いて「食料準備」や「時間」といった人間が理解可能な仮説に蒸留し、fMRI実験で因果関係を直接検証するフレームワーク。