🔥🔥🔥2024-05-09Hugging Face、1.3 兆トークンの教育特化データセット FineWeb-Edu を公開──Llama-3 による品質フィルタリングを実施ウェブから抽出した 15 兆トークンの FineWeb から、Llama-3-70B を用いた分類器で教育的価値の高い 1.3 兆トークンを厳選し、小規模モデルの学習効率を劇的に改善する。LLMDatasetHuggingFaceFine-tuning
🔥🔥2026-05-02個人開発者が 1,030 億トークンの Usenet データセットを公開──1980-2013 年のネット黎明期の対話を網羅インターネット黎明期の対話・議論データを 103B トークン規模で集約し、LLM の歴史的知識や推論能力の向上に寄与する。DatasetUsenetLLM Pre-trainingNLP
🔥🔥2026-05-02AI、救急外来(ER)医師の診断精度を上回る──臨床ケーススタディで医師単独の正答率を凌駕救急医療の診断において AI 単独の正答率が医師を上回る研究結果が示され、医師の判断を AI が補完・検証する「協調型ケア」の実装が現場の誤診率低下における現実解となる。LLMHealthcareMedical AIBenchmark
🔥🔥2026-05-02xAI、Grok 4.3 を公開──NYT Connections ベンチマークで 67.5 点を記録し低コスト化推論コストを削減した一方で、複雑なパズル解読能力が Grok 4.20 の 93.4 点から大幅に低下しており、モデルの軽量化と性能のトレードオフが鮮明になった。xAIGrokLLMBenchmark
🔥🔥2026-04-27Xiaomi、ネイティブ・オムニモーダルモデル MiMo-V2.5 を公開──310B パラメータの MoE 構成で 1M トークンに対応テキスト・画像・動画・音声を統合処理する 310B MoE モデルで、KV キャッシュを 6 倍削減するハイブリッド Attention を採用した。LLMMoEMultimodalHuggingFace
🔥🔥2026-04-27Xiaomi MiMo、MoE モデル MiMo-V2.5-Pro を公開──1T パラメータで 1M トークンの長文脈推論を実現ハイブリッドアテンションと Multi-Token Prediction を採用し、1M トークン環境下でも高い推論精度を維持するエージェント特化型モデル。LLMMoEAgenticLongContext
🔥🔥2026-04-24DeepSeek、V4 シリーズを公開──1.6T のオープンウェイト最大級モデルと圧倒的な低価格推論を実現GPT-5.4 級に肉薄する性能を維持しつつ、KV キャッシュを前世代比最大 93% 削減。1M トークンの長文脈推論を既存フロンティアモデルの数分の一のコストで提供する。LLMMoEOpenWeightsDeepSeek
🔥🔥2025-05-28LLM脱獄手法「The Gay Jailbreak」公開──「政治的正しさ」を逆手に取り GPT-4o や o3 の拒否を回避特定の属性への配慮を優先するアライメントの脆弱性を突き、有害な指示を遂行させる新手法。安全策が強化されるほど突破しやすくなる逆説的な特性を持つ。JailbreakLLM SafetyAlignmentGPT-4o
🔥🔥2025-05-20メタ学習論文「P」の実装による再現性と学習安定性の検証メタ学習アルゴリズム「P」のオープンソース実装と、学習時におけるハイパーパラメータ依存性の解析。(原題: I implemented meta paper P)Meta-LearningReproducibilityImplementation
🔥🔥2024-06-17LLM の拒絶挙動を制御する「単一のベクトル」を特定──13 種のオープンモデルで実証モデル内部の残留ストリームから特定の 1 次元を削除するだけで、安全ガードレールを無効化できるメカニズムを解明した。LLMAI SafetyMechanistic InterpretabilityJailbreak
🔥🔥2025-01-20複数カメラの人物追跡で「ゴースト」をリアルタイム抑制──自己校正ホモグラフィで位置合わせを自動化カメラ間の幾何学的関係を自動推定し、死角や重なりで生じる誤検知を排除。キャリブレーション不要で実環境へ導入可能。(原題: Self-calibrating cross-camera homography for real-time ghost prediction in multi-camera person tracking)Multi-Camera TrackingComputer VisionHomographyReal-time
🔥🔥2026-05-02Apple、サポートアプリ内に Claude.md ファイルを誤混入──LLM 統合を裏付ける内部構成Apple Support アプリのパッケージ内に Claude 関連の定義ファイルが発見され、今後の AI 機能統合に向けた準備が進行中であることが判明した。AppleClaudeLLMHacker News
🔥🔥2026-05-01Lum1104、コードベース可視化ツール Understand Anything を公開──Claude Code 連携で依存関係をグラフ化ソースコードやドキュメントを知識グラフに変換し、Claude Code 等から対話的にアーキテクチャやビジネスロジックを探索可能にする。LLMClaude CodeKnowledge GraphDeveloper Tools
🔥2026-05-01darrylmorley、macOS メニューバーアプリ WhatCable を公開──USB-C ケーブルの給電・転送性能を可視化外観では判別不能な USB-C ケーブルの e-marker 情報を IOKit 経由で取得し、最大 240W 給電や 80Gbps 通信の対応可否を即座に判定する。macOSUSB-CHardwareUtility
🔥🔥2026-04-30Microsoft、OSSライブラリ lib0xc を公開──C言語の安全性を高める標準ライブラリ拡張既存のCコードと互換性を保ちつつ、コンパイル時の境界チェックと型安全性を強化するAPI群を提供し、メモリ安全性の向上を支援する。CSystemsProgrammingSafetyMicrosoft
🔥2026-04-15VS Code、エディタ機能「AI 共同作成者タグ」をデフォルト有効化──利用有無を問わずコミットに Copilot 署名GitHub Copilot の利用実態に関わらず Git コミットメッセージへ AI 署名を強制付与する PR がマージされ、履歴の正確性を重視する開発者の間で議論となっている。VS CodeGitHub CopilotGitOpen Source
🔥2024-08-21Apple、「Apple Support」アプリ内に設定ファイル Claude.md を誤混入──マルチ LLM 採用を裏付けApple Intelligence 以外のサポート業務でも Anthropic の Claude を検証・活用している実態が、アプリ内パッケージの露出により浮き彫りになった。AppleClaudeAnthropiciOS
🔥🔥2026-05-02Figure AI、人型ロボット Figure 03 の足部を公開──ワイヤレス充電機能を統合Figure 03 に搭載された新設計の足部により、自律的なワイヤレス充電が可能となり、24時間稼働の運用サイクルを確立した。roboticshardwareFigure AIautomation
🔥🔥2026-05-01Microsoft、Word向け「Legal Agent」を公開──法務特化の契約書レビューとリスク抽出を自動化元Robin AIエンジニアの知見を統合し、汎用LLMではなく実務のプレイブックに基づいた構造化ワークフローで契約審査を完結させる。MicrosoftWordAgentic AILegalTech
🔥🔥2025-02-23Reddit ユーザー、LLM で呪文ロジックをリアルタイム生成するオンライン対戦ゲームデモを公開プロンプトから呪文の挙動・視覚効果・ロジックを即時生成し、固定されたスキルセットが存在しない自由な対戦環境をブラウザ上で実現した。Generative AIGame DevelopmentReal-time GenerationLLM