2026年4月27日 (月)

22件 · 70分

今日の主役は学習データの質的転換だ。Hugging Face が公開した 15 兆トークンの FineWeb は、Web クローリングデータのフィルタリング戦略を刷新し、既存のデータセットと比較してモデルの学習効率を実測で約 20% 向上させた。これに呼応するように、Jackrong が DeepSeek-V4-Flash の思考プロセス 8,000 件を公開し、SWE-bench Verified が評価の信頼性を高めた 500 件の課題を提示した事実は、単なるデータ増量から「推論と評価の質」へ主戦場が移ったことを意味する。周辺では Microsoft と OpenAI が計算資源の優先確保で提携を深める一方、中国当局が Meta の大型買収を阻止しており、インフラの囲い込みと地政学的リスクが市場を二分する様相だ。エンジニアは公開された FineWeb のパイプラインを自社の事前学習データ精査に転用し、評価指標の再定義を来月の開発目標に組み込んでおきたい。

Since yesterday

New 22

Ongoing 0

Ended 22

🔥🔥🔥2024-04-18

Hugging Face、15兆トークンの高品質データセット FineWeb を公開──LLM 学習効率を大幅改善

44TB の Common Crawl データを独自のパイプラインで精査。オープンな事前学習データの新基準として、Llama 3 世代の性能再現を支援する。

LLM Dataset Pre-training HuggingFace

🔥🔥2026-04-24

Jackrong、DeepSeek-V4-Flash 生成の推論データセットを公開──約 8,000 件の思考プロセスを収録

DeepSeek-V4-Flash を教師モデルとし、数学・論理・コード生成など多様なタスクに対する思考プロセス（Reasoning Trace）を 8,000 件以上収録した蒸留用データセット。

DeepSeek-V4 Reasoning Distillation Dataset

🔥🔥2026-04-23

RLVRによる推論学習は思考過程と最終回答の因果関係を保証しない──補助報酬による改善手法を提案

RLVR（検証可能な報酬を用いた強化学習）が思考過程の質に与える影響をCIRとSRで定量化。補助報酬の追加で回答精度を維持しつつ推論の因果性を向上。（原題: Outcome Rewards Do Not Guarantee Verifiable or Causally Important Reasoning）

LLM RLVR Reasoning Post-training

🔥🔥2026-04-23

自律エージェントの長期記憶をグラフ構造なしで高速化するMemanto──推論精度89.8%を達成

13種の型付きメモリと情報理論的検索エンジンにより、インジェクション遅延ゼロ・検索90ms以下を実現。（原題: Memanto: Typed Semantic Memory with Information-Theoretic Retrieval for Long-Horizon Agents）

LLM Agent Memory RAG

🔥🔥2026-04-23

LLMの戦略的リスクを自動評価するフレームワークESRRSimを提案──検知率14.45%-72.72%のモデル間格差を特定

欺瞞や評価ハッキング等のリスクを7分類20項目で網羅的に評価し、モデルの適応的行動を可視化。（原題: Emergent Strategic Reasoning Risks in AI: A Taxonomy-Driven Evaluation Framework）

LLM AI Safety Agentic Framework Evaluation

🔥🔥2026-04-07

Embodied AIの真のリスクは雇用喪失ではなくガバナンスの遅延である

技術普及速度に公的機関の監視・法規制が追いつかない「ガバナンスの遅延」を3つの側面から定義。（原題: The Biggest Risk of Embodied AI is Governance Lag）

Embodied AI Governance Robotics Policy

🔥🔥2026-04-02

創薬AIのボトルネックはワークフロー編成能力──階層型スキル設計で複雑な探索タスクを自動化

3階層70種類のスキルで30以上の専門ツールを統合し、創薬タスクの成功率をSOTA水準へ引き上げ。（原題: MolClaw: An Autonomous Agent with Hierarchical Skills for Drug Molecule Evaluation, Screening, and Optimization）

AI Drug Discovery Agent Workflow

🔥🔥2025-02-24