News Articles Projects About

2026年5月13日 (水)

12件 · 40分

← 05-12 Archive 05-14 →

今日の主役はマルチモーダル埋め込みの統合的進化だ。Jina AI が公開した jina-embeddings-v5-omni は、テキスト性能を維持したまま画像・音声を同一ベクトル空間へ射影し、検索精度を損なわずにマルチモーダル RAG を実現する。これに呼応するように、Cactus Compute が Gemini 蒸留による 26M パラメータの Needle を発表し、推論 1200 tokens/sec という圧倒的な速度でツール呼び出しを実装した──「高精度な埋め込み」と「軽量な推論」が揃ったことで、エージェントの実装コストは一段階下がるだろう。周辺では、Microsoft が公開した SocialReasoning-Bench が交渉時の社会的推論能力を定量化しており、単なるタスク処理から対人交渉へとエージェントの評価軸がシフトしている。特に医療ドメインの基盤モデル BRAVE が陰性症例の 7 割を自動除外する成果を出した点は、専門業務における AI の実装優先度を再考させる。明日以降の開発ロードマップには、これらの軽量モデルとドメイン特化モデルの組み合わせを組み込んでおきたい。

Since yesterday

New 12

Ongoing 0

Ended 11

🔥🔥🔥2026-05-08

Jina AI、マルチモーダル埋め込みモデル jina-embeddings-v5-omni 公開──テキスト性能を維持しつつ画像・音声を統合

既存のテキスト埋め込み空間を固定し、わずか 0.35% の追加学習で画像・音声・動画のクロスモーダル検索を可能にした。

LLM Multimodal Embeddings RAG

🔥🔥🔥2026-05-11

Microsoft、AI エージェントの社会的推論ベンチマーク SocialReasoning-Bench を公開──交渉時の利益最大化能力を測定

GPT-5.4 や Claude 4.6 級のモデルでも、価格交渉において相手の不利な条件を 90% 以上受け入れてしまう「社会的推論」の欠如を定量化した。

Microsoft Research LLM Benchmark AI Agents Social Reasoning

🔥🔥🔥2025-02-13

OpenAI、「Parameter Golf」の知見を公開──AI エージェントによるモデル軽量化の自動探索手法を提示

AI エージェントが研究者の代わりに「実装・実験・評価」のループを自律的に回すことで、人間が数週間かける最適化を数時間に短縮する可能性を示した。

OpenAI AI Agents Deep Learning Optimization

🔥🔥2026-05-06

乳腺病理診断の全工程を支援する基盤モデル BRAVE ── 陰性症例の 7 割以上を安全に自動除外

10万枚超の病理画像で学習した乳腺特化型モデル。術前・術中・術後の全診断ワークフローで実用性を実証。（原題: A Breast Vision Pathology Foundation Model for Real-world Clinical Utility）

Foundation Model Medical AI Pathology WSI

🔥🔥🔥2026-05-12

Cactus Compute、Gemini 蒸留の 26M 極小ツール呼び出しモデル Needle を公開──推論 1200 tokens/sec を実現

Gemini 3.1 の知識を 2600 万パラメータに凝縮し、スマホやウェアラブル端末でのローカル実行と高速なツール連携を可能にする。

LLM Tool Calling Edge AI Distillation

🔥2026-05-12

matklad、ソフトウェア設計ガイド Learning Software Architecture を公開──rust-analyzer を事例に「社会的制約」からの設計を提唱

rust-analyzer 開発者が、技術的知識よりも「組織のインセンティブ」と「貢献のしやすさ」がアーキテクチャを決定付ける実態を解説。

Software Architecture Rust rust-analyzer Engineering Management

🔥2026-05-12

エージェント SDK Statewright ── 状態遷移図で AI エージェントのツール利用を制御し信頼性を向上

AI エージェントに「状態」の概念を導入し、フェーズごとに使用可能なツールを制限することで、13B 級の小規模モデルでも SWE-bench 完答を可能にする。

AI Agent State Machine Software Engineering SWE-bench

🔥🔥🔥2026-05-05

PyTorch、オンデバイス推論フレームワーク ExecuTorch を公開──MCU から SoC までネイティブ展開

PyTorch エコシステム内でモデル変換なしにウェアラブルやスマホ、エッジ AI への最適化・デプロイを完結させる。

PyTorch Edge AI On-Device Inference Engine

🔥2024-01-01

Phil Eaton、技術書読書会コミュニティ Software Internals Book Club を運営──2,500名超が参加する高度なシステム学習

データベースや分散システム等の難解な技術書を、メールベースの非同期議論で読破するシニアエンジニア向けのグローバルコミュニティ。

distributed systems databases operating systems community

🔥🔥🔥2026-05-12

Palantir、米ICEのiPhoneに2,000万人分のデータ提供──モバイル監視を加速

捜査官が現場から即座にターゲットを特定・追跡できるモバイル監視インフラが構築され、法執行の執行スピードが非連続的に向上した。

Palantir ICE Privacy Surveillance

🔥🔥🔥2026-05-11

Instructure、LMS「Canvas」への攻撃で身代金を支払──2億7500万人分のデータ保護を優先

北米の高等教育機関の4割が利用するCanvasが2度の攻撃を受け、異例の身代金支払いに踏み切ったことで、SaaS運営者のインシデント対応の是非が問われている。

Cybersecurity LMS SaaS DataBreach

🔥🔥🔥2026-05-12

Google、Gemini 搭載 PC「Googlebook」発表──Android 全域にエージェント機能を統合

Gemini を OS の核に据えた新ハードウェアに加え、自然言語によるウィジェット生成やアプリ間を跨ぐマルチステップ実行など、Android エコシステムの AI エージェント化を加速させる。

Android Gemini Googlebook AI Agent

⚠ 一部カテゴリが未達（12 件）