News Articles Projects About

2026年5月24日 (日)

15件 · 45分

← 05-23 Archive 05-25 →

今日の主役はエージェント特化型モデルにおける推論効率の再定義だ。Cohereが公開した218B MoEのCommand A+は、アクティブパラメータを25Bに抑えつつエージェント性能を強化しており、巨大な計算資源を投じずとも高精度なツール利用が可能であることを示した。これと対照的に、Googleが公開したAndroid XR搭載AIメガネのプロトタイプは、オンデバイス処理とクラウドの境界を再定義するものであり、ハードウェア側からのAI実装が本格化していると見ていい。周辺では、anomalycoがモデル価格データベースModels.devをOSS化した点が重要だ。各社のAPI単価やスペックを横並びで比較可能なインフラが整ったことで、コスト最適化の自動化が加速するだろう。モデルの軽量化とハードウェア統合、そしてコスト可視化の3点が揃った今週、自社パイプラインの構成を見直すタイミングだ。

Since yesterday

New 15

Ongoing 0

Ended 14

🔥🔥🔥2026-05-01

Cohere、218B MoE モデル Command A+ を公開──25B アクティブパラメータでエージェント性能を強化

48 言語対応の Apache 2.0 ライセンス。128K コンテキストと画像入力を備え、推論プロセスを可視化する思考ログ生成と高精度なツール連携に特化している。

Cohere MoE LLM Agentic AI

🔥🔥🔥2026-05-23

Google、マルチモーダルモデル Omni Flash を公開──実写動画への高度な被写体合成と編集を実現

従来の Veo を刷新し、動画や写真を元にした「Anything-to-Anything」の生成に対応。実写の人物を別環境へ合成する精度が向上し、テキストによる編集指示の追従性も強化された。

Gemini Omni Omni Flash Video Generation Deepfake

🔥🔥🔥2026-05-17

OpenBMB、エッジ特化 MLLM「MiniCPM-V 4.6」を公開──0.8B 規模で 2B 級の視覚理解を実現

視覚エンコードの計算量を 50% 削減しつつ、iOS/Android へのネイティブ実装と OCR 性能の両立を 10 億パラメータ未満で達成した。

MLLM Edge AI MiniCPM OpenSource

🔥🔥🔥2026-05-03

SulphurAI、動画生成モデル Sulphur 2 を公開──LTX 2.3 ベースの検閲なし t2v/i2v 対応モデル

LTX 2.3 の全フォーマットをネイティブサポートし、専用のプロンプト拡張機能により、ローカル環境でも高品質な動画生成ワークフローを構築できる。

Video Generation LTX 2.3 Uncensored Open Source

🔥🔥🔥2026-01-29

CircleStone Labs、20億パラメータの画像生成モデル Anima を公開──アニメ特化の非商用ベースモデル

NVIDIA Cosmos 基盤で数百万のアニメ画像を学習。Danbooru タグと自然言語を併用でき、ComfyUI で 1536px 級のイラストを高精度に生成する。

Image Generation Anime NVIDIA Cosmos ComfyUI

🔥2025-03-06

VLA モデルは環境の僅かな変化で成功率が 80% から 20% へ急落──空間推論の脆弱性を特定

視覚・言語・行動（VLA）モデルが直面する未知の課題を体系化。空間配置や指示の微細な変化への耐性を評価。（原題: Novel Problems in Vision-Language-Action Models）

VLA Robotics Spatial Reasoning Robustness

🔥🔥2026-05-19

Transformer のメモリ律速を解消──非 Attention 演算を GEMM 後処理として統合する CODA

Transformer ブロック内の正規化や活性化関数を GEMM のエピローグとして再定義し、GPU メモリへの冗長なアクセスを削減。（原題: CODA: Rewriting Transformer Blocks as GEMM-Epilogue Programs）

Transformer GPU Kernel GEMM Memory-Bound

🔥🔥2026-05-23

anomalyco、AI モデルスペック・価格データベース Models.dev を OSS 公開──Vercel AI SDK 互換の API を提供

各社 LLM のトークン単価、コンテキスト窓、Reasoning 対応の有無などを TOML で管理し、Vercel AI SDK 互換の ID でスペックを動的取得できる開発者向けカタログ。

LLM Pricing Vercel AI SDK OSS

🔥🔥2026-05-23

Superset、エージェント専用 IDE を公開──Claude Code 等を並列実行

複数の CLI エージェントを git worktree で独立させて同時稼働し、開発者のコンテキストスイッチを排除して 10 倍速のコーディングを目指す。

AI Agent IDE Claude Code Git Worktree

🔥2026-05-23

nand2mario、FPGA CPU z386 を公開──Intel オリジナルのマイクロコードで 80386 を再現

Intel 80386 のマイクロコードを解析・実装し、FPGA 上で DOS 6/7 や Doom が動作する 70MHz 相当の処理能力を実現した教育・実用向けオープンソースプロジェクト。

FPGA 80386 CPU OpenSource

🔥2026-05-21

松田明氏、Unix シェル Rubish を公開──Bash 互換と Ruby メソッドチェーンをシームレスに統合

Bash スクリプトを無修正で実行できる完全な互換性を維持しつつ、シェルコマンドを Ruby のメソッドとして連鎖させ、条件分岐に Ruby 式を直接記述できるツール。

Ruby Unix Shell Bash OSS

🔥2021-08-06

Web 標準 HTML <dl> 要素の再評価──セマンティックな名前・値ペアの実装ガイド

<div> の羅列を避け、スクリーンリーダー等の支援技術が構造を正しく解釈できるアクセシブルな名前・値リストの構築手法を解説。

HTML Accessibility Web Standards Frontend

🔥🔥2026-05-24

Figure AI、ヒューマノイドロボットによる 200 時間連続の荷役作業を完遂──自律的な物流実証の成果を公開

物流拠点での実運用を想定し、8 日間以上にわたるパッケージハンドリングを自律的に継続。人型ロボットが「デモ」から「実稼働」のフェーズへ移行したことを示す。

Humanoid Robot Figure AI Logistics Autonomous Robotics

🔥🔥2026-05-22

Google、Android XR 搭載 AI メガネのプロトタイプを公開──Gemini 連携とレンズ内表示を統合

Google I/O で披露された次世代ウェアラブルは、Samsung らと提携した高いデザイン性と、現実空間に Gemini の回答や翻訳を重ねる実用的な AR 体験を両立する。

Android XR Gemini Smart Glasses AR

🔥🔥2026-05-22

Google 検索、AI サマリー優先 UI で不具合──「disregard」検索時に巨大な空白が表示され機能不全

Google が AI 応答を最前面に配置した結果、辞書検索などの基本機能で UX が崩壊し、皮肉にも Bing の有用性が上回る逆転現象が起きている。

Google AI Overviews Search UX

⚠ 一部カテゴリが未達（15 件）