News Articles Projects About

2026年5月4日 (月)

11件 · 32分

← 05-03 Archive 05-05 →

今日の主役は、コーディングや医療診断といった高難度ドメインにおける SOTA の塗り替えと、それに伴う実効性能の再定義にある。Moonshot AI の Kimi K2.6 が競技プログラミングで GPT-5.5 や Claude を抑えて首位に立ち、一方で OpenAI o1 は救急外来の初診正解率 67% で医師を凌駕した。汎用的な知能競争から、特定領域で「人間や既存 SOTA を実効的に超える」実利的な性能競争へ軸足が移ったと見ていい。周辺では、学習レシピの自動進化でコストを 2 割削減する議論や、エージェント基盤 Mendral による Harness 分離の設計指針が公開されている。インフラコストの最適化とセキュリティの両立を急ぐ PM やリードは、これらの実装詳細を読んでおきたい。

Since yesterday

New 11

Ongoing 0

Ended 12

🔥🔥🔥2026-04-30

Moonshot AI、モデル Kimi K2.6 を公開──コーディング競技で GPT-5.5 や Claude を抑え首位

リアルタイムの意思決定と TCP プロトコル実装が求められる動的パズル競技において、中国のオープンウェイトモデルが米国勢のフロンティアモデルを凌駕した。

LLM Open-Weights CodingBenchmark Kimi

🔥🔥2026-05-04

Reddit、深層学習向け最適化アルゴリズムの自動進化手法を議論──学習レシピの最適化でコスト 2 割削減

手動設計の AdamW に代わり、プログラム探索で発見された Optimizer が LLM の学習コストを 10% 以上削減する実用段階に達した。

LLM Optimizer DeepLearning Research

🔥🔥2026-05-03

ハーバード大、救急外来の診断モデル研究で OpenAI o1 が医師を凌駕──初診正解率 67% を達成

76 件の救急症例において、OpenAI o1 が内科医の診断精度（50-55%）を 10 ポイント以上上回り、特に情報が少ない初診段階での推論能力の高さを示した。

LLM Medical AI OpenAI o1 Reasoning

🔥2025-07-02

ネアンデルタール人、12.5万年前に「脂肪工場」を運営──172頭以上の骨を砕き加熱抽出する高度な加工技術を実証

ドイツの遺跡で大型哺乳類の骨片数万点を発見。従来の定説を数万年遡る、組織的かつ労働集約的な資源管理の実態が明らかになった。

Anthropology Archaeology Neanderthals Evolutionary Biology

🔥🔥2025-01-24

150ドルの低価格FPGAでQwen3-30Bを18 t/s駆動──LLM推論専用アクセラレータ「Hummingbird+」

24GBメモリ搭載の低コストFPGAにより、30BクラスのLLMを実用速度で動作。量産コスト150ドルを目指す。（原題: Hummingbird+: Low-cost FPGAs for LLM Inference）

FPGA LLM Inference Edge AI Hardware Acceleration

🔥2026-05-03

Christopher Meiklejohn、AI エージェント基盤 Rift を公開──30 年の経験を反映した開発フローの自動化

開発者の「フロー状態」を維持するため、エージェントがバックグラウンドでコードの整合性維持やリファクタリングを自律実行する。

AI Agents LSP Software Engineering Rift

🔥🔥2026-05-01

BYOMesh、LoRa メッシュ無線通信ツールを公開──帯域幅を従来比 100 倍に拡張

長距離・低電力な LoRa 通信に広帯域メッシュ網を導入し、エッジ AI 端末間での画像転送やデータ共有を実用レベルに引き上げる。

LoRa Mesh Network Edge AI IoT

🔥🔥2026-04-10

Mendral、エージェント実行基盤の設計指針を公開──Harness をサンドボックス外に分離し、セキュリティとマルチユーザー対応を両立

制御ループをバックエンドに配置し、ファイルシステムを仮想化することで、25ms の高速起動と組織内でのメモリ共有を両立する設計思想。

Agentic Workflow Infrastructure Security Inngest

🔥2023-01-01

Southwest Airlines、航空訓練施設 LEAD Center を公開──100万ドルの CAE 737 シミュレータ群と緊急対応訓練の全容

23台のフライトシミュレータや8秒以内の酸素マスク装着試験など、航空安全を支えるミッションクリティカルな教育インフラの全容。

SouthwestAirlines AviationTech Simulator SafetyTraining

🔥🔥2026-05-03

クリエイターが Claude で開発した動画撮影アプリ DualShot Recorder 公開──12 時間で App Store 有料首位

非エンジニアが Claude を用いた Vibe-coding で、iPhone センサー全域から縦横動画を同時切り出しする高度な制御を実装し、実用的なツールとして成功させた。

Claude Vibe-coding iOS Video Production

🔥2026-05-02

Simon Willison、CMS 連携機能「Sightings」を公開──Claude Code を使いモバイル端末のみで開発

iNaturalist の観察記録をブログへ自動同期する機能を、Claude Code を使いスマートフォンからのプロンプト操作のみで構築・デプロイした。

Claude Code Simon Willison iNaturalist LLM Agent

⚠ 一部カテゴリが未達（11 件）