BaseRT、Apple Silicon 向け推論ランタイムを公開──llama.cpp 比で最大 1.56 倍の高速化を実現
Apple Silicon の統合メモリ構造に最適化したネイティブ Metal 実装により、M3/M4 Pro 環境での LLM 推論スループットを大幅に引き上げた。