News Articles Projects About

🧠Research🔥🔥

HauhauCS、Qwen3.6-35B-A3B の検閲解除版モデルを公開──拒絶率 0% と独自量子化 K_P を採用

Qwen3.6 の MoE アーキテクチャを維持しつつガードレールを完全に排除し、独自手法 K_P 量子化によってファイルサイズを抑えながら 1-2 段階上の推論精度を確保した。

リリース: 2026-04-17 · 読了 2 分

Qwen Uncensored MoE GGUF K_P Quants

HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive (2026-04-17 公開)

記事の要約

1. 核心（What）

Qwen3.6-35B-A3B をベースに、465 件のテストで拒絶率 0% を達成した完全検閲解除（Uncensored）モデル
35B パラメータのうち推論時は 3B のみを使用する MoE 構成で、262K の長文脈とテキスト・画像・動画のマルチモーダルに対応
独自手法「K_P (Perfect) quants」を導入し、通常の GGUF 量子化より 5-15% のサイズ増で 1-2 ランク上の品質を維持
llama.cpp や LM Studio 等の既存 GGUF 互換ランタイムで動作し、128K 以上のコンテキスト保持で思考（Thinking）能力を維持可能

2. 影響（Why）

標準モデルでは「安全性」を理由に拒絶されるエッジケースの解析や、極めて自由度の高い創作・検証において、ベースモデルの推論性能を 100% 活用できる。
量子化による劣化を抑えた K_P 版により、24GB 程度のコンシューマー向け GPU でも、量子化前の性能に近い MoE モデルを実用的な速度で運用できる。
開発者への影響: ローカル LLM を活用する開発者は、llama.cpp 等の既存環境を維持したまま、お節介な拒絶のない 3B 級の軽快な推論環境を構築し、プロンプトエンジニアリングの試行錯誤を大幅に短縮できる。
日本への影響: [国内 AI キャラクター開発・エンタメ業種] のような表現の自由度と推論コストの低さを両立させたい事業者は、本モデルをベースに RAG を構築することで、ガードレールによるユーザー体験（UX）の低下を回避し、一貫したキャラクター性を維持できる。

3. 根拠・詳細（How）

HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive (2026-04-17 公開)

← 日別ページに戻るカテゴリ一覧 (research)