Tag: Mcp

Gemma 4 E4B QAT Q4_0をCodex CLIローカルモデルとして評価したメモ

Gemma 4 E4B QAT Q4_0 GGUF を、Codex CLI の text-only local model backend 候補として試した。

比較対象は、先に評価していた Gemma 4 12B Q4_K_M である。見たかったのは、単なる短文応答ではなく次の 4 点だった。

  • 12B より GPU memory が下がるか
  • Codex CLI の agent prompt を現実的な context に収められるか
  • JSON final answer と read-only shell tool use が成立するか
  • 広い文書検索や MCP tool selection で破綻しないか

先に結論を書くと、E4B は memory / speed 面では 12B よりかなり扱いやすい。 一方で、Codex CLI の tool routing まで含めると、12B の単純な置き換えではない。特に MCP tool を model に直接選ばせる構成は不安定で、検索 intent は adapter / router 側でルールベースに拾う方が堅い。

Read more...