Instructions to use NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- MLX
How to use NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx with MLX:
# Make sure mlx-vlm is installed # pip install --upgrade mlx-vlm from mlx_vlm import load, generate from mlx_vlm.prompt_utils import apply_chat_template from mlx_vlm.utils import load_config # Load the model model, processor = load("NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx") config = load_config("NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx") # Prepare input image = ["http://images.cocodataset.org/val2017/000000039769.jpg"] prompt = "Describe this image." # Apply chat template formatted_prompt = apply_chat_template( processor, config, prompt, num_images=1 ) # Generate output output = generate(model, processor, formatted_prompt, image) print(output) - Notebooks
- Google Colab
- Kaggle
- Local Apps Settings
- LM Studio
- Pi
How to use NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx with Pi:
Start the MLX server
# Install MLX LM: uv tool install mlx-lm # Start a local OpenAI-compatible server: mlx_lm.server --model "NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx"
Configure the model in Pi
# Install Pi: npm install -g @mariozechner/pi-coding-agent # Add to ~/.pi/agent/models.json: { "providers": { "mlx-lm": { "baseUrl": "http://localhost:8080/v1", "api": "openai-completions", "apiKey": "none", "models": [ { "id": "NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx" } ] } } }Run Pi
# Start Pi in your project directory: pi
- Hermes Agent new
How to use NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx with Hermes Agent:
Start the MLX server
# Install MLX LM: uv tool install mlx-lm # Start a local OpenAI-compatible server: mlx_lm.server --model "NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx"
Configure Hermes
# Install Hermes: curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash hermes setup # Point Hermes at the local server: hermes config set model.provider custom hermes config set model.base_url http://127.0.0.1:8080/v1 hermes config set model.default NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx
Run Hermes
hermes
gemma-4-26b-a4b-it-qat-q4_0-mlx
Checkpoint MLX quantifié QAT Q4_0 pour Apple Silicon, dérivé de
google/gemma-4-26B-A4B-it (release officielle Gemma 4 QAT de Google).
Ce dépôt publie une variante locale préparée pour Oriloq MLX. L'objectif est de diffuser un checkpoint téléchargeable tel quel par identifiant de repo Hugging Face, lisible par les chargeurs MLX.
Résumé
- Famille : Gemma 4 26B A4B
- Base model :
google/gemma-4-26B-A4B-it - Repo id conseillé :
NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx - Modalités : text, image
- Architecture : MoE
- Couches texte : 30
- Quantification : affine 4-bit uniforme,
group_size=32,mode=affine(Q4_0) - Taille totale des poids : 16.93 GB
- Plus gros shard : 5.37 GB
Quantification
- Schéma homogène : quantification affine asymétrique 4-bit, blocs de 32 (Q4_0),
appliquée uniformément (pas d'override par couche dans
config.json). .weighten U32,.scaleset.biasesen BF16.- Provient de la quantification du checkpoint QAT officiel
*-qat-q4_0-unquantizedde Google : le modèle a été entraîné en tenant compte de la quantification (Quantization-Aware Training), ce qui limite la perte de qualité face à une quantification post-entraînement classique.
Fichiers de poids
model-00001-of-00004.safetensorsmodel-00002-of-00004.safetensorsmodel-00003-of-00004.safetensorsmodel-00004-of-00004.safetensors
Format et compatibilité
- Format de repo :
safetensors+config.json+ tokenizer/chat template. - Pensé pour les chargeurs MLX capables de lire la section
quantizationdeconfig.json. - Checkpoint MLX complet, ce n'est pas un alias vers le modèle Google original.
Téléchargement
from huggingface_hub import snapshot_download
local_path = snapshot_download("NeoRoth/gemma-4-26b-a4b-it-qat-q4_0-mlx")
print(local_path)
Licence et conditions d'utilisation
Ce checkpoint est un dérivé de Gemma (modèle de base google/gemma-4-26B-A4B-it) et reste
soumis aux Gemma Terms of Use. Il n'est pas sous licence Apache 2.0.
Gemma is provided under and subject to the Gemma Terms of Use found at ai.google.dev/gemma/terms
- Conditions complètes : https://ai.google.dev/gemma/terms
- Politique d'usage interdit (Prohibited Use Policy) : https://ai.google.dev/gemma/prohibited_use_policy
- Usage commercial autorisé dans le strict respect de ces conditions.
- En téléchargeant ou en utilisant ce checkpoint, vous acceptez les Gemma Terms of Use et la Prohibited Use Policy, qui se propagent à tout usage en aval.
Le fichier LICENSE de ce dépôt rappelle l'avis Gemma à transmettre aux
utilisateurs downstream.
- Downloads last month
- 276
Quantized