Gemma 4 E2B IT GGUF

Conversión propia de google/gemma-4-E2B-it a formato GGUF para uso con llama.cpp y despliegue local.

Archivos

  • gemma-4-E2B-it-fp16.gguf
  • gemma-4-E2B-it-Q4_K_M.gguf
  • SHA256SUMS

Checksums

9f2e0e10a0e10d15021aa916d1d0b6d248fa2d3f84197c13dff9dc316ffe3571  gemma-4-E2B-it-fp16.gguf
e9fc4a0cf6f509342efd556a6178450952e0230f184ed79ab88e59979ddf3a55  gemma-4-E2B-it-Q4_K_M.gguf

Notas

  • Modelo base: google/gemma-4-E2B-it
  • Licencia original del modelo base: Apache 2.0
  • Esta publicación contiene conversiones GGUF para inferencia local
  • El archivo Q4_K_M fue cuantizado para reducir memoria y tamaño en disco

Uso con llama.cpp

./llama-cli -m gemma-4-E2B-it-Q4_K_M.gguf -cnv

Si prefieres máxima fidelidad frente al modelo original, usa la variante fp16. Si priorizas tamaño y velocidad, usa Q4_K_M.

Origen

Este repositorio no es el modelo base original. El mérito del modelo corresponde a Google DeepMind y a la publicación oficial de google/gemma-4-E2B-it.

Downloads last month
63
GGUF
Model size
5B params
Architecture
gemma4
Hardware compatibility
Log In to add your hardware

4-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for rdrgzlng/gemma-4-E2B-it-GGUF

Quantized
(247)
this model