--- license: apache-2.0 base_model: Qwen/Qwen3.5-0.8B language: - multilingual library_name: llama.cpp tags: - gguf - llama.cpp - quantized - multimodal - vision --- # Qwen3.5-0.8B GGUF Conversión propia de `Qwen/Qwen3.5-0.8B` a GGUF para uso con `llama.cpp`. ## Archivos - `Qwen3.5-0.8B-fp16.gguf` - `Qwen3.5-0.8B-Q4_K_M.gguf` ## Notas El archivo `Q4_K_M` fue cuantizado con `llama.cpp`. Algunos tensores requirieron fallback automático a otros formatos de cuantización por restricciones de forma. ## Características del modelo - **Parámetros**: 0.8B - **Arquitectura**: híbrida Gated DeltaNet + atención completa (6 × bloques alternados) - **Contexto**: 262 144 tokens (256K) - **Multimodal**: soporta entrada de texto e imagen - **Idiomas**: 201 idiomas y dialectos - **Licencia**: Apache 2.0 ## Uso con llama.cpp ```bash ./llama-cli -m Qwen3.5-0.8B-Q4_K_M.gguf -cnv ```