Qwen3.5-0.8B-GGUF / README.md
rdrgzlng's picture
Upload folder using huggingface_hub
e8e652f verified
|
Raw
History Blame Contribute Delete
904 Bytes
---
license: apache-2.0
base_model: Qwen/Qwen3.5-0.8B
language:
- multilingual
library_name: llama.cpp
tags:
- gguf
- llama.cpp
- quantized
- multimodal
- vision
---
# Qwen3.5-0.8B GGUF
Conversión propia de `Qwen/Qwen3.5-0.8B` a GGUF para uso con `llama.cpp`.
## Archivos
- `Qwen3.5-0.8B-fp16.gguf`
- `Qwen3.5-0.8B-Q4_K_M.gguf`
## Notas
El archivo `Q4_K_M` fue cuantizado con `llama.cpp`.
Algunos tensores requirieron fallback automático a otros formatos de cuantización por restricciones de forma.
## Características del modelo
- **Parámetros**: 0.8B
- **Arquitectura**: híbrida Gated DeltaNet + atención completa (6 × bloques alternados)
- **Contexto**: 262 144 tokens (256K)
- **Multimodal**: soporta entrada de texto e imagen
- **Idiomas**: 201 idiomas y dialectos
- **Licencia**: Apache 2.0
## Uso con llama.cpp
```bash
./llama-cli -m Qwen3.5-0.8B-Q4_K_M.gguf -cnv
```