File size: 904 Bytes
e8e652f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
---
license: apache-2.0
base_model: Qwen/Qwen3.5-0.8B
language:
  - multilingual
library_name: llama.cpp
tags:
  - gguf
  - llama.cpp
  - quantized
  - multimodal
  - vision
---

# Qwen3.5-0.8B GGUF

Conversión propia de `Qwen/Qwen3.5-0.8B` a GGUF para uso con `llama.cpp`.

## Archivos

- `Qwen3.5-0.8B-fp16.gguf`
- `Qwen3.5-0.8B-Q4_K_M.gguf`

## Notas

El archivo `Q4_K_M` fue cuantizado con `llama.cpp`.
Algunos tensores requirieron fallback automático a otros formatos de cuantización por restricciones de forma.

## Características del modelo

- **Parámetros**: 0.8B
- **Arquitectura**: híbrida Gated DeltaNet + atención completa (6 × bloques alternados)
- **Contexto**: 262 144 tokens (256K)
- **Multimodal**: soporta entrada de texto e imagen
- **Idiomas**: 201 idiomas y dialectos
- **Licencia**: Apache 2.0

## Uso con llama.cpp

```bash
./llama-cli -m Qwen3.5-0.8B-Q4_K_M.gguf -cnv
```