Qwen3.5-0.8B-GGUF / README.md
rdrgzlng's picture
Upload folder using huggingface_hub
e8e652f verified
|
Raw
History Blame Contribute Delete
904 Bytes
metadata
license: apache-2.0
base_model: Qwen/Qwen3.5-0.8B
language:
  - multilingual
library_name: llama.cpp
tags:
  - gguf
  - llama.cpp
  - quantized
  - multimodal
  - vision

Qwen3.5-0.8B GGUF

Conversión propia de Qwen/Qwen3.5-0.8B a GGUF para uso con llama.cpp.

Archivos

  • Qwen3.5-0.8B-fp16.gguf
  • Qwen3.5-0.8B-Q4_K_M.gguf

Notas

El archivo Q4_K_M fue cuantizado con llama.cpp. Algunos tensores requirieron fallback automático a otros formatos de cuantización por restricciones de forma.

Características del modelo

  • Parámetros: 0.8B
  • Arquitectura: híbrida Gated DeltaNet + atención completa (6 × bloques alternados)
  • Contexto: 262 144 tokens (256K)
  • Multimodal: soporta entrada de texto e imagen
  • Idiomas: 201 idiomas y dialectos
  • Licencia: Apache 2.0

Uso con llama.cpp

./llama-cli -m Qwen3.5-0.8B-Q4_K_M.gguf -cnv