How to use from
SGLang
Install from pip and serve model
# Install SGLang from pip:
pip install sglang
# Start the SGLang server:
python3 -m sglang.launch_server \
    --model-path "lumen-models/Qwen2.5-7B-Instruct-abliterated-v2-Q4_K_M-GGUF" \
    --host 0.0.0.0 \
    --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "lumen-models/Qwen2.5-7B-Instruct-abliterated-v2-Q4_K_M-GGUF",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'
Use Docker images
docker run --gpus all \
    --shm-size 32g \
    -p 30000:30000 \
    -v ~/.cache/huggingface:/root/.cache/huggingface \
    --env "HF_TOKEN=<secret>" \
    --ipc=host \
    lmsysorg/sglang:latest \
    python3 -m sglang.launch_server \
        --model-path "lumen-models/Qwen2.5-7B-Instruct-abliterated-v2-Q4_K_M-GGUF" \
        --host 0.0.0.0 \
        --port 30000
# Call the server using curl (OpenAI-compatible API):
curl -X POST "http://localhost:30000/v1/chat/completions" \
	-H "Content-Type: application/json" \
	--data '{
		"model": "lumen-models/Qwen2.5-7B-Instruct-abliterated-v2-Q4_K_M-GGUF",
		"messages": [
			{
				"role": "user",
				"content": "What is the capital of France?"
			}
		]
	}'
Quick Links

Qwen 2.5 7B Instruct Abliterated v2 (Spanish Friendly) - GGUF 🚀

Este repositorio contiene el modelo Qwen 2.5 7B Instruct (v2), liberado de censura mediante la avanzada técnica Abliterated por huihui-ai, y convertido al formato ligero GGUF (Cuantización Q4_K_M) por Lumen Models.

Está optimizado para ejecutarse de forma 100% local, privada y eficiente en ordenadores comunes (8GB - 16GB de RAM) utilizando programas gratuitos como LM Studio, Ollama, Jan o Faraday.

🔥 Características Destacadas:

  • 100% Uncensored / Abliterated: Libre de filtros morales, sermones o bloqueos corporativos. Responde de forma directa y madura a cualquier solicitud de escritura creativa, juegos de rol (RP), análisis de textos complejos o investigación sin restricciones.
  • Spanish Native Performance: Una de las mejores arquitecturas del mundo (Qwen 2.5) con una fluidez, vocabulario, gramática y comprensión espectaculares en español nativo.
  • Formato Optimizado Q4_K_M: El método de cuantización más recomendado por la comunidad en Reddit y Hugging Face. Reduce el peso del modelo drásticamente manteniendo casi intacta la inteligencia del modelo original.

💻 ¿Cómo usarlo localmente?

  1. Descarga el archivo .gguf de la pestaña Files and versions.
  2. Ábrelo en tu software favorito:
    • LM Studio: Arrastra el archivo a la carpeta de modelos y cárgalo.
    • Ollama: Crea un Modelfile apuntando a este archivo.
  3. ¡Disfruta de una IA inteligente, rápida y totalmente libre en tu PC!

⚠️ Disclaimer (Descargo de responsabilidad)

Este modelo se comparte exclusivamente con fines de investigación, literatura creativa, testeo de ciberseguridad y desarrollo local privado. Lumen Models actúa únicamente como distribuidor del formato optimizado GGUF y no se hace responsable de las opiniones, sesgos, contenidos generados o del uso final que los usuarios den a las respuestas del modelo.

Downloads last month
663
GGUF
Model size
8B params
Architecture
qwen2
Hardware compatibility
Log In to add your hardware

4-bit

Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for lumen-models/Qwen2.5-7B-Instruct-abliterated-v2-Q4_K_M-GGUF

Base model

Qwen/Qwen2.5-7B
Quantized
(13)
this model