databricks/databricks-dolly-15k
Viewer • Updated • 15k • 35.1k • 972
How to use Aleberna5/llama3-8b-dolly-instruct with PEFT:
from peft import PeftModel
from transformers import AutoModelForCausalLM
base_model = AutoModelForCausalLM.from_pretrained("unsloth/llama-3-8b-bnb-4bit")
model = PeftModel.from_pretrained(base_model, "Aleberna5/llama3-8b-dolly-instruct")Este modelo es una versión optimizada de Llama-3-8B (Meta) ajustada para seguir instrucciones de manera más precisa. Se ha utilizado la técnica de Fine-Tuning Eficiente (PEFT) mediante LoRA sobre una versión cuantizada de 4 bits.
unsloth/llama-3-8b-bnb-4bit (Llama-3-8B optimizado)databricks/databricks-dolly-15kEl modelo fue entrenado con el dataset Dolly-15k, que contiene aproximadamente 15,000 registros generados por humanos en categorías como:
El entrenamiento se realizó en un entorno de Google Colab utilizando una GPU NVIDIA T4.
Para cargar este modelo, necesitas tener instaladas las librerías peft, transformers y bitsandbytes.
from peft import PeftModel
from transformers import AutoModelForCausalLM, AutoTokenizer
import torch
model_id = "unsloth/llama-3-8b-bnb-4bit"
adapter_id = "TU_USUARIO/TU_MODELO"
tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto", torch_dtype=torch.float16)
model = PeftModel.from_pretrained(model, adapter_id)
prompt = "### Inst:\nExplain why the sky is blue.\n### Resp:\n"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
Base model
meta-llama/Meta-Llama-3-8B