Spaces:

lilmeaty
/

vllmxd

Runtime error

Hjgugugjhuhjggg commited on Nov 15, 2024

Commit

5f8cec1

verified ·

1 Parent(s): 017c336

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,11 +9,20 @@ app = Flask(__name__)
 device = "cuda" if torch.cuda.is_available() else "cpu"
 # Inicializar los modelos con el dispositivo adecuado (GPU o CPU)
-modelos = {
-    "facebook/opt-125m": LLM(model="facebook/opt-125m", device=device),
-    "llama-3.2-1B": LLM(model="Hjgugugjhuhjggg/llama-3.2-1B-spinquant-hf", device=device),
-    "gpt2": LLM(model="gpt2", device=device)
-}
 # Configuración de caché para los modelos
 caches = {
@@ -164,4 +173,8 @@ def chat():
     return render_template_string(html_code_chatbot)
 if __name__ == '__main__':
-    app.run(host='0.0.0.0', port=7860)

 device = "cuda" if torch.cuda.is_available() else "cpu"
 # Inicializar los modelos con el dispositivo adecuado (GPU o CPU)
+try:
+    modelos = {
+        "facebook/opt-125m": LLM(model="facebook/opt-125m", device=device),
+        "llama-3.2-1B": LLM(model="Hjgugugjhuhjggg/llama-3.2-1B-spinquant-hf", device=device),
+        "gpt2": LLM(model="gpt2", device=device)
+    }
+except KeyError as e:
+    print(f"Error al inicializar el modelo con {device}: {e}")
+    modelos = {}
+# Verificar si los modelos fueron correctamente inicializados
+if not modelos:
+    print("Error: No se pudo inicializar ningún modelo.")
+    exit(1)
 # Configuración de caché para los modelos
 caches = {
     return render_template_string(html_code_chatbot)
 if __name__ == '__main__':
+    # Asegurar que el servidor solo arranca si los modelos fueron inicializados correctamente
+    if modelos:
+        app.run(host='0.0.0.0', port=7860)
+    else:
+        print("Error: No se pudieron cargar los modelos. El servidor no se iniciará.")