gradio==4.26.0 transformers==4.38.1 torch==2.1.2 torchvision==0.16.2 torchaudio==2.1.2 # Optimization für HF Spaces accelerate==0.27.0 bitsandbytes==0.42.0 # 8-bit quantization peft==0.8.2 safetensors==0.4.1 # Model formats sentencepiece==0.2.0 pydantic==2.5.3 # Server python-multipart==0.0.9 fastapi==0.109.0 # Für app_fastapi.py uvicorn==0.27.0 # ASGI server # Optional: GGUF Support (für extrem komprimierte Modelle) # llama-cpp-python==0.2.45 # Uncomment falls du GGUF nutzen willst # Optional: Quantization Tools # auto-gptq==0.7.1 # Für GPTQ quantization # optimum==1.18.0 # Hugging Face Optimum