Instructions to use gumush/turkish-finance-llama3.1-8b-mlx-4bit with libraries, inference providers, notebooks, and local apps. Follow these links to get started.
- Libraries
- MLX
How to use gumush/turkish-finance-llama3.1-8b-mlx-4bit with MLX:
# Make sure mlx-lm is installed # pip install --upgrade mlx-lm # Generate text with mlx-lm from mlx_lm import load, generate model, tokenizer = load("gumush/turkish-finance-llama3.1-8b-mlx-4bit") prompt = "Write a story about Einstein" messages = [{"role": "user", "content": prompt}] prompt = tokenizer.apply_chat_template( messages, add_generation_prompt=True ) text = generate(model, tokenizer, prompt=prompt, verbose=True) - Notebooks
- Google Colab
- Kaggle
- Local Apps
- LM Studio
- Unsloth Studio new
How to use gumush/turkish-finance-llama3.1-8b-mlx-4bit with Unsloth Studio:
Install Unsloth Studio (macOS, Linux, WSL)
curl -fsSL https://unsloth.ai/install.sh | sh # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for gumush/turkish-finance-llama3.1-8b-mlx-4bit to start chatting
Install Unsloth Studio (Windows)
irm https://unsloth.ai/install.ps1 | iex # Run unsloth studio unsloth studio -H 0.0.0.0 -p 8888 # Then open http://localhost:8888 in your browser # Search for gumush/turkish-finance-llama3.1-8b-mlx-4bit to start chatting
Using HuggingFace Spaces for Unsloth
# No setup required # Open https://huggingface.co/spaces/unsloth/studio in your browser # Search for gumush/turkish-finance-llama3.1-8b-mlx-4bit to start chatting
Load model with FastModel
pip install unsloth from unsloth import FastModel model, tokenizer = FastModel.from_pretrained( model_name="gumush/turkish-finance-llama3.1-8b-mlx-4bit", max_seq_length=2048, ) - Pi new
How to use gumush/turkish-finance-llama3.1-8b-mlx-4bit with Pi:
Start the MLX server
# Install MLX LM: uv tool install mlx-lm # Start a local OpenAI-compatible server: mlx_lm.server --model "gumush/turkish-finance-llama3.1-8b-mlx-4bit"
Configure the model in Pi
# Install Pi: npm install -g @mariozechner/pi-coding-agent # Add to ~/.pi/agent/models.json: { "providers": { "mlx-lm": { "baseUrl": "http://localhost:8080/v1", "api": "openai-completions", "apiKey": "none", "models": [ { "id": "gumush/turkish-finance-llama3.1-8b-mlx-4bit" } ] } } }Run Pi
# Start Pi in your project directory: pi
- Hermes Agent new
How to use gumush/turkish-finance-llama3.1-8b-mlx-4bit with Hermes Agent:
Start the MLX server
# Install MLX LM: uv tool install mlx-lm # Start a local OpenAI-compatible server: mlx_lm.server --model "gumush/turkish-finance-llama3.1-8b-mlx-4bit"
Configure Hermes
# Install Hermes: curl -fsSL https://hermes-agent.nousresearch.com/install.sh | bash hermes setup # Point Hermes at the local server: hermes config set model.provider custom hermes config set model.base_url http://127.0.0.1:8080/v1 hermes config set model.default gumush/turkish-finance-llama3.1-8b-mlx-4bit
Run Hermes
hermes
- MLX LM
How to use gumush/turkish-finance-llama3.1-8b-mlx-4bit with MLX LM:
Generate or start a chat session
# Install MLX LM uv tool install mlx-lm # Interactive chat REPL mlx_lm.chat --model "gumush/turkish-finance-llama3.1-8b-mlx-4bit"
Run an OpenAI-compatible server
# Install MLX LM uv tool install mlx-lm # Start the server mlx_lm.server --model "gumush/turkish-finance-llama3.1-8b-mlx-4bit" # Calling the OpenAI-compatible server with curl curl -X POST "http://localhost:8000/v1/chat/completions" \ -H "Content-Type: application/json" \ --data '{ "model": "gumush/turkish-finance-llama3.1-8b-mlx-4bit", "messages": [ {"role": "user", "content": "Hello"} ] }'
Turkish Finance Llama 3.1 8B - MLX 4-Bit
gumush/turkish-finance-llama3.1-8b-lora modelinin Apple Silicon için MLX formatına dönüştürülmüş ve 4-bit quantize edilmiş halidir.
Türkçe finansal piyasalar için özel olarak fine-tune edilmiştir: kripto para, borsa, teknik analiz, temel analiz, risk yönetimi ve finansal regülasyonlar.
4-Bit vs 8-Bit Karşılaştırma
| Özellik | 4-Bit (Bu Model) | 8-Bit |
|---|---|---|
| Boyut | ~4.2 GB | ~8.5 GB |
| RAM Kullanımı | Düşük | Orta |
| Yanıt Kalitesi | İyi | Daha iyi |
| Hız | Daha hızlı | Hızlı |
| Minimum RAM | 8 GB | 16 GB |
Ne zaman 4-bit? RAM kısıtlı ortamlarda (8GB Mac) veya hız öncelikli kullanımda. Ne zaman 8-bit? Yanıt kalitesi kritik olduğunda ve yeterli RAM varsa (16GB+).
Model Detayları
| Özellik | Değer |
|---|---|
| Orijinal Model | gumush/turkish-finance-llama3.1-8b-lora |
| Base Model | meta-llama/Llama-3.1-8B-Instruct |
| Parametre | 8B |
| Quantization | 4-bit (MLX) |
| Eğitim Yöntemi | QLoRA (4-bit) + SFT |
| Dil | Türkçe |
| Uzmanlık | Finans, Kripto, Borsa, Teknik/Temel Analiz |
| Lisans | MIT |
| Platform | Apple Silicon (M1/M2/M3/M4) |
| Dönüştürücü | mlx-lm |
Gereksinimler
- Apple Silicon Mac (M1, M2, M3, M4)
- macOS 13.5 veya üzeri
- Python 3.10+
pip install mlx-lm
Kullanım
Hızlı Başlangıç (CLI)
mlx_lm.generate \
--model gumush/turkish-finance-llama3.1-8b-mlx-4bit \
--prompt "Teknik analizde RSI indikatörü nedir?" \
--max-tokens 512
Python ile Kullanım
from mlx_lm import load, generate
model, tokenizer = load("gumush/turkish-finance-llama3.1-8b-mlx-4bit")
SYSTEM_PROMPT = """Sen Türkiye finansal piyasaları konusunda uzmanlaşmış bir yapay zeka asistanısın.
Görevin kullanıcılara doğru, güncel ve anlaşılır finansal bilgi sağlamaktır.
SADECE doğruluğundan emin olduğun bilgileri paylaş.
ASLA uydurma terim, kurum veya düzenleme oluşturma.
Her finansal bilgi içeren yanıtın sonunda şu uyarıyı ekle:
'Bu bilgiler genel niteliktedir, yatırım tavsiyesi değildir.
Kararlarınızdan önce lisanslı bir yatırım danışmanına başvurmanız önerilir.'"""
messages = [
{"role": "system", "content": SYSTEM_PROMPT},
{"role": "user", "content": "Teknik analizde RSI indikatörü nedir ve nasıl yorumlanır?"}
]
prompt = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True,
)
response = generate(
model,
tokenizer,
prompt=prompt,
max_tokens=512,
temp=0.7,
top_p=0.9,
)
print(response)
Chat Modu ile Kullanım
from mlx_lm import load, stream_generate
model, tokenizer = load("gumush/turkish-finance-llama3.1-8b-mlx-4bit")
SYSTEM_PROMPT = "Sen Türkiye finansal piyasaları konusunda uzmanlaşmış bir yapay zeka asistanısın."
while True:
user_input = input("\nSoru: ")
if user_input.lower() in ["çık", "exit", "q"]:
break
messages = [
{"role": "system", "content": SYSTEM_PROMPT},
{"role": "user", "content": user_input}
]
prompt = tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True,
)
print("\nYanıt: ", end="", flush=True)
for token in stream_generate(model, tokenizer, prompt=prompt, max_tokens=512, temp=0.7):
print(token, end="", flush=True)
print()
MLX-LM Server (OpenAI Uyumlu API)
mlx_lm.server --model gumush/turkish-finance-llama3.1-8b-mlx-4bit --port 8080
from openai import OpenAI
client = OpenAI(base_url="http://localhost:8080/v1", api_key="not-needed")
response = client.chat.completions.create(
model="gumush/turkish-finance-llama3.1-8b-mlx-4bit",
messages=[
{"role": "system", "content": "Sen Türkiye finansal piyasaları konusunda uzmanlaşmış bir yapay zeka asistanısın."},
{"role": "user", "content": "BIST 100 endeksi nedir?"}
],
temperature=0.7,
max_tokens=512,
)
print(response.choices[0].message.content)
Örnek Sorular
Kripto Para
- "Bitcoin halving döngüsü nedir ve fiyata nasıl etki eder?"
- "DeFi protokollerinde TVL metriği neden önemlidir?"
- "Ethereum'daki EIP-1559 güncellemesi tokenomics'i nasıl etkiledi?"
Borsa
- "BIST 100 endeksinde ağırlık hesaplaması nasıl yapılır?"
- "Hisse senedi seçerken temel analiz için hangi oranlara bakılmalı?"
- "Temettü yatırımı stratejisi nasıl uygulanır?"
Teknik Analiz
- "RSI göstergesi 70 üzerindeyken ne anlama gelir?"
- "MACD indikatörü nasıl yorumlanır?"
- "Fibonacci geri çekilme seviyeleri nasıl kullanılır?"
Risk Yönetimi
- "Portföy çeşitlendirmesi nasıl yapılır?"
- "Stop-loss emirleri nasıl kullanılmalı?"
- "Pozisyon büyüklüğü nasıl hesaplanır?"
Uzmanlık Alanları
- Kripto Para Ekosistemi: Bitcoin, Ethereum, altcoinler, DeFi, Layer 2, NFT, stablecoinler
- Borsa: BIST 100, NASDAQ, global piyasalar, ETF'ler, opsiyon stratejileri
- Teknik Analiz: Grafik formasyonları, RSI, MACD, Bollinger Bands, Ichimoku, Elliott Wave, Fibonacci
- Temel Analiz: F/K, PD/DD, finansal tablo analizi, DCF değerleme, tokenomics
- Risk Yönetimi: Portföy optimizasyonu, pozisyon boyutlandırma, hedging
- Regülasyon: SPK, TCMB, BDDK, TMSF düzenlemeleri, vergilendirme
Sınırlamalar
- Yatırım Tavsiyesi Değildir: Yalnızca eğitim ve bilgilendirme amacıdır
- Veri Kesimi: Tarihsel veri üzerinde eğitilmiştir, canlı fiyat bilgisi içermez
- Yüksek Risk: Kripto ve hisse senedi yatırımları önemli risk taşır
- Düzenleme Değişiklikleri: Finansal düzenlemeler sık değişir, resmi kaynaklardan teyit edin
- Doğrulama Gerekli: Yanıtları birden fazla kaynakla çapraz kontrol edin
- Platform: Sadece Apple Silicon Mac'lerde çalışır (CUDA/NVIDIA desteklemez)
- Quantization Etkisi: 4-bit quantization nedeniyle 8-bit versiyona kıyasla küçük doğruluk kayıpları olabilir
Teşekkürler
- Alican Kiraz — Turkish-Finance-SFT-Dataset veri setini oluşturup açık kaynak olarak paylaştığı için teşekkür ederiz. Ayrıca Mihenk-LLM çalışmaları Türkçe finans LLM ekosistemi için önemli bir referans olmuştur.
- Meta AI — Llama 3.1 base modelini açık kaynak olarak sunduğu için.
- Apple MLX Team — MLX framework ve mlx-lm kütüphanesi için.
- Unsloth — Hızlı ve verimli fine-tuning altyapısı için.
- Hugging Face — TRL, Transformers ve PEFT kütüphaneleri için.
Referanslar
@dataset{turkish-finance-sft,
author = {Alican Kiraz},
title = {Turkish-Finance-SFT-Dataset},
year = {2026},
publisher = {HuggingFace},
url = {https://huggingface.co/datasets/AlicanKiraz0/Turkish-Finance-SFT-Dataset}
}
@model{llama3.1,
author = {Meta AI},
title = {Llama 3.1},
year = {2024},
publisher = {Meta},
url = {https://huggingface.co/meta-llama/Llama-3.1-8B-Instruct}
}
@software{mlx,
author = {Apple},
title = {MLX: An array framework for Apple silicon},
year = {2023},
publisher = {GitHub},
url = {https://github.com/ml-explore/mlx}
}
İlgili Modeller
| Model | Format | Platform | Açıklama |
|---|---|---|---|
| turkish-finance-llama3.1-8b-lora | LoRA | CUDA/CPU | Orijinal LoRA adapter (Transformers/Unsloth) |
| turkish-finance-llama3.1-8b-lora-GGUF | GGUF | Tüm platformlar | Q4_K_M quantized (llama.cpp/Ollama) |
| turkish-finance-llama3.1-8b-mlx-8bit | MLX | Apple Silicon | 8-bit quantized (mlx-lm) |
| turkish-finance-llama3.1-8b-mlx-4bit | MLX | Apple Silicon | Bu model — 4-bit quantized (mlx-lm) |
İletişim
- HuggingFace: gumush
Lisans
MIT — Bu model MIT lisansı altında dağıtılmaktadır. Base model (Llama 3.1) Meta'nın Llama lisansı koşullarına tabidir. Dataset (Turkish-Finance-SFT-Dataset) MIT lisansı altındadır.
- Downloads last month
- 37
4-bit
Model tree for gumush/turkish-finance-llama3.1-8b-mlx-4bit
Base model
meta-llama/Llama-3.1-8B
# Make sure mlx-lm is installed # pip install --upgrade mlx-lm # Generate text with mlx-lm from mlx_lm import load, generate model, tokenizer = load("gumush/turkish-finance-llama3.1-8b-mlx-4bit") prompt = "Write a story about Einstein" messages = [{"role": "user", "content": prompt}] prompt = tokenizer.apply_chat_template( messages, add_generation_prompt=True ) text = generate(model, tokenizer, prompt=prompt, verbose=True)