metadata
title: Detector de Clickbait BR
emoji: 👀
colorFrom: blue
colorTo: green
sdk: gradio
sdk_version: 6.0.1
app_file: app.py
pinned: false
license: mit
🔍 Detector de Clickbait BR
Aplicação de Machine Learning para detectar manchetes clickbait em português brasileiro.
🎯 Funcionalidades
- ✅ Classificação automática de manchetes
- 📊 Exibição de probabilidades
- 📈 Análise de features (palavras, caracteres, pontuação)
- 🚀 Interface interativa com Gradio
🧠 Modelo
- Algoritmo: Random Forest Otimizado com Ensemble (Stacking)
- Features: TF-IDF (200) + Features Numéricas (4)
- Acurácia: ~92%
- F1-Score: ~91%
📊 Dataset
Dataset coletado de portais de notícias brasileiros, contendo:
- Total: 5.931 manchetes
- Clickbait: 2.933 (49.5%)
- Não-Clickbait: 2.998 (50.5%)
🚀 Como Usar
- Digite ou cole uma manchete no campo de texto
- Clique em Submit
- Veja a classificação, probabilidades e features extraídas
📝 Exemplos
- ✅ "Banco Central anuncia nova taxa de juros" → Não-Clickbait
- ❌ "Você não vai acreditar no que esse cachorro fez!" → Clickbait
🛠️ Tecnologias
- Python 3.10+
- Gradio 4.44
- Scikit-learn
- NLTK
- Pandas/NumPy
📄 Licença
MIT License
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference