| --- |
| title: Detector de Clickbait BR |
| emoji: 👀 |
| colorFrom: blue |
| colorTo: green |
| sdk: gradio |
| sdk_version: 6.0.1 |
| app_file: app.py |
| pinned: false |
| license: mit |
| --- |
| |
| # 🔍 Detector de Clickbait BR |
|
|
| Aplicação de Machine Learning para detectar manchetes clickbait em português brasileiro. |
|
|
| ## 🎯 Funcionalidades |
|
|
| - ✅ Classificação automática de manchetes |
| - 📊 Exibição de probabilidades |
| - 📈 Análise de features (palavras, caracteres, pontuação) |
| - 🚀 Interface interativa com Gradio |
|
|
| ## 🧠 Modelo |
|
|
| - **Algoritmo**: Random Forest Otimizado com Ensemble (Stacking) |
| - **Features**: TF-IDF (200) + Features Numéricas (4) |
| - **Acurácia**: ~92% |
| - **F1-Score**: ~91% |
|
|
| ## 📊 Dataset |
|
|
| Dataset coletado de portais de notícias brasileiros, contendo: |
| - **Total**: 5.931 manchetes |
| - **Clickbait**: 2.933 (49.5%) |
| - **Não-Clickbait**: 2.998 (50.5%) |
|
|
| ## 🚀 Como Usar |
|
|
| 1. Digite ou cole uma manchete no campo de texto |
| 2. Clique em **Submit** |
| 3. Veja a classificação, probabilidades e features extraídas |
|
|
| ## 📝 Exemplos |
|
|
| - ✅ "Banco Central anuncia nova taxa de juros" → **Não-Clickbait** |
| - ❌ "Você não vai acreditar no que esse cachorro fez!" → **Clickbait** |
|
|
| ## 🛠️ Tecnologias |
|
|
| - Python 3.10+ |
| - Gradio 4.44 |
| - Scikit-learn |
| - NLTK |
| - Pandas/NumPy |
|
|
| ## 📄 Licença |
|
|
| MIT License |
|
|
| Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference |