Spaces:
Running
Running
| # Base de prix indicative des moteurs OCR/HTR et des LLM utilisés dans les | |
| # pipelines OCR+LLM. Sert uniquement à la vue Pareto coût/qualité du rapport. | |
| # | |
| # AVERTISSEMENT | |
| # ------------- | |
| # Ces prix sont des estimations datées et vieillissent vite. Ils sont donnés | |
| # à titre indicatif et ne remplacent pas une négociation commerciale ou un | |
| # relevé sur facture. Toute institution menant un benchmark avec un budget | |
| # réel doit surcharger ces valeurs via ``ReportGenerator(..., pricing=...)``. | |
| # | |
| # CONVENTIONS | |
| # ----------- | |
| # - Unité monétaire : EUR (conversion indicative depuis USD quand applicable) | |
| # - Prix exprimé par 1000 pages traitées (1 page = 1 document moyen patrimonial, | |
| # environ 1 500 caractères ou ~2 000 tokens LLM). | |
| # - kWh par 1000 pages : estimation énergétique pour le calcul carbone optionnel. | |
| # - Intensité carbone du réseau (g CO2 / kWh) : dépend du mix électrique de la | |
| # région où le moteur est exécuté (France ≈ 58, US moyen ≈ 400, Irlande ≈ 350). | |
| # | |
| # CATÉGORIES | |
| # ---------- | |
| # - ``type: local`` : moteur open-source tournant sur machine de l'utilisateur. | |
| # Coût effectif = temps d'inférence × taux horaire paramétré. | |
| # - ``type: cloud_api`` : service facturé à la page ou au token. | |
| meta: | |
| last_updated: "2026-04-01" | |
| currency: EUR | |
| default_hourly_rate_local_cpu_eur: 0.08 # machine locale amortie | |
| default_hourly_rate_local_gpu_eur: 1.20 # g4dn.xlarge ou équivalent | |
| default_grid_intensity_g_co2_per_kwh: 58 # France 2025 (mix bas carbone) | |
| cloud_grid_intensity_g_co2_per_kwh: 380 # moyenne cloud hyperscalers | |
| engines: | |
| # ── OCR classiques locaux ───────────────────────────────────────── | |
| tesseract: | |
| type: local | |
| local_mean_seconds_per_page: 2.0 | |
| kwh_per_1k_pages: 0.012 | |
| notes: "Open-source, CPU uniquement. Rapide mais moins précis sur écriture manuscrite." | |
| pero_ocr: | |
| type: local | |
| local_mean_seconds_per_page: 18.0 | |
| kwh_per_1k_pages: 0.300 | |
| hourly_rate_override_eur: 1.20 # GPU | |
| notes: "HTR deep learning, GPU recommandé. Best-in-class sur documents historiques." | |
| kraken: | |
| type: local | |
| local_mean_seconds_per_page: 8.0 | |
| kwh_per_1k_pages: 0.150 | |
| hourly_rate_override_eur: 1.20 | |
| notes: "HTR open-source, GPU recommandé. Modèles pré-entraînés via HTR-United." | |
| calamari: | |
| type: local | |
| local_mean_seconds_per_page: 6.0 | |
| kwh_per_1k_pages: 0.100 | |
| hourly_rate_override_eur: 1.20 | |
| # ── APIs OCR cloud ──────────────────────────────────────────────── | |
| mistral_ocr: | |
| type: cloud_api | |
| api_price_per_1k_pages: 0.90 # ≈ 0.001 USD / page, endpoint /v1/ocr dédié | |
| pricing_source_url: "https://mistral.ai/pricing" | |
| pricing_date: "2026-01" | |
| kwh_per_1k_pages: 0.120 | |
| notes: "Endpoint /v1/ocr dédié (pas chat/completions)." | |
| google_vision: | |
| type: cloud_api | |
| api_price_per_1k_pages: 1.40 # Document Text Detection, 1-1000 = $1.50/1k | |
| pricing_source_url: "https://cloud.google.com/vision/pricing" | |
| pricing_date: "2026-01" | |
| kwh_per_1k_pages: 0.120 | |
| azure_doc_intel: | |
| type: cloud_api | |
| api_price_per_1k_pages: 9.50 # Read S1 tier | |
| pricing_source_url: "https://azure.microsoft.com/pricing/details/ai-document-intelligence/" | |
| pricing_date: "2026-01" | |
| kwh_per_1k_pages: 0.120 | |
| # ── LLM pour pipelines OCR+LLM ──────────────────────────────────── | |
| # Estimation par page : prompt ~500 tokens + réponse ~1500 tokens = 2k tokens. | |
| # Les VLM consomment en plus des tokens image (~1k tokens pour une page A4). | |
| "gpt-4o": | |
| type: cloud_api | |
| api_price_per_1k_pages: 7.50 # approx 2.5k tokens text + 1k image | |
| pricing_source_url: "https://openai.com/api/pricing/" | |
| pricing_date: "2026-01" | |
| kwh_per_1k_pages: 0.200 | |
| "gpt-4o-mini": | |
| type: cloud_api | |
| api_price_per_1k_pages: 0.45 | |
| pricing_source_url: "https://openai.com/api/pricing/" | |
| pricing_date: "2026-01" | |
| kwh_per_1k_pages: 0.060 | |
| "claude-sonnet-4-6": | |
| type: cloud_api | |
| api_price_per_1k_pages: 6.00 | |
| pricing_source_url: "https://www.anthropic.com/pricing" | |
| pricing_date: "2026-01" | |
| kwh_per_1k_pages: 0.180 | |
| "claude-haiku-4-5": | |
| type: cloud_api | |
| api_price_per_1k_pages: 0.80 | |
| pricing_source_url: "https://www.anthropic.com/pricing" | |
| pricing_date: "2026-01" | |
| kwh_per_1k_pages: 0.070 | |
| "mistral-large-latest": | |
| type: cloud_api | |
| api_price_per_1k_pages: 2.40 | |
| pricing_source_url: "https://mistral.ai/pricing" | |
| pricing_date: "2026-01" | |
| kwh_per_1k_pages: 0.150 | |
| "ministral-3b-latest": | |
| type: cloud_api | |
| api_price_per_1k_pages: 0.08 | |
| pricing_source_url: "https://mistral.ai/pricing" | |
| pricing_date: "2026-01" | |
| kwh_per_1k_pages: 0.040 | |
| notes: "Text-only, ne supporte pas le mode multimodal." | |
| "pixtral-large-latest": | |
| type: cloud_api | |
| api_price_per_1k_pages: 3.00 | |
| pricing_source_url: "https://mistral.ai/pricing" | |
| pricing_date: "2026-01" | |
| kwh_per_1k_pages: 0.170 | |