File size: 1,512 Bytes
d2df0b9
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
"""Index thématique : tests des engines OCR et adapters LLM.

Chantier 6 du plan d'évolution post-Sprint 97.

Tests couvrant cette feature
----------------------------
- :mod:`tests.test_engines` — 5 adapters OCR (Tesseract, Pero,
  Mistral OCR, Google Vision, Azure DI), `BaseOCREngine` factorisé.
- :mod:`tests.test_engines_cloud` — tests cloud-only (gated).
- :mod:`tests.test_chantier4` (sous-classes ``TestNormalizeLlmContent``,
  ``TestLogHttpError``, ``TestLlmAdaptersInheritEnvVar``) — helpers
  factorisés `picarones.llm.base`.
- :mod:`tests.test_alto_baseline` (chantier 1) — `BaseOCREngine`
  refondu (hooks `_run_with_native` + `_extract_raw_confidences`).

Sprints d'origine
-----------------
- Sprint 1 : adapters Tesseract et Pero OCR (texte historique).
- Sprint 4 : adapter Mistral OCR (endpoint /v1/ocr dédié).
- Sprint 4 : adapter Google Vision et Azure DI.
- Sprint 15 : ``test_sprint15_llm_pipeline_bugs.py`` — fix
  normalisation `ContentChunk` Mistral (propagé aux 4 adapters
  par chantier 4).
- Sprints 47-51 : ``test_sprint{47,48,49,50,51}_*_confidences.py``
  — exposition `token_confidences` natifs des 5 adapters
  (refondue par chantier 1 sur les hooks unifiés).

Pour exécuter :

.. code-block:: bash

    pytest tests/test_engines*.py \\
           tests/test_sprint{47,48,49,50,51}_*.py \\
           tests/test_chantier4.py::TestNormalizeLlmContent \\
           tests/test_chantier4.py::TestLogHttpError
"""

# Index documentaire — pas de tests propres.