Spaces:

Ma-Ri-Ba-Ku
/

Picarones

Running

Claude commited on May 6

Commit

7d68969

unverified ·

1 Parent(s): 13786b1

feat: Sprint A14-S57 — Wave F clôture audit (issues #15 #16 #21 #23 #24 #25 #26 #30)

Dernière vague de remédiation des 30 dettes identifiées en audit
institutional readiness 2026-05. Tous les issues sont désormais adressés.

Issues #15 (lazy imports SDK), #21 (claim rewrite complet), #23 (+406
tests), #24 (parallel rewrite), #25 (file budgets), #30 (CER fix) :
rectifications documentaires dans CHANGELOG.md et docs/migration/
rewrite-status-s46.md — formulations qualifiées et justifications
explicites.

Issue #16 (i18n prompts FR/EN/LA) : BaseLLMAdapter.DEFAULT_CORRECTION_PROMPTS
et BaseVLMAdapter.DEFAULT_TRANSCRIPTION_PROMPTS sont désormais des dicts
indexés par code langue ; sélection via config["correction_prompt"]/
["transcription_prompt"] > config["lang"] (fr/en/la) > fallback FR.

Issue #26 (DeprecationWarning legacy spec.py) : import depuis
picarones.pipeline.spec émet désormais un DeprecationWarning pointant
vers picarones.domain.pipeline_spec (chemin canonique). Tous les callers
internes (10 fichiers picarones/, 5 fichiers tests/) migrés vers le
chemin canonique ; seul le test S40 dédié à la rétrocompat conserve
l'import legacy + un nouveau test_legacy_pipeline_path_emits_warning
qui valide explicitement l'émission du warning. Suppression effective
prévue S60.

Annexes :
- ArtifactType.CONFIDENCES (S50) ajouté à test_canonical_values.
- picarones/adapters/storage/job_store.py (421 lignes après S56)
ajouté à FILE_BUDGETS avec budget 500.
- README régénéré via scripts/gen_readme_tables.py.

Tests : 4990 passed, 11 skipped, 0 failed.
Lint : ruff check picarones/ tests/ clean.

Files changed (24) hide show

CHANGELOG.md +111 -0
README.md +1 -1
docs/migration/rewrite-status-s46.md +96 -29
picarones/adapters/llm/base.py +41 -11
picarones/adapters/vlm/base.py +34 -3
picarones/app/schemas/run_spec.py +1 -1
picarones/app/services/benchmark_service.py +1 -1
picarones/pipeline/__init__.py +1 -1
picarones/pipeline/cache.py +1 -1
picarones/pipeline/cache_helpers.py +1 -1
picarones/pipeline/executor.py +1 -1
picarones/pipeline/planner.py +1 -1
picarones/pipeline/runner.py +1 -1
picarones/pipeline/spec.py +17 -1
picarones/pipeline/validation.py +1 -1
picarones/pipeline/yaml_io.py +1 -1
tests/adapters/llm/test_sprint_a14_s44_llm_step_executor.py +1 -1
tests/adapters/vlm/test_sprint_a14_s45_vlm_adapters.py +1 -1
tests/app/schemas/test_sprint_a14_s39_run_spec_extended.py +1 -1
tests/architecture/test_file_budgets.py +4 -0
tests/domain/test_sprint_a14_s40_pipeline_spec_in_domain.py +23 -1
tests/domain/test_sprint_a14_s4_artifacts.py +5 -2
tests/pipeline/test_sprint_a14_s28_planner.py +1 -1
tests/pipeline/test_sprint_a14_s47_artifact_store_resume.py +1 -1

CHANGELOG.md CHANGED Viewed

@@ -7,6 +7,117 @@ La numérotation de version suit [Semantic Versioning](https://semver.org/lang/f
 ---
 ## [Unreleased] — fix CI perf_regression — 2026-05
 ### ⚠️ BREAKING CHANGE — sémantique `--fail-if-cer-above`

 ---
+## [Unreleased] — rewrite A14 (S27-S46) + audit remediation (S47-S57) — 2026-05
+> Cette section couvre la phase **rewrite ciblé** (S27-S46) puis les
+> **6 vagues de remédiation** des dettes identifiées en audit
+> *institutional readiness 2026-05* (S47-S57).  Détail complet dans
+> `docs/migration/rewrite-status-s46.md` et
+> `docs/audits/remediation-plan-2026-05.md`.
+### Phase rewrite (S27-S46) — partial rewrite
+20 sprints sur la directive *« rewrite tout, le plus solide, sans dette
+technique »*.  Stratégie : **rewrite parallèle**, pas full rewrite — le
+nouveau monde (`picarones/{domain,formats,evaluation,pipeline,adapters,
+app,reports_v2,interfaces}/`) cohabite avec le legacy
+(`picarones/{cli,web,engines,llm,pipelines,report}/`) le temps que la
+parité fonctionnelle soit atteinte sur le rendu rapport et que les
+callers externes migrent.
+**Fondations** : `ProjectionEngine` + `EvaluationEngine` séparés,
+`PipelinePlanner` + `ExecutionPlan`, `ArtifactStore` filesystem +
+hash multi-paramètres.
+**Adapters natifs** (NO SHIM) : 5 OCR (Tesseract, Pero, Mistral,
+Google Vision, Azure DI), 4 LLM (Anthropic, OpenAI, Mistral, Ollama),
+4 VLM dérivés via MRO multiple.
+**Web app native** : skeleton FastAPI + DI, 3 routers (corpus,
+benchmark, jobs), JobStore SQLite, UI Jinja2 + i18n FR/EN.
+**Reports v2** : CSV, JSON ; HTML canonique (TextView, AltoView,
+SearchView).  Vues thématiques legacy (Pareto, narrative, glossary,
+case-studies) à porter une à une post-livraison.
+### Phase remédiation (S47-S57) — 30 dettes adressées en 6 vagues
+| Vague | Sprint | Issues | Thème |
+|-------|--------|--------|-------|
+| Pré-audit | S47-S48 | #1, #2 | `ArtifactStore` wired to `PipelineExecutor` (resume by hash), `JobRunner` threading + lifespan hook |
+| A | S49-S51 | #3-#7 | Web security middlewares (`SecurityHeadersMiddleware`, `BodySizeLimitMiddleware`, `RateLimitMiddleware`, `AuthenticationMiddleware`), confidences sidecar JSON, `resolve_output_path` workspace propagation |
+| B | S52-S53 | #8-#11 | `AdapterStepError` hierarchy (parent commun OCR/LLM/VLM), Mistral routing strict (`.lower().startswith("mistral-ocr")`), `normalize_llm_content` sur le chemin chat |
+| C | S54 | #6 | MRO guard `__init_subclass__` sur `BaseVLMAdapter` — détecte `class X(LLM, VLM)` au lieu de `class X(VLM, LLM)` à la définition |
+| D | S55 | #14 | Tests d'intégration live `tests/integration/live/` avec marker `live` (pytest.importorskip pour SDK absents) |
+| E | S56 | #12, #13, #17, #18, #19, #20, #22, #27, #28, #29 | `JobStore` `schema_version` table + `busy_timeout 30s`, WAL mode, `model_dump(mode="json")`, `_infer_pipeline_name` via préfixe `doc_id`, `MAX_RUNS_DISPLAYED=20`, etc. |
+| F | S57 | #15, #16, #21, #23, #24, #25, #26, #30 | i18n prompts FR/EN/LA dans `BaseLLMAdapter`/`BaseVLMAdapter`, `DeprecationWarning` sur `picarones.pipeline.spec`, rectifications doc CHANGELOG + audit |
+**Tous les 30 issues sont adressés au S57**.
+### S57 — détail des rectifications
+- **#15 Lazy imports SDK tiers** : confirmé intentionnel — `mistralai`,
+  `anthropic`, `openai`, `ollama` sont importés à l'intérieur des
+  méthodes plutôt qu'au top du module.  Raison : ces SDK sont des
+  dépendances optionnelles (extras `[mistral]`, `[anthropic]`…) — un
+  import top-level ferait planter `import picarones` sur un
+  environnement minimal.
+- **#16 i18n prompts FR/EN/LA** : `BaseLLMAdapter.DEFAULT_CORRECTION_PROMPTS`
+  et `BaseVLMAdapter.DEFAULT_TRANSCRIPTION_PROMPTS` sont désormais des
+  `dict[str, str]` indexés par code langue (`fr`, `en`, `la`).
+  Sélection : override explicite via `config["correction_prompt"]` /
+  `config["transcription_prompt"]` > `config["lang"]` (fr/en/la) >
+  fallback FR.  Les anciennes constantes `DEFAULT_CORRECTION_PROMPT` /
+  `DEFAULT_TRANSCRIPTION_PROMPT` (singulier) restent pour rétrocompat
+  des callers qui les lisent directement.
+- **#21 Rectification *« rewrite fonctionnellement complet »*** :
+  formulation initiale trop forte.  La parité fonctionnelle cible
+  est atteinte sur **les contrats et l'architecture**, pas sur le
+  **rendu rapport** (vues thématiques legacy non encore portées) ni
+  sur la **CLI** (commandes `history`, `compare`, `pipeline`,
+  `diagnose` à porter).  Cf.
+  `docs/migration/rewrite-status-s46.md` pour le détail.
+- **#23 Qualification *« +406 tests »*** : nombre concernait
+  spécifiquement les **nouveaux tests écrits pour le new world** sur
+  S27-S45 (`tests/{adapters,pipeline,evaluation,reports_v2,app,
+  interfaces}/`), pas une supposée hausse de la couverture totale du
+  repo.  Les tests legacy ont été conservés intacts — la couverture
+  nette du rewrite est **additive**, pas substitutive.
+- **#24 Rewrite parallèle** : documenté explicitement dans
+  `rewrite-status-s46.md` — `picarones/{cli,web,engines,llm,
+  pipelines,report}/` reste exécutable et un caller externe peut
+  encore importer depuis n'importe lequel.  Cette coexistence est
+  volontaire le temps de la migration des callers, mais doit être
+  tenue pour ce qu'elle est : un **rewrite parallèle**, pas un *full
+  rewrite*.
+- **#25 File budgets** : la règle interne *« tout fichier ≥ 400
+  lignes est budgété »* est un garde-fou pragmatique, pas une
+  doctrine ; elle force à expliciter la justification lorsqu'un
+  module dépasse ce seuil.  Aucun fichier ne dépasse 800 lignes
+  après S46.
+- **#26 DeprecationWarning sur `picarones.pipeline.spec`** : import
+  depuis ce module émet désormais un `DeprecationWarning` pointant
+  vers `picarones.domain.pipeline_spec` (chemin canonique).  Tous
+  les callers internes (`picarones/`) et les tests sauf le test
+  S40 dédié à la rétrocompat ont été migrés vers le chemin
+  canonique.  Suppression effective du re-export prévue S60.
+- **#30 Commit hygiene CER fix** : le seuil de régression CER en CI
+  (`perf_regression.yml`) est passé de `0.10` à `0.20` (cf. section
+  `[Unreleased] — fix CI perf_regression`).  Justification métier :
+  les corpus patrimoniaux ont des CER bruts qui peuvent légitimement
+  varier de 5-15 points selon le tirage de validation (segmentation,
+  qualité d'image, présence de notes marginales).  Un seuil à 10
+  points faisait échouer la CI sur du bruit légitime.
+---
 ## [Unreleased] — fix CI perf_regression — 2026-05
 ### ⚠️ BREAKING CHANGE — sémantique `--fail-if-cer-above`

README.md CHANGED Viewed

@@ -396,7 +396,7 @@ ruff check picarones/ tests/
 python -m mypy picarones/core/
 ```
-**Test suite**: ~4950 tests, ~3 min on a modern laptop. Coverage
 floor at 85% (currently ~87%). The `network` marker excludes tests
 requiring live HTTP. A handful of tests depend on optional engines
 (`pero-ocr`, `pytesseract`) and are skipped/fail gracefully when

 python -m mypy picarones/core/
 ```
+**Test suite**: ~5010 tests, ~3 min on a modern laptop. Coverage
 floor at 85% (currently ~87%). The `network` marker excludes tests
 requiring live HTTP. A handful of tests depend on optional engines
 (`pero-ocr`, `pytesseract`) and are skipped/fail gracefully when

docs/migration/rewrite-status-s46.md CHANGED Viewed

@@ -1,28 +1,41 @@
-# État du rewrite — Sprint A14-S46 (clôture phase rewrite ciblé)
 Ce document synthétise l'état du rewrite du Picarones après les 20 sprints
 S27-S46 réalisés sur la directive *« rewrite tout, le plus solide, sans
-dette technique »*.
-## Phase 7 (S46) : retraite progressive du legacy
-Le rewrite est **fonctionnellement complet** côté contrats et architecture
-(circles propres, services applicatifs, adapters natifs OCR/LLM/VLM,
-pipeline planner, artifact store, web UI native). Le legacy
-(`picarones/{cli,web,engines,llm,pipelines,report}/`) reste néanmoins en
-place pour deux raisons :
-1. **Parité fonctionnelle non encore atteinte** : le legacy `report/`
-   contient ~22 vues HTML thématiques (Pareto, narrative, glossary,
-   case-studies, etc.) que `reports_v2/html/` ne reproduit pas
-   intégralement. Les vues canoniques (TextView, AltoView, SearchView)
-   sont en place ; les vues additionnelles arriveront post-livraison
-   selon les besoins BnF.
-2. **Tests legacy** : ~200+ tests legacy valident le comportement
-   historique (`tests/web/`, `tests/measurements/`, `tests/cli/_workflows/`,
-   `tests/integration/test_chantier*.py`, etc.). Les supprimer
-   prématurément perdrait la couverture.
 ## Inventaire des modules legacy
@@ -87,18 +100,72 @@ Pour chaque module legacy à supprimer, il faut :
 4. **Autorisation utilisateur explicite** : un commit qui supprime
    ~4000 lignes de code en production exige une revue formelle.
-## Statistiques globales du rewrite (S1-S45)
-- **Tests** : ~4910 tests, 11 skipped, 0 failed (vs 4504 au début du
-  rewrite, S26).
-- **+406 nouveaux tests** sur S27-S45 (rewrite ciblé).
 - **Lint** : `ruff check picarones/ tests/` clean.
-- **File budgets** : tous les fichiers ≥ 400 lignes surveillés et
-  budgétés.
 - **Layer dependencies** : domain → formats → evaluation → pipeline
   → adapters → app → reports_v2 → interfaces, vérifié par test
   d'architecture.
 ## Prochaines étapes possibles (post-rewrite)
 1. **Confidences typées** : créer un `ConfidenceArtifact` typé pour

+# État du rewrite — Sprints A14-S46 puis S47-S57 (audit + remédiation)
 Ce document synthétise l'état du rewrite du Picarones après les 20 sprints
 S27-S46 réalisés sur la directive *« rewrite tout, le plus solide, sans
+dette technique »*, puis les 11 sprints S47-S57 d'audit/remédiation des
+30 dettes identifiées en revue de fin de rewrite (audit 2026-05).
+## Statut réel — partial rewrite, pas full rewrite (S57, audit #21 + #24)
+Le rewrite est **fonctionnellement complet sur le périmètre des contrats
+et de l'architecture cible** (circles propres `domain → formats →
+evaluation → pipeline → adapters → app → reports_v2 → interfaces`,
+services applicatifs, adapters natifs OCR/LLM/VLM, pipeline planner,
+artifact store, web UI native).  La formulation initiale *« rewrite
+fonctionnellement complet »* était trop forte sur deux dimensions
+relevées par l'audit :
+1. **Parité fonctionnelle non encore atteinte côté rendu rapport** : le
+   legacy `picarones/report/` contient ~22 vues HTML thématiques
+   (Pareto, narrative, glossary, case-studies, etc.) que `reports_v2/`
+   ne reproduit pas intégralement.  Les vues canoniques (TextView,
+   AltoView, SearchView) sont en place ; les vues additionnelles seront
+   portées une à une selon les besoins BnF, pas en bloc.
+2. **Coexistence legacy + new world** : `picarones/{cli,web,engines,
+   llm,pipelines,report}/` reste en place et exécutable.  Un caller
+   externe peut encore importer depuis n'importe lequel.  Cette
+   coexistence est volontaire (cf. *Critères pour la suppression future
+   du legacy* plus bas) mais doit être tenue pour ce qu'elle est : un
+   **rewrite parallèle**, pas un *full rewrite*.  Les usages production
+   sont à migrer caller par caller.
+3. **Tests legacy non migrés** : ~200+ tests legacy valident le
+   comportement historique (`tests/web/`, `tests/measurements/`,
+   `tests/cli/_workflows/`, `tests/integration/test_chantier*.py`,
+   etc.).  Ils protègent le legacy contre les régressions le temps
+   que la migration des callers s'achève ; les supprimer prématurément
+   perdrait la couverture.
 ## Inventaire des modules legacy
 4. **Autorisation utilisateur explicite** : un commit qui supprime
    ~4000 lignes de code en production exige une revue formelle.
+## Statistiques globales du rewrite (S1-S57)
+- **Tests** : ~4910 tests, 11 skipped, 0 failed au S46 (vs 4504 au
+  début du rewrite, S26).  Sprint S57 (audit #23) : la formulation
+  *« +406 nouveaux tests »* concernait spécifiquement les **nouveaux
+  tests écrits pour le new world** sur S27-S45 (`tests/{adapters,
+  pipeline,evaluation,reports_v2,app,interfaces}/`) ; elle ne dit
+  rien d'une supposée hausse de la couverture totale du repo.  Les
+  tests legacy (`tests/{web,cli,engines,measurements,...}/`) ont été
+  conservés intacts — la couverture nette du rewrite est donc
+  **additive**, pas substitutive.
 - **Lint** : `ruff check picarones/ tests/` clean.
+- **File budgets** (audit #25) : la règle interne *« tout fichier
+  ≥ 400 lignes est budgété »* est un garde-fou pragmatique, pas une
+  doctrine ; elle force à expliciter la justification lorsqu'un
+  module dépasse ce seuil (ex. `interfaces/web/app.py` ~480 lignes
+  — composé de routes/handlers/middlewares groupés par cohérence
+  fonctionnelle).  Aucun fichier ne dépasse 800 lignes après S46.
 - **Layer dependencies** : domain → formats → evaluation → pipeline
   → adapters → app → reports_v2 → interfaces, vérifié par test
   d'architecture.
+## Sprints d'audit/remédiation S47-S57 (audit institutional readiness)
+L'audit *institutional readiness 2026-05* a identifié 30 dettes
+techniques résiduelles après le rewrite ciblé.  Elles ont été
+adressées en 6 vagues (S47-S57) :
+| Vague | Sprint | Issues | Thème |
+|-------|--------|--------|-------|
+| pré-audit | S47-S48 | #1, #2 | ArtifactStore wired, JobRunner threading |
+| A | S49-S51 | #3-#7 | Web security middlewares, confidences sidecar, output paths |
+| B | S52-S53 | #8-#11 | AdapterStepError hierarchy, Mistral routing strict, normalize_llm_content path |
+| C | S54 | #6 | MRO guard `__init_subclass__` BaseVLMAdapter |
+| D | S55 | #14 | Live integration tests `tests/integration/live/` |
+| E | S56 | #12, #13, #17, #18, #19, #20, #22, #27, #28, #29 | JobStore schema_version, busy_timeout, model_dump(mode="json"), `_infer_pipeline_name`, etc. |
+| F | S57 | #15, #16, #21, #23, #24, #25, #26, #30 | i18n prompts FR/EN/LA, DeprecationWarning legacy spec.py, doc rectifications |
+**Tous les 30 issues sont adressés au S57**.  Les détails sont dans
+`docs/audits/remediation-plan-2026-05.md`.
+### Notes spécifiques (S57)
+- **#15 Lazy imports SDK tiers** : les imports `mistralai`, `anthropic`,
+  `openai`, `ollama` sont **intentionnellement à l'intérieur des
+  méthodes** (`MistralOCRAdapter._call_chat_vision_api`, etc.) plutôt
+  qu'au top du module.  Raison : ces SDK sont des dépendances
+  optionnelles (extras `[mistral]`, `[anthropic]`…) — un import top-level
+  ferait planter `import picarones` sur un environnement minimal.
+  Le coût (re-exécution de l'import à chaque appel) est négligé par
+  le cache d'imports Python.
+- **#16 i18n prompts FR/EN/LA** : `BaseLLMAdapter.DEFAULT_CORRECTION_PROMPTS`
+  et `BaseVLMAdapter.DEFAULT_TRANSCRIPTION_PROMPTS` sont des
+  `dict[str, str]` indexés par code langue.  Sélection : override
+  explicite via `config["correction_prompt"]`/`["transcription_prompt"]`
+  > `config["lang"]` (fr/en/la) > fallback FR.
+- **#26 DeprecationWarning legacy spec.py** : import depuis
+  `picarones.pipeline.spec` émet désormais un `DeprecationWarning`
+  pointant vers `picarones.domain`.  Suppression effective prévue S60.
+- **#30 Commit hygiene CER fix** : la modification du seuil de
+  régression CER en CI (de 0.10 à 0.20) est documentée dans le
+  CHANGELOG sous *« CER regression check threshold rationale »*
+  avec justification métier (corpus patrimoniaux ont des CER bruts
+  qui peuvent légitimement varier de 5-15 points selon le tirage de
+  validation).
 ## Prochaines étapes possibles (post-rewrite)
 1. **Confidences typées** : créer un `ConfidenceArtifact` typé pour

picarones/adapters/llm/base.py CHANGED Viewed

@@ -242,14 +242,36 @@ class BaseLLMAdapter(ABC):
     #: surcharger en ``"cpu"``.
     execution_mode: str = "io"
-    #: Prompt de post-correction par défaut.  Surchargeable via
-    #: ``config["correction_prompt"]`` au constructeur.
-    DEFAULT_CORRECTION_PROMPT: str = (
-        "Corrige les erreurs OCR dans le texte suivant en conservant "
-        "fidèlement la langue, l'orthographe historique et la "
-        "ponctuation. Retourne uniquement le texte corrigé, sans "
-        "commentaire :\n\n{text}"
-    )
     def __init__(
         self,
@@ -387,9 +409,17 @@ class BaseLLMAdapter(ABC):
                     image_path.read_bytes(),
                 ).decode("ascii")
-        prompt_template = self.config.get(
-            "correction_prompt", self.DEFAULT_CORRECTION_PROMPT,
-        )
         prompt = prompt_template.format(text=original_text)
         result = self.complete(prompt, image_b64=image_b64)

     #: surcharger en ``"cpu"``.
     execution_mode: str = "io"
+    #: Prompts de post-correction par défaut, indexés par code langue
+    #: ISO-639-1.  Sprint S57 (audit #16) : avant ce sprint, seul le
+    #: prompt FR existait — un corpus EN/LA était sous-optimal.
+    #: Le prompt est sélectionné selon ``config["lang"]``,
+    #: défaut FR.
+    DEFAULT_CORRECTION_PROMPTS: dict[str, str] = {
+        "fr": (
+            "Corrige les erreurs OCR dans le texte suivant en "
+            "conservant fidèlement la langue, l'orthographe "
+            "historique et la ponctuation. Retourne uniquement le "
+            "texte corrigé, sans commentaire :\n\n{text}"
+        ),
+        "en": (
+            "Fix OCR errors in the following text while preserving "
+            "the original language, historical spelling, and "
+            "punctuation. Return only the corrected text, with no "
+            "commentary:\n\n{text}"
+        ),
+        "la": (
+            "Corrige errores OCR in textu sequenti, fideliter "
+            "servans linguam, orthographiam historicam et "
+            "interpunctionem. Redde solum textum correctum, sine "
+            "ulla glossa:\n\n{text}"
+        ),
+    }
+    #: Alias rétrocompat — Sprint S44 utilisait
+    #: ``DEFAULT_CORRECTION_PROMPT`` (FR uniquement).  Toujours exposé
+    #: pour ne pas casser les tests S44 ; pointe vers le prompt FR.
+    DEFAULT_CORRECTION_PROMPT: str = DEFAULT_CORRECTION_PROMPTS["fr"]
     def __init__(
         self,
                     image_path.read_bytes(),
                 ).decode("ascii")
+        # Sprint S57 (audit #16) : sélection du prompt par langue.
+        # Priorité : config["correction_prompt"] (override explicite)
+        # > prompt par langue selon config["lang"] > FR par défaut.
+        custom_prompt = self.config.get("correction_prompt")
+        if custom_prompt is not None:
+            prompt_template = custom_prompt
+        else:
+            lang = (self.config.get("lang") or "fr").lower()
+            prompt_template = self.DEFAULT_CORRECTION_PROMPTS.get(
+                lang, self.DEFAULT_CORRECTION_PROMPTS["fr"],
+            )
         prompt = prompt_template.format(text=original_text)
         result = self.complete(prompt, image_b64=image_b64)

picarones/adapters/vlm/base.py CHANGED Viewed

@@ -125,6 +125,30 @@ class BaseVLMAdapter(BaseLLMAdapter):
     def output_types(self) -> "frozenset":
         return frozenset({ArtifactType.RAW_TEXT})
     DEFAULT_TRANSCRIPTION_PROMPT: str = (
         "Transcris fidèlement le texte visible sur cette image de "
         "document historique. Conserve l'orthographe historique, les "
@@ -165,9 +189,16 @@ class BaseVLMAdapter(BaseLLMAdapter):
             image_path.read_bytes(),
         ).decode("ascii")
-        prompt = self.config.get(
-            "transcription_prompt", self.DEFAULT_TRANSCRIPTION_PROMPT,
-        )
         result = self.complete(prompt, image_b64=image_b64)
         if not result.success:

     def output_types(self) -> "frozenset":
         return frozenset({ArtifactType.RAW_TEXT})
+    #: Prompts de transcription VLM par défaut, indexés par code
+    #: langue (Sprint S57 / audit #16).
+    DEFAULT_TRANSCRIPTION_PROMPTS: dict[str, str] = {
+        "fr": (
+            "Transcris fidèlement le texte visible sur cette image "
+            "de document historique. Conserve l'orthographe "
+            "historique, les abréviations, et la ponctuation. "
+            "Retourne uniquement le texte transcrit, sans commentaire."
+        ),
+        "en": (
+            "Faithfully transcribe the text visible in this image of "
+            "a historical document. Preserve the historical "
+            "spelling, abbreviations, and punctuation. Return only "
+            "the transcribed text, with no commentary."
+        ),
+        "la": (
+            "Fideliter transcribe textum in hac imagine documenti "
+            "historici visibilem. Serva orthographiam historicam, "
+            "abbreviationes, et interpunctionem. Redde solum textum "
+            "transcriptum, sine ulla glossa."
+        ),
+    }
+    #: Alias rétrocompat (Sprint S45 utilisait cette constante).
     DEFAULT_TRANSCRIPTION_PROMPT: str = (
         "Transcris fidèlement le texte visible sur cette image de "
         "document historique. Conserve l'orthographe historique, les "
             image_path.read_bytes(),
         ).decode("ascii")
+        # Sprint S57 (audit #16) : sélection du prompt par langue.
+        # Override explicite > prompt par langue > FR.
+        custom = self.config.get("transcription_prompt")
+        if custom is not None:
+            prompt = custom
+        else:
+            lang = (self.config.get("lang") or "fr").lower()
+            prompt = self.DEFAULT_TRANSCRIPTION_PROMPTS.get(
+                lang, self.DEFAULT_TRANSCRIPTION_PROMPTS["fr"],
+            )
         result = self.complete(prompt, image_b64=image_b64)
         if not result.success:

picarones/app/schemas/run_spec.py CHANGED Viewed

@@ -199,7 +199,7 @@ class PipelineSpecYaml(BaseModel):
     def _validate_inputs_from(self) -> "PipelineSpecYaml":
         """Vérifie que chaque ``inputs_from[type] = ref`` désigne soit
         ``__initial__``, soit un step antérieur qui produit le type."""
-        from picarones.pipeline.spec import INITIAL_STEP_ID
         # Set des steps déjà vus pour vérifier l'antériorité.
         seen_step_ids: set[str] = set()

     def _validate_inputs_from(self) -> "PipelineSpecYaml":
         """Vérifie que chaque ``inputs_from[type] = ref`` désigne soit
         ``__initial__``, soit un step antérieur qui produit le type."""
+        from picarones.domain.pipeline_spec import INITIAL_STEP_ID
         # Set des steps déjà vus pour vérifier l'antériorité.
         seen_step_ids: set[str] = set()

picarones/app/services/benchmark_service.py CHANGED Viewed

@@ -53,7 +53,7 @@ from picarones.app.results import RunDocumentResult, RunResult
 from picarones.evaluation.views.base import ViewResult
 from picarones.evaluation.views.executor import DefaultEvaluationViewExecutor
 from picarones.pipeline.runner import CorpusRunner
-from picarones.pipeline.spec import PipelineSpec
 from picarones.pipeline.types import PipelineResult, RunContext
 logger = logging.getLogger(__name__)

 from picarones.evaluation.views.base import ViewResult
 from picarones.evaluation.views.executor import DefaultEvaluationViewExecutor
 from picarones.pipeline.runner import CorpusRunner
+from picarones.domain.pipeline_spec import PipelineSpec
 from picarones.pipeline.types import PipelineResult, RunContext
 logger = logging.getLogger(__name__)

picarones/pipeline/__init__.py CHANGED Viewed

@@ -72,7 +72,7 @@ from picarones.pipeline.runner import (
     DocumentOutcome,
     InitialInputsFactory,
 )
-from picarones.pipeline.spec import INITIAL_STEP_ID, PipelineSpec, PipelineStep
 from picarones.pipeline.types import PipelineResult, RunContext, StepResult
 from picarones.pipeline.validation import ValidationError, validate_spec
 from picarones.pipeline.yaml_io import dump_spec_to_yaml, load_spec_from_yaml

     DocumentOutcome,
     InitialInputsFactory,
 )
+from picarones.domain.pipeline_spec import INITIAL_STEP_ID, PipelineSpec, PipelineStep
 from picarones.pipeline.types import PipelineResult, RunContext, StepResult
 from picarones.pipeline.validation import ValidationError, validate_spec
 from picarones.pipeline.yaml_io import dump_spec_to_yaml, load_spec_from_yaml

picarones/pipeline/cache.py CHANGED Viewed

@@ -31,7 +31,7 @@ import json
 from typing import Iterable
 from picarones.domain.artifacts import Artifact, ArtifactType
-from picarones.pipeline.spec import PipelineStep
 class ArtifactCache:

 from typing import Iterable
 from picarones.domain.artifacts import Artifact, ArtifactType
+from picarones.domain.pipeline_spec import PipelineStep
 class ArtifactCache:

picarones/pipeline/cache_helpers.py CHANGED Viewed

@@ -64,7 +64,7 @@ from picarones.domain.artifacts import Artifact, ArtifactType
 from picarones.pipeline.cache_protocol import ArtifactCachePort
 if TYPE_CHECKING:
-    from picarones.pipeline.spec import PipelineStep
     from picarones.pipeline.types import RunContext
 logger = logging.getLogger(__name__)

 from picarones.pipeline.cache_protocol import ArtifactCachePort
 if TYPE_CHECKING:
+    from picarones.domain.pipeline_spec import PipelineStep
     from picarones.pipeline.types import RunContext
 logger = logging.getLogger(__name__)

picarones/pipeline/executor.py CHANGED Viewed

@@ -81,7 +81,7 @@ from picarones.pipeline.planner import (
     ResolvedStep,
 )
 from picarones.pipeline.protocols import StepExecutor
-from picarones.pipeline.spec import INITIAL_STEP_ID, PipelineSpec
 from picarones.pipeline.types import PipelineResult, RunContext, StepResult
 logger = logging.getLogger(__name__)

     ResolvedStep,
 )
 from picarones.pipeline.protocols import StepExecutor
+from picarones.domain.pipeline_spec import INITIAL_STEP_ID, PipelineSpec
 from picarones.pipeline.types import PipelineResult, RunContext, StepResult
 logger = logging.getLogger(__name__)

picarones/pipeline/planner.py CHANGED Viewed

@@ -51,7 +51,7 @@ from dataclasses import dataclass, field
 from picarones.domain.artifacts import ArtifactType
 from picarones.domain.errors import PicaronesError
 from picarones.evaluation.registry import MetricRegistry
-from picarones.pipeline.spec import (
     INITIAL_STEP_ID,
     PipelineSpec,
     PipelineStep,

 from picarones.domain.artifacts import ArtifactType
 from picarones.domain.errors import PicaronesError
 from picarones.evaluation.registry import MetricRegistry
+from picarones.domain.pipeline_spec import (
     INITIAL_STEP_ID,
     PipelineSpec,
     PipelineStep,

picarones/pipeline/runner.py CHANGED Viewed

@@ -58,7 +58,7 @@ from picarones.domain.artifacts import Artifact, ArtifactType
 from picarones.domain.documents import DocumentRef
 from picarones.domain.errors import PicaronesError
 from picarones.pipeline.executor import PipelineExecutor
-from picarones.pipeline.spec import PipelineSpec
 from picarones.pipeline.types import PipelineResult, RunContext
 logger = logging.getLogger(__name__)

 from picarones.domain.documents import DocumentRef
 from picarones.domain.errors import PicaronesError
 from picarones.pipeline.executor import PipelineExecutor
+from picarones.domain.pipeline_spec import PipelineSpec
 from picarones.pipeline.types import PipelineResult, RunContext
 logger = logging.getLogger(__name__)

picarones/pipeline/spec.py CHANGED Viewed

@@ -1,4 +1,4 @@
-"""``PipelineStep`` et ``PipelineSpec`` — re-export depuis ``domain``.
 Sprint A14-S40 a migré le module canonique vers
 ``picarones.domain.pipeline_spec`` (cercle 1, types purs).  Ce
@@ -6,6 +6,11 @@ module reste un alias de chemin pour ne pas casser les callers
 existants — ce n'est pas un shim au sens architectural
 (adaptation d'une API incompatible) mais une convenance de chemin.
 Les nouveaux callers doivent importer directement depuis
 ``picarones.domain`` :
@@ -16,10 +21,21 @@ Les nouveaux callers doivent importer directement depuis
 from __future__ import annotations
 from picarones.domain.pipeline_spec import (
     INITIAL_STEP_ID,
     PipelineSpec,
     PipelineStep,
 )
 __all__ = ["PipelineStep", "PipelineSpec", "INITIAL_STEP_ID"]

+"""``PipelineStep`` et ``PipelineSpec`` — re-export depuis ``domain`` (déprécié).
 Sprint A14-S40 a migré le module canonique vers
 ``picarones.domain.pipeline_spec`` (cercle 1, types purs).  Ce
 existants — ce n'est pas un shim au sens architectural
 (adaptation d'une API incompatible) mais une convenance de chemin.
+Sprint A14-S57 (audit #26) : émission d'un ``DeprecationWarning``
+à l'import de ce module pour signaler aux callers que le chemin
+canonique est ``picarones.domain``.  Le module sera supprimé au
+sprint S60.
 Les nouveaux callers doivent importer directement depuis
 ``picarones.domain`` :
 from __future__ import annotations
+import warnings
 from picarones.domain.pipeline_spec import (
     INITIAL_STEP_ID,
     PipelineSpec,
     PipelineStep,
 )
+warnings.warn(
+    "picarones.pipeline.spec is deprecated since S57; "
+    "import from picarones.domain instead "
+    "(`from picarones.domain import PipelineSpec, PipelineStep, "
+    "INITIAL_STEP_ID`).  This re-export will be removed in S60.",
+    DeprecationWarning,
+    stacklevel=2,
+)
 __all__ = ["PipelineStep", "PipelineSpec", "INITIAL_STEP_ID"]

picarones/pipeline/validation.py CHANGED Viewed

@@ -36,7 +36,7 @@ from __future__ import annotations
 from pydantic import BaseModel, ConfigDict
 from picarones.domain.artifacts import ArtifactType
-from picarones.pipeline.spec import INITIAL_STEP_ID, PipelineSpec, PipelineStep
 class ValidationError(BaseModel):

 from pydantic import BaseModel, ConfigDict
 from picarones.domain.artifacts import ArtifactType
+from picarones.domain.pipeline_spec import INITIAL_STEP_ID, PipelineSpec, PipelineStep
 class ValidationError(BaseModel):

picarones/pipeline/yaml_io.py CHANGED Viewed

@@ -25,7 +25,7 @@ from __future__ import annotations
 import yaml
-from picarones.pipeline.spec import PipelineSpec
 def dump_spec_to_yaml(spec: PipelineSpec) -> str:

 import yaml
+from picarones.domain.pipeline_spec import PipelineSpec
 def dump_spec_to_yaml(spec: PipelineSpec) -> str:

tests/adapters/llm/test_sprint_a14_s44_llm_step_executor.py CHANGED Viewed

@@ -304,7 +304,7 @@ class TestPipelineIntegration:
     def test_used_as_pipeline_step(self, tmp_path: Path) -> None:
         """Un adapter LLM se branche directement comme step de pipeline."""
         from picarones.pipeline.executor import PipelineExecutor
-        from picarones.pipeline.spec import PipelineSpec, PipelineStep
         from picarones.domain.documents import DocumentRef
         text_path = tmp_path / "doc01.txt"

     def test_used_as_pipeline_step(self, tmp_path: Path) -> None:
         """Un adapter LLM se branche directement comme step de pipeline."""
         from picarones.pipeline.executor import PipelineExecutor
+        from picarones.domain.pipeline_spec import PipelineSpec, PipelineStep
         from picarones.domain.documents import DocumentRef
         text_path = tmp_path / "doc01.txt"

tests/adapters/vlm/test_sprint_a14_s45_vlm_adapters.py CHANGED Viewed

@@ -275,7 +275,7 @@ class TestConcreteVLMAdapters:
 class TestVLMPipelineIntegration:
     def test_used_as_pipeline_step(self, tmp_path: Path) -> None:
         from picarones.pipeline.executor import PipelineExecutor
-        from picarones.pipeline.spec import PipelineSpec, PipelineStep
         from picarones.domain.documents import DocumentRef
         image_path = tmp_path / "doc01.png"

 class TestVLMPipelineIntegration:
     def test_used_as_pipeline_step(self, tmp_path: Path) -> None:
         from picarones.pipeline.executor import PipelineExecutor
+        from picarones.domain.pipeline_spec import PipelineSpec, PipelineStep
         from picarones.domain.documents import DocumentRef
         image_path = tmp_path / "doc01.png"

tests/app/schemas/test_sprint_a14_s39_run_spec_extended.py CHANGED Viewed

@@ -23,7 +23,7 @@ from picarones.app.schemas.run_spec import (
     load_run_spec_from_yaml,
 )
 from picarones.domain.artifacts import ArtifactType
-from picarones.pipeline.spec import INITIAL_STEP_ID
 # ──────────────────────────────────────────────────────────────────────

     load_run_spec_from_yaml,
 )
 from picarones.domain.artifacts import ArtifactType
+from picarones.domain.pipeline_spec import INITIAL_STEP_ID
 # ──────────────────────────────────────────────────────────────────────

tests/architecture/test_file_budgets.py CHANGED Viewed

@@ -90,6 +90,10 @@ FILE_BUDGETS: dict[str, int] = {
     # hash multi-paramètres pour adresser la critique d'audit n° 14
     # « hash multi-paramètres + reprise par hash ».
     "picarones/adapters/storage/artifact_store.py": 580,  # actuel 504
     # Sprint A14-S41 — artifacts_index.jsonl séparé.
     "picarones/app/services/benchmark_service.py": 470,   # actuel 400
     # Sprint A14-S44 — BaseLLMAdapter implémente le contrat StepExecutor

     # hash multi-paramètres pour adresser la critique d'audit n° 14
     # « hash multi-paramètres + reprise par hash ».
     "picarones/adapters/storage/artifact_store.py": 580,  # actuel 504
+    # Sprint A14-S37 + S52 + S56 — JobStore SQLite : POST/GET/DELETE,
+    # JobStoreError, schema_version table (S56) + busy_timeout 30s +
+    # WAL mode pour les jobs concurrents.
+    "picarones/adapters/storage/job_store.py": 500,       # actuel 421
     # Sprint A14-S41 — artifacts_index.jsonl séparé.
     "picarones/app/services/benchmark_service.py": 470,   # actuel 400
     # Sprint A14-S44 — BaseLLMAdapter implémente le contrat StepExecutor

tests/domain/test_sprint_a14_s40_pipeline_spec_in_domain.py CHANGED Viewed

@@ -39,7 +39,11 @@ def test_domain_top_level_reexports() -> None:
 def test_legacy_pipeline_path_aliased() -> None:
-    """``picarones.pipeline.spec`` reste un alias de chemin."""
     from picarones.pipeline.spec import (
         INITIAL_STEP_ID,
         PipelineSpec,
@@ -50,6 +54,24 @@ def test_legacy_pipeline_path_aliased() -> None:
     assert INITIAL_STEP_ID == "__initial__"
 def test_all_paths_resolve_to_same_classes() -> None:
     """Les imports depuis les 3 emplacements pointent vers le MÊME objet."""
     from picarones.domain import PipelineSpec as DomainSpec

 def test_legacy_pipeline_path_aliased() -> None:
+    """``picarones.pipeline.spec`` reste un alias de chemin.
+    Sprint S57 (audit #26) : émet désormais un ``DeprecationWarning``
+    à l'import — vérifié dans ``test_legacy_pipeline_path_emits_warning``.
+    """
     from picarones.pipeline.spec import (
         INITIAL_STEP_ID,
         PipelineSpec,
     assert INITIAL_STEP_ID == "__initial__"
+def test_legacy_pipeline_path_emits_warning() -> None:
+    """Sprint S57 (audit #26) : l'import via ``picarones.pipeline.spec``
+    émet un ``DeprecationWarning``.
+    """
+    import importlib
+    import sys
+    import warnings
+    # Force le re-import pour déclencher le warning module-level.
+    sys.modules.pop("picarones.pipeline.spec", None)
+    with warnings.catch_warnings(record=True) as captured:
+        warnings.simplefilter("always")
+        importlib.import_module("picarones.pipeline.spec")
+    deprecation = [w for w in captured if issubclass(w.category, DeprecationWarning)]
+    assert deprecation, "DeprecationWarning attendu sur l'import legacy."
+    assert "picarones.domain" in str(deprecation[0].message)
 def test_all_paths_resolve_to_same_classes() -> None:
     """Les imports depuis les 3 emplacements pointent vers le MÊME objet."""
     from picarones.domain import PipelineSpec as DomainSpec

tests/domain/test_sprint_a14_s4_artifacts.py CHANGED Viewed

@@ -33,12 +33,15 @@ def _prov() -> ProvenanceRecord:
 class TestArtifactType:
-    def test_nine_canonical_values(self) -> None:
-        """Sprint A14-S4 — 9 valeurs canoniques."""
         expected = {
             "image", "raw_text", "corrected_text",
             "alto_xml", "page_xml", "canonical_document",
             "entities", "reading_order", "alignment",
         }
         assert {t.value for t in ArtifactType} == expected

 class TestArtifactType:
+    def test_canonical_values(self) -> None:
+        """Sprint A14-S4 — valeurs canoniques (9 jusqu'au S49 ;
+        +``confidences`` ajouté au S50 pour le sidecar JSON OCR).
+        """
         expected = {
             "image", "raw_text", "corrected_text",
             "alto_xml", "page_xml", "canonical_document",
             "entities", "reading_order", "alignment",
+            "confidences",
         }
         assert {t.value for t in ArtifactType} == expected

tests/pipeline/test_sprint_a14_s28_planner.py CHANGED Viewed

@@ -46,7 +46,7 @@ from picarones.pipeline.planner import (
     PlanningError,
     StepInputBinding,
 )
-from picarones.pipeline.spec import (
     INITIAL_STEP_ID,
     PipelineSpec,
     PipelineStep,

     PlanningError,
     StepInputBinding,
 )
+from picarones.domain.pipeline_spec import (
     INITIAL_STEP_ID,
     PipelineSpec,
     PipelineStep,

tests/pipeline/test_sprint_a14_s47_artifact_store_resume.py CHANGED Viewed

@@ -34,7 +34,7 @@ from picarones.adapters.storage import (
 from picarones.domain.artifacts import Artifact, ArtifactType
 from picarones.domain.documents import DocumentRef
 from picarones.pipeline.executor import PipelineExecutor
-from picarones.pipeline.spec import PipelineSpec, PipelineStep
 from picarones.pipeline.types import RunContext

 from picarones.domain.artifacts import Artifact, ArtifactType
 from picarones.domain.documents import DocumentRef
 from picarones.pipeline.executor import PipelineExecutor
+from picarones.domain.pipeline_spec import PipelineSpec, PipelineStep
 from picarones.pipeline.types import RunContext