Spaces:

Ma-Ri-Ba-Ku
/

Picarones

Running

Claude commited on 29 days ago

Commit

1ef330c

unverified ·

1 Parent(s): 478e60e

feat(services): Phase B3-final commit 5 — supprimer le shim legacy_runner_compat

Phase B3-final commit 5/7. Vérification que plus aucun caller ne
dépend du shim, puis suppression.

picarones/app/services/legacy_runner_compat.py — SUPPRIMÉ
- 257 LOC nets supprimées.
- Plus aucun import résiduel dans picarones/ ni tests/ — vérifié
par grep avant suppression :
grep -rn 'from picarones.app.services.legacy_runner_compat'
picarones/ tests/ → 0 résultat.

picarones/app/services/benchmark_runner.py
- Mise à jour de la docstring deprecated : pointe vers le pattern
3 étapes (prepare_preset_args + execute_preset + converter) au
lieu du shim disparu.

picarones/interfaces/web/benchmark_utils.py
- Commentaire ajusté (« plus de shim » → « pattern explicite »).

tests/_migration_helpers.py
- Docstring mise à jour : le helper test n'est plus présenté
comme un re-export du shim mais comme un outil de test
autonome. Aucun changement de comportement runtime.

État : aucun shim run_via_orchestrator ne subsiste en
production. Le helper de test du même nom reste dans tests/ —
préfixe _ du module + dossier tests/ rendent clair que c'est
un outil de test, pas de la dette production.

Files changed (4) hide show

picarones/app/services/benchmark_runner.py +5 -3
picarones/app/services/legacy_runner_compat.py +0 -257
picarones/interfaces/web/benchmark_utils.py +1 -2
tests/_migration_helpers.py +7 -13

picarones/app/services/benchmark_runner.py CHANGED Viewed

@@ -8,9 +8,11 @@
     - La fonction ``run_benchmark_via_service`` émet une
       ``DeprecationWarning`` à chaque appel.
     - Aucun call site actif ne subsiste dans ``picarones/`` —
-      CLI/Web passent désormais par
-      ``picarones.app.services.legacy_runner_compat.run_via_orchestrator``.
-    - Retrait du module prévu **Phase B8** (release suivante).
     Pour migrer votre code, voir le guide
     ``docs/migration/option_b_user_guide.md``.

     - La fonction ``run_benchmark_via_service`` émet une
       ``DeprecationWarning`` à chaque appel.
     - Aucun call site actif ne subsiste dans ``picarones/`` —
+      CLI/Web utilisent désormais directement le pattern 3 étapes
+      ``prepare_preset_args → execute_preset →
+      run_result_to_benchmark_result`` (cf.
+      :mod:`picarones.app.services.python_helpers`).
+    - Retrait du module prévu **Phase B3-final commit 6** (suivant).
     Pour migrer votre code, voir le guide
     ``docs/migration/option_b_user_guide.md``.

picarones/app/services/legacy_runner_compat.py DELETED Viewed

@@ -1,257 +0,0 @@
-"""Shim de compatibilité ``run_benchmark_via_service`` → ``RunOrchestrator``.
-Phase B3 (résiduel) du chantier Option B (mai 2026).  Fournit
-``run_via_orchestrator()`` comme drop-in remplacement de
-``run_benchmark_via_service`` qui s'appuie sur
-``RunOrchestrator.execute_preset()`` en interne mais préserve la
-signature legacy et le retour ``BenchmarkResult``.
-Utilisé par
------------
-- ``picarones.interfaces.cli._workflows`` (commandes ``run``,
-  ``diagnose``, ``economics``, ``edition``, ``compare``,
-  ``robustness``).
-- ``picarones.interfaces.web.benchmark_utils.run_benchmark_thread_v2``.
-- Les tests catégorie A migrés en Phase B4 (via le re-export
-  ``tests._migration_helpers``).
-Pourquoi un shim dédié et pas un alias direct
----------------------------------------------
-``RunOrchestrator.execute_preset()`` consomme des objets domain pré-
-construits (``CorpusSpec`` couche 1, ``PipelineSpec`` couche 1).  Les
-callers legacy (CLI/Web/tests) manipulent toujours :
-- ``Corpus`` legacy (couche 3) avec ``Document.image_path``,
-  ``ground_truth`` in-memory.
-- Liste d'instances ``BaseOCRAdapter`` / ``OCRLLMPipelineConfig``.
-Ce shim convertit ces structures en objets domain via les helpers
-existants (``corpus_to_corpus_spec``, ``engine_to_pipeline_spec``,
-``build_adapter_resolver``), puis appelle
-``RunOrchestrator.execute_preset()``.  Sortie : ``BenchmarkResult``
-legacy via ``run_result_to_benchmark_result``.
-Retrait prévu
--------------
-Phase B8 (post-deprecation release).  Quand ``run_benchmark_via_service``
-sera supprimé, ce shim aussi — les callers devront construire leurs
-``RunSpec`` directement (pattern utilisateur documenté dans
-``docs/migration/option_b_user_guide.md``).
-"""
-from __future__ import annotations
-import tempfile
-from pathlib import Path
-from typing import TYPE_CHECKING, Any, Callable
-if TYPE_CHECKING:
-    from picarones.evaluation.benchmark_result import BenchmarkResult
-    from picarones.evaluation.corpus import Corpus
-def _dummy_pipeline_yaml(name: str = "preset_pipeline") -> Any:
-    """Construit un ``PipelineSpecYaml`` minimaliste pour satisfaire
-    le validator ``RunSpec.pipelines`` (min_length=1).
-    Le contenu est **ignoré** par ``execute_preset()`` qui utilise les
-    ``pipeline_specs`` fournis en kwargs.  Le YAML dummy sert
-    uniquement à passer la validation Pydantic.
-    """
-    from picarones.app.schemas.run_spec import PipelineSpecYaml, StepSpec
-    from picarones.domain.artifacts import ArtifactType
-    return PipelineSpecYaml(
-        name=name,
-        initial_inputs=(ArtifactType.IMAGE,),
-        steps=(StepSpec(
-            id="ocr",
-            adapter_class="picarones.app.services.legacy_runner_compat.IgnoredByPreset",
-            adapter_kwargs={},
-            input_types=(ArtifactType.IMAGE,),
-            output_types=(ArtifactType.RAW_TEXT,),
-        ),),
-    )
-def run_via_orchestrator(
-    corpus: "Corpus",
-    engines: list[Any],
-    *,
-    char_exclude: Any | None = None,
-    normalization_profile: Any | None = None,
-    output_json: str | Path | None = None,
-    code_version: str | None = None,
-    show_progress: bool = True,  # noqa: ARG001 — absorbé pour compat
-    progress_callback: Callable[[str, int, str], None] | None = None,
-    timeout_seconds: float = 60.0,
-    cancel_event: Any | None = None,
-    partial_dir: str | Path | None = None,
-    entity_extractor: Callable[[str], list[dict]] | str | None = None,
-    profile: str = "standard",
-) -> "BenchmarkResult":
-    """Drop-in remplacement de ``run_benchmark_via_service`` via
-    ``RunOrchestrator.execute_preset()``.
-    Préserve la signature legacy pour permettre la migration mécanique
-    des call sites (CLI, web, tests).  Retourne un ``BenchmarkResult``
-    construit via le converter ``run_result_to_benchmark_result``.
-    Parameters
-    ----------
-    corpus, engines:
-        Identiques à ``run_benchmark_via_service``.
-    char_exclude, normalization_profile, output_json, code_version,
-    show_progress, progress_callback, timeout_seconds, cancel_event,
-    partial_dir, entity_extractor, profile:
-        Identiques à ``run_benchmark_via_service``.
-    Notes
-    -----
-    Quelques différences subtiles vs le legacy :
-    - ``entity_extractor`` accepte un callable direct (legacy) OU un
-      dotted path string (RunSpec).  Si callable, on l'invoque
-      directement en post-process sur le ``BenchmarkResult``.
-    - Le workspace temporaire est nettoyé automatiquement via
-      ``TemporaryDirectory`` — ne pas s'attendre à des fichiers
-      résiduels après l'appel.
-    - ``normalization_profile`` accepte un objet ``NormalizationProfile``
-      (legacy) OU un nom string (RunSpec).  Conversion automatique.
-    """
-    from picarones.app.schemas.run_spec import RunSpec
-    from picarones.app.services._benchmark_adapter_resolver import (
-        build_adapter_resolver,
-        engine_to_pipeline_spec,
-    )
-    from picarones.app.services._benchmark_converter import (
-        run_result_to_benchmark_result,
-    )
-    from picarones.app.services._benchmark_conversions import (
-        corpus_to_corpus_spec,
-    )
-    from picarones.app.services.run_orchestrator import RunOrchestrator
-    # Résolution code_version (cohérent avec run_benchmark_via_service:219).
-    if code_version is None:
-        import importlib
-        try:
-            code_version = importlib.import_module("picarones").__version__
-        except (ImportError, AttributeError):
-            code_version = "unknown"
-    # ``normalization_profile`` legacy accepte un objet
-    # NormalizationProfile.  RunSpec attend une string.  On convertit.
-    norm_profile_str = normalization_profile
-    if normalization_profile is not None and not isinstance(
-        normalization_profile, str,
-    ):
-        norm_profile_str = getattr(normalization_profile, "name", None)
-    # ``entity_extractor`` legacy accepte un callable direct.  RunSpec
-    # attend un dotted path.  Si callable, on le traite post-process
-    # comme run_benchmark_via_service le fait.
-    entity_extractor_dotted: str | None = None
-    entity_extractor_callable: Callable | None = None
-    if entity_extractor is not None:
-        if isinstance(entity_extractor, str):
-            entity_extractor_dotted = entity_extractor
-        elif callable(entity_extractor):
-            entity_extractor_callable = entity_extractor
-    with tempfile.TemporaryDirectory(prefix="picarones_compat_") as ws:
-        ws_path = Path(ws)
-        gt_dir = ws_path / "gt"
-        gt_dir.mkdir()
-        run_dir = ws_path / "run"
-        run_dir.mkdir()
-        corpus_spec = corpus_to_corpus_spec(corpus, workspace_dir=gt_dir)
-        pipeline_specs = [engine_to_pipeline_spec(e) for e in engines]
-        adapter_resolver = build_adapter_resolver(engines)
-        pipeline_to_engine_name = {
-            spec.name: engine.name
-            for spec, engine in zip(pipeline_specs, engines)
-        }
-        # ``char_exclude`` peut être frozenset (legacy parsed) ou string
-        # (RunSpec format).  RunSpec attend une string ; on convertit.
-        char_exclude_str: str | None = None
-        if char_exclude is not None:
-            if isinstance(char_exclude, str):
-                char_exclude_str = char_exclude
-            else:
-                char_exclude_str = "".join(sorted(char_exclude))
-        spec = RunSpec(
-            corpus_dir=str(ws_path),  # ignoré par execute_preset
-            pipelines=(_dummy_pipeline_yaml(),),  # ignoré, juste pour validator
-            views=("text_final",),
-            output_dir=str(run_dir),
-            char_exclude=char_exclude_str,
-            normalization_profile=norm_profile_str,
-            partial_dir=str(partial_dir) if partial_dir else None,
-            entity_extractor=entity_extractor_dotted,
-            profile=profile,
-            output_json=str(output_json) if output_json else None,
-            code_version=code_version,
-            timeout_seconds_per_doc=timeout_seconds,
-        )
-        # Tag des engines avec le nom pour la map pipeline_to_engine
-        # (utilisé par le progress_callback wrapper).
-        wrapped_callback = None
-        if progress_callback is not None:
-            def wrapped_callback(
-                pipeline_name: str, doc_idx: int, doc_id: str,
-            ) -> None:
-                engine_name = pipeline_to_engine_name.get(
-                    pipeline_name, pipeline_name,
-                )
-                progress_callback(engine_name, doc_idx, doc_id)
-        orch = RunOrchestrator(run_dir)
-        orch_result = orch.execute_preset(
-            spec,
-            corpus_spec=corpus_spec,
-            extracted_dir=gt_dir,
-            pipeline_specs=pipeline_specs,
-            adapter_resolver=adapter_resolver,
-            adapter_kwargs={},
-            progress_callback=wrapped_callback,
-            cancel_event=cancel_event,
-        )
-        # Converti RunResult → BenchmarkResult via le converter
-        # canonique (utilisé aussi par output_json en Phase B2.7).
-        benchmark_result = run_result_to_benchmark_result(
-            orch_result.run_result,
-            corpus=corpus,
-            engines=engines,
-            char_exclude=char_exclude,  # passe la valeur originale
-            normalization_profile=normalization_profile,
-            profile=profile,
-        )
-        # NER attach post-process si entity_extractor callable fourni.
-        # Cohérent avec run_benchmark_via_service:261-264.
-        if entity_extractor_callable is not None:
-            from picarones.app.services._benchmark_ner import (
-                attach_ner_metrics_to_benchmark,
-            )
-            attach_ner_metrics_to_benchmark(
-                benchmark_result, corpus, entity_extractor_callable,
-            )
-        # Sérialisation output_json si demandée (legacy comportement).
-        if output_json is not None:
-            from picarones.app.services._benchmark_persistence import (
-                persist_benchmark_result_json,
-            )
-            persist_benchmark_result_json(
-                benchmark_result, Path(output_json),
-            )
-        return benchmark_result
-__all__ = ["run_via_orchestrator"]

picarones/interfaces/web/benchmark_utils.py CHANGED Viewed

@@ -380,8 +380,7 @@ def run_benchmark_thread_v2(job: BenchmarkJob, req: BenchmarkRunRequest) -> None
         #     1. prepare_preset_args     (conversion vers domain)
         #     2. execute_preset          (run du benchmark)
         #     3. run_result_to_benchmark_result (BenchmarkResult legacy)
-        # Plus de shim ``run_via_orchestrator`` — la mécanique est
-        # visible et chaque étape est unitairement testable.
         with tempfile.TemporaryDirectory(prefix="picarones_web_") as _ws:
             _ws_path = Path(_ws)
             _run_dir = _ws_path / "run"

         #     1. prepare_preset_args     (conversion vers domain)
         #     2. execute_preset          (run du benchmark)
         #     3. run_result_to_benchmark_result (BenchmarkResult legacy)
+        # Pattern explicite — chaque étape est unitairement testable.
         with tempfile.TemporaryDirectory(prefix="picarones_web_") as _ws:
             _ws_path = Path(_ws)
             _run_dir = _ws_path / "run"

tests/_migration_helpers.py CHANGED Viewed

@@ -1,10 +1,9 @@
 """Helpers tests — pattern ``RunOrchestrator`` pour les tests B4.
-Phase B3-final (mai 2026) — ce module **n'est plus un re-export**
-du shim de production ``legacy_runner_compat``.  Il implémente
-directement le pattern 3 étapes (``prepare_preset_args`` →
-``execute_preset`` → ``run_result_to_benchmark_result``) pour servir
-les 6 fichiers de tests catégorie A migrés en Phase B4.
 Pourquoi un helper test dédié plutôt qu'inline dans chaque test ?
 -----------------------------------------------------------------
@@ -13,16 +12,11 @@ que l'ancien ``run_benchmark_via_service``.  Le mettre inline dans
 chaque test ajouterait ~10 lignes de boilerplate par cas, noyant
 l'intention du test.
-Différence vs le shim de production
------------------------------------
-Le shim ``legacy_runner_compat`` exposait ``run_via_orchestrator``
-comme API publique pour CLI/Web — il a été supprimé en Phase
-B3-final commit 5 au profit du pattern 3 étapes explicite dans
-chaque call site.
 Ce helper ``run_via_orchestrator`` est un **outil de test**
 (préfixe ``_`` du module + dossier ``tests/``).  Son existence ne
-constitue pas de la dette technique en production.
 """
 from __future__ import annotations

 """Helpers tests — pattern ``RunOrchestrator`` pour les tests B4.
+Phase B3-final (mai 2026) — implémente directement le pattern 3
+étapes ``prepare_preset_args`` → ``execute_preset`` →
+``run_result_to_benchmark_result`` pour servir les 6 fichiers de
+tests catégorie A migrés en Phase B4.
 Pourquoi un helper test dédié plutôt qu'inline dans chaque test ?
 -----------------------------------------------------------------
 chaque test ajouterait ~10 lignes de boilerplate par cas, noyant
 l'intention du test.
 Ce helper ``run_via_orchestrator`` est un **outil de test**
 (préfixe ``_`` du module + dossier ``tests/``).  Son existence ne
+constitue pas de la dette technique en production : il n'y a pas
+de shim équivalent dans ``picarones/`` (les call sites CLI/Web
+font le pattern 3 étapes explicitement).
 """
 from __future__ import annotations