Spaces:

Ma-Ri-Ba-Ku
/

Picarones

Running

Claude commited on May 1

Commit

77d9c47

unverified ·

1 Parent(s): 360239b

refactor(measurements): renommer _runner.py en _hooks.py pour cohérence

Avant ce commit, le suffixe ``_runner`` était ambigu : il existait
``measurements/runner.py`` (orchestrateur central qui exécute le
benchmark) et ``measurements/{readability,searchability,
numerical_sequences,philological}_runner.py`` (couches d'adaptation
entre le calcul pur et le runner principal). Le nom suggérait
faussement que les seconds étaient des orchestrateurs.

Ces 4 fichiers sont en réalité des **hooks adaptifs** : ils calculent
une métrique par document avec adaptive masking (rien n'apparaît
pour un doc sans GT exploitable), agrègent corpus-wide, et sont
consommés par ``measurements.builtin_hooks``. Le nom ``_hooks`` les
classe avec leur consommateur naturel.

Renommages :

- ``readability_runner.py`` → ``readability_hooks.py``
- ``searchability_runner.py`` → ``searchability_hooks.py``
- ``numerical_sequences_runner.py`` → ``numerical_sequences_hooks.py``
- ``philological_runner.py`` → ``philological_hooks.py``

Tous les imports dans le code source et les tests sont migrés. Aucun
shim — les imports historiques cessent de fonctionner mais sont
substitués par les nouveaux. La docstring de
``measurements/__init__.py`` documente la convention :
``*_hooks.py`` = couche d'adaptation entre calcul pur et runner.

Le nom ``runner.py`` (sans suffixe) reste pour l'orchestrateur central
``run_benchmark`` ; c'est cohérent avec le pattern Django/Flask qui
distingue ``app.py`` (l'orchestrateur) et ``views.py`` (les hooks
de présentation).

https://claude.ai/code/session_01Hsd7kL8yeCbXn1mA7GQK9L

Files changed (10) hide show

picarones/core/metric_hooks.py +2 -2
picarones/measurements/__init__.py +7 -5
picarones/measurements/builtin_hooks.py +8 -8
picarones/measurements/{numerical_sequences_runner.py → numerical_sequences_hooks.py} +0 -0
picarones/measurements/{philological_runner.py → philological_hooks.py} +2 -2
picarones/measurements/{readability_runner.py → readability_hooks.py} +0 -0
picarones/measurements/{searchability_runner.py → searchability_hooks.py} +0 -0
tests/test_sprint61_philological_runner.py +1 -1
tests/test_sprint86_aii5_html.py +2 -2
tests/test_sprint87_readability_html.py +1 -1

picarones/core/metric_hooks.py CHANGED Viewed

@@ -8,8 +8,8 @@ Avant ce chantier, ``picarones.measurements.runner._compute_document_result``
 contenait **11 imports tardifs codés en dur** vers
 ``picarones.measurements.confusion``, ``char_scores``, ``taxonomy``, ``structure``,
 ``image_quality``, ``line_metrics``, ``hallucination``,
-``philological_runner``, ``searchability_runner``,
-``numerical_sequences_runner``, ``readability_runner`` — chacun enrobé
 dans un ``try/except Exception`` qui logue un warning. Symétriquement,
 la phase d'agrégation contenait 11 fonctions ``_aggregate_*`` ou
 ``aggregate_*``. Ajouter une nouvelle métrique exigeait de patcher

 contenait **11 imports tardifs codés en dur** vers
 ``picarones.measurements.confusion``, ``char_scores``, ``taxonomy``, ``structure``,
 ``image_quality``, ``line_metrics``, ``hallucination``,
+``philological_hooks``, ``searchability_hooks``,
+``numerical_sequences_hooks``, ``readability_hooks`` — chacun enrobé
 dans un ``try/except Exception`` qui logue un warning. Symétriquement,
 la phase d'agrégation contenait 11 fonctions ``_aggregate_*`` ou
 ``aggregate_*``. Ajouter une nouvelle métrique exigeait de patcher

picarones/measurements/__init__.py CHANGED Viewed

@@ -86,7 +86,6 @@ Philologie historique :
 - :mod:`modern_archives`      marqueurs XIXᵉ-XXᵉ
 - :mod:`roman_numerals`       numéraux romains
 - :mod:`lexical_modernization` sur-normalisation lexicale
-- :mod:`philological_runner`  câblage runner adaptive
 Pipelines composées (axe B) :
@@ -99,11 +98,14 @@ Aide à la décision :
 - :mod:`equivalence_profile`  curseur fin équivalences diplomatiques
 - :mod:`module_policy`        manifest + audit modules contribués
-Câblages adaptifs (suffixe ``_runner``) :
-- :mod:`readability_runner`, :mod:`searchability_runner`,
-  :mod:`numerical_sequences_runner` — adaptive masking
-  document-par-document, consommés par :mod:`builtin_hooks`.
 Moteur narratif :

 - :mod:`modern_archives`      marqueurs XIXᵉ-XXᵉ
 - :mod:`roman_numerals`       numéraux romains
 - :mod:`lexical_modernization` sur-normalisation lexicale
 Pipelines composées (axe B) :
 - :mod:`equivalence_profile`  curseur fin équivalences diplomatiques
 - :mod:`module_policy`        manifest + audit modules contribués
+Câblages adaptifs (suffixe ``_hooks``) :
+- :mod:`readability_hooks`, :mod:`searchability_hooks`,
+  :mod:`numerical_sequences_hooks`, :mod:`philological_hooks` —
+  adaptive masking document-par-document, consommés par
+  :mod:`builtin_hooks`. Ces modules sont des couches d'adaptation
+  entre le calcul pur (sans I/O) et le runner principal (avec
+  agrégation par moteur).
 Moteur narratif :

picarones/measurements/builtin_hooks.py CHANGED Viewed

@@ -247,7 +247,7 @@ def _image_quality_hook(*, image_path, **_):
     # — comportement adaptive intact.
 )
 def _philological_hook(*, ground_truth, hypothesis, **_):
-    from picarones.measurements.philological_runner import compute_philological_metrics
     return compute_philological_metrics(ground_truth, hypothesis)
@@ -257,7 +257,7 @@ def _philological_hook(*, ground_truth, hypothesis, **_):
     profiles=_STANDARD_PROFILES,
 )
 def _searchability_hook(*, ground_truth, hypothesis, **_):
-    from picarones.measurements.searchability_runner import compute_searchability_metrics
     return compute_searchability_metrics(ground_truth, hypothesis)
@@ -267,7 +267,7 @@ def _searchability_hook(*, ground_truth, hypothesis, **_):
     profiles=_STANDARD_PROFILES,
 )
 def _numerical_sequences_hook(*, ground_truth, hypothesis, **_):
-    from picarones.measurements.numerical_sequences_runner import (
         compute_numerical_sequence_metrics_adaptive,
     )
     return compute_numerical_sequence_metrics_adaptive(ground_truth, hypothesis)
@@ -279,7 +279,7 @@ def _numerical_sequences_hook(*, ground_truth, hypothesis, **_):
     profiles=_STANDARD_PROFILES,
 )
 def _readability_hook(*, ground_truth, hypothesis, corpus_lang, **_):
-    from picarones.measurements.readability_runner import compute_readability_metrics
     return compute_readability_metrics(ground_truth, hypothesis, lang=corpus_lang)
@@ -543,7 +543,7 @@ def _aggregate_calibration(doc_results: list) -> Optional[dict]:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_philological(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.philological_runner import aggregate_philological_metrics
     return aggregate_philological_metrics(
         [dr.philological_metrics for dr in doc_results],
     )
@@ -555,7 +555,7 @@ def _aggregate_philological(doc_results: list) -> Optional[dict]:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_searchability(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.searchability_runner import aggregate_searchability_metrics
     return aggregate_searchability_metrics(
         [dr.searchability_metrics for dr in doc_results],
     )
@@ -567,7 +567,7 @@ def _aggregate_searchability(doc_results: list) -> Optional[dict]:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_numerical_sequences(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.numerical_sequences_runner import (
         aggregate_numerical_sequence_metrics,
     )
     return aggregate_numerical_sequence_metrics(
@@ -581,7 +581,7 @@ def _aggregate_numerical_sequences(doc_results: list) -> Optional[dict]:
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_readability(doc_results: list) -> Optional[dict]:
-    from picarones.measurements.readability_runner import aggregate_readability_metrics
     return aggregate_readability_metrics(
         [dr.readability_metrics for dr in doc_results],
     )

     # — comportement adaptive intact.
 )
 def _philological_hook(*, ground_truth, hypothesis, **_):
+    from picarones.measurements.philological_hooks import compute_philological_metrics
     return compute_philological_metrics(ground_truth, hypothesis)
     profiles=_STANDARD_PROFILES,
 )
 def _searchability_hook(*, ground_truth, hypothesis, **_):
+    from picarones.measurements.searchability_hooks import compute_searchability_metrics
     return compute_searchability_metrics(ground_truth, hypothesis)
     profiles=_STANDARD_PROFILES,
 )
 def _numerical_sequences_hook(*, ground_truth, hypothesis, **_):
+    from picarones.measurements.numerical_sequences_hooks import (
         compute_numerical_sequence_metrics_adaptive,
     )
     return compute_numerical_sequence_metrics_adaptive(ground_truth, hypothesis)
     profiles=_STANDARD_PROFILES,
 )
 def _readability_hook(*, ground_truth, hypothesis, corpus_lang, **_):
+    from picarones.measurements.readability_hooks import compute_readability_metrics
     return compute_readability_metrics(ground_truth, hypothesis, lang=corpus_lang)
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_philological(doc_results: list) -> Optional[dict]:
+    from picarones.measurements.philological_hooks import aggregate_philological_metrics
     return aggregate_philological_metrics(
         [dr.philological_metrics for dr in doc_results],
     )
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_searchability(doc_results: list) -> Optional[dict]:
+    from picarones.measurements.searchability_hooks import aggregate_searchability_metrics
     return aggregate_searchability_metrics(
         [dr.searchability_metrics for dr in doc_results],
     )
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_numerical_sequences(doc_results: list) -> Optional[dict]:
+    from picarones.measurements.numerical_sequences_hooks import (
         aggregate_numerical_sequence_metrics,
     )
     return aggregate_numerical_sequence_metrics(
     profiles=_STANDARD_PROFILES,
 )
 def _aggregate_readability(doc_results: list) -> Optional[dict]:
+    from picarones.measurements.readability_hooks import aggregate_readability_metrics
     return aggregate_readability_metrics(
         [dr.readability_metrics for dr in doc_results],
     )

picarones/measurements/{numerical_sequences_runner.py → numerical_sequences_hooks.py} RENAMED Viewed

File without changes

picarones/measurements/{philological_runner.py → philological_hooks.py} RENAMED Viewed

@@ -123,7 +123,7 @@ def compute_philological_metrics(
             result = compute_fn(ref, hypothesis or "")
         except Exception as exc:  # pragma: no cover — défense en profondeur
             logger.warning(
-                "[philological_runner] module %s a échoué : %s", name, exc,
             )
             continue
         if has_signal_fn(result):
@@ -350,7 +350,7 @@ def aggregate_philological_metrics(
         aggregator = _AGGREGATORS.get(module)
         if aggregator is None:  # pragma: no cover
             logger.warning(
-                "[philological_runner] aucun agrégateur pour %s", module,
             )
             continue
         out[module] = aggregator(payloads)

             result = compute_fn(ref, hypothesis or "")
         except Exception as exc:  # pragma: no cover — défense en profondeur
             logger.warning(
+                "[philological_hooks] module %s a échoué : %s", name, exc,
             )
             continue
         if has_signal_fn(result):
         aggregator = _AGGREGATORS.get(module)
         if aggregator is None:  # pragma: no cover
             logger.warning(
+                "[philological_hooks] aucun agrégateur pour %s", module,
             )
             continue
         out[module] = aggregator(payloads)

picarones/measurements/{readability_runner.py → readability_hooks.py} RENAMED Viewed

File without changes

picarones/measurements/{searchability_runner.py → searchability_hooks.py} RENAMED Viewed

File without changes

tests/test_sprint61_philological_runner.py CHANGED Viewed

@@ -24,7 +24,7 @@ Couvre :
 from __future__ import annotations
-from picarones.measurements.philological_runner import (
     aggregate_philological_metrics,
     compute_philological_metrics,
 )

 from __future__ import annotations
+from picarones.measurements.philological_hooks import (
     aggregate_philological_metrics,
     compute_philological_metrics,
 )

tests/test_sprint86_aii5_html.py CHANGED Viewed

@@ -18,7 +18,7 @@ from __future__ import annotations
 import json
 from pathlib import Path
-from picarones.measurements.numerical_sequences_runner import (
     aggregate_numerical_sequence_metrics,
     compute_numerical_sequence_metrics_adaptive,
 )
@@ -32,7 +32,7 @@ def _stub_metrics() -> MetricsResult:
         wer=0.0, wer_normalized=0.0, mer=0.0, wil=0.0,
         reference_length=0, hypothesis_length=0,
     )
-from picarones.measurements.searchability_runner import (
     aggregate_searchability_metrics,
     compute_searchability_metrics,
 )

 import json
 from pathlib import Path
+from picarones.measurements.numerical_sequences_hooks import (
     aggregate_numerical_sequence_metrics,
     compute_numerical_sequence_metrics_adaptive,
 )
         wer=0.0, wer_normalized=0.0, mer=0.0, wil=0.0,
         reference_length=0, hypothesis_length=0,
     )
+from picarones.measurements.searchability_hooks import (
     aggregate_searchability_metrics,
     compute_searchability_metrics,
 )

tests/test_sprint87_readability_html.py CHANGED Viewed

@@ -17,7 +17,7 @@ import json
 from pathlib import Path
 from picarones.measurements.metrics import MetricsResult
-from picarones.measurements.readability_runner import (
     aggregate_readability_metrics,
     compute_readability_metrics,
 )

 from pathlib import Path
 from picarones.measurements.metrics import MetricsResult
+from picarones.measurements.readability_hooks import (
     aggregate_readability_metrics,
     compute_readability_metrics,
 )

refactor(measurements): renommer *_runner.py en *_hooks.py pour cohérence

refactor(measurements): renommer _runner.py en _hooks.py pour cohérence