Spaces:

Ma-Ri-Ba-Ku
/

Picarones

Running

Picarones / tests /test_pricing_degenerate_cases.py

Claude

refactor(core): faire de core/ un cercle 1 strict, déplacer cercle 2 vers measurements/

979f3c3 unverified about 2 months ago

9.28 kB

	"""Tests Sprint 31 — cas dégénérés du module ``picarones/core/pricing.py``.

	Le test ``test_sprint20_pareto_pricing.py`` couvre les chemins
	nominaux. Sprint 31 ajoute la couverture des cas pathologiques :

	- pricing.yaml malformé (meta vide, engines absent, YAML invalide) ;
	- ``estimate_cost`` avec entrées extrêmes (durée nulle, taux 0,
	modèle inconnu mêmes lookups) ;
	- ``compute_pareto_front`` sur ensembles dégénérés (vide, 1 point,
	toutes valeurs identiques, NaN partout, objectifs incohérents).

	Le but est de garantir qu'aucun de ces cas ne lève une exception
	non documentée — un faux résultat doit être traité comme un signal
	faible (``unknown``, ``[]``, ``score=1.0``), pas comme un crash qui
	bloquerait la génération du rapport.
	"""

	from __future__ import annotations

	import pytest

	from picarones.measurements.pricing import (
	EngineCost,
	PricingDefaults,
	build_costs_for_benchmark,
	estimate_cost,
	load_pricing_database,
	)
	from picarones.measurements.statistics import compute_pareto_front


	# ---------------------------------------------------------------------------
	# 1. Robustesse de load_pricing_database
	# ---------------------------------------------------------------------------

	class TestLoadPricingDegenerate:
	def test_meta_only_file(self, tmp_path):
	path = tmp_path / "p.yaml"
	path.write_text("meta:\n currency: EUR\n", encoding="utf-8")
	defaults, table = load_pricing_database(path)
	assert defaults.currency == "EUR"
	assert table == {}

	def test_engines_only_file(self, tmp_path):
	path = tmp_path / "p.yaml"
	path.write_text("engines:\n fake: {type: local}\n", encoding="utf-8")
	defaults, table = load_pricing_database(path)
	# Defaults retombent sur les constantes par défaut
	assert isinstance(defaults, PricingDefaults)
	assert "fake" in table

	def test_completely_empty_yaml(self, tmp_path):
	path = tmp_path / "p.yaml"
	path.write_text("", encoding="utf-8")
	defaults, table = load_pricing_database(path)
	assert isinstance(defaults, PricingDefaults)
	assert table == {}

	def test_invalid_yaml_returns_empty(self, tmp_path):
	path = tmp_path / "p.yaml"
	path.write_text("meta: : :\n invalid", encoding="utf-8")
	defaults, table = load_pricing_database(path)
	# Comportement dégradé documenté : retourne PricingDefaults() + {}
	assert isinstance(defaults, PricingDefaults)
	assert table == {}


	# ---------------------------------------------------------------------------
	# 2. estimate_cost cas extrêmes
	# ---------------------------------------------------------------------------

	class TestEstimateCostDegenerate:
	def test_unknown_engine_returns_unknown_type(self):
	cost = estimate_cost("ne-pas-exister", table={}, defaults=PricingDefaults())
	assert isinstance(cost, EngineCost)
	assert cost.type == "unknown"
	assert cost.assumptions # message d'avertissement présent

	def test_zero_seconds_per_page_does_not_raise(self):
	# Un moteur infiniment rapide (théorique) ne doit pas crasher
	cost = estimate_cost(
	"tesseract",
	measured_seconds_per_page=0.0,
	)
	# On accepte un coût nul ou indéfini, mais pas d'exception.
	assert isinstance(cost, EngineCost)

	def test_negative_seconds_per_page_does_not_raise(self):
	# Anti-glitch : un timer qui descend (valeur négative) ne doit
	# pas crasher. Le module ne clamp PAS la valeur (comportement
	# documenté ici) — les vrais runs ne produisent jamais de
	# durées négatives. Le test vérifie juste l'absence d'exception.
	cost = estimate_cost(
	"tesseract",
	measured_seconds_per_page=-1.0,
	)
	assert isinstance(cost, EngineCost)
	# On accepte n'importe quelle valeur de coût ; ce qui compte
	# c'est qu'aucune exception ne soit levée.

	def test_hourly_rate_override_zero(self):
	cost = estimate_cost(
	"tesseract",
	measured_seconds_per_page=10.0,
	hourly_rate_override_eur=0.0,
	)
	# Coût zéro acceptable (cas universitaire / matériel amorti)
	if cost.cost_per_1k_pages_eur is not None:
	assert cost.cost_per_1k_pages_eur == pytest.approx(0.0)

	def test_as_dict_serializable(self):
	cost = estimate_cost("tesseract", measured_seconds_per_page=2.0)
	d = cost.as_dict()
	assert isinstance(d, dict)
	# Quelques clefs publiques attendues
	for k in ("engine_key", "type", "cost_per_1k_pages_eur"):
	assert k in d


	# ---------------------------------------------------------------------------
	# 3. compute_pareto_front cas pathologiques
	# ---------------------------------------------------------------------------

	class TestParetoFrontDegenerate:
	def test_single_point_is_dominant(self):
	front = compute_pareto_front(
	[{"engine": "A", "cer": 0.05, "cost": 10.0}],
	objectives=("cer", "cost"),
	)
	assert front == ["A"]

	def test_all_points_identical_keep_all(self):
	# Quand plusieurs moteurs ont les mêmes coordonnées, tous sont
	# sur le front (aucun ne domine strictement les autres).
	pts = [
	{"engine": "A", "cer": 0.05, "cost": 10.0},
	{"engine": "B", "cer": 0.05, "cost": 10.0},
	{"engine": "C", "cer": 0.05, "cost": 10.0},
	]
	front = set(compute_pareto_front(pts, objectives=("cer", "cost")))
	assert front == {"A", "B", "C"}

	def test_nan_values_do_not_crash(self):
	# NaN n'est pas filtré explicitement (comparaisons NaN < x = False).
	# On vérifie juste l'absence d'exception ; B doit toujours figurer
	# sur le front comme point Pareto-valide.
	pts = [
	{"engine": "A", "cer": float("nan"), "cost": 10.0},
	{"engine": "B", "cer": 0.05, "cost": 10.0},
	]
	front = compute_pareto_front(pts, objectives=("cer", "cost"))
	assert isinstance(front, list)
	assert "B" in front

	def test_missing_objective_field_skipped(self):
	pts = [
	{"engine": "A", "cer": 0.05}, # cost manquant
	{"engine": "B", "cer": 0.06, "cost": 5.0},
	]
	front = compute_pareto_front(pts, objectives=("cer", "cost"))
	assert "B" in front
	# A n'a pas pu être évalué → exclu
	assert "A" not in front

	def test_empty_points_returns_empty_list(self):
	assert compute_pareto_front([], objectives=("cer", "cost")) == []

	def test_single_objective_pareto_is_min(self):
	# Avec une seule dimension, Pareto = optimum global
	pts = [
	{"engine": "A", "cer": 0.10},
	{"engine": "B", "cer": 0.05}, # le meilleur
	{"engine": "C", "cer": 0.20},
	]
	front = compute_pareto_front(pts, objectives=("cer",))
	assert front == ["B"]

	def test_maximize_dimension(self):
	# Pour un objectif à maximiser (ex. accuracy), le front prend
	# les valeurs les plus hautes.
	pts = [
	{"engine": "A", "accuracy": 0.90, "cost": 10.0},
	{"engine": "B", "accuracy": 0.95, "cost": 10.0},
	{"engine": "C", "accuracy": 0.99, "cost": 10.0},
	]
	front = set(compute_pareto_front(
	pts,
	objectives=("accuracy", "cost"),
	minimize=(False, True),
	))
	# C maximise accuracy à coût égal — il domine A et B
	assert "C" in front

	def test_invalid_minimize_length_raises(self):
	pts = [{"engine": "A", "cer": 0.05, "cost": 10.0}]
	with pytest.raises((ValueError, AssertionError)):
	compute_pareto_front(
	pts,
	objectives=("cer", "cost"),
	minimize=(True,), # longueur ≠ objectives
	)


	# ---------------------------------------------------------------------------
	# 4. build_costs_for_benchmark — cas dégénérés
	# ---------------------------------------------------------------------------

	class TestBuildCostsDegenerate:
	def test_empty_engine_list_returns_empty(self):
	costs = build_costs_for_benchmark([], {})
	assert costs == {}

	def test_engines_without_measured_durations(self, tmp_path):
	# pricing.yaml minimal, juste un moteur local.
	path = tmp_path / "p.yaml"
	path.write_text(
	"meta:\n currency: EUR\n"
	"engines:\n tesseract: {type: local, indicative_seconds_per_page: 2.0}\n",
	encoding="utf-8",
	)
	# Pas de durée mesurée pour tesseract — l'algo retombe sur la
	# valeur indicative de la table.
	engines_summary = [{"name": "tesseract"}]
	durations_by_engine: dict[str, float] = {}
	costs = build_costs_for_benchmark(
	engines_summary, durations_by_engine, pricing_path=path,
	)
	assert "tesseract" in costs
	# ``costs`` retourne des dicts (cf. EngineCost.as_dict())
	assert costs["tesseract"]["type"] == "local"