"""
Industry-level enhanced ML generation model with:
- Multi-strategy retrieval
- Spec-aware adaptation
- Code validation
- Multi-level fallback
- Comprehensive reporting

This model ensures output quality through:
1. Protocol-first retrieval
2. Coverage-aware selection
3. Full adaptation with signal/register mapping
4. Pre-validation before writing
5. Automatic fallback to templates if issues found
6. Detailed generation reports
"""

from __future__ import annotations

import json
import logging
from dataclasses import dataclass, field
from datetime import datetime
from enum import Enum
from pathlib import Path
from typing import Any, Dict, List, Optional, Tuple

from src.config import DesignSpec, PipelineConfig
from src.models.base_model import GenerationModel
from src.models.code_validator import (
    CodeValidator,
    FileValidationResult,
    ValidationReport,
    ValidationSeverity,
)
from src.models.ml_utils import RichFeatureVector
from src.models.ml_generation_model import MLModelConfig, NameNormalizer
from src.models.spec_adapter import (
    AdaptationPlan,
    MappingConfidence,
    SpecAdapter,
)
from src.models.similarity_index import SimilarityIndex, get_global_index
from src.models.template_model import TemplateModel

logger = logging.getLogger("uvmgen")


class GenerationSource(Enum):
    RETRIEVAL_HIGH_CONF = "retrieval_high_confidence"
    RETRIEVAL_MEDIUM_CONF = "retrieval_medium_confidence"
    RETRIEVAL_LOW_CONF = "retrieval_low_confidence"
    TEMPLATE_FALLBACK = "template_fallback"
    BLENDED = "blended"
    HYBRID = "hybrid"


@dataclass
class GenerationResult:
    """
    Enhanced generation result with full validation and audit trail.
    """
    design_name: str
    source: GenerationSource
    passed: bool
    generated_files: Dict[str, str] = field(default_factory=dict)
    validation_report: Optional[ValidationReport] = None
    adaptation_plan: Optional[AdaptationPlan] = None
    similar_specs_found: int = 0
    best_match_score: float = 0.0
    files_from_retrieval: List[str] = field(default_factory=list)
    files_from_template: List[str] = field(default_factory=list)
    warnings: List[str] = field(default_factory=list)
    errors: List[str] = field(default_factory=list)
    timestamp: str = field(default_factory=lambda: datetime.now().isoformat())

    def to_dict(self) -> Dict[str, Any]:
        return {
            "design_name": self.design_name,
            "source": self.source.value,
            "passed": self.passed,
            "file_count": len(self.generated_files),
            "similar_specs_found": self.similar_specs_found,
            "best_match_score": self.best_match_score,
            "files_from_retrieval": self.files_from_retrieval,
            "files_from_template": self.files_from_template,
            "warnings": self.warnings,
            "errors": self.errors,
            "timestamp": self.timestamp,
            "validation": (
                self.validation_report.to_dict()
                if self.validation_report else None
            ),
            "adaptation": (
                {
                    "overall_score": self.adaptation_plan.overall_score,
                    "overall_confidence": self.adaptation_plan.overall_confidence.value,
                    "warnings": self.adaptation_plan.warnings,
                    "errors": self.adaptation_plan.errors,
                }
                if self.adaptation_plan else None
            ),
        }


@dataclass
class RetrievalCandidate:
    """A candidate from retrieval with pre-validation info."""
    result: Any
    feature_vector: RichFeatureVector
    spec_dict: Dict[str, Any]
    generated_files: Dict[str, str]
    adaptation_plan: Optional[AdaptationPlan] = None
    pre_validation_score: float = 0.0
    rank: int = 0


class EnhancedMLGenerationModel(GenerationModel):
    """
    Industry-level enhanced ML generation model.

    Key features:
    1. Multi-strategy retrieval (protocol-first, then similarity)
    2. Spec-aware adaptation with signal/register mapping
    3. Pre-validation before output
    4. Multi-level fallback strategies
    5. Comprehensive reporting and audit trail
    6. Coverage-aware candidate selection
    """

    def __init__(
        self,
        name: str = "enhanced_ml_model",
        config: Optional[MLModelConfig] = None,
        index: Optional[SimilarityIndex] = None,
        templates_dir: Optional[str] = None,
        strict_validation: bool = True,
    ):
        super().__init__(name)
        self.config = config or MLModelConfig()
        self._index = index
        self._templates_dir = templates_dir
        self._template_model: Optional[TemplateModel] = None
        self._strict_validation = strict_validation
        self._metadata: Dict[str, Any] = {}
        self._last_result: Optional[GenerationResult] = None

    @property
    def index(self) -> SimilarityIndex:
        if self._index is None:
            if self.config.index_path:
                self._index = SimilarityIndex.load(self.config.index_path)
            else:
                self._index = get_global_index()
        return self._index

    @property
    def template_model(self) -> TemplateModel:
        if self._template_model is None:
            self._template_model = TemplateModel(
                name="fallback_template",
                templates_dir=self._templates_dir,
            )
        return self._template_model

    def train(self, specs: List[DesignSpec]) -> Dict[str, Any]:
        """Train the model by adding specs to the similarity index."""
        from src.features.extractors import RichSpecFeatureExtractor

        if not self._templates_dir:
            import os
            self._templates_dir = os.path.join(
                os.path.dirname(__file__), "..", "..", "src", "generation", "templates"
            )

        self.template_model.train([])

        extractor = RichSpecFeatureExtractor()
        added_count = 0

        for spec in specs:
            try:
                fv = extractor.extract(spec)
                spec_dict = self._spec_to_dict(spec)

                cfg = PipelineConfig()
                if self._templates_dir:
                    cfg.generation.templates_dir = self._templates_dir

                import tempfile
                with tempfile.TemporaryDirectory() as tmp:
                    cfg.generation.output_dir = tmp
                    files = self.template_model.predict(spec, cfg)
                    file_contents: Dict[str, str] = {}
                    for fname, fpath in files.items():
                        try:
                            file_contents[fname] = Path(fpath).read_text(encoding="utf-8")
                        except Exception:
                            pass

                self.index.add(fv, spec_dict, file_contents)
                added_count += 1
            except Exception as e:
                logger.warning("Failed to add spec to index: %s", e)

        self._metadata = {
            "model_type": "enhanced_ml",
            "strict_validation": self._strict_validation,
            "config": {
                "similarity_threshold": self.config.similarity_threshold,
                "auto_learn": self.config.auto_learn,
                "fallback_to_templates": self.config.fallback_to_templates,
            },
            "index_size": len(self.index),
            "added_in_train": added_count,
            "trained_on_specs": len(specs),
        }
        self._is_trained = True
        logger.info("Trained enhanced ML model: index has %d entries", len(self.index))
        return self._metadata

    def predict(
        self,
        spec: DesignSpec,
        cfg: PipelineConfig,
        extra_seqs: Optional[List[str]] = None,
    ) -> Dict[str, str]:
        """
        Generate testbench with full validation and fallback.

        Workflow:
        1. Extract rich features
        2. Search for similar specs
        3. For each candidate:
           - Create adaptation plan
           - Pre-validate
           - Score
        4. Select best candidate or fallback
        5. Adapt best candidate
        6. Validate output
        7. If validation fails, fallback to templates
        8. If auto_learn, add to index
        """
        if not self._is_trained:
            self.train([])

        from src.features.extractors import RichSpecFeatureExtractor
        extractor = RichSpecFeatureExtractor()
        query_fv = extractor.extract(spec)
        query_dict = self._spec_to_dict(spec)

        similar = self.index.search(
            query_fv,
            top_k=self.config.top_k_retrieval,
            min_similarity=0.3,
        )

        logger.info(
            "Enhanced ML generation: found %d similar specs, best score: %.3f",
            len(similar), similar[0].similarity if similar else 0.0
        )

        result: Optional[GenerationResult] = None

        if similar and similar[0].similarity >= self.config.similarity_threshold:
            result = self._try_retrieval_generation(
                similar, query_fv, query_dict, spec, cfg
            )

        if (
            result is None
            or (self._strict_validation and not result.passed)
            and self.config.fallback_to_templates
        ):
            if result is None:
                logger.info("No valid retrieval candidate, falling back to templates")
            else:
                logger.warning(
                    "Retrieval-based generation failed validation (errors: %d), falling back to templates",
                    result.validation_report.total_errors if result.validation_report else 0
                )
            result = self._generate_with_fallback(spec, cfg, extra_seqs, result)

        if result is None:
            raise RuntimeError("All generation strategies failed")

        if self.config.auto_learn and result.passed:
            self._learn_from_result(result, query_fv, query_dict)

        self._last_result = result
        self._log_result_summary(result)

        return result.generated_files

    def _try_retrieval_generation(
        self,
        similar: List[Any],
        query_fv: RichFeatureVector,
        query_dict: Dict[str, Any],
        spec: DesignSpec,
        cfg: PipelineConfig,
    ) -> Optional[GenerationResult]:
        """Try retrieval-based generation with validation."""
        candidates = self._rank_candidates(similar, query_fv, query_dict)

        if not candidates:
            return None

        best_candidate = candidates[0]
        logger.info(
            "Best candidate: '%s' (score: %.3f, pre-val: %.2f)",
            best_candidate.spec_dict.get("design_name", "unknown"),
            best_candidate.result.similarity,
            best_candidate.pre_validation_score,
        )

        if best_candidate.pre_validation_score < 0.5:
            logger.info("Candidate pre-validation score too low (%.2f)", best_candidate.pre_validation_score)
            return None

        adapted = self._adapt_candidate(best_candidate, query_dict, spec, cfg)
        if adapted is None:
            return None

        final_files, val_report, source = adapted

        passed = val_report.overall_passed if val_report else True
        if self._strict_validation:
            passed = passed and (val_report.total_errors == 0 if val_report else True)

        if best_candidate.result.similarity >= 0.9:
            generation_source = GenerationSource.RETRIEVAL_HIGH_CONF
        elif best_candidate.result.similarity >= 0.7:
            generation_source = GenerationSource.RETRIEVAL_MEDIUM_CONF
        else:
            generation_source = GenerationSource.RETRIEVAL_LOW_CONF

        result = GenerationResult(
            design_name=spec.design_name,
            source=generation_source,
            passed=passed,
            generated_files=final_files,
            validation_report=val_report,
            adaptation_plan=best_candidate.adaptation_plan,
            similar_specs_found=len(similar),
            best_match_score=best_candidate.result.similarity,
            files_from_retrieval=list(final_files.keys()),
            files_from_template=[],
            warnings=self._collect_warnings(best_candidate, val_report),
            errors=self._collect_errors(best_candidate, val_report),
        )

        return result

    def _rank_candidates(
        self,
        similar: List[Any],
        query_fv: RichFeatureVector,
        query_dict: Dict[str, Any],
    ) -> List[RetrievalCandidate]:
        """Rank candidates by similarity + pre-validation score."""
        candidates: List[RetrievalCandidate] = []

        for rank, result in enumerate(similar):
            if not result.generated_files:
                continue

            spec_dict = result.spec_dict
            gen_files = result.generated_files

            adapter = SpecAdapter(
                source_protocol=spec_dict.get("protocol"),
                target_protocol=query_fv.protocol_type,
                strict_mode=self._strict_validation,
            )
            plan = adapter.create_adaptation_plan(spec_dict, query_dict)

            pre_val_score = self._compute_pre_validation_score(plan, result)

            candidate = RetrievalCandidate(
                result=result,
                feature_vector=result.spec_dict,
                spec_dict=spec_dict,
                generated_files=gen_files,
                adaptation_plan=plan,
                pre_validation_score=pre_val_score,
                rank=rank,
            )
            candidates.append(candidate)

        candidates.sort(
            key=lambda c: (
                c.pre_validation_score * 0.6 +
                c.result.similarity * 0.4
            ),
            reverse=True,
        )

        return candidates

    def _compute_pre_validation_score(
        self,
        plan: AdaptationPlan,
        result: Any,
    ) -> float:
        """Compute a pre-validation score from the adaptation plan."""
        if plan.errors:
            return 0.0

        score = plan.overall_score

        if plan.unmapped_target_signals:
            score *= 0.5

        if plan.warnings:
            score *= 0.9

        if plan.overall_confidence == MappingConfidence.EXACT:
            score = min(1.0, score + 0.1)
        elif plan.overall_confidence == MappingConfidence.HIGH:
            score = min(1.0, score + 0.05)

        return max(0.0, min(1.0, score))

    def _adapt_candidate(
        self,
        candidate: RetrievalCandidate,
        query_dict: Dict[str, Any],
        spec: DesignSpec,
        cfg: PipelineConfig,
    ) -> Optional[Tuple[Dict[str, str], Optional[ValidationReport], GenerationSource]]:
        """Adapt the candidate to the target spec."""
        if not candidate.adaptation_plan:
            return None

        output_dir = Path(cfg.generation.output_dir) / f"{spec.design_name}_tb"
        output_dir.mkdir(parents=True, exist_ok=True)

        final_files: Dict[str, str] = {}
        adapted_contents: Dict[str, str] = {}

        adapter = SpecAdapter(
            source_protocol=candidate.spec_dict.get("protocol"),
            target_protocol=query_dict.get("protocol"),
            strict_mode=self._strict_validation,
        )

        total_changes: List[str] = []
        total_warnings: List[str] = []

        for filename, content in candidate.generated_files.items():
            new_filename = NameNormalizer.adapt_names(
                filename,
                candidate.spec_dict.get("design_name", ""),
                spec.design_name,
            )

            if new_filename == filename and candidate.spec_dict.get("design_name") != spec.design_name:
                base = os.path.splitext(filename)[0]
                ext = os.path.splitext(filename)[1]
                old_name = candidate.spec_dict.get("design_name", "")
                if old_name and old_name in base:
                    new_filename = base.replace(old_name, spec.design_name) + ext

            adapted_content, changes, warnings = adapter.apply_adaptation(
                candidate.adaptation_plan, content
            )

            total_changes.extend(changes)
            total_warnings.extend(warnings)
            adapted_contents[new_filename] = adapted_content

        validator = CodeValidator(query_dict)
        val_report = validator.validate_files(adapted_contents, spec.design_name)

        for filename, content in adapted_contents.items():
            out_path = output_dir / filename
            out_path.parent.mkdir(parents=True, exist_ok=True)
            out_path.write_text(content, encoding="utf-8")
            final_files[filename] = str(out_path)

        if total_changes:
            logger.info("Applied %d adaptations during generation", len(total_changes))
        if total_warnings:
            logger.warning("Adaptation produced %d warnings", len(total_warnings))

        source = GenerationSource.RETRIEVAL_MEDIUM_CONF
        if candidate.result.similarity >= 0.9:
            source = GenerationSource.RETRIEVAL_HIGH_CONF

        return final_files, val_report, source

    def _generate_with_fallback(
        self,
        spec: DesignSpec,
        cfg: PipelineConfig,
        extra_seqs: Optional[List[str]],
        previous_result: Optional[GenerationResult],
    ) -> GenerationResult:
        """Generate using template fallback."""
        logger.info("Using template-based generation as fallback")

        files = self.template_model.predict(spec, cfg, extra_seqs)

        query_dict = self._spec_to_dict(spec)
        validator = CodeValidator(query_dict)

        file_contents: Dict[str, str] = {}
        for fname, fpath in files.items():
            try:
                file_contents[fname] = Path(fpath).read_text(encoding="utf-8")
            except Exception:
                pass

        val_report = validator.validate_files(file_contents, spec.design_name)

        passed = val_report.overall_passed if val_report else True

        warnings: List[str] = []
        if previous_result:
            warnings.append("Fell back to template generation (retrieval validation failed)")
            if previous_result.errors:
                warnings.extend(previous_result.errors[:3])

        result = GenerationResult(
            design_name=spec.design_name,
            source=GenerationSource.TEMPLATE_FALLBACK,
            passed=passed,
            generated_files=files,
            validation_report=val_report,
            adaptation_plan=None,
            similar_specs_found=previous_result.similar_specs_found if previous_result else 0,
            best_match_score=previous_result.best_match_score if previous_result else 0.0,
            files_from_retrieval=[],
            files_from_template=list(files.keys()),
            warnings=warnings,
            errors=[],
        )

        return result

    def _learn_from_result(
        self,
        result: GenerationResult,
        query_fv: RichFeatureVector,
        query_dict: Dict[str, Any],
    ) -> None:
        """Learn from a successful generation."""
        try:
            file_contents: Dict[str, str] = {}
            for fname, fpath in result.generated_files.items():
                try:
                    file_contents[fname] = Path(fpath).read_text(encoding="utf-8")
                except Exception:
                    pass

            fp = self.index.add(query_fv, query_dict, file_contents)
            logger.debug("Learned from generation: added to index as %s", fp[:8])

            if self.config.index_path:
                self.index.save(self.config.index_path)
        except Exception as e:
            logger.warning("Failed to learn from generation: %s", e)

    def _collect_warnings(
        self,
        candidate: RetrievalCandidate,
        val_report: Optional[ValidationReport],
    ) -> List[str]:
        warnings: List[str] = []
        if candidate.adaptation_plan and candidate.adaptation_plan.warnings:
            warnings.extend(candidate.adaptation_plan.warnings[:5])
        if val_report and val_report.total_warnings > 0:
            warnings.append(f"Validation: {val_report.total_warnings} warning(s)")
        return warnings

    def _collect_errors(
        self,
        candidate: RetrievalCandidate,
        val_report: Optional[ValidationReport],
    ) -> List[str]:
        errors: List[str] = []
        if candidate.adaptation_plan and candidate.adaptation_plan.errors:
            errors.extend(candidate.adaptation_plan.errors)
        if val_report and val_report.total_errors > 0:
            errors.append(f"Validation: {val_report.total_errors} error(s)")
        return errors

    def _log_result_summary(self, result: GenerationResult) -> None:
        """Log a summary of the generation result."""
        status = "PASSED" if result.passed else "FAILED"
        logger.info(
            "Generation complete: %s (source=%s, files=%d, retrieval_specs=%d, best_score=%.2f)",
            status,
            result.source.value,
            len(result.generated_files),
            result.similar_specs_found,
            result.best_match_score,
        )
        if result.validation_report:
            logger.info(
                "  Validation: errors=%d, warnings=%d, pass_rate=%.1f%%",
                result.validation_report.total_errors,
                result.validation_report.total_warnings,
                result.validation_report.pass_rate * 100,
            )
        if result.warnings:
            for w in result.warnings[:3]:
                logger.warning("  %s", w)
        if result.errors:
            for e in result.errors[:3]:
                logger.error("  %s", e)

    @staticmethod
    def _spec_to_dict(spec: DesignSpec) -> Dict[str, Any]:
        """Convert DesignSpec to serializable dict."""
        return {
            "design_name": spec.design_name,
            "protocol": spec.protocol,
            "clock_reset": {
                "clock": spec.clock_reset.clock,
                "reset": spec.clock_reset.reset,
                "reset_active": spec.clock_reset.reset_active,
            },
            "interfaces": [
                {
                    "name": iface.name,
                    "signals": [
                        {"name": s.name, "direction": s.direction, "width": s.width}
                        for s in iface.signals
                    ],
                }
                for iface in spec.interfaces
            ],
            "registers": [
                {
                    "name": r.name,
                    "address": r.address,
                    "access": r.access,
                    "size": r.size,
                    "reset_value": r.reset_value,
                    "fields": [
                        {"name": f.name, "bits": f.bits, "description": f.description}
                        for f in r.fields
                    ],
                }
                for r in spec.registers
            ],
        }

    def save(self, path: str) -> None:
        """Save the model to disk."""
        save_dir = Path(path)
        save_dir.mkdir(parents=True, exist_ok=True)

        meta = {
            "name": self.name,
            "model_type": "enhanced_ml",
            "strict_validation": self._strict_validation,
            "config": {
                "similarity_threshold": self.config.similarity_threshold,
                "auto_learn": self.config.auto_learn,
                "fallback_to_templates": self.config.fallback_to_templates,
                "index_path": self.config.index_path,
                "top_k_retrieval": self.config.top_k_retrieval,
            },
            "metadata": self._metadata,
            "index_size": len(self.index),
        }

        (save_dir / "model_metadata.json").write_text(
            json.dumps(meta, indent=2),
            encoding="utf-8",
        )

        index_path = save_dir / "similarity_index.json"
        self.index.save(str(index_path))

        if self._template_model:
            tmpl_dir = save_dir / "template_model"
            self._template_model.save(str(tmpl_dir))

        logger.info("Saved enhanced ML model to %s", save_dir)

    @classmethod
    def load(cls, path: str) -> "EnhancedMLGenerationModel":
        """Load the model from disk."""
        load_dir = Path(path)
        meta_path = load_dir / "model_metadata.json"

        if not meta_path.exists():
            raise FileNotFoundError(f"Model metadata not found: {meta_path}")

        meta = json.loads(meta_path.read_text(encoding="utf-8"))
        config_dict = meta.get("config", {})

        config = MLModelConfig(
            similarity_threshold=config_dict.get("similarity_threshold", 0.75),
            auto_learn=config_dict.get("auto_learn", True),
            fallback_to_templates=config_dict.get("fallback_to_templates", True),
            index_path=config_dict.get("index_path"),
            top_k_retrieval=config_dict.get("top_k_retrieval", 3),
        )

        index_path = load_dir / "similarity_index.json"
        index = SimilarityIndex.load(str(index_path)) if index_path.exists() else None

        strict = meta.get("strict_validation", True)

        model = cls(
            name=meta["name"],
            config=config,
            index=index,
            strict_validation=strict,
        )
        model._metadata = meta.get("metadata", {})
        model._is_trained = True

        tmpl_dir = load_dir / "template_model"
        if tmpl_dir.exists():
            model._template_model = TemplateModel.load(str(tmpl_dir))

        logger.info("Loaded enhanced ML model from %s", load_dir)
        return model

    @property
    def last_result(self) -> Optional[GenerationResult]:
        """Get the last generation result with full details."""
        return self._last_result


import os