"""
Module: models.forensic_investigation
Description: Forensic Investigation Models - Ultra-detailed investigation data structures
Author: Anderson Henrique da Silva
Date: 2025-10-07 17:59:00
License: Proprietary - All rights reserved

This module defines comprehensive data models for storing detailed forensic
evidence, legal references, and documentary proof for government transparency.
"""

from typing import List, Optional, Dict, Any
from datetime import datetime
from dataclasses import dataclass, field
from enum import Enum


class AnomalySeverity(str, Enum):
    """Severity levels for anomalies."""
    CRITICAL = "critical"  # Suspeita forte de irregularidade grave
    HIGH = "high"         # Irregularidade significativa
    MEDIUM = "medium"     # Padrão suspeito que merece atenção
    LOW = "low"          # Desvio menor, monitoramento recomendado
    INFO = "info"        # Informativo, sem suspeita


class EvidenceType(str, Enum):
    """Types of evidence collected."""
    DOCUMENT = "document"           # Documento oficial
    STATISTICAL = "statistical"     # Análise estatística
    COMPARATIVE = "comparative"     # Comparação com outros casos
    TEMPORAL = "temporal"          # Análise temporal/padrões
    FINANCIAL = "financial"        # Análise financeira
    LEGAL = "legal"               # Base legal/jurídica
    WITNESS = "witness"           # Declarações/testemunhos públicos
    OPEN_DATA = "open_data"       # Dados abertos gov.br


@dataclass
class OfficialDocument:
    """Official government document with full traceability."""

    title: str
    document_type: str  # edital, contrato, nota_fiscal, processo, etc
    document_number: Optional[str] = None
    url: Optional[str] = None  # Link direto ao documento
    portal_url: Optional[str] = None  # Portal da Transparência
    issue_date: Optional[datetime] = None
    issuing_authority: Optional[str] = None
    legal_basis: Optional[str] = None  # Base legal aplicável
    hash_verification: Optional[str] = None  # Hash para verificação
    access_date: datetime = field(default_factory=datetime.utcnow)
    notes: Optional[str] = None


@dataclass
class LegalEntity:
    """Complete information about a legal entity (supplier, contractor, etc)."""

    name: str
    entity_type: str  # empresa, pessoa_fisica, orgao_publico

    # Identificação
    cnpj: Optional[str] = None
    cpf: Optional[str] = None
    company_registration: Optional[str] = None  # Inscrição estadual/municipal

    # Contato
    address: Optional[str] = None
    city: Optional[str] = None
    state: Optional[str] = None
    phone: Optional[str] = None
    email: Optional[str] = None

    # Links e Referências
    receita_federal_url: Optional[str] = None
    transparency_portal_url: Optional[str] = None
    company_website: Optional[str] = None

    # Histórico
    foundation_date: Optional[datetime] = None
    previous_contracts_count: int = 0
    previous_irregularities: List[str] = field(default_factory=list)
    total_contracted_value: Optional[float] = None

    # Status Legal
    legal_status: Optional[str] = None  # ativa, suspensa, inidônea
    sanctions: List[Dict[str, Any]] = field(default_factory=list)

    # Metadata
    last_updated: datetime = field(default_factory=datetime.utcnow)
    data_sources: List[str] = field(default_factory=list)


@dataclass
class Evidence:
    """Piece of evidence supporting an anomaly finding."""

    evidence_id: str
    evidence_type: EvidenceType
    title: str
    description: str

    # Conteúdo da evidência
    data: Dict[str, Any]  # Dados estruturados da evidência

    # Análise
    analysis_method: str  # Como foi obtida/analisada

    # Optional fields with defaults
    raw_data: Optional[str] = None  # Dados brutos se aplicável
    confidence_score: float = 1.0  # 0-1, confiança na evidência

    # Referências
    source_documents: List[OfficialDocument] = field(default_factory=list)
    source_urls: List[str] = field(default_factory=list)

    # Comparações
    comparison_baseline: Optional[str] = None  # O que foi usado como referência
    deviation_percentage: Optional[float] = None
    statistical_significance: Optional[float] = None  # p-value

    # Metadata
    collected_at: datetime = field(default_factory=datetime.utcnow)
    verified: bool = False
    verification_notes: Optional[str] = None


@dataclass
class FinancialImpact:
    """Detailed financial impact analysis."""

    # Valores
    contract_value: float
    expected_value: Optional[float] = None  # Valor esperado/normal
    overcharge_amount: Optional[float] = None  # Sobrepreço identificado
    potential_savings: Optional[float] = None  # Economia potencial

    # Análise Comparativa
    market_average: Optional[float] = None
    previous_contracts_average: Optional[float] = None
    similar_contracts: List[Dict[str, Any]] = field(default_factory=list)

    # Classificação Orçamentária
    budget_source: Optional[str] = None  # Fonte de recurso
    budget_category: Optional[str] = None
    fiscal_year: Optional[int] = None

    # Impacto
    affected_population: Optional[int] = None  # Pessoas afetadas
    opportunity_cost: Optional[str] = None  # O que poderia ser feito com o valor

    # Cálculos
    calculation_method: Optional[str] = None
    calculation_notes: Optional[str] = None


@dataclass
class Timeline:
    """Detailed timeline of events related to the anomaly."""

    event_date: datetime
    event_type: str  # licitacao, assinatura, pagamento, fiscalizacao, etc
    description: str
    relevance: str  # Por que esse evento é relevante

    # Documentação
    related_documents: List[OfficialDocument] = field(default_factory=list)
    responsible_party: Optional[str] = None

    # Análise
    suspicious_aspects: List[str] = field(default_factory=list)
    legal_implications: Optional[str] = None


@dataclass
class LegalFramework:
    """Legal framework and regulatory context."""

    # Legislação Aplicável
    applicable_laws: List[str] = field(default_factory=list)  # Lei 8666/93, etc
    regulations: List[str] = field(default_factory=list)
    jurisprudence: List[str] = field(default_factory=list)  # Precedentes

    # Órgãos Competentes
    oversight_bodies: List[str] = field(default_factory=list)  # TCU, CGU, MPF
    jurisdiction: Optional[str] = None  # Federal, estadual, municipal

    # Procedimentos
    required_procedures: List[str] = field(default_factory=list)
    procedures_followed: List[str] = field(default_factory=list)
    procedures_violated: List[str] = field(default_factory=list)

    # Penalidades Possíveis
    possible_sanctions: List[str] = field(default_factory=list)
    responsible_parties: List[str] = field(default_factory=list)


@dataclass
class RecommendedAction:
    """Recommended action with full justification."""

    action_type: str  # investigacao, auditoria, denuncia, recurso
    priority: str  # urgente, alta, media, baixa
    title: str
    description: str

    # Justificativa
    rationale: str  # Por que essa ação é recomendada
    expected_outcome: str  # Resultado esperado

    # Execução
    responsible_body: Optional[str] = None  # Quem deve executar
    contact_info: Optional[str] = None
    submission_url: Optional[str] = None
    required_documents: List[str] = field(default_factory=list)

    # Prazos
    recommended_deadline: Optional[datetime] = None
    legal_deadline: Optional[datetime] = None

    # Referências
    legal_basis: List[str] = field(default_factory=list)
    similar_cases: List[str] = field(default_factory=list)


@dataclass
class ForensicAnomalyResult:
    """Ultra-detailed anomaly result with full forensic evidence."""

    # Identificação
    anomaly_id: str
    anomaly_type: str
    severity: AnomalySeverity

    # Título e Descrição Executiva
    title: str
    executive_summary: str  # Resumo executivo (2-3 parágrafos)
    detailed_description: str  # Descrição completa e técnica

    # O QUE foi detectado
    what_happened: str  # Descrição clara do que aconteceu

    # COMO foi detectado
    detection_method: str  # Como o sistema detectou
    analysis_methodology: str  # Metodologia de análise aplicada

    # POR QUE é suspeito/irregular
    why_suspicious: str  # Explicação clara das irregularidades
    legal_violations: List[str] = field(default_factory=list)

    # Confiança e Qualidade
    confidence_score: float = 0.0  # 0-1
    data_quality_score: float = 0.0  # 0-1
    completeness_score: float = 0.0  # 0-1

    # ENTIDADES ENVOLVIDAS
    involved_entities: List[LegalEntity] = field(default_factory=list)

    # DOCUMENTAÇÃO E EVIDÊNCIAS
    official_documents: List[OfficialDocument] = field(default_factory=list)
    evidence: List[Evidence] = field(default_factory=list)

    # ANÁLISE FINANCEIRA
    financial_impact: Optional[FinancialImpact] = None

    # CRONOLOGIA
    timeline: List[Timeline] = field(default_factory=list)

    # CONTEXTO LEGAL
    legal_framework: Optional[LegalFramework] = None

    # COMPARAÇÕES E BENCHMARK
    similar_cases: List[Dict[str, Any]] = field(default_factory=list)
    statistical_comparison: Optional[Dict[str, Any]] = None

    # AÇÕES RECOMENDADAS
    recommended_actions: List[RecommendedAction] = field(default_factory=list)

    # FONTES E RASTREABILIDADE
    data_sources: List[str] = field(default_factory=list)
    api_endpoints_used: List[str] = field(default_factory=list)
    external_references: List[str] = field(default_factory=list)

    # VISUALIZAÇÕES
    charts: List[Dict[str, Any]] = field(default_factory=list)
    visualizations_urls: List[str] = field(default_factory=list)

    # METADATA
    created_at: datetime = field(default_factory=datetime.utcnow)
    analyzed_by: str = "Cidadão.AI"
    analysis_version: str = "1.0"
    last_updated: datetime = field(default_factory=datetime.utcnow)

    # Para Auditoria
    reproducible: bool = True
    reproducibility_notes: Optional[str] = None
    peer_reviewed: bool = False
    review_notes: Optional[str] = None

    def to_dict(self) -> Dict[str, Any]:
        """Convert to dictionary for JSON serialization."""
        return {
            "anomaly_id": self.anomaly_id,
            "anomaly_type": self.anomaly_type,
            "severity": self.severity.value,
            "title": self.title,
            "executive_summary": self.executive_summary,
            "detailed_description": self.detailed_description,
            "what_happened": self.what_happened,
            "detection_method": self.detection_method,
            "analysis_methodology": self.analysis_methodology,
            "why_suspicious": self.why_suspicious,
            "legal_violations": self.legal_violations,
            "confidence_score": self.confidence_score,
            "data_quality_score": self.data_quality_score,
            "completeness_score": self.completeness_score,
            "involved_entities": [
                {
                    "name": e.name,
                    "type": e.entity_type,
                    "cnpj": e.cnpj,
                    "cpf": e.cpf,
                    "address": e.address,
                    "city": e.city,
                    "state": e.state,
                    "transparency_portal_url": e.transparency_portal_url,
                    "previous_contracts_count": e.previous_contracts_count,
                    "legal_status": e.legal_status,
                    "sanctions": e.sanctions,
                }
                for e in self.involved_entities
            ],
            "official_documents": [
                {
                    "title": d.title,
                    "type": d.document_type,
                    "number": d.document_number,
                    "url": d.url,
                    "portal_url": d.portal_url,
                    "issue_date": d.issue_date.isoformat() if d.issue_date else None,
                    "issuing_authority": d.issuing_authority,
                    "legal_basis": d.legal_basis,
                }
                for d in self.official_documents
            ],
            "evidence": [
                {
                    "id": e.evidence_id,
                    "type": e.evidence_type.value,
                    "title": e.title,
                    "description": e.description,
                    "data": e.data,
                    "analysis_method": e.analysis_method,
                    "confidence_score": e.confidence_score,
                    "source_urls": e.source_urls,
                    "deviation_percentage": e.deviation_percentage,
                    "statistical_significance": e.statistical_significance,
                }
                for e in self.evidence
            ],
            "financial_impact": {
                "contract_value": self.financial_impact.contract_value,
                "expected_value": self.financial_impact.expected_value,
                "overcharge_amount": self.financial_impact.overcharge_amount,
                "potential_savings": self.financial_impact.potential_savings,
                "market_average": self.financial_impact.market_average,
                "similar_contracts": self.financial_impact.similar_contracts,
                "opportunity_cost": self.financial_impact.opportunity_cost,
            } if self.financial_impact else None,
            "timeline": [
                {
                    "date": t.event_date.isoformat(),
                    "type": t.event_type,
                    "description": t.description,
                    "relevance": t.relevance,
                    "suspicious_aspects": t.suspicious_aspects,
                }
                for t in self.timeline
            ],
            "legal_framework": {
                "applicable_laws": self.legal_framework.applicable_laws,
                "oversight_bodies": self.legal_framework.oversight_bodies,
                "procedures_violated": self.legal_framework.procedures_violated,
                "possible_sanctions": self.legal_framework.possible_sanctions,
            } if self.legal_framework else None,
            "recommended_actions": [
                {
                    "type": a.action_type,
                    "priority": a.priority,
                    "title": a.title,
                    "description": a.description,
                    "rationale": a.rationale,
                    "expected_outcome": a.expected_outcome,
                    "responsible_body": a.responsible_body,
                    "submission_url": a.submission_url,
                    "legal_basis": a.legal_basis,
                }
                for a in self.recommended_actions
            ],
            "data_sources": self.data_sources,
            "created_at": self.created_at.isoformat(),
            "analyzed_by": self.analyzed_by,
            "reproducible": self.reproducible,
        }