from abc import ABC, abstractmethod
import asyncio
from dataclasses import dataclass
import io
import wave
from typing import List, Tuple, Union
import httpx
import logging

logger = logging.getLogger(__name__)


@dataclass
class SpeechRecognitionResult:
    text: str = None
    preprocess_metadata: dict = None
    postprocess_metadata: dict = None


class SpeechRecognizer(ABC):
    def __init__(
        self,
        *,
        language: str = None,
        alternative_languages: List[str] = None,
        max_connections: int = 100,
        max_keepalive_connections: int = 20,
        timeout: float = 10.0,
        max_retries: int = 2,
        debug: bool = False
    ):
        self.language = language
        self.alternative_languages = alternative_languages or []
        self.http_client = httpx.AsyncClient(
            follow_redirects=False,
            timeout=httpx.Timeout(timeout),
            limits=httpx.Limits(
                max_connections=max_connections,
                max_keepalive_connections=max_keepalive_connections
            )
        )
        self.max_retries = max_retries

        self.debug = debug

    def get_config(self) -> dict:
        return {
            "language": self.language,
            "alternative_languages": self.alternative_languages,
            "timeout": getattr(self.http_client.timeout, "read", None) if self.http_client else None,
            "max_retries": self.max_retries,
            "debug": self.debug,
        }

    def set_config(self, config: dict) -> dict:
        allowed_keys = self.get_config().keys()
        updated = {}
        for k, v in config.items():
            if v is None:
                continue
            if k not in allowed_keys:
                continue
            if k == "timeout":
                if self.http_client:
                    import httpx
                    self.http_client = httpx.AsyncClient(
                        follow_redirects=self.http_client._follow_redirects,
                        timeout=httpx.Timeout(v),
                        limits=httpx.Limits(
                            max_connections=self.http_client._pool._max_connections,
                            max_keepalive_connections=self.http_client._pool._max_keepalive_connections
                        )
                    )
                    updated[k] = v
            else:
                try:
                    setattr(self, k, v)
                    updated[k] = v
                except Exception:
                    pass
        return updated

    def preprocess(self, func) -> dict:
        self._preprocess = func
        return func

    def postprocess(self, func) -> dict:
        self._postprocess = func
        return func

    async def recognize(self, session_id: str, data: bytes) -> SpeechRecognitionResult:
        result = SpeechRecognitionResult()

        # Pre-process
        preprocess_result = await self._preprocess(session_id, data)
        if isinstance(preprocess_result, tuple):
            preprocessed_bytes, result.preprocess_metadata = preprocess_result
        else:
            preprocessed_bytes = preprocess_result

        if not preprocessed_bytes:
            return result

        # Transcribe
        result.text = await self.transcribe(preprocessed_bytes)

        # Post-process
        postprocess_result = await self._postprocess(session_id, result.text, preprocessed_bytes, result.preprocess_metadata)
        if isinstance(postprocess_result, tuple):
            result.text, result.postprocess_metadata = postprocess_result
        else:
            result.text = postprocess_result

        return result

    async def _preprocess(self, session_id: str, data: bytes) -> Union[bytes, Tuple[bytes, dict]]:
        return data

    @abstractmethod
    async def transcribe(self, data: bytes) -> str:
        pass

    async def _postprocess(self, session_id: str, text: str, data: bytes, preprocess_metadata: dict) -> Union[str, Tuple[bytes, dict]]:
        return text

    async def close(self):
        await self.http_client.aclose()

    def downsample(self, audio_bytes: bytes, sample_rate: int, target_sample_rate: int) -> bytes:
        if target_sample_rate <= 0 or sample_rate == target_sample_rate:
            return audio_bytes
 
        if sample_rate < target_sample_rate:
            logger.warning(f"Cannot upsample from {sample_rate}Hz to {target_sample_rate}Hz")
            return audio_bytes
            
        # Convert bytes to 16-bit signed integers
        import struct
        audio_data = struct.unpack(f'<{len(audio_bytes)//2}h', audio_bytes)
        
        # Calculate decimation factor
        decimation_factor = sample_rate // target_sample_rate
        
        if decimation_factor <= 1:
            # Use linear interpolation for non-integer ratios
            ratio = sample_rate / target_sample_rate
            output_length = int(len(audio_data) / ratio)
            downsampled = []
            
            for i in range(output_length):
                source_index = i * ratio
                index = int(source_index)
                
                if index + 1 < len(audio_data):
                    # Linear interpolation between adjacent samples
                    fraction = source_index - index
                    interpolated = audio_data[index] * (1 - fraction) + audio_data[index + 1] * fraction
                    downsampled.append(int(interpolated))
                else:
                    downsampled.append(audio_data[index] if index < len(audio_data) else 0)
        else:
            # Simple decimation for integer ratios
            downsampled = audio_data[::decimation_factor]
        
        # Convert back to bytes
        return struct.pack(f'<{len(downsampled)}h', *downsampled)

    def to_wave_file(self, audio_bytes: bytes, sample_rate: int):
        buffer = io.BytesIO()
        with wave.open(buffer, "wb") as wf:
            wf.setnchannels(1)  # mono
            wf.setsampwidth(2)  # 16bit
            wf.setframerate(sample_rate)
            wf.writeframes(audio_bytes)
        buffer.seek(0)
        return buffer

    async def http_request_with_retry(
        self,
        method: str,
        url: str,
        **kwargs,
    ) -> httpx.Response | None:
        for attempt in range(1, self.max_retries + 1):
            try:
                resp = await self.http_client.request(method, url, **kwargs)
                resp.raise_for_status()
                return resp

            except httpx.HTTPStatusError as hserr:
                if hserr.response.status_code < 500:
                    logger.error(
                        f"Failed in recognition: Non-retriable HTTP error {hserr.response.status_code}, body={hserr.response.text}"
                    )
                    return None
                logger.warning(
                    f"HTTP {hserr.response.status_code} (attempt {attempt}/{self.max_retries}), retrying..."
                )

            except httpx.RequestError as hrerr:
                logger.warning(
                    f"Request error '{hrerr}' (attempt {attempt}/{self.max_retries}), retrying..."
                )
                continue

        logger.error(
            f"Failed in recognition: Retry attempts exceeded ({self.max_retries} attempts)."
        )
        return None


class SpeechRecognizerDummy(SpeechRecognizer):
    def __init__(
        self,
        *,
        recognized_text: str = None,
        wait_sec: float = 0.0,
        language: str = None,
        alternative_languages: List[str] = None,
        max_connections: int = 100,
        max_keepalive_connections: int = 20,
        timeout: float = 10.0,
        max_retries: int = 2,
        debug: bool = False
    ):
        super().__init__(
            language=language,
            alternative_languages=alternative_languages,
            max_connections=max_connections,
            max_keepalive_connections=max_keepalive_connections,
            timeout=timeout,
            max_retries=max_retries,
            debug=debug
        )
        self.recognized_text = recognized_text
        self.wait_sec = wait_sec

    async def transcribe(self, data: bytes) -> str:
        await asyncio.sleep(self.wait_sec)
        return self.recognized_text