Source code for timesmith.forecasters.bayesian

"""Bayesian forecasting with uncertainty quantification using MCMC."""

import logging
from typing import TYPE_CHECKING, Any, Dict, Optional, Union

import numpy as np
import pandas as pd

from timesmith.core.base import BaseForecaster
from timesmith.core.tags import set_tags
from timesmith.results.forecast import Forecast

if TYPE_CHECKING:
    from timesmith.typing import SeriesLike, TableLike

logger = logging.getLogger(__name__)

# Optional PyMC for Bayesian inference
try:
    import arviz as az
    import pymc as pm

    PYMC_AVAILABLE = True
except ImportError:
    PYMC_AVAILABLE = False
    logger.warning(
        "PyMC not available. BayesianForecaster requires PyMC. "
        "Install with: pip install pymc arviz"
    )



[docs]
class BayesianForecaster(BaseForecaster):
    """Bayesian forecaster with uncertainty quantification using MCMC.

    Uses Bayesian inference to estimate forecaster parameters and provides
    uncertainty quantification through posterior sampling. Works by fitting
    a probabilistic model to the time series and sampling from the posterior.

    This is a general-purpose Bayesian forecaster that can be used with
    any time series model. For specific models (like ARIMA), consider using
    model-specific Bayesian implementations.
    """


[docs]
    def __init__(
        self,
        model_type: str = "linear_trend",
        n_samples: int = 2000,
        n_tune: int = 1000,
        random_state: Optional[int] = None,
        prior_params: Optional[Dict[str, Any]] = None,
    ):
        """Initialize Bayesian forecaster.

        Args:
            model_type: Type of probabilistic model:
                - 'linear_trend': Linear trend with noise
                - 'exponential_trend': Exponential trend
                - 'ar1': AR(1) model
            n_samples: Number of MCMC samples.
            n_tune: Number of tuning samples.
            random_state: Random state for reproducibility.
            prior_params: Optional prior parameter distributions.
        """
        if not PYMC_AVAILABLE:
            raise ImportError(
                "PyMC is required for BayesianForecaster. "
                "Install with: pip install pymc arviz"
            )

        super().__init__()
        self.model_type = model_type
        self.n_samples = n_samples
        self.n_tune = n_tune
        self.random_state = random_state
        self.prior_params = prior_params or {}

        self.trace_ = None
        self.model_ = None

        set_tags(
            self,
            scitype_input="SeriesLike",
            scitype_output="ForecastLike",
            handles_missing=False,
            requires_sorted_index=True,
        )



[docs]
    def fit(
        self,
        y: Union["SeriesLike", Any],
        X: Optional[Union["TableLike", Any]] = None,
        **fit_params: Any,
    ) -> "BayesianForecaster":
        """Fit Bayesian model using MCMC.

        Args:
            y: Target time series.
            X: Optional exogenous data (not yet supported).
            **fit_params: Additional fit parameters.

        Returns:
            Self for method chaining.
        """
        if X is not None:
            logger.warning("Exogenous data X not yet supported in BayesianForecaster")

        if isinstance(y, pd.Series):
            self.y_ = y.values
            self.index_ = y.index
        elif isinstance(y, pd.DataFrame) and y.shape[1] == 1:
            self.y_ = y.iloc[:, 0].values
            self.index_ = y.index
        else:
            self.y_ = np.asarray(y, dtype=float)
            self.index_ = np.arange(len(self.y_))

        # Remove invalid values
        valid_mask = np.isfinite(self.y_)
        self.y_ = self.y_[valid_mask]
        self.index_ = self.index_[valid_mask]

        if len(self.y_) < 3:
            raise ValueError("Need at least 3 valid data points")

        # Normalize time to start at 0
        if isinstance(self.index_, pd.DatetimeIndex):
            time_arr = (self.index_ - self.index_[0]).days
        else:
            time_arr = np.arange(len(self.y_))

        # Build and fit PyMC model
        self.trace_, self.model_ = self._fit_bayesian_model(time_arr, self.y_)

        self._is_fitted = True
        return self


    def _fit_bayesian_model(self, time: np.ndarray, y: np.ndarray) -> tuple:
        """Fit Bayesian model using PyMC.

        Args:
            time: Time array (normalized).
            y: Target values.

        Returns:
            Tuple of (trace, model).
        """
        with pm.Model() as model:
            if self.model_type == "linear_trend":
                # Linear trend model: y = a + b*t + noise
                a = pm.Normal(
                    "a",
                    mu=np.mean(y),
                    sigma=np.std(y),
                    **self.prior_params.get("a", {}),
                )
                b = pm.Normal(
                    "b",
                    mu=0.0,
                    sigma=np.std(y) / len(y),
                    **self.prior_params.get("b", {}),
                )
                sigma = pm.HalfNormal(
                    "sigma",
                    sigma=np.std(y),
                    **self.prior_params.get("sigma", {}),
                )

                # Likelihood
                mu = a + b * time
                pm.Normal("obs", mu=mu, sigma=sigma, observed=y)

            elif self.model_type == "exponential_trend":
                # Exponential trend: y = a * exp(b*t) + noise
                a = pm.Lognormal(
                    "a",
                    mu=np.log(np.maximum(y[0], 0.1)),
                    sigma=0.5,
                    **self.prior_params.get("a", {}),
                )
                b = pm.Normal(
                    "b",
                    mu=0.0,
                    sigma=0.1,
                    **self.prior_params.get("b", {}),
                )
                sigma = pm.HalfNormal(
                    "sigma",
                    sigma=np.std(y),
                    **self.prior_params.get("sigma", {}),
                )

                # Likelihood
                mu = a * pm.math.exp(b * time)
                pm.Normal("obs", mu=mu, sigma=sigma, observed=y)

            elif self.model_type == "ar1":
                # AR(1) model: y_t = phi * y_{t-1} + noise
                phi = pm.Normal(
                    "phi",
                    mu=0.0,
                    sigma=1.0,
                    **self.prior_params.get("phi", {}),
                )
                sigma = pm.HalfNormal(
                    "sigma",
                    sigma=np.std(y),
                    **self.prior_params.get("sigma", {}),
                )

                # Likelihood (AR(1))
                mu = phi * y[:-1]
                pm.Normal("obs", mu=mu, sigma=sigma, observed=y[1:])

            else:
                raise ValueError(f"Unknown model_type: {self.model_type}")

            # Sample
            trace = pm.sample(
                draws=self.n_samples,
                tune=self.n_tune,
                random_seed=self.random_state,
                return_inferencedata=True,
                progressbar=False,
            )

        logger.info(
            f"Completed Bayesian sampling: {len(trace.posterior.draw)} samples "
            f"(model={self.model_type})"
        )

        return trace, model


[docs]
    def predict(
        self,
        fh: Union[int, list, Any],
        X: Optional[Union["TableLike", Any]] = None,
        **predict_params: Any,
    ) -> Forecast:
        """Generate Bayesian forecast with uncertainty.

        Args:
            fh: Forecast horizon (integer or array-like).
            X: Optional exogenous data (not yet supported).
            **predict_params: Additional prediction parameters.

        Returns:
            Forecast with mean prediction and uncertainty intervals.
        """
        self._check_is_fitted()

        if X is not None:
            logger.warning("Exogenous data X not yet supported in BayesianForecaster")

        # Convert fh to array
        if isinstance(fh, (int, np.integer)):
            fh_arr = np.arange(1, fh + 1)
        elif isinstance(fh, (list, np.ndarray, pd.Index)):
            fh_arr = np.asarray(fh)
        else:
            raise ValueError(f"Unsupported fh type: {type(fh)}")

        # Get forecast times (relative to last observed time)
        last_time = len(self.y_) - 1
        forecast_times = last_time + fh_arr

        # Sample from posterior and generate forecasts
        posterior = self.trace_.posterior
        forecasts = []

        # Limit samples for computational efficiency
        n_posterior_samples = min(100, len(posterior.draw))

        for i in range(n_posterior_samples):
            # Sample parameters from posterior
            if self.model_type == "linear_trend":
                a = float(posterior.a.values.flatten()[i])
                b = float(posterior.b.values.flatten()[i])
                y_pred = a + b * forecast_times
            elif self.model_type == "exponential_trend":
                a = float(posterior.a.values.flatten()[i])
                b = float(posterior.b.values.flatten()[i])
                y_pred = a * np.exp(b * forecast_times)
            elif self.model_type == "ar1":
                phi = float(posterior.phi.values.flatten()[i])
                # AR(1) forecast: y_t = phi * y_{t-1}
                y_pred = np.zeros(len(fh_arr))
                last_value = self.y_[-1]
                for j, t in enumerate(fh_arr):
                    last_value = phi * last_value
                    y_pred[j] = last_value
            else:
                raise ValueError(f"Unknown model_type: {self.model_type}")

            forecasts.append(y_pred)

        forecasts = np.array(forecasts)

        # Calculate statistics
        mean_forecast = np.mean(forecasts, axis=0)
        std_forecast = np.std(forecasts, axis=0)

        # Calculate quantiles
        quantiles = {
            "p05": np.quantile(forecasts, 0.05, axis=0),
            "p25": np.quantile(forecasts, 0.25, axis=0),
            "p50": np.quantile(forecasts, 0.50, axis=0),
            "p75": np.quantile(forecasts, 0.75, axis=0),
            "p95": np.quantile(forecasts, 0.95, axis=0),
        }

        # Create prediction intervals DataFrame
        y_int = pd.DataFrame(
            {
                "lower": quantiles["p05"],
                "upper": quantiles["p95"],
            }
        )

        # Convert mean forecast to Series
        if isinstance(fh, (list, np.ndarray, pd.Index)):
            y_pred_series = pd.Series(mean_forecast, index=fh)
        else:
            y_pred_series = pd.Series(mean_forecast)

        return Forecast(
            y_pred=y_pred_series,
            fh=fh,
            y_int=y_int,
            metadata={
                "n_samples": n_posterior_samples,
                "std": std_forecast.tolist()
                if isinstance(std_forecast, np.ndarray)
                else std_forecast,
                "quantiles": {
                    k: v.tolist() if isinstance(v, np.ndarray) else v
                    for k, v in quantiles.items()
                },
                "model_type": self.model_type,
            },
        )



[docs]
    def predict_interval(
        self,
        fh: Any,
        X: Optional[Any] = None,
        coverage: float = 0.9,
        **predict_params: Any,
    ) -> Forecast:
        """Generate forecast with prediction intervals.

        Args:
            fh: Forecast horizon.
            X: Optional exogenous data (not yet supported).
            coverage: Coverage level (e.g., 0.9 for 90%).
            **predict_params: Additional prediction parameters.

        Returns:
            Forecast with prediction intervals.
        """
        # predict() already includes intervals, so just adjust coverage
        forecast = self.predict(fh, X, **predict_params)

        # Adjust intervals to requested coverage
        alpha = 1 - coverage
        lower_quantile = alpha / 2
        upper_quantile = 1 - alpha / 2

        # Get forecasts from metadata
        if "forecasts" in forecast.metadata:
            forecasts = np.array(forecast.metadata["forecasts"])
        else:
            # Re-generate if needed (shouldn't happen)
            return self.predict(fh, X, **predict_params)

        lower = np.quantile(forecasts, lower_quantile, axis=0)
        upper = np.quantile(forecasts, upper_quantile, axis=0)

        forecast.y_int = pd.DataFrame({"lower": lower, "upper": upper})
        return forecast



[docs]
    def get_posterior_summary(self) -> pd.DataFrame:
        """Get summary statistics of posterior distributions.

        Returns:
            DataFrame with posterior summary (mean, std, credible intervals).
        """
        self._check_is_fitted()
        return az.summary(self.trace_)