Tipos de predicción
La predicción puede clasificarse según distintos criterios. Los criterios básicos son:
- los datos que tenemos disponibles para el entrenamiento y la predicción
- qué queremos predecir: un valor o una tendencia
Predicción de valor o de tendencia
Cuando queremos obtener el valor futuro exacto (o varios valores futuros) de una variable, estamos prediciendo un valor. Otra posibilidad es predecir la tendencia de una variable, es decir, si el valor subirá o bajará sin considerar el tamaño del cambio; en ese caso, estamos prediciendo una tendencia. La predicción de tendencias es en realidad una clasificación en dos (o tres) clases: subida, bajada o ningún cambio significativo. En general, predecir un valor cercano es más fácil que predecir una tendencia. Además de la tendencia, también puede interesarnos predecir cantidades relacionadas, como cambios en una media móvil.
Datos para la predicción
Para la predicción de series temporales, normalmente tenemos valores de una variable muestreados en intervalos equidistantes. Entonces podemos intentar predecir la evolución futura del valor basándonos solo en los valores históricos y en el tiempo. En este caso, la serie temporal histórica debería ser suficientemente larga y densa.
También podemos tener información adicional sobre la serie temporal, como por ejemplo su derivada. Esta información puede utilizarse para mejorar la precisión de la predicción. También puede añadirse información importante mediante las llamadas variables de intervención (indicadores de intervención), que representan información sobre la serie temporal o sobre el periodo para el cual estamos realizando una predicción. Por ejemplo, al predecir el consumo de energía, saber si estamos prediciendo un lunes o un sábado puede mejorar el resultado de forma notable; esta información no se deduce de la serie temporal de manera explícita y debe añadirse. A menudo es muy útil utilizar indicadores de intervención al crear un modelo para la predicción.
También podemos tener información sobre otras variables relacionadas, preferiblemente también en forma de series temporales. A partir de la historia de variables relacionadas podemos inferir información sobre otras variables. La relación puede expresarse de varias maneras. Un ejemplo es una suma estática (o que cambia lentamente) de dos variables. La dependencia no tiene por qué estar expresada explícitamente; por ejemplo, los precios de las acciones dentro de un mismo sector pueden estar relacionados, pero esa dependencia puede ser difícil de expresar computacionalmente. Este tipo de información se selecciona con la esperanza de que se correlacione con el valor predicho, aunque no podemos estar seguros de ello de antemano. El campo de la minería de datos puede ayudar a seleccionar la información adecuada y a interpretarla.