Conjunto de entrenamiento
Un conjunto de entrenamiento puede crearse directamente a partir de la serie temporal. Se usa un cierto número de valores medidos como entradas y el valor que se quiere predecir (es decir, el valor futuro, a una distancia elegida después de esos valores medidos de entrada) se utiliza como salida requerida. La parte de entrada de la serie temporal se llama ventana, y la parte de salida es el valor predicho. Al desplazar la ventana sobre la serie temporal, se crean los elementos del conjunto de entrenamiento (véase la figura 4). Es aconsejable reservar una parte de la serie temporal para las pruebas, es decir, no utilizar esta parte durante el aprendizaje, sino usarla para comprobar qué tan bien la red aprendió a predecir nuestros datos.
El conjunto de entrenamiento obtenido de esta manera puede ajustarse después a las necesidades de una red neuronal en particular. Por ejemplo, puede ser necesario ajustar los valores a un cierto intervalo, como (0,1).
Figura 4 - Creación del conjunto de entrenamiento
Los datos disponibles suelen dividirse en tres conjuntos: el conjunto de aprendizaje, el conjunto de validación y el conjunto de prueba. Estos conjuntos pueden superponerse (véase la figura 5) y no tienen por qué ser continuos. El conjunto de aprendizaje es la secuencia que se muestra a la red neuronal durante la fase de entrenamiento. La red se adapta a él para alcanzar las salidas requeridas (en otras palabras, los pesos de la red se cambian en función de este conjunto). La diferencia con respecto a la salida requerida se mide usando el conjunto de validación, y esta diferencia se utiliza para determinar si el entrenamiento de la red puede detenerse. El último conjunto, el conjunto de prueba, se utiliza después para comprobar si la red es capaz de trabajar también con datos que no se usaron en el proceso anterior.
En resumen, el conjunto de aprendizaje se utiliza para crear un modelo, el conjunto de validación se utiliza para verificar el modelo y el conjunto de prueba se utiliza para probar la utilidad del modelo.
Figura 5 - Conjuntos de datos de validación, aprendizaje y prueba
El preprocesamiento de datos también es importante. Por ejemplo, puede ser útil eliminar la tendencia y otros componentes (como tendencias estacionales), aunque por supuesto solo si somos capaces de detectar esos componentes. En las referencias puede encontrarse una visión general de la descomposición de series temporales.
Especialmente en redes neuronales que solo pueden tener salidas dentro de un cierto intervalo, es importante darse cuenta de que no es posible predecir valores fuera de ese intervalo. Entonces se requiere la normalización de los datos para que la red pueda producir salidas con sentido.