7–10 de noviembre de 2023
Asunción
America/Asuncion zona horaria

Predicción en series temporales a través de inteligencia artificial.

No programado
20m
Sociedad Científica del Paraguay (Asunción )

Sociedad Científica del Paraguay

Asunción

Andrés Barbero 230 casi Avenida Artigas
Presentación Oral Ciencias Fisicomatématicas e Ingenierías

Ponente

Diego Fermín Palacios Riquelme (Facultad de Ingeniería - Universidad Nacional de Asunción)

Descripción

En este trabajo se propone un método basado en inteligencia artificial para predecir valores futuros en series temporales. Se parte de la hipótesis de que una serie temporal contiene en sus propios valores ya registrados toda la información necesaria para predecir los siguientes, sin la necesidad de analizar factores externos, ya que estos factores estarían siendo representados implícitamente en los eventos que ya sucedieron y fueron registrados. Se implementa una red neuronal basada en perceptrón para establecer una curva ajustada que defina los valores futuros en función de componentes o características propias de las series temporales. Las componentes que se utilizarán como entradas a la red neuronal y que serán las variables independientes que definirán en la función ajustada los siguientes valores predichos son: los N valores anteriores a la predicción, la tendencia de esos N valores, la tendencia acumulada de toda la serie temporal registrada, los valores cíclicos y estacionales, y el error de predicciones anteriores. Se establece la forma en que debe ser creado el dataset de entrenamiento y su estructura, se determinan los pasos del entrenamiento definido en dos fases para incorporar los errores de predicción, se explican los métodos para establecer una arquitectura de red neuronal óptima minimizando errores, y se definen los delineamientos generales para implementar un paradigma de predicción en series temporales basado en inteligencia artificial.

Metodología

La creación del dataset es fundamental ya que definirá, a través de un entrenamiento de la red neuronal, la curva ajustada que hará las predicciones en función de las variables de entrada. El dataset está formado por una tabla en donde las columnas se componen por las distintas variables de entrada y una variable dependiente de salida que representa la predicción; las filas en cambio representan los registros, los valores reales medidos y obtenidos a partir de la serie temporal. La figura adjunta 1 muestra el dataset de entrenamiento.
Los registros para cada columna son extraídos de la propia serie temporal o de un procesamiento de la misma. Para crear el dataset se necesita tener registrado grandes cantidades de datos de un determinado fenómeno en forma de serie temporal. Cada valor de la serie temporal entonces es determinado a partir de su historial y queda estructurada esa dependencia en forma de tabla en un dataset. Para cada valor de predicción entonces se asocian los N valores anteriores establecidos en la propia serie temporal, definiendo N en el entrenamiento de forma a minimizar los errores y optimizar el tiempo de cómputo, calculando además la tendencia de esos N valores anteriores y la tendencia total acumulada, asociando estas tendencias a un determinado valor de predicción. La tendencia queda definida en el marco de este trabajo como el promedio de la diferencia entre valores consecutivos dentro de la serie temporal. Los valores estacionales están determinados por los períodos fundamentales, se definen entonces así M valores anteriores al valor de predicción distanciados temporalmente en un periodo fundamental. Estos períodos fundamentales se definen a partir de las frecuencias fundamentales calculadas a partir de la transformada de Fourier aplicada a la serie temporal tomada como una función digital. El valor de M y la importancia de cada frecuencia fundamental son definidas en período de entrenamiento, minimizando errores y seleccionando los más relevantes.
Con el dataset establecido de la manera mencionada se entrena una red neuronal basada en perceptrón con métodos bien conocidos como el Backpropagation, se ejecuta así lo que se denomina en el marco del siguiente trabajo el entrenamiento en Fase 1. Con la red neuronal entrenada en Fase 1 se ejecutan las predicciones y se van registrando los errores de predicción, estos errores son registrados en un nuevo dataset conformado por el dataset anterior con una columna adicional en donde se establece el error cometido en la predicción anterior, con el objetivo de que la red neuronal vaya teniendo en cuenta estos errores para afinar las siguientes predicciones. Con el nuevo dataset creado en el que se registran los errores anteriores se vuelve a entrenar la red neuronal, lo que se denomina en el marco del presente trabajo un entrenamiento en Fase 2. Luego del entrenamiento en Fase 2, la red neuronal ya está preparada para realizar predicciones de valores futuros en forma operativa.

Conclusión

El presente trabajo ofrece un nuevo paradigma de predicción de series temporales basado en inteligencia artificial. En futuros trabajos se busca la implementación real de la propuesta y la comparación de resultados con otras técnicas como SARIMA (Seasonal Autoregressive Integrated Moving Average Model) y redes neuronales que no tienen en cuenta fenómenos de estacionalidad y errores como se propone en este trabajo.

Objetivo

Establecer un paradigma de predicción en series temporales a través de la inteligencia artificial.

Introducción

La predicción es deseable en muchos aspectos de la vida: en economía para planificar costos y beneficios, en procesos de todo tipo para optimizarlos, en la salud para evitar enfermedades, malestares y mejorar la calidad de vida, en la naturaleza para prevenir desastres naturales. El ser humano viene tratando de encontrar este don desde hace mucho tiempo, anteriormente se lo trataba de implementar a través del misticismo pero en tiempos actuales esto puede ser una realidad a través de la inteligencia artificial y el procesamiento de una enorme cantidad de datos que pueden ser registrados y almacenados gracias a los avances de la tecnología.

Resultados

Este trabajo presenta un protocolo para crear un dataset y determinar la forma en que debe ser entrenada una red neuronal artificial para que pueda realizar predicciones futuras de un determinado evento a partir de información contenida en su serie temporal. El proceso de entrenamiento es exhaustivo en pruebas y presenta un problema de optimización a la hora de definir meta parámetros de la red neuronal (cantidad de capas ocultas, cantidad de perceptrones en cada capa, arquitectura de conexiones, etc), y también para establecer las cantidades óptimas de valores anteriores (N) y de valores estacionales (M); estos problemas de optimización pueden ser encarados a través de técnicas computacionales como los algoritmos genéticos, minimizando los errores de predicción. Una vez obtenida la red neuronal operativa ya entrenada en Fase 2 se contará con una poderosa herramienta de predicción basada en inteligencia artificial, principal resultado de la presente propuesta.

Area Ingenierías, Matemáticas y Física

Autor primario

Diego Fermín Palacios Riquelme (Facultad de Ingeniería - Universidad Nacional de Asunción)

Coautores

Derlis Gregor (Facultad de Ingeniería UNA) Mario Arzamendia Lopez (Facultad de Ingeniería Universidad Nacional de Asuncion)

Materiales de la presentación