SciELO - Scientific Electronic Library Online

 
vol.22 número6Aislamiento e Identificación de Bacterias y Levaduras Resistentes a PetróleoRelación entre el Parque de Tractores Agrícolas y el Patrón de Difusión y Adopción mediante un Modelo Logístico índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Información tecnológica

versión On-line ISSN 0718-0764

Inf. tecnol. vol.22 no.6 La Serena  2011

http://dx.doi.org/10.4067/S0718-07642011000600012 

Información Tecnológica Vol. 22(6), 111-120 (2011) doi: 10.4067/S0718-07642011000600012

 

Pronóstico del Precio de la Energía Eléctrica usando Redes Neuro-Difusas

 

Electricity Price Forecasting using Neurofuzzy Networks

 

Fernando Villada (1) , Edwin García(1) y Juan D. Molina(2)

(1) Fac. de Ingeniería, Depto Ing. Eléctrica, Grupo de Manejo Eficiente de la Energía - Gimel, Universidad de Antioquia, Calle 67 No. 53-108, Oficina 19-441, Medellín-Colombia (e-mail: fvillada@udea.edu.co)

(2) Depto Ing. Eléctrica, Univ. Católica de Chile, Avda Vicuña Mackenna 4860, Santiago-Chile. (e-mail: jdmolinac@gmail.com)


Resumen

Se propone un modelo para el pronóstico del precio de la energía eléctrica en Colombia mediante el uso de redes neuro-difusas. Se utilizan dos estructuras de redes incluyendo como entradas la serie de precios diarios en la primera y la serie de precios más el nivel medio de los embalses en la segunda. Los resultados son comparados con dos estructuras de redes neuronales y con un modelo Autoregresivo Condicional Heterocedástico Generalizado (GARCH). Los datos históricos fueron obtenidos de la Compañía XM del Grupo ISA; datos para 120 días son usados para entrenamiento y los 31 días siguientes para verificar la capacidad predictiva del modelo. Se encontró ventajas en este último dentro del periodo de muestreo para una variable de entrada, pero un mejor desempeño de las redes neuro-difusas en el periodo fuera de la muestra tanto para una como para dos variables de entrada.

Palabras clave: precio de la electricidad, redes neuronales artificiales, redes neuro-difusas, modelos de series de tiempo


Abstract

A forecasting model for the price of electricity in Colombia using neurofuzzy networks is proposed. Two network structures including the price series in the first and the price series plus the reserve water levels in the latter are used. The results are compared with two neural networks structures and a Generalized Autoregressive Conditional Heteroscedasticity model (GARCH). Historical data were supplied by the Company XM of the ISA Group; data for 120 days were used as for training the network and the following 31 days were used for testing the predictive capabilities of the model. The GARCH model shows better adjustment within the training period for the prices series as input, but the neurofuzzy networks have better forecasting performance for one and for two input variables.

Keywords: electricity price, artificial neural networks, neurofuzzy networks, time series models


 

INTRODUCCIÓN

El comportamiento de los precios de los bienes en general se determina principalmente por la oferta y la demanda. El precio de la energía eléctrica no se escapa a esta relación, no obstante la energía es un bien ligeramente distinto en aspectos importantes como su generación (producción), distribución y consumo. Un elemento importante para los administradores de los mercados de la electricidad es el pronóstico de los precios en el corto, mediano y largo plazo. Decisiones sobre expansión en la transmisión, ampliación de la generación, planeación de la distribución e intercambios de electricidad entre regiones o países están determinadas por el pronóstico del precio de la electricidad en el largo plazo. Sin embargo, los niveles de transacciones entre los participantes del mercado son altamente dependientes del pronóstico del precio en el corto plazo.

Varios autores han propuesto diferentes modelos de pronóstico del precio de la electricidad en el corto plazo (el día siguiente). Nogales et al. (2002) y Contreras et al. (2003) utilizan respectivamente modelos de series de tiempo y modelos autorregresivos e integrados de promedios móviles (ARIMA) para pronosticar el precio de la electricidad del día siguiente. Su aplicación a los mercados de California y de España mostró errores medios inferiores al 10%. Ante el comportamiento no lineal de este tipo de variables económicas, se han propuesto nuevos métodos basados en diferentes estructuras de redes neuronales artificiales (Amjady y Keynia, 2009) y métodos híbridos combinando algoritmos genéticos y redes neuronales (Amjady y Hemmati, 2009). Los resultados con redes neuronales fueron evaluados con datos de los mercados eléctricos de España y PJM (Pennsylvania - New Jersey - Maryland) mostrando siempre un mejor desempeño que los métodos ARIMA y GARCH. La principal característica de las redes neuronales de permitir establecer relaciones lineales y no lineales entre las entradas y salidas de un sistema ha hecho posible mostrar su aplicabilidad en mercados de alta volatilidad en diversas áreas de la ingeniería y las finanzas (Villada et al., 2006).

En otra aplicación, Szkuta et al. (1999) entrenaron una red neuronal multicapa para pronosticar el próximo precio de la electricidad en el mercado Australiano utilizando como entradas los datos de tres días anteriores en relación al precio, las reservas del sistema y la demanda potencial. Los resultados encontrados mostraron gran superioridad de las redes neuronales en comparación con las técnicas de regresión lineal convencionales utilizadas por la empresa. Radwan (2004) propone una nueva estructura de red neuronal utilizando la información del clima con el fin de pronosticar la demanda en un plazo muy corto (desde una hora hasta un día), obteniendo errores medios del orden del 3%. En un trabajo más reciente (Tang y Dancen, 2010), presentaron un modelo neuronal para pronosticar el precio de la energía eléctrica en el mercado del día siguiente donde utilizaron el MAPE (error medio porcentual por sus siglas en Inglés) como indicador de error. En este caso se necesitaron 20 neuronas en la capa oculta para encontrar la estructura de red más adecuada y para la selección de entradas se tuvieron en cuenta los principales factores de ese mercado, el histórico de precios, el histórico de la demanda y las proyecciones de la demanda para un escenario horario.

Durante los últimos años se han desarrollado trabajos basados en lógica difusa y en la combinación de ésta con redes neuronales conocida como sistemas neuro-difusos en diferentes campos de la ingeniería y la economía. Rodríguez y Anders (2004) presentaron un modelo para el pronóstico del precio horario de la energía eléctrica basado en redes neuro-diifusas. Su aplicación al mercado de Ontario mostró un mejor desempeño de estas últimas con respecto a las redes neuronales. Mariño et al. (2006) implementaron un algoritmo de inspección basado en redes neuro-difusas para el control de la calidad en la producción de tapas en la industria metalgráfica. El sistema permite reemplazar la inspección de un experto cubriendo el total de la producción. Bekiros y Georgoutsos (2007) compararon el desempeño de una red neuro-difusa con respecto a una red neuronal en la tarea de predecir la dirección del mercado para el caso de los índices NASDAQ y NIKKEI. Se encontró que una estrategia de negociación basada en la indicación de ambos modelos es superior con respecto a una estrategia de comprar y mantener el índice. Adicionalmente, los resultados del modelo neuro-difuso fueron superiores al modelo neuronal ya que tuvieron mayor acierto en la predicción de su dirección.

Lira et al. (2009) evaluaron el desempeño de sistemas neuro-difusos para el pronóstico de la electricidad en el corto plazo para el mercado eléctrico colombiano. Los resultados se compararon con modelos ARMAX, PARMAX, ARX y redes neuronales, encontrando que ninguno de los modelos superaba suficientemente a los demás con errores en el pronóstico que oscilaban entre el 4.7% y 6.7%. En un trabajo posterior (Catal ã o, Poushinho y Mendes, 2011a), proponen un sistema híbrido entre la transformada de Walet y redes neuro-difusas para el pronóstico de la electricidad en el corto plazo. El desempeño del método híbrido es comparado con otras metodologías de pronóstico evaluadas con datos del sistema eléctrico español, obteniéndose un error medio de 4.53% para las cuatro estaciones e inferior en todos los casos. Como ventaja adicional se resalta la rapidez en la ejecución con un tiempo de cómputo inferior a cinco segundos. En otro de sus artículos, (Catal ã o, Poushinho y Mendes, 2011b) proponen también un modelo híbrido combinando además de la transformada de Walet y las redes neuro-difusas, el método de optimización de enjambre de partículas para determinar los mejores parámetros de la función de membresía. Su aplicación al mercado eléctrico español, presentó un error del 5.07% en promedio, siendo también inferior a los casos publicados con otros métodos de pronóstico.

Otra aplicación de las redes neuro-difusas es el pronóstico de carga en el corto plazo (Hinojosa y Huese, 2010). En este trabajo se compara el comportamiento de una red neuro-difusa con otros métodos como sistemas de inferencia difusos, redes neuronales y modelos Arima para el pronóstico de la demanda de energía eléctrica del día siguiente en el sistema eléctrico ecuatoriano. Se reporta que el sistema de inferencia difuso combinado con la selección de las variables de entrada mediante entrenamiento supervisado da lugar a una mayor precisión en el pronóstico.

Los anteriores trabajos se enfocan en el pronóstico a muy corto plazo (día siguiente). En aplicaciones que buscan cubrir un margen de tiempo superior ( 1 a 3 meses), se tienen aplicaciones de las redes neuronales para el pronóstico de tasas de cambio y otras variables macroeconómicas. Gradojevic y Yang (2000) utilizaron las redes neuronales para pronosticar la tasa de cambio entre el dólar canadiense y el dólar americano en el rango de 90 días. Para ello utilizó el historial de diez años como datos de entrenamiento, teniendo en cuenta el efecto de dos variables macroeconómicas (tasa de interés y precio del petróleo) y los flujos de órdenes de transacciones. Los resultados mostraron menor error en el pronóstico con redes neuronales en comparación con el modelo del paseo aleatorio y otros modelos lineales.

En este artículo se pretende estudiar el comportamiento del precio de la energía eléctrica en un rango de tiempo superior a los trabajos referenciados. Se propone un modelo basado en sistemas neuro-difusos y se evalúa su desempeño en el pronóstico de un mes completo para el mercado eléctrico colombiano. Para este efecto se creará un sistema de inferencia difuso neuroadaptable ( ANFIS ) aprovechando las mejores características de dos sistemas de la inteligencia artificial como lo son: las redes neuronales y la lógica difusa; de los primeros aprovechar el aprendizaje, la adaptación, la tolerancia a fallas, el paralelismo y la generalización; mientras de los segundos obtener un mecanismo de inferencia sobre la incertidumbre. Con estas ventajas se pretende trabajar con uno o varios sistemas neuro-difusos en los que se puedan introducir variables de entrada no lineales y obtener como salida el precio de energía. Los resultados obtenidos son comparados con otros métodos basados en redes neuronales y modelos GARCH encontrándose un mejor desempeño en el modelo neuro-difuso.

SISTEMAS NEURO-DIFUSOS

Los sistemas neuro-difusos son usados en múltiples aplicaciones porque combinan las ventajas de las redes neuronales con la capacidad de proporcionar la explicación y comprensión del conocimiento explícito que tienen los modelos difusos. El interés en este sistema se debe principalmente a las siguientes razones: 1) Aplicación de los algoritmos de entrenamiento desarrollados para redes neuronales; 2) Posibilidad de proporcionar la integración del conocimiento; 3) Posibilidad de extracción de conocimiento, bajo el formato de reglas del conjunto de datos. En este trabajo se utiliza el modelo ANFIS (Adaptative Network Fuzzy Inference System) implementado por Jang (1993) dada su propiedad de generar reglas difusas a partir de la información de entrada. Este enfoque es flexible y permite manejar información estándar sujeta a fluctuaciones cubriendo los requerimientos para el pronóstico de los precios. En la mayoría de los mercados competitivos, las series de precios presentan las siguientes características: alta frecuencia, media y varianza no constantes, estacionalidad diario y semanal y alta volatilidad.

Un modelo ANFIS está conformado por cinco capas en la que t odos los nodos de una misma capa tienen una función similar. La primera capa es usada para las entradas, La ultima capa para la salida y tiene 3 capas intermedias ocultas. Este número de capas ocultas permanece constante en todo tipo de ANFIS a implementar, sin importar las entradas que tenga el sistema y solamente tiene una salida posible. Se parte de la suposición de que el sistema de inferencia difuso tiene dos entradas (x e y , una salida (f) y que la base de reglas tiene dos reglas difusas IF-Then del tipo Takagi-Sugeno:

Regla 1 :

If x is A1 and y es B1 , Then f1 = p1x + q1y + r1

Regla 2:

If x is A2 and y es B2 , Then f2 = p2x +q2y + r2

Las cinco capas de la estructura de la red ANFIS son las siguientes:

Capa 1: Cada nodo i de esta capa es cuadrado (son adaptables, es decir tienen parámetros ajustables) y descrito por la ecuación 1.

Oi1 = µAi (x)                                                              (1)

Donde x es la entrada al nodo i , Ai es una variable lingüística asociada con la función de este nodo. En otras palabras, Oi1 es la función de membresía de Ai y especifica el grado de pertenencia de x respecto Ai . Usualmente µAi (x) es una función tipo campana con un máximo de 1 y mínimo de 0,

Donde: { ai , bi , ci } son parámetros de ajuste para la función campana obteniéndose diferentes formas de la función de membresía de la variable lingüística Ai . Se hace notar que cualquier tipo de forma para la función de membresía es aceptable (triangular, trapezoidal, etc.) para utilizarse en esta capa.

Capa 2: Cada nodo en esta capa es circular (parámetros fijos) y etiquetado con ? (figura 1) el cual multiplica las señales de entrada y envía el producto a la salida, es decir, cuando múltiples señales entran a este nodo envían como resultado el producto de cada instancia i. Para un instante:

Oi2 = µAi (x) µBi (y) i=1,2                                                           (4)

Cada nodo de salida representa

Cada nodo de salida representa el grado de activación de una regla. Además, representan las T-norma para modelar la operación lógica AND . Se suelen conocer como nodos de reglas.

Capa 3: Cada nodo en esta capa es circular y etiquetado con N, para indicar la normalización de los grados de activación. El iésimo nodo calcula la normal de la iésimas reglas de activación con la suma de todas las reglas activadas de acuerdo a la ecuación 5. Las salidas de esta capa pueden llamarse reglas de activación normalizadas.

Capa 4: Cada nodo i en esta capa es cuadrado y tiene una función de nodo:

Donde wi es la salida de la capa 3 y el conjunto de parámetros { pi , qi , ri } son referidos a los parámetros del consecuente .

Capa 5: presenta un nodo único circular con la etiqueta ?, aquí se calcula la salida a partir de las señales de entrada (ecuación 7):

El proceso de entrenamiento se realiza con dos conjuntos de parámetros: los del antecedente (constantes que caracterizan las funciones de pertenencia) y los del consecuente (coeficientes de las funciones lineales del consecuente de las reglas). Los enlaces entre nodos sólo indican la dirección en la que fluyen las señales, no tienen pesos asociados. En la Figura 1 se muestra la arquitectura resumida de la ANFIS.

 

Fig. 1: Arquitectura de la ANFIS

APLICACIÓN AL PRONÓSTICO DEL PRECIO DE LA ENERGÍA ELÉCTRICA

Para el desarrollo del trabajo se procedió a recopilar los datos históricos del precio de la electricidad en la bolsa de energía colombiana y los niveles de los embalses; esta información fue suministrada por XM (Compañía de Expertos en Mercados S.A. E.S.P) quienes son los operadores y administradores del mercado eléctrico Colombiano. Las variables de entrada corresponden a los precios diarios y el nivel total de embalses con diferentes rezagos de tiempo, como salida única se tiene el precio a pronosticar para los siguientes 31 días. El nivel de los embalses corresponde a la reserva de energía de acuerdo a la cantidad de agua almacenada en los mismos, el dato se obtiene como la suma de los aportes de energía de todos los ríos al sistema interconectado nacional de Colombia; es expresado en kWh.

A partir de la información anterior se probaron diferentes estructuras de redes neuro-difusas tomando un conjunto aleatorio de 150 datos diarios, de los cuales se dejaron 119 para entrenamiento (aproximadamente 80%) y los demás 31 datos correspondientes a un mes completo para pronóstico fuera de la muestra. En primer lugar se tomó una red con una variable de entrada que correspondía a la serie de datos de los precios, una variable de salida correspondiente al precio de la electricidad y como indicadores de desempeño se tomaron la raíz del error medio cuadrático (RMSE) y el error absoluto porcentual promedio (MAPE), calculados mediante las ecuaciones 8 y 9.

Donde n es el número de observaciones consideradas, y t es el precio real y y' t es el precio estimado por el modelo. En la tabla 1 se muestran los resultados con una variable de entrada en la cual se variaron el número y el tipo de funciones de membresía, al igual que el número de retardos de tiempo.

Tabla 1: Desempeño con una variable de entrada

La estructura de la red con dos entradas, una salida y tres rezagos de tiempo contiene tres funciones de membresía tipo campana e igual rango de influencia para las tres variables (entrada y salida) de 0.448. Las Figuras 2 y 3 muestran el desempeño de la red tanto dentro como fuera de la muestra (pronóstico) indicando que los resultados están muy próximos a la realidad.

Tabla 2: Desempeño con dos variables de entrada

ANÁLISIS DE RESULTADOS

Los resultados se compararon con estructuras de redes neuronales de una capa oculta incluyendo una o dos variables de entrada y entrenadas con los mismos datos. Adicionalmente se estableció un modelo autorregresivo condicional heterocedástico generalizado de orden 1 - GARCH(1,1) - debido a la volatilidad de la serie de precios diarios de la energía eléctrica, la cual de forma similar a la mayoría de las series de tiempo financieras, presenta la particularidad de que grandes cambios en el precio alternan con periodos en los cuales los precios difícilmente cambian.

En la tabla 3 se comparan los dos modelos de redes neuronales con una y dos variables de entrada (ANN1 y ANN2 respectivamente) con los dos modelos de redes neuro-difusas también para una y dos variables de entrada (NF1 y NF2 respectivamente) y el modelo GARCH (1,1).

Fig. 2: Pronóstico dentro de la muestra

Fig. 3: Pronóstico fuera de la muestra

Tabla 3: Comparación de resultados con modelos GARCH y redes neuronales artificiales

Los resultados con una variable de entrada (ANN1, NF1 y GARCH) indican que para datos dentro de la muestra se tiene un mejor desempeño del modelo GARCH, seguido por la red neuronal y la red neuro-difusa. El análisis fuera de la muestra arroja que la red neuro-difusa supera a los modelo de red neuronal y al modelo GARCH. Los mejores resultados se tienen con dos variables de entrada (ANN2 y NF2), es decir, involucrando los precios y el nivel de los embalses. Dado que el objetivo es encontrar el mejor modelo de pronóstico, se concluye que el mejor desempeño lo presenta la red neuro-difusa por mostrar un menor error fuera de la muestra. Como ventaja adicional se resalta que el tiempo de ejecución fue inferior a 5 segundos usando un PC de 2 GB de RAM y con procesador de 2.0 GHZ, tiempo inferior a la mayoría de los casos referenciados e igualando al tiempo reportado por Catalao et. al (2011a).

CONCLUSIONES

En este trabajo propone un modelo basado en redes neuro-difusas para el pronóstico del precio de la energía eléctrica en Colombia. Se utilizan dos estructuras de redes incluyendo como entradas la serie de precios diarios en la primera y la serie de precios más el nivel medio de los embalses en la segunda. Se destaca que este tipo de modelos son en general más fáciles de implementar; muestran además un buen desempeño, presentando bajos errores y poca variación en estos últimos, aún en los casos donde se cambió el número de rezagos y se adicionó una nueva variable de entrada.

A pesar de que el modelo GARCH para el caso univariable mostró mejor ajuste dentro de la muestra, requiere de un experto que determine el procedimiento a seguir dependiendo del tipo de datos. Estos datos deben ser estacionarios, se deben analizar los gráficos de correlación, adecuar los modelos y medir los errores. Los modelos basados en redes neuronales y redes neuro-difusas son más sencillos de implementar; adicionalmente, la red neuro-difusa ampliada con dos variables de entrada superó a la red neuronal y al modelo GARCH en el ajuste fuera de la muestra. Se concluye por lo tanto que además de la facilidad para su implementación, las redes neuro-difusas presentaron un mejor desempeño en el pronóstico fuera de la muestra y requieren un menor tiempo de cómputo comparado con el demandado por los otros métodos. Estas ventajas han permitido la disponibilidad del método para otras aplicaciones en diferentes áreas de la ingeniería y para el pronóstico de demanda de energía eléctrica e índices en los mercados financieros tal como lo reportaron otros autores en las referencias consultadas.

AGRADECIMIENTOS

Los autores agradecen a la Universidad de Antioquia por el apoyo financiero recibido a través del proyecto "Sostenibilidad 2009- 2010" y a la Pontificia Universidad Católica de Chile - Programa de Becas MECESUP (2).

REFERENCIAS

Amjady, N. y H. Hemmati, Day-ahead price forecasting of electricity markets by a hybrid intelligent system , European Transactions on Electrical Power, 19 (1), 89-102 (2009).         [ Links ]

Amjady, N. y F. Keynia, Day-ahead price forecasting of electricity markets by mutual information technique and cascaded neuro-evolutionary algorithm , IEEE Transactions on Power Systems, 24 (1) 306-318 (2009).         [ Links ]

Bekiros , S. D. y D. A. Georgoutsos, Evaluating Direction of Change Forecasting: Neurofuzzy Models vs. Neural Networks , Mathematical and Computer Modelling, 46, 38-46 (2007).         [ Links ]

Catalão, J. P. S., H. M. I. Pousinho y V.M.F. Mendes, Short-term electricity prices forecasting in a competitive market by a hybrid intelligent approach , Energy Conversion and Management, 52 (2) 1061-1065 (2011a).         [ Links ]

Catalão, J. P. S., H. M. I. Pousinho y V. M. F. Mendes, Hybrid Wavelet-PSO-ANFIS approach for short-term electricity prices forecasting , IEEE Transactions on Power Systems, 26 (1), 137-144 (2011b).         [ Links ]

Contreras, J., R. Espínola, F. J. Nogales y A. Conejo, ARIMA models to predict next-day electricity prices , IEEE Transactions on Power Systems , 18 (3), 1014-1020 (2003).         [ Links ]

Hinojosa, V. H. y A. Hoese, Short-Term Load Forecasting using Fuzzy Inductive Reasoning and Evolutionary Algorithms , IEEE Transactions on Power Systems, 25 (1), 565-574 (2010).         [ Links ]

Jang, J., ANFIS: Adaptive-Network-Based Fuzzy Inference Systems , IEEE Transactions on Systems, Man and Cybernetics, 23 (3), 665-685 (1993).         [ Links ]

Lira, F., C. Munoz, F. Nunez y A. Cipriano, Short-term forecasting of electricity prices in the colombian electricity market , IET Generation, Transmission & Distribution, 3 (11) 980-986 (2009).         [ Links ]

Mariño, P., V. Pastoriza, M. Santamaría y E. Martínez, Sistema borroso de inspección del rebarnizado de tapas en la industria metalgráfica , Revista Información Tecnológica, 17 (4), 17-22 (2006).         [ Links ]

Nogales, F. J., J. Contreras, A. Conejo y R. Espínola, Forecasting next-day electricity prices by time series models, IEEE Transactions on Power Systems, 17 (2), 342-348 (2002).         [ Links ]

Gradojevic, N. y J. Yang, The application of artificial neural networks to exchange rate forecasting: the role of market microstructure variables, Bank of Canada, Working paper 2000-23, 10-27 (2000).         [ Links ]

Radwan, E., Short term hourly load forecasting using abductive networks, IEEE Transactions on Power Systems, 19 (1), 164-173 (2004) .         [ Links ]

Rodríguez, C. P. y G. J. Anders, Energy Price Forecasting in the Ontario Competitive Power System Market, IEEE Transactions on Power Systems, 19 (1), 366-374 (2004) .         [ Links ]

Szkuta, B. R., L. A. Sanabria y T. S. Dillon, Electricity price short-term forecasting using artificial neural networks, IEEE Transactions on Power Systems, 14 (3), 851-857 (1999).         [ Links ]

Tang, Q. y G. U. Dancen, Day Ahead electricity prices forecasting using artificial neural networks, Artificial Intelligence and Computational Intelligence, 2 (1), 511-514 (2010).         [ Links ]

Villada, F., W. Muño z y A. Henao, Pronóstico de las tasas de cambio. Una aplicación al Yen Japonés mediante redes neuronales artificiales , Revista Scientia et Technica, 12, 233-238 (2006).         [ Links ]

Recibido Mar. 02, 2011; Aceptado Abr. 27, 2011; Versión Final recibida May. 17, 2011