Servicios Personalizados
Articulo
Indicadores
Citado por SciELO
Links relacionados
Bookmark
Información tecnológica
versión On-line ISSN 0718-0764
Inf. tecnol. v.19 n.2 La Serena 2008
doi: 10.4067/S0718-07642008000200012
| Información Tecnológica-Vol. 19 N°2-2008, pág.: 103-112 ARTICULOS VARIOS Comparación del Método del Principio de la Máxima Entropía en la Estimación de Parámetros de la Distribución de Valores Extremos Tipo I Comparison of the Method of the Principle of Maximum Entropy for the Estimation of Parameters of the Extreme Value Type I Distribution José A. Raynal Resumen Se analiza el método del Principio de la Máxima Entropía (PME) para la estimación de los parámetros de la distribución de valores extremos tipo I (VEI). El método PME ha sido comparado con otros de uso común, como son los de momentos (MOM), máxima verosimilitud (MV) y momentos de probabilidad pesada (MPP), tanto con datos reales, como por medio de experimentos de muestreo distribucional. El método PME resultó ser una opción viable adicional para estimar los parámetros de la distribución VEI, aunque no tan buena como la de los métodos de MPP, MV y MOM. También se detectó que el método PME funciona mejor cuando la muestra de datos es mayor a 50 valores de caudales máximo anuales. Palabras clave: máxima entropía, análisis de frecuencias, caudales máximos anuales, estimación de parámetros, valores extremos Abstract The method of the Principle of Maximum Entropy (POME) applied to the estimation of parameters of the extreme value type I distribution, (EVI) is analyzed. The POME method has been compared with others of widespread use, like the methods of moments (MOM), maximum likelihood (ML) and probability weighted moments (PWM), with both real flood data and through distributional sampling experiments. The POME method was another good option for estimating the parameters of the EVI distribution, but not as good as those provided by the methods of PWM, ML and MOM. It was also detected that the POME method has a better performance when the sample size is bigger than 50 values of maximum annual floods. Keywords: maximum entropy, frequency analysis, floods, parameter estimation, extreme values INTRODUCCIÓN La selección de la función de distribución de probabilidad y la elección del mejor método para estimar sus parámetros, han sido siempre asuntos de gran preocupación en el ámbito de la hidrología superficial. La literatura técnica sobre análisis de caudales máximos anuales usando la distribución de valores extremos tipo I (VEI), es abundante (Singh, 1998; Rao y Hamed, 2000). A la fecha han sido propuestos varios métodos de estimación de parámetros para la distribución VEI, los más tradicionales son: momentos (M) y máxima verosimilitud (MV). Recientemente, se han propuesto métodos más novedosos como el de momentos de probabilidad pesada (MPP) (Greenwood et al., 1979) y el del principio de máxima entropía (PME) (Jaynes, 1961 y 1982). Es conveniente decir que existen varios métodos más que se han propuesto para el mismo fin, pero ninguno de ellos ha demostrado ser superior a los antes descritos (Raynal y Salas, 1986; Jain y Singh, 1986; Phien, 1987). En particular, se ha encontrado que los métodos de mínimos cuadrados, de rango intercuartil de la moda, momentos mixtos y medias incompletas son muy ineficientes en la estimación de los parámetros de la distribución VEI (Raynal y Salas, 1986; Jain y Singh, 1986; Phien, 1987). En fechas recientes, el método PME ha sido escasamente aplicado en la estimación de parámetros de la distribución VEI en el campo de la hidrología superficial, en otras áreas se han presentado aplicaciones del principio de máxima entropía en la modelación física regional de crecientes (Solana-Ortega y Solana, 2001), en la representación de la lluvia intermitente (Koutsoyiannis, 2006), para la obtención de relaciones geométricas hidráulicas (Singh et al., 2003), para hacer análisis regional de precipitación (Escalante y Domínguez, 2001) y para hacer una comparación entre los Momentos-L y los Momentos-C (Ulrych et al., 2000). El objetivo de este artículo consiste en determinar la bondad de aplicación del método PME en el análisis de caudales máximos anuales, tanto a nivel de aplicación práctica como a nivel de bondad estadística, por medio de experimentos de muestro distribucional. METODOLOGÍA Función de Distribución de Probabilidad de Valores Extremos Tipo I para Máximos La función de distribución de probabilidad de valores extremos tipo I, (VEI), es (NERC, 1975): donde a, y x0 son los parámetros de escala, y ubicación, respectivamente. La función de densidad de probabilidad está dada por (NERC, 1975): El Método del Principio de la Máxima Entropía El método del Principio de la Máxima Entropía (PME) ha sido definido y aplicado a varias funciones de distribución de probabilidad, con funciones de densidad de probabilidad definidas y directamente invertibles (Singh, 1998). El método del PME aplicado a la estimación de parámetros de funciones de distribución probabilidad, consiste en los siguientes pasos principales (Singh, 1998): 1) Definir la información dada en términos de las restricciones El método PME fue formulado por Jaynes (1961, 1982). Este principio establece que la asignación de probabilidades con un grado de prejuicio mínimo es aquella que maximiza la entropía sujeta a la información dada. Estimadores de Máxima Entropía de los Parámetros de la Distribución de Valores Extremos Tipo I Al tomar el logaritmo natural de la ecuación (2), se tiene que: y la entropía funcional de Shannon (EFS) para la función de distribución VEI es (Singh, 1998): De aquí, se tiene que las restricciones apropiadas para la ecuación (2) son (Singh, 1998): La función de densidad de probabilidad menos sesgada, basada en el PME, y que es consistente con las ecuaciones (5)-(7), tiene la siguiente forma (Singh, 1998): El multiplicador de Lagrange de orden cero es (Singh, 1998): donde l1 y l2 son los multiplicadores de Lagrange de orden uno y dos, respectivamente. También, l0 puede expresarse como (Singh, 1998): donde G(.) es la función Gamma completa de (.). Derivando las ecuaciones (9) y (10) con respecto a l1 y l2, se obtiene lo siguiente: La relación entre los parámetros y las restricciones puede construirse al sustituir la ecuación (9) en la ecuación (8) (Singh, 1998): y por comparación con la ecuación (2) se tiene que: y: La relación entre los parámetros y las restricciones se puede establecer como: Finalmente, las expresiones necesarias para estimar los parámetros de la distribución VEI son (Jowitt, 1979; Jain y Singh, 1987): Un estimador muestral de la ecuación (21) es (Jowitt, 1979): donde El procedimiento antes descrito implica hacer una búsqueda de raíces de la ecuación (22), proponiendo primero un estimador del parámetro de escala,a, encontrar el valor del parámetro de ubicación, x0, por medio de la ecuación (20) e ir ajustando ambos parámetros con cualquier técnica de búsqueda de raíces. El método PME es particularmente adaptable para ser estimado por medio de una hoja de cálculo, como por ejemplo Excelâ (Marca Registrada de Microsoft, Inc.). RESULTADOS Y DISCUSIÓN Aplicación a Muestras de Caudales Reales Como ejemplos de aplicación, los datos de caudales máximos anuales de 10 estaciones hidrométricas, ubicadas en las Regiones Hidrológicas números 9 y 10 de los estados de Sonora y Sinaloa, en el Noroeste de México, ver figura 1, fueron procesados y calculados los estimadores producidos por los métodos PME, MV, MOM y MPP para los parámetros de la distribución VEI, para dichas muestras de datos; así como, sus errores estándar de ajuste y las desviaciones absolutas promedio. Los detalles de los estimadores MV, MOM y MPP pueden encontrarse en Rao y Hamed (2000). El área drenada, media, desviación estándar y el coeficiente de asimetría de los datos de muestra de las estaciones citadas, se indican en la tabla 1.
Tabla 1: Datos estadísticos de las estaciones hidrométricas seleccionadas
Para medir la bondad del ajuste por varios métodos se calculó el error estándar de ajuste, EE, dado por Kite (1988): donde xi son los valores históricos de la muestra de datos, yi son los valores producidos por la función de distribución correspondiente a los periodos de retorno de los valores históricos, N es el tamaño de la muestra, y mj es el número de parámetros de la función de distribución. Se calculó también otra medida común de bondad de ajuste conocida como la desviación absoluta relativa promedio, DARP, cuya formulación es como sigue (Jain y Singh, 1987): donde xi, yi y N fueron definidas previamente. Los parámetros de la distribución VEI, obtenidos por los métodos del principio de máxima entropía, máxima verosimilitud, momentos y momentos de probabilidad pesada, para las diez estaciones seleccionadas se muestran en la tabla 2. En esta tabla se muestran también los EE y las DARP para dichos ajustes. Tabla 2: Parámetros, errores estándar de ajuste y desviaciones absolutas promedio de la distribución
De la información contenida en la tabla 2, se observó que el error estándar de ajuste, EE, que muestra los mejores resultados es el método MOM con ocho valores mínimos del EE de diez posibles. Fue seguido por los métodos de MPP y del PME, con uno cada uno. De acuerdo con la desviación absoluta relativa promedio, DARP, contenida en la tabla 2, el método que muestra los mejores resultados es el MV con siete valores mínimos del DARP de diez posibles. Fue seguido por los métodos PME, MPP y MOM, con uno cada uno. Aplicación a Muestras de caudales Sintéticos Adicionalmente, se realizaron experimentos de muestreo distribucional para tamaños de muestra 9, 19, 49 y 99 y números de muestras de 11000, 5210, 2020 y 1000, respectivamente. Se usaron los métodos de MOM, MV, MPP y PME. Los experimentos de muestreo distribucional consistieron en asignar los valores poblacionales de 10 y 1, sin pérdida de generalidad, a los parámetros de ubicación y escala, respectivamente, de la distribución VEI. El proceso consistió de los pasos siguientes: 1) Generación de números aleatorios con distribución uniforme en el intervalo (0,1) 2) Utilización de estos números aleatorios como valores de la función de distribución VEI 3) Conversión a valores aleatorios con distribución VEI por medio de la inversión de la ecuación (1): 4) Conformación de muestras de tamaños 9, 19, 49 y 99, con los valores generados en el punto anterior 5) Estimación de los parámetros de la distribución VEI, basada en la muestras anteriores y por medio de los métodos PME, MV, MOM y MPP 6) Estimación de los parámetros estadísticos de la media, sesgo y varianza de los parámetros de la distribución VEI obtenidos en el punto anterior. El sesgo se definió como: donde Tabla 3: Propiedades de los estimadores de PME, MOM, ML y MPP para el parámetro de ubicación
Tabla 4: Propiedades de los estimadores de PME, MOM, ML y MPP para el parámetro de escala a,
Los resultados contenidos en las tablas 3 y 4 son consistentes con lo reportado en la literatura con experimentos de muestreo distribucional. Raynal y Salas (1986) ubican al método MPP como la mejor opción, sin haber considerado el método PME. Jain y Singh (1986) encontraron que el mejor método era el de MV. Phien (1987) ubica como mejor método el de MPP. El método MOM es el mejor al reducir el sesgo, pero sus varianzas son consistentemente más grandes que las de los métodos MV y MPP. El método MPP y el MV, son consistentemente los que producen las varianzas mínimas para los parámetros de ubicación y escala, respectivamente. Se observó también que el método PME debe ser utilizado cuando el tamaño de la muestra es mayor a 50 valores de caudales máximos, ya que para tamaños de muestra más pequeños la varianza de los parámetros es muy grande. CONCLUSIONES Se concluye que el método del principio de máxima entropía tiene las características estadísticas necesarias para ser usado con toda confianza en el análisis de caudales máximos anuales, siempre y cuando el tamaño de muestra sea superior a 50 datos de caudales máximos anuales, en caso contrario se tendrán varianzas elevadas en la evaluación de los parámetros de la distribución VEI. El autor recomienda el uso del método del principio de máxima entropía como una alternativa viable, cuando se requiera hacer algún análisis de caudales máximos anuales, basado en los argumentos anteriores y dada su gran facilidad computacional en la obtención de los parámetros de la distribución VEI. NOMENCLATURA
AGRADECIMIENTOS A la Universidad de las Américas, Puebla por el apoyo y las facilidades otorgadas para la realización de este artículo. REFERENCIAS Escalante Sandoval C.A. y Domínguez Esquivel, J.Y.; Análisis Regional de Precipitación con Base en una Distribución Bivariada Ajustada por Máxima Entropía, Ingeniería Hidráulica en México: 16 (3), 91-102 (2001) [ Links ] Greenwood, J.A., J.M. Lanwher, N.C. Matalas y J.R. Wallis; Probability Weighted Moments: Definition, and Relation to Parameters of Several Distributions Expressable in Inverse Form, Water Resources Research, 15, 1049-1054 (1979). [ Links ] Jain, D. y V.P. Singh; Estimating Parameters of EV1 Distribution for Flood Frequency Analysis, Water Resources Bulletin: 23(1), 59-71 (1987) [ Links ] Jaynes, E.T.; Probability Theory in Science and Engineering, Mc-Graw Hill Book Company, New York, N. Y., EUA (1961). [ Links ] Jaynes, E.T.; On the Rationale of Maximum Entropy Methods, Proceedings of IEEE: 70, 939-952 (1982). [ Links ] Jowitt, P. W.; The Extreme-Value Type-1 Distribution and the Principle of Maximum Entropy, Journal of Hydrology: 42, 23-38 (1979) [ Links ] Kite, G. W.; Frequency y Risk Analyses in Hydrology, 187, Water Resources Publications, Littleton, Colorado, EUA (1988) [ Links ] Koutsoyiannis D.: An Entropic-Stochastic Representation of Rainfall Intermittency: The Origin of Clustering and Persistence, Water Resources Research: 42 (1): Art. No. W01401 (2006) [ Links ] NERC, Natural Environment Research Council. Flood Studies Report, I, Hydrologic Studies, 41-87, Whitefriars Press Ltd., Londres, Inglaterra (1975) [ Links ] Phien, H.N.; A Review of Methods of Parameter Estimation for the Extreme Value Type-1 Distribution, Journal of Hydrology: 90, 251-260 (1987) [ Links ] Rao, A.R. y K.H. Hamed; Flood Frequency Analysis, 229-257, CRC Press, Boca Ratón, Florida, EUA (2000). [ Links ] Raynal, J.A. y J.D. Salas; Estimation Procedures for the Type-1 Extreme Value Distribution, Journal of Hydrology: 87, 315-336 (1986) [ Links ] Singh, V.P.; Entropy Based Parameter Estimation in Hydrology, 108-136, Kluwer Academic Publishers, Dordrecht, Holanda (1998). [ Links ] Singh V.P., C.T. Yang y Z.Q. Deng; Downstream Hydraulic Geometry Relations: 1. Theoretical Development, Water Resources Research: 39 (12): Art. No. 1337 (2003) [ Links ] Solana-Ortega, A. y Solana, V.; Entropy-based inference of Simple Physical Models for Regional Flood Analysis, Stochastic Environmental Research and Risk Assessment: 15(6), 415-446 (2001) [ Links ] Ulrych, T.J., D.R. Velis y A.D. Woodbury; L-moments and C-moments, Stochastic Environmental Research and Risk Assessment: 14 (1), 50-68 (2000) [ Links ] | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||










(1)
(2)
(4)
(9)
(19)
(21)
(23)
(24)