SciELO - Scientific Electronic Library Online

 
vol.15 número3Eliminación de Bandas Calientes en Reformador de Gas Natural índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Información tecnológica

versión On-line ISSN 0718-0764

Inf. tecnol. v.15 n.3 La Serena  2004

http://dx.doi.org/10.4067/S0718-07642004000300016 

 

Información TecnológicaVol. 15 N° 32004, págs.: 97-104

ARTÍCULOS VARIOS

Análisis de Frecuencias de Gastos Máximos Anuales Usando la Distribución de Valores Extremos Tipo I para Tres Poblaciones

Flood Frequency Analysis by the Three-Populations Extreme Value Type I Distribution

 

J.A. Raynal y L.G. García

Univ. de las Américas-Puebla, Dpto. de Ingeniería Civil, Santa Catarina Mártir, 72820 Cholula Pue.-México (e-mail: jraynal@mail.udlap.mx)


Resumen

En este trabajo se presenta la función de distribución de probabilidad de valores extremos tipo I para tres poblaciones (T3PG) y su aplicación en el análisis de frecuencias de gastos máximos anuales. Se propone también un procedimiento para estimar sus parámetros, basado en el método de máxima verosimilitud. Dicho procedimiento utiliza un algoritmo de optimización no lineal para la maximización de la función logarítmica de verosimilitud y la consiguiente obtención de los estimadores de los parámetros de la distribución propuesta. El modelo ha trabajado muy bien en la mayoría de las muestras de gastos máximos hasta ahora analizadas, dos de las cuales se incluyen como ejemplos de aplicación para ilustrar el procedimiento. Se concluye que la metodología propuesta produce buenos resultados, y puede ser aplicado a la práctica hidrológica.


Abstract

This study presents the probability distribution function for extreme value type I for three populations (T3PG) and its application for flood frequency analysis. Also, a procedure for estimation of its parameters based on the method of maximum likelihood, is proposed. This procedure uses a non-linear optimization algorithm to maximize the log-likelihood function for the computation of the parameters of the proposed distribution function. The model worked well in most of the study cases analyzed so far, two of which are contained in the paper to illustrate the procedure. It is concluded that the methodology proposed produces good results, and may be applied to hydrological practice.

Keywords: flood control, frequency analysis, probability, maximum likelihood, design values


 

INTRODUCCIÓN

La selección de la distribución de probabilidad y la elección del mejor método para estimar sus parámetros y límites de confianza para los valores de diseño, han sido siempre asun-tos de gran preocupación entre los hidrólogos superficiales. Cuando hay la necesidad de considerar, por características meteorológicas existentes en la zona de estudio, dos o más poblaciones presentes en las muestras de datos, la preocupación citada crece.

El modelado probabilístico de muestras de gastos máximos anuales con dos o más po-blaciones presentes, arroja información que el análisis de una población no puede proveer porque está limitado a esa condición.

La literatura técnica sobre análisis de gastos máximos para una población es abundante (Rao y Hamed, 2000; Castillo 1988; entre otros). No así la que se tiene para modelar muestras de gastos máximos anuales cuando éstas contienen dos o más poblaciones.

El uso de funciones de distribución de proba-bilidad mezcladas, para ajustar muestras pro-venientes de dos o más poblaciones ha sido propuesto desde tiempo atrás (Gumbel, 1958). Se ha propuesto un modelo general del tipo aditivo para distribuciones mezcladas, (Mood et al., 1974).

En particular, en el caso de las funciones de distribución de valores extremos, se ha pro-puesto la distribución de valores extremos de dos componentes (TCEV), (Gumbel, 1958; Todorovic y Rousselle 1971; Canfield, 1979; Rossi et al., 1984; Beran et al, 1986).

La distribución doble Gumbel se propuso con un esquema de estimación de parámetros ba-sado en el método de mínimos cuadrados, (González-Villarreal, 1970)

Más recientemente, se han propuesto las dis-tribuciones de valores extremos tipo I para dos poblaciones (Raynal-Villasenor y Gueva-ra-Miranda, 1997), y la general de valores extremos para dos poblaciones (Raynal- Villaseñor y Santillán-Hernández, 1986; Gutiérrez-Ojeda y Raynal-Villaseñor; 1988).

A la fecha no hay una propuesta de función de distribución mezclada para tres poblacio-nes y por consiguiente no se ha propuesto un procedimiento para estimar sus parámetros.

El objetivo de este artículo es expandir el conocimiento sobre la distribución de valores extremos tipo I de tres poblaciones para el caso de gastos máximos anuales, proponen-do un procedimiento basado en el método de máxima verosimilitud para la estimación de los parámetros de dicha distribución y así fa-cilitar su aplicación en la práctica hidrológica.

METODOLOGÍA

Función de distribución de probabilidad de valores extremos tipo I para una población

La distribución de la función de valores extremos tipo I (Gumbel) para una población y para máximos es (NERC. 1975):

(1)

donde a y x0 son los parámetros de escala y ubicación, respectivamente.

La función de densidad de probabilidad está dada por (NERC, 1975):

 

(2)
donde: -¥ < x < ¥ y a > 0  

La distribución de valores extremos I para tres poblaciones

Basada en la forma general de la función de distribución de probabilidad para dos pobla-ciones (Raynal-Villasenor y Guevara-Miranda, 1997), se ha propuesto la siguiente forma general para distribuciones para tres poblacio-nes (García-Valenzuela, 1999):

 
(3)

donde p1 y p2 son las proporciones de la primera y segunda poblaciones en la mezcla, respectivamente. La distribución de valores extremos tipo I para tres poblaciones (TP3G) puede ser construida como (García-Valen-zuela, 1999):

 
 
(4)

y la correspondiente función de densidad de probabilidad es (García-Valenzuela, 1999):

 
 
 
 
 
(5)

El método de máxima verosimilitud

El método de máxima verosimilitud ha sido definido y aplicado a varias funciones de distribución de probabilidad, con funciones de densidad de probabilidad definidas, (NERC, 1975).

Este método tiene propiedades adecuadas como la propiedad de invarianza, (Mood et al., 1974), y la falta de sesgo asintótica, sufi-ciencia, consistencia y eficiencia (Haan, 1977), en la estimación de grandes muestras y su aplicabilidad en la estimación de pará-metros con funciones de verosimilitud muy complejas.

La vieja queja de la complejidad numérica en la aplicación del método de máxima verosími-litud, cuando no se disponía de una computa-dora, es casi cosa del pasado dado el uso ca-si universal de computadoras personales fijas y portátiles.

La función de verosimilitud para N variables independientes e idénticamente distribuidas X1, X2,..., Xn puede obtenerse como la función de densidad de probabilidad conjunta, esto es, (Mood et al 1974):

(6)

donde q denota el conjunto de parámetros y f(.) es la función de densidad de probabilidad.

La versión logarítmica de la Ecuación (6) es:

(7)

y será usada en la lugar de la Ecuación (6) dada su forma de manejo más fácil en el procedimiento computacional descrito en la próxima sección.

El conjunto de parámetros que maximizan a la Ecuación (7), serán los estimadores de máxi-ma verosimilitud de los parámetros de la fun-ción de distribución de probabilidad.

Estimadores de máxima verosimilitud

Con base en los principios contenidos en la sección anterior, la función logarítmica de ve-rosimilitud para la distribución TP3G para máximos esta dado en la ecuación 8.

Los parámetros de la distribución de valores extremos tipo I de tres poblaciones para má-ximos, se obtienen al maximizar directamente la Ecuación (8), por medio de un algoritmo de optimización no lineal conocido el método de como el método de Rosenbrock para variables múltiples restringidas (Kuester y Mize, 1973).

 
 
 
 
(8)

RESULTADOS Y DISCUSION

Se han escogido las muestras de gastos máximos anuales de las estaciones hidromé-tricas de Santa Cruz y Guamúchil, ubicadas en el estado de Sinaloa, y Villalba en el es-tado de Chihuahua, todas en el Noroeste de México (Figura 1), para obtener los estima-dores de máxima verosimilitud para el modelo propuesto (T3PG).

Estas estaciones hidrométricas se encuentran en un área que se ve afectada por la pre-sencia de huracanes frecuentemente durante el Verano-Otoño y por frentes fríos durante la época invernal, fenómenos que sumados al proceso local convectivo provocan que estas muestras de gastos máximos anuales evi-dencien la presencia de más de una pobla-ción en sus valores.



Fig. 1: Regiones hidrológicas de México (SRH, 1974)

En la Figura 2 se muestran los ciclones, en la categoría de huracán, que impactaron las costas de México en el periodo 1980-2002.



Fig. 2: Lugares de impactos de ciclones, en la categoría de huracán, en Sinaloa, México du-rante el periodo 1980-2002 (SMN, 2003)

1) Estación Hidrométrica Santa Cruz, Méx. Los valores estadísticos de la media, desvia-ción estándar y coeficiente de asimetría de la muestra de gastos máximos anuales de la es-tación hidrométrica Santa Cruz son:

media = 1228.42 m3/s
desviación estándar = 1203.99 m3/s

Los parámetros de la distribución de valores extremos tipo I para una sola población para la estación Santa Cruz son:

X0 = 799.12 m3/s
a = 634.46m3/s

Los parámetros de la distribución de valores extremos tipo I para tres poblaciones para la estación Santa Cruz son:

X01 = 351.30 m3/s
a 1 = 254.99 m3/s
p1 = 0.3410

X02 = 898.68 m3/s
a 2 = 121.96 m3/s
p2 = 0.4010

X03 = 1893.20 m3/s
a 3 = 1139.43 m3/s
p3 = 0.2580

2) Estación Hidrométrica Guamúchil, Méx. Los valores estadísticos de la media, des-viación estándar y coeficiente de asimetría de la muestra de gastos máximos anuales de la estación hidrométrica Guamúchil son:

media = 580.78 m3/s
desviación estándar = 635.36 m3/s

Los parámetros de la distribución de valores extremos tipo I para una sola población para la estación Guamúchil son:

X0 = 352.37 m3/s
a = 342.49m3/s

Los parámetros de la distribución de valores extremos tipo I para tres poblaciones para la estación Guamúchil son:

X01 = 8.88 m3/s
a 1 = 7.97 m3/s
p1 = 0.1000

X02 = 230.23m3/s
a 2 = 188.29 m3/s
p2 = 0.7000

X03 = 999.90 m3/s
a 3 = 622.42 m3/s
p3 = 0.2000

3) Estación Hidrométrica Villalba, Méx.Los valores estadísticos de la media, des-viación estándar y coeficiente de asimetría de la muestra de gastos máximos anuales de la estación hidrométrica Villalba son:

Media = 393.98 m3/s
desviación estándar = 355.40 m3/s

Los parámetros de la distribución de valores extremos tipo I para una sola población para la estación Villalba son:

X0 = 230.66 m3/s
a = 178.96 m3/s

Los parámetros de la distribución de valores extremos tipo I para tres poblaciones para la estación Villalba son:

X01 = 124.57m3/s
a 1 = 80.98 m3/s
p1 = 0.38

X02 = 322.99 m3/s
a 2 = 133.20 m3/s
p2 = 0.58

X03 = 1835.04 m3/s
a 3 = 217.90 m3/s
p3 = 0.03

Para comparar estos resultados con los producidos por modelos ampliamente usados como la distribución de valores extremos I (VEI) para una población, en las tablas 1, 2 y 3 se presentan los valores de diseño para diferentes periodos de retorno, así como sus errores estándar de ajuste, EE, producidos por el método considerando una sola pobla-ción y el propuesto en este artículo para tres poblaciones. El EE está definido como,(Kite, 1988):

(9)

donde xi son los valores históricos de la muestra de datos, yi son los valores produ-cidos por la función de distribución correspon-diente a los periodos de retorno de los valores históricos, N es el tamaño de la muestra y mj es el número de parámetros de la función de distribución.

Una representación gráfica del ajuste rea-lizado para el modelo propuesto, puede observarse en las Figuras 3, 4 y 5 anexas.



Período de Retorno

Fig. 3: Gráfica de los datos de la muestra (+) y los producidos por el modelo ajustado (ž) para la estación Santa Cruz, Méx.



Período de Retorno

Fig. 4: Gráfica de los datos de la muestra (+) y los producidos por el modelo ajustado (ž) para la estación Guamúchil, Méx.



Período de Retorno

Fig. 5: Gráfica de los datos de la muestra (+) y los producidos por el modelo ajustado (ž) para la estación Villalba, Méx.

Con base en las muestras de datos ana-lizadas, de las cuales sólo dos se incluyen en el artículo como ejemplos de aplicación, se ha observado que, en todos los casos analiza-dos, el procedimiento pudo implementarse, aunque hubo problemas de convergencia en algunas muestras analizadas. Esta situación es normal cuado se utilizan modelos de dos o más poblaciones, siendo la distribución TCEV la que más frecuentemente presenta esta situación de no convergencia, cuando se utili-za el método de máxima verosimilitud.

Como es usual, el utilizar una metodología de tres poblaciones en lugar de una sola, en aquellos sitios de medición que están en una región meteorológicamente homogénea don-de ocurren más de un tipo de precipitación, el ajuste tiende a ser mucho mejor al tener di-chas distribuciones de probabilidad una ma-yor flexibilidad de ajuste, como puede bóxer-varse en los resultados consignados en las tablas 1, 2 y 3 bajo el concepto designado co-mo EE, el error estándar de ajuste.


Tabla 1: Comparación entre los valores de diseño y errores estándar de ajuste entre los modelos de una población y tres poblaciones, Estación Hidrométrica Santa Cruz, Méx.

DIST.

Q10

Q20

Q50

Q100

EE

TP3G

2704

3642

1736

4760

391

VEI

2226

2683

1176

3275

642


Tabla 2: Comparación entre los valores de diseño y errores estándar de ajuste entre los modelos de una población y tres poblaciones, Estación Hidrométrica Guamúchil, Méx.

DIST.

Q10

Q20

Q50

Q100

EE

TP3G

1268

1779

2400

2848

245

VEI

1123

1370

1689

1928

337


Tabla 3: Comparación entre los valores de diseño y errores estándar de ajuste entre los modelos de una población y tres poblaciones, Estación Hidrométrica Villalba, Méx.

DIST.

Q10

Q20

Q50

Q100

EE

TP3G

613

828

1890

2086

56

VEI

633

762

928

1054

255


Para los ejemplos de aplicación mostrados, el modelo propuesto reduce el error estándar de ajuste a más la mitad del valor obtenido por el modelo de una sola población en el primer caso, una cuarte parte para el segundo caso y a casi la quinta parte para el tercero. Esta es una cualidad muy relevante de la metodología propuesta.

Es claro que para la tercera muestra, Villalba, Méx., el modelo evidencia que prácticamente sólo hay dos poblaciones presentes, la tercera población es demasiado pequeña para considerarla como un elemento real. Esta capacidad que tiene el modelo para hacer este tipo de discriminación, es un elemento de análisis muy útil también ya que permite ajustar el modelo a utilizar y evita el modelado excesivo para un caso particular.

Cuando puede demostrarse que una muestra de gastos máximos anuales proviene de dos o más poblaciones, el usar metodologías como la propuesta produce resultados que me-joran los obtenidos por el procedimiento tradicional de considerar que la muestra proviene de una sola población. De hecho, el modelado de gastos máximos anuales se realiza adecuadamente considerando los factores que realmente están presentes en la muestra y no suponiendo que sólo provienen de un mecanismo productor de precipitación.

La metodología propuesta tiene, sin embargo, la necesidad de contar con un equipo de cómputo personal, sin él, es prácticamente imposible aplicarla dada la complejidad de los procesos numéricos a realizar. Esta aparente desventaja tiende a desaparecer porque los equipos de cómputo personal se generalizan cada vez más en la práctica ingenieril. Los equipos de cómputo personal de cada nueva generación poseen capacidades aumentadas, mayor portabilidad y una reducción asociada de tamaño.

CONCLUSIONES

El procedimiento para calcular los estimadores de los parámetros de la distribución de valores extremos tipo I para tres poblaciones (T3PG), utilizando el método de máxima verosimilitud ha sido presentado.

La distribución T3PG se ha comportado muy bien en las muestras analizadas en el estudio, de las cuales sólo se han incluido dos en este artículo.

Cabe mencionar que en algunas muestras se ha observado falta de convergencia al tratar de estimar los parámetros de la distribución, esta situación frecuentemente se observa al aplicar la distribución de valores extremos de dos componentes (TCEV), la cual es un modelo muy utilizado en el análisis de frecuencias de gastos máximos considerando dos poblaciones.

AGRADECIMIENTOS

A la Universidad de las Américas, Puebla por el apoyo y las facilidades otorgadas para la realización de este artículo.

REFERENCIAS

Beran, M., J.R.M. Hosking, y N. Arnell, Comment on Two Component Extreme Value Distribution for Flood Frequency Analysis by Rossi et al, Wat. Resour. Res., 22(2), 263-266 (1986).        [ Links ]

Canfield, R.V. The Distribution of the Extremes of a Mixture of Random Variable with Applications to Hydrology, in Input for Risk Analysis in Water Systems, E.A. McBean, K. W. Hipel and T. E. Unny, eds., Water Resources Publications, 77-84 (1979).        [ Links ]

Castillo, E., Extreme Value Theory in Engineering, Academic Press (1988).        [ Links ]

García-Valenzuela, L.G., Paquete Interactivo para Distribuciones de Valores Extremos Mixtas de Tres Poblaciones y sus Aplicaciones en Análisis de Gastos Máximos, Tesis de Licenciatura, Departamento de Ingeniería Civil, Universidad de las Américas, Puebla, 100 págs. (1999).        [ Links ]

González-Villarreal, F.J., Contribución al Analisis de Frecuencias de Valores Extremos de Gastos Máximos en un Río, Reporte # 277, Instituto de Ingeniería, Universidad Nacional Autónoma de México, México, D.F., Méx. (1970).        [ Links ]

Gumbel, E.J. Statistics of Extremes, Columbia University Press, New York, N.Y., 8, (1958)        [ Links ]

Gutiérrez-Ojeda, C. y J.A. Raynal Villaseñor, Distribuciones   Mezcladas  en  el Análisis de Frecuencias de  Gastos Máximos,  X  Congreso  Nacional de Hidráulica, Morelia, Mich., Méx., 220-228 (1988).        [ Links ]

Haan, C.T. Statistical Methods in Hydrology, The Iowa State University Press, Ames, Iowa, 63,(1977).        [ Links ]

Kite, G.W. Frequency and Risk Analyses in Hydrology, Water Resources Publications, Littleton, Colorado, 187 (1988)..        [ Links ]

Kuester, J.L. y J.H. Mize, Optimization Techniques with FORTRAN, Mc-Graw Hill Book Co., 386-398 (1973).        [ Links ]

Mood, A.M., F. Graybill, y D.C. Boes, Introduction to the Theory of Statistics, McGraw Hill Inc., Third Ed., New York, N. Y., 276-286 (1974).         [ Links ]

NERC, Natural Environment Research Council, Flood Studies Report, I, Hydrologic Studies, Whitefriars Press Ltd., London, 51 (1975).        [ Links ]

Rao, A.R. y K.H. Hamed, Flood Frequency Analysis, CRC Press (2000).        [ Links ]

Raynal-Villaseñor, J.A., y O.D. Santillán Hernández, Estimadores de Máxima Verosimilitud para los Parámetros de la distribución GVE Mixta, IX Congreso Nacional de Hidráulica, Querétaro, Qro., Méx., 79-90 (1986).        [ Links ]

Raynal-Villasenor, J.A. y J.L Guevara Miranda, Maximum Likelihood Estimators for the Two Populations Gumbel Distribution, Hydrological Science and Technology J., 14 (1-4), 15-24 (1998).        [ Links ]

Rossi, F., M. Florentino, y P. Versace, Two Component Extreme Value Distribution for Flood Frequency Analysis, Wat. Resour. Res., 20(7), 847-856 (1984).        [ Links ]

SMN, Servicio Meteorológico Nacional, Fenómenos Hidrometerológicos Extremos en la Categoría de Huracán que Impactaron Directamente a México de 1980 a 2002, http://smn.cna.gob.mx/ (2003).        [ Links ]

Todorovic, P. y J. Rousselle, Some Problems of Flood Analysis, Water Resources Research, 7(5),1144-1150 (1971).        [ Links ]