You are on page 1of 21

WATER RESOURCES RESEARCH, VOL. 46, W10531, doi:10.

1029/2009WR008933, 2010

Una función de verosimilitud formal para el


parámetro y la inferencia predictiva de modelos
hidrológicos con errores correlacionados,
heteroscedásticos y no gaussianos
Gerrit Schoups1 and Jasper A. Vrugt2,3,4
Received 26 November 2009; revised 22 May 2010; accepted 10 June 2010; published 20 October 2010.

[1] La estimación de parámetros y la incertidumbre predictiva de los modelos hidrológicos se han basado tradicionalmente en varias
suposiciones simplificadoras. Con frecuencia, se supone que los errores residuales son independientes y se describen
adecuadamente mediante una distribución de probabilidad gaussiana con una media de cero y una varianza constante. Aquí
investigamos hasta qué punto las estimaciones de los parámetros y la incertidumbre predictiva se ven afectadas cuando estas
suposiciones se relajan. Se presenta una función formal de verosimilitud generalizada, que amplía la aplicabilidad de las funciones
de verosimilitud previamente utilizadas a situaciones en las que los errores residuales están correlacionados, heteroscedástico y
no gaussiano con grados variables de curtosis y asimetría. El enfoque se centra en una descripción estadística correcta de los datos
y los residuales totales del modelo, sin separar varias fuentes de error. La aplicación al análisis bayesiano de incertidumbre de un
modelo conceptual de precipitación-escorrentía identifica simultáneamente los parámetros del modelo hidrológico y la distribución
estadística apropiada de los errores residuales. Cuando se aplica a los datos diarios de precipitación-escorrentía de una cuenca
húmeda, encontramos que (1) los errores residuales se describen mejor mediante un modelo de error heteroscedástico de primer
orden autocorrelacionado con una función de distribución laplaciana caracterizada por colas más pesadas que una distribución
gaussiana ; y (2) en comparación con un enfoque de mínimos cuadrados estándar, la representación adecuada de la distribución
estadística de errores residuales produce bandas de incertidumbre predictiva más ajustadas y estimaciones de incertidumbre de
parámetros diferentes que son menos sensibles al período de tiempo particular utilizado para la inferencia. La aplicación a los datos
de escorrentía pluvial diaria de una cuenca semiárida con errores residuales más significativos y subestimación sistemática de los
picos muestra que (1) los factores de sesgo multiplicativos se pueden usar para compensar algunos de los errores más grandes y
(2) los rendimientos de distribución de errores sesgados estimaciones mejoradas de la incertidumbre predictiva en esta cuenca
semiárida con flujos cercanos a cero. Concluimos que la metodología presentada proporciona estimaciones mejoradas de los
parámetros y la incertidumbre de predicción total y también debería ser útil para el manejo de errores residuales complejos en
otros modelos de regresión hidrológica.

Cita: Schoups, G. y J. A. Vrugt (2010), una función de verosimilitud formal para el parámetro y la inferencia predictiva de modelos
hidrológicos con errores correlacionados, heterocedásticos y no gaussianos, Water Resour. Res., 46, W10531,

doi: 10.1029 / 2009WR008933.

1 Department of Water Management, Delft University of Technology, Delft, Netherlands.


2 Center for Nonlinear Studies, Los Alamos National Laboratory, Los Alamos, New Mexico, USA.
3 Institute for Biodiversity and Ecosystem Dynamics, University of Amsterdam, Amsterdam, Netherlands.
4 Department of Civil and Environmental Engineering, University of California, Irvine, California, USA.

W10531
WATER RESOURCES RESEARCH, VOL. 46, W10531, doi:10.1029/2009WR008933, 2010
estudios se observa como un aumento en la varianza del error
1. Introducción con la descarga del flujo de agua [Sorooshian y Dracup, 1980].
La violación de las suposiciones de SLS puede introducir un
[2] La evaluación del parámetro y la incertidumbre predictiva de sesgo en los valores estimados de los parámetros y afectar el
los modelos hidrológicos es una parte esencial de cualquier parámetro y la incertidumbre predictiva [Thyer et al., 2009].
estudio hidrológico. El análisis de incertidumbre forma la base Alternativamente, se han propuesto funciones informales de
para la comparación y selección de modelos [Schoups et al., verosimilitud como un enfoque pragmático para la estimación
2008], permite identificar estrategias sólidas de gestión del agua de la incertidumbre en presencia de estructuras complejas de
que tienen en cuenta las incertidumbres de predicción [Ajami et error residual. Un ejemplo bien conocido es la metodología de
al., 2008] y proporciona un impulso para la recolección de datos estimación de incertidumbre de verosimilitud generalizada de
para mejorar las predicciones hidrológicas y la gestión del agua Beven y Freer [2001]. Aquí la función de verosimilitud se
[Feyen y Gorelick, 2004]. Además, a menudo se requiere una especifica a priori sin vincularla explícitamente a un modelo de
estimación precisa de la incertidumbre de parámetros para la error subyacente. El modelador tiene flexibilidad para
regionalización y la extrapolación de parámetros hidrológicos a especificar la forma de la función de verosimilitud, lo que hace
cuencas no sometidas a pruebas [Vrugt et al., 2002; Zhang et al., que el enfoque informal sea atractivo en situaciones en las que
2008]. se violan los supuestos de error tradicionales. Por ejemplo,
[3] El análisis de incertidumbre se basa comúnmente en un Beven et al. [2008] han defendido el uso de una función de
modelo de regresión, donde las observaciones se representan verosimilitud plana para evitar el exceso de acondicionamiento
mediante la suma de un componente determinista, es decir, el del modelo de error estadístico en un solo conjunto de datos de
modelo hidrológico y un componente aleatorio que describe los calibración. Sin embargo, dado que el enfoque informal no hace
errores o residuos restantes. Estos errores residuales referencia explícita al modelo de error subyacente, sus
normalmente consisten en una combinación de entrada, suposiciones son implícitas y no pueden verificarse a posteriori.
modelo estructural, salida y errores de parámetros. Las Más discusión y comparación de enfoques formales e informales
inferencias de los parámetros del modelo se basan en una son dados por Mantovan y Todini [2006], Beven et al. [2008],
función de verosimilitud que cuantifica la probabilidad de que Vrugt et al. [2008b], Stedinger et al [2008], y McMillan y Clark
los datos observados hayan sido generados por un conjunto de [2009].
parámetros particular [Box y Tiao, 1992]. El mapeo del espacio [6] El objetivo principal de este trabajo es ampliar la
de parámetros al espacio de verosimilitud da como resultado la aplicabilidad del enfoque formal derivando y aplicando una
identificación de un rango de conjuntos de parámetros función de verosimilitud formal basada en un modelo de error
plausibles dados los datos y permite la estimación del general que permite el sesgo del modelo y la correlación, no
parámetro y la incertidumbre predictiva. estacionariedad y no normalidad de los residuos del modelo.
[4] En los últimos años, gran parte del debate se ha centrado en Como tal, conservamos las ventajas del enfoque formal (base
el uso de un enfoque formal o informal para especificar la teórica y posibilidad de verificación diagnóstica de los supuestos
función de verosimilitud [Mantovan y Todini, 2006; Beven et al., del modelo de error), al tiempo que obtenemos flexibilidad y
2008; Vrugt et al., 2008b; Stedinger et al., 2008; McMillan y reducimos la necesidad de suposiciones poco realistas sobre los
Clark, 2009]. En el enfoque formal, se parte de un modelo errores residuales.
estadístico supuesto para los errores residuales, es decir, la [7] Construimos sobre enfoques formales previos que se han
forma funcional de la función de densidad de probabilidad utilizado para relajar algunas de las suposiciones de error de SLS
conjunta (pdf) de los errores residuales se especifica a priori. [Sorooshian y Dracup, 1980; Kuczera, 1983; Thiemann et al.,
Este modelo estadístico se usa luego para derivar la forma 2001; Bates y Campbell, 2001]. En particular, seguimos a Bates
apropiada para la función de verosimilitud [Box y Tiao, 1992]. y Campbell [2001] y damos cuenta de la dependencia en serie
Por ejemplo, suponiendo que los errores son independientes y de los errores residuales utilizando un modelo de serie temporal
se distribuyen de forma idéntica según una distribución normal general autorregresivo (AR). La principal contribución de
con media cero y una varianza constante 𝜎 2 , se obtiene el nuestro trabajo radica en el tratamiento de heterocedasticidad
enfoque de mínimos cuadrados estándar (SLS) para la y anormalidad, mientras que los enfoques anteriores han
estimación de parámetros. Una ventaja del enfoque formal es utilizado datos y transformaciones de respuesta modelo, por
que los supuestos del modelo de error se establecen ejemplo, transformaciones de Box-Cox [Box y Tiao, 1992], para
explícitamente, y su validez se puede verificar a posteriori [por inducir homoscedasticity (varianza constante) y eliminar
ejemplo, Stedinger et al., 2008]. asimetria , en cambio, confiamos en un modelo estadístico
[5] El enfoque formal ha sido criticado por confiar demasiado en explícito para dar cuenta de heterocedasticidad y anormalidad.
las suposiciones residuales de error que no son válidas en La desviación estándar de error se modela como una función
muchas aplicaciones [Beven et al., 2008]. En muchos casos, los lineal del flujo de flujo simulado, y la no normalidad se tiene en
errores residuales están correlacionados, no son estacionarios y cuenta con una distribución de error paramétrico que permite
no gaussianos [Kuczera, 1983]. Una forma común de no un control separado de la curtosis y la asimetría en los residuos
estacionariedad es la heterocedasticidad, que en muchos del modelo. Como se analiza a continuación, nuestro enfoque es

W10531
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
a la vez más flexible e intuitivo en comparación con el método donde 𝒀 es un vector de 𝑛 observaciones de flujo de corriente;
de transformación. El foco está en la simulación y 𝑬 es un vector correspondiente de valores esperados; y 𝒆 es un
representación correctas de los errores residuales totales, es vector de errores o residuales aleatorios de media cero, incluida
decir, la medición, la entrada del modelo y los errores la medición, la entrada del modelo y los errores estructurales
estructurales del modelo se tratan de forma agrupada, en del modelo.
oposición a los intentos recientes de separar las diversas fuentes
de error en el modelado hidrológico [Kavetski et al. 2006a; [10] Los valores esperados se modelan utilizando un modelo
Kuczera et al., 2006; Gotzinger y Bardossy, 2008; Vrugt et al., hidrológico ℎ basado en el balance de masa, que arroja valores
2008b; Reichert y Mieleitner, 2009; Thyer et al., 2009; Renard et simulados 𝒀ℎ en función de una entrada observada 𝑿 y un
al., 2010]. El enfoque agrupado proporciona una menor vector de parámetros modelo 𝜼ℎ . Como los errores en las
comprensión de las fuentes de error, pero arroja estimaciones observaciones 𝒀, el modelo de entrada 𝑿 y la estructura del
prácticas del parámetro y la incertidumbre de la predicción modelo pueden llevar a desviaciones sistemáticas o sesgos en
total. las predicciones del modelo hidrológico, se introducen factores
de sesgo multiplicativos.
[8] La siguiente sección presenta el enfoque de modelado
estadístico, deriva una nueva función de verosimilitud para la 𝐸𝑡 = 𝑌ℎ,𝑡 (𝑿|𝜼ℎ )𝜇𝑡 , (2)
inferencia de parámetros y describe un método para la donde el flujo medio 𝐸𝑡 , el flujo simulado hidrológicamente 𝑌ℎ,𝑡 ,
simulación predictiva. La metodología se aplica en la sección 3 y el factor de polarización 𝜇𝑡 varían todos como una función del
para estimar el parámetro y la incertidumbre predictiva de un tiempo 𝑡. El factor de sesgo puede tratarse como una variable
modelo de precipitación pluvial espacialmente agrupado, estocástica, similar al enfoque de multiplicador de lluvia
utilizando datos sintéticos y reales de una cuenca húmeda y una introducido por Kavetski et al. [2006a, 2006b] para explicar los
semiárida. Siguiendo a Thyer et al. [2009], evaluamos los efectos errores de entrada del modelo, o el enfoque de parámetros de
de las suposiciones en el modelo de error sobre la incertidumbre modelo de tiempo variable de Kuczera et al. [2006] para dar
de los parámetros y la predicción. La Sección 4 discute y resume cuenta de los errores estructurales del modelo. Aquí se intenta
nuestros hallazgos. un enfoque más simple parametrizando los factores de
polarización como una función del flujo simulado 𝑌ℎ,𝑡 ,
2. Estimación formal de la incertidumbre de la 𝜇𝑡 = exp(𝜇ℎ 𝑌ℎ,𝑡 ), (3)
verosimilitud
donde 𝜇ℎ es un parámetro de sesgo que se deduce de los datos.
2.1. Formulación modelo La ecuación (3) proporciona una forma simple de amplificar la
[9] Nuestro análisis se basa en un modelo aditivo de regresión no linealidad de la respuesta esperada lluvia-escorrentía.
no lineal de la forma, También se podrían usar otros enfoques, como la
parametrización de 𝜇𝑡 como función de la precipitación
𝒀 = 𝑬 + 𝒆, (1) (retardada).

Figura 1. Densidades de la distribución de potencia exponencial sesgada (SEP) con media cero y desviación estándar unitaria para
varios valores de los parámetros de curtosis (𝛽) y sesgo (𝜉).

[11] Los errores residuales 𝒆 se caracterizan por una función de acuerdo con una densidad gaussiana 𝑁 (0, 𝜎 2 ). Sin embargo,
densidad de probabilidad conjunta (pdf) y un vector de en aplicaciones hidrológicas, los errores residuales
parámetros 𝜼𝑒 . Un enfoque común es suponer que los errores generalmente violan estas suposiciones, ya que muestran
son independientes e idénticamente distribuidos (i.i.d.) de correlación temporal, varianza no constante

3
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
(heterocedasticidad) y no normalidad. Para tratar con estas más altos [Sorooshian y Dracup, 1980; Di Baldassarre y
situaciones no ideales, proponemos el siguiente modelo para Montanari, 2009]. Thyer y cols. Usaron un modelo
los errores residuales 𝑒𝑡 , heteroscedástico similar. [2009], aunque en su estudio, se usó
como un modelo de error de medición del flujo, con los
Φ𝑝 (𝐵)𝑒𝑡 = 𝜎𝑡 𝑎𝑡 con 𝑎𝑡 ~SEP(0,1, 𝜉, 𝛽), (4) parámetros 𝜎0 y 𝜎1 estimados utilizando los datos de la curva
Donde
𝑝
Φ𝑝 (𝐵) = 1 − ∑𝑖=1 𝜙𝑖 𝐵𝑖 es un polinomio de clasificación y fijados antes de la calibración del modelo
hidrológico. Aquí, la ecuación (5) se usa para representar la
autorregresivo con parámetros 𝑝 autorregresivos 𝜙𝑖 , B, es el
heterocedasticidad de los residuales totales del modelo
operador de cambio de retroceso (𝐵𝑖 𝑒𝑡 = 𝑒𝑡−𝑖 ), 𝜎𝑡 es la
(incluidos la observación, la entrada y los errores estructurales),
desviación estándar en el tiempo 𝑡, y 𝑎𝑡 es un i.i.d. error
y los parámetros 𝜎0 y 𝜎1 se deducen simultáneamente con los
aleatorio con media cero y desviación estándar unitaria,
parámetros del modelo hidrológico.
descrita por una densidad de potencia exponencial oblicua
(SEP), que se definirá a continuación, con los parámetros 𝜉 y 𝛽 [14] Finalmente, la densidad de 𝑆𝐸𝑃 (0, 1, 𝜉, 𝛽) en la ecuación
para dar cuenta de la anormalidad. (4) explica la anormalidad de los residuales del modelo, con el
pdf expresado como (ver el Apéndice A para más detalles).
[12] El modelo autorregresivo de orden p, AR (p), en la ecuación
(4) explica la dependencia y la correlación entre los errores. El 2𝜎𝜉 2⁄(1+𝛽)
modelo podría extenderse más a modelos autorregresivos y 𝑝(𝑎𝑡 |𝜉, 𝛽) = −1
𝜔𝛽 exp {−𝑐𝛽 |𝑎𝜉,𝑡 | }, (6)
𝜉+𝜉
promedio móvil (ARMA) más generales, como lo hizo Kuczera
[1983]. Sin embargo, la literatura publicada y la experiencia con donde 𝑎𝜉,𝑡 = 𝜉 −𝑠𝑖𝑔𝑛(𝜇𝜉 +𝜎𝑡 𝑎𝑡) (𝜇𝜉 + 𝜎𝑡 𝑎𝑡 ), y los valores de
la simulación de errores residuales de los modelos de 𝜇𝜉 , 𝜎𝜉 , 𝑐𝛽 , 𝜔𝛽 se calculan en función del parámetro de asimetría
precipitación y escorrentía sugieren que los modelos 𝜉 y el parámetro de curtosis 𝛽, como se detalla en el Apéndice
autorregresivos (AR) suelen ser suficientes. Además, Bates y A. Curtosis el parámetro 𝛽 toma valores entre -1 y + 1 y
Campbell [2001] señalan que la aproximación de los modelos determina el pico del pdf, mientras que el parámetro de
ARMA por los modelos AR de orden superior evita los asimetría 𝜉 afecta la asimetría (𝑥 > 0), como se ilustra en la
problemas con los óptimos locales múltiples en los modelos Figura 1. La densidad es simétrica para 𝜉 = 1 y positivamente
ARMA. Por lo tanto, para propósitos prácticos, limitamos (negativamente) sesgado para 𝜉 > 1 (𝜉 < 1). En el caso de
nuestra presentación a los modelos AR, pero de ser necesario, una densidad simétrica, se obtiene una distribución uniforme
el enfoque podría adaptarse fácilmente para incluir modelos cuando 𝛽 = −1, una distribución gaussiana cuando 𝛽 = 0, y
ARMA. una distribución de Laplace o doble exponencial cuando 𝛽 =
1. Por lo tanto, los parámetros 𝜉 y 𝛽 nos permiten relajar el
[13] La heterocedasticidad se explica explícitamente
supuesto de Errores gaussianos En particular, los valores para
suponiendo que la desviación estándar de error 𝜎𝑡 aumenta
𝛽 > 0 resultan en más densidades puntuadas con colas más
linealmente con el flujo medio 𝐸𝑡 ,
pesadas en comparación con un pdf Gaussiano, que es útil para
𝜎𝑡 = 𝜎0 + 𝜎1 𝐸𝑡 , (5) hacer robusta la inferencia de parámetros contra valores
atípicos.
donde 𝜎0 y 𝜎1 son parámetros que se deducen de los datos. Las
desviaciones estándar de error típicamente aumentan como Tabla 1. Varias funciones de verosimilitud utilizadas en la
una función del flujo, es decir, 𝜎1 > 1, por ejemplo, debido a la literatura hidrológica, sus supuestos y su relación con la
creciente incertidumbre en la relación etapa-descarga a flujos ecuación (8) en este articuloa

a
Sesgo nunca se incluye, es decir, m1 = 0 en la ecuación (3).

4
WATER RESOURCES RESEARCH, VOL. 46, W10531, doi:10.1029/2009WR008933, 2010
2.2. Parámetro Incertidumbre observado y simulado para explicar los errores
heteroscedásticos y asimétricos. Un enfoque similar fue
[15] El modelo formulado en la sección anterior contiene una adoptado por Bates y Campbell [2001], pero utilizando AR en
serie de parámetros 𝜼 = {𝜼ℎ , 𝜼𝑒 }, incluidos los parámetros del lugar de modelos ARMA para dar cuenta de la correlación.
modelo hidrológico 𝜼ℎ y el modelo de error residual 𝜼𝑒 . La Finalmente, Thiemann et al. [2001] descuidó la correlación de
incertidumbre del parámetro después de observar los datos 𝒀 errores, pero propuso la distribución de potencia exponencial
puede expresarse mediante un parámetro posterior pdf [Box y [Box y Tiao, 1992] para modelar la curtosis, mientras usaba una
Tiao, 1992], log-transformación para explicar la heterocedasticidad y la
𝑝(𝜼|𝒀) ∝ ℓ(𝜼|𝒀)𝑝(𝜼), (7) asimetría. Debe quedar claro a partir de la Tabla 1 que la
función de verosimilitud logarítmica en la ecuación (8)
donde 𝑝(𝜼) es el pdf previo de los parámetros, lo que refleja el generaliza los enfoques previos e introduce flexibilidad
conocimiento de los parámetros antes de que los datos 𝒀 estén adicional para dar cuenta simultáneamente de los residuos
disponibles, y ℓ(𝜼|𝒀) es la función de verosimilitud. En el correlacionados, heteroscedásticos y no gaussianos.
Apéndice B, una expresión para la función de verosimilitud se
deriva en base al modelo de error definido en las ecuaciones (4) [17] Con la especificación de un parámetro anterior pdf, la
- (6). La expresión resultante para la función log-verosimilitud ecuación (8) puede usarse para calcular la incertidumbre
es, posterior del parámetro usando la ecuación (7), por ejemplo,
mediante el muestreo repetido de Monte Carlo de conjuntos
2𝜎𝜉 𝜔𝛽 de parámetros del espacio de parámetros anterior. Esto se
𝐿(𝜼|𝒀) = 𝑛 log
𝜉 + 𝜉 −1 realiza de manera eficiente utilizando la simulación de la
𝑛 𝑛
2⁄(1+𝛽)
cadena Monte Carlo Markov (MCMC) [Bates y Campbell, 2001;
− ∑ log 𝜎𝑡 − 𝑐𝛽 ∑|𝑎𝜉,𝑡 | , (8) Vrugt et al., 2003; Engeland et al., 2005; Vrugt et al., 2006;
𝑡=1 𝑖=1 Kuczera y Parent, 1998; Smith y Marshall, 2008]. El algoritmo
donde los errores 𝑎𝜉,𝑡 y los valores para 𝜎𝑡 , 𝜎𝜉 , 𝑐𝛽 , 𝜔𝛽 se de MCMC utilizado en este documento se llama DREAM-ZS
(algoritmo de Metrópolis Adaptativa de DiffeRential Evolution)
calculan como se describe en la sección anterior. La función de
y fue desarrollado por Vrugt et al. [2009]. DREAM-ZS se basa en
verosimilitud logarítmica en la ecuación (8) relaja las
el algoritmo DREAM original [Vrugt et al., 2009] pero utiliza el
suposiciones comunes sobre los errores residuales y, por lo
muestreo de un archivo de estados pasados para generar
tanto, se prevé que sea más aplicable en los estudios
puntos candidatos en cada cadena individual. El muestreo del
hidrológicos. Esto se investigará en la sección 3, donde el
pasado evita la necesidad de un gran número de cadenas
rendimiento de la función de log-verosimilitud generalizada
paralelas, diseñadas para acelerar la convergencia en
("GL") en la ecuación (8) se comparará con el enfoque de
problemas de grandes dimensiones. La experiencia con
mínimos cuadrados estándar común ("SLS"). Como se discutió
DREAM-ZS sugiere que solo se necesitan tres cadenas paralelas
en el Apéndice B, la ecuación (8) es una función de log-
para explorar adecuadamente el PDF posterior, lo que reduce
verosimilitud condicional, válida para tamaños de muestra de
el tiempo requerido para la quema. Además, DREAM-ZS no
moderados a grandes 𝑛 típicamente disponible en aplicaciones
requiere la detección y eliminación de valores atípicos,
de precipitación-escorrentía. Por ejemplo, Sorooshian y Dracup
manteniendo un equilibrio detallado en cada paso en cada una
[1980] compararon las funciones de verosimilitud condicional y
de las cadenas paralelas. Finalmente, DREAM-ZS contiene una
exacta para el caso especial de un modelo de error de AR (1)
actualización de snooker para generar saltos más allá de las
con innovaciones gaussianas y encontraron que estaban muy
actualizaciones de dirección paralela [ter Braak y Vrugt, 2008] y
de acuerdo.
aumenta la diversidad de los puntos candidatos.
[16] La Tabla 1 resume varias funciones de verosimilitud
formales utilizadas anteriormente en aplicaciones de modelado 2.3. Incertidumbre predictiva
de precipitación-escorrentía y muestra cómo la función de [18] Además de la incertidumbre de los parámetros, también
verosimilitud logarítmica en la ecuación (8) puede reducirse a estamos interesados en la incertidumbre predictiva del
estas haciendo suposiciones específicas sobre los errores modelo. Los percentiles predictivos 𝒀𝛼 , que corresponden a
residuales. Por ejemplo, para errores gaussianos (𝜉 = 1, 𝛽 = una probabilidad de excedencia especificada 1 − 𝛼 se
0) que son homoscedásticos (𝜎1 = 0) e independientes (𝜙𝑖 = obtienen de la siguiente relación,
0), la ecuación (8) se reduce al enfoque SLS. También se
enumeran otras funciones de verosimilitud previamente 𝑃(𝒀 ≤ 𝒀𝜶 |𝑿) = 𝑃([𝒀ℎ (𝑿|𝜼ℎ )𝝁 + 𝒆(𝜼𝑒 )]1…𝐽 ≤ 𝒀𝛼 |𝑿)
utilizadas. Sorooshian y Dracup [1980] introdujeron un modelo = 𝛼, (9)
de error gaussiano multivariante y derivaron funciones de
donde 𝐽 parámetro establece 𝜼 = {𝜼ℎ , 𝜼𝑒 } se muestrean
verosimilitud para casos de errores heteroscedásticos, es decir,
aleatoriamente desde el parámetro posterior pdf obtenido con
varianza no constante o de autocorrelación de primer orden. Su
el algoritmo MCMC y se utilizan para generar series de tiempo
enfoque fue generalizado por Kuczera [1983], que consideró un
𝐽 para la salida del modelo 𝒀ℎ y los errores 𝒆. Estas series de
modelo ARMA general para los errores, en combinación con
tiempo 𝐽 corresponden a predicciones del modelo 𝐽 en cada
una transformación de Box-Cox del flujo de corriente
W10531
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
paso de tiempo, a partir de las cuales podemos calcular los exponencial sesgada 𝑆𝐸𝑃(0,1, 𝜉, 𝛽). Los correspondientes
percentiles de predicción 𝒀𝛼 para cada paso de tiempo (por errores heteroscedásticos y correlacionados se obtienen
ejemplo, tomando 𝛼 = 0.975 y 𝛼 = 0.025 rendimientos de usando la ecuación (4). Una función de MATLAB que
series de tiempo de los percentiles de predicción de 97.5% y implementa este algoritmo de simulación, así como también la
2.5%; que juntos constituyen las bandas de incertidumbre de función de verosimilitud logarítmica generalizada de la
predicción del 95%). Para 𝒆 = 0, obtenemos percentiles de ecuación (8), está disponible a petición del primer autor.
predicción 𝒀𝛼 debido a la incertidumbre en los valores del
parámetro del modelo hidrológico. La estimación de la
incertidumbre predictiva total requiere errores de cálculo 𝒆, lo 3. Aplicación al modelado de precipitación-
que implica generar muestras independientes de una escorrentía
distribución de SEP. Esto se hace usando el siguiente algoritmo [26] Usamos datos diarios de la precipitación media del área, la
basado en los estudios de Johnson [1979] y Würtz y Chalabi evaporación potencial media del área y el flujo de dos cuencas
[2009]: estadounidenses, a saber, la cuenca francesa Broad River en
[19] 1. Genere una muestra 𝑔𝑡 de la distribución 𝛾 con el Asheville, Carolina del Norte, y la cuenca del río Guadalupe en
parámetro de forma (1 + 𝛽) / 2 y el parámetro de escala 1. Spring Branch, TX. Estas son, respectivamente, la más húmeda
y más seca de las 12 cuencas MOPEX descritas en el estudio de
Duan et al. [2006]. Los registros diarios de precipitación y
evaporación potencial se ingresan en un modelo de
precipitación-escorrentía conceptual concentrado [Schoups et
al., 2010] basado en el sistema de modelado FLEX [Fenicia et
al., 2007] para simular el flujo de flujo diario. El modelo
considera la interceptación, la caída, la evaporación, la
generación de escorrentía, la percolación y el enrutamiento de
agua superficial y subterránea a la salida de la cuenca. Se
Figura 2. Estructura del modelo y parametrizaciones del proceso supone que la generación de escorrentía está dominada por un
hidrológico. Las cajas representan unidades de balance de agua flujo superficial saturado y se simula en función del
con los flujos de agua indicados simulados de la siguiente almacenamiento de agua de la cuenca sin una dependencia
manera: evaporación 𝐸𝐼 = 𝑚𝑖𝑛 (𝐸𝑝 , 𝑆𝐼,0 ), precipitación explícita de la intensidad de la lluvia. Esta suposición es
efectiva 𝑃 𝑒 = 𝑃 − (𝐼𝑚𝑎𝑥 − 𝑆𝐼,0 ), evaporación 𝐸𝑎 = (𝐸𝑝 − típicamente válida para climas templados, pero puede ser
𝐸𝐼 ) 𝑓 (𝑆𝑟 |𝛼𝐸 ), escorrentía 𝑄𝑟𝑢𝑛𝑜𝑓𝑓 = 𝑃 𝑒 𝑓(𝑆𝑟 |𝛼𝐹 ), violada en la cuenca semiárida del río Guadalupe. La
percolación 𝑄 𝑝𝑒𝑟𝑐 = 𝑄 𝑠𝑚𝑎𝑥 𝑓 (𝑆𝑟 |𝛼𝑆 ), flujo de flujo rápido acumulación de nieve y el deshielo no se tienen en cuenta,
𝑄𝐹 = 𝐾𝐹 𝑆𝐹 y flujo base 𝑄𝑆 = 𝐾𝑆 𝑆𝑆 . La relación funcional entre aunque estos procesos ocurren en la cuenca francesa de Broad
los flujos y el almacenamiento en el yacimiento no saturado se River. La severidad de estos errores estructurales del modelo se
1−𝑒 −𝛼𝑆𝑟 evaluará en los estudios de casos a continuación. En la Figura 2
parametriza como 𝑓(𝑆𝑟 |𝛼𝐹 ) = , donde 𝛼 es un se muestran las parametrizaciones de la estructura del modelo
1−𝑒 −𝛼
parámetro específico del proceso. Todos los parámetros se y del proceso hidrológico. Obsérvese que nuestro enfoque es
enumeran y explican en la Tabla 2. similar a las estructuras conceptuales de escorrentía pluvial
utilizadas comúnmente: el almacén no lineal de contabilidad de
[20] 2. Genera un signo aleatorio 𝑠𝑡 (+1 𝑜 − 1) con la misma humedad del suelo combinado con reservorios paralelos para
probabilidad. una respuesta hidrológica lenta y rápida fue defendido por
Γ1⁄2 [(1+𝛽)⁄2] Jakeman y Hornberger [1993] y se ha utilizado en muchos otros
[21] 3. Calcula 𝐸𝑃𝑡 = 𝑠𝑡 |𝑔𝑡 |(1+𝛽)⁄2 , que es una estudios también. El modelo incluye un total de siete
Γ1⁄2 [3(1+𝛽)⁄2]
muestra de la distribución de potencia exponencial, parámetros hidrológicos que deben estimarse, como se resume
𝐸𝑃 (0, 1, 𝛽). en la Tabla 2. Suponemos los residuos que se describirán
mediante un modelo de error autorregresivo de primer orden,
[22] 4. Genera un signo aleatorio 𝑤𝑡 (+1 𝑜 − 1) con la ecuación (4), con el coeficiente de correlación 𝜙1 . Este
𝜉 𝜉
probabilidades 1 − −1 y −1 . modelo AR (1) se extenderá a modelos AR de orden superior si
𝜉+𝜉 𝜉+𝜉
así lo determinan los datos.
[23] 5. Calcule 𝑆𝐸𝑃𝑡 = −𝑤𝑡 𝐼𝐸𝑃𝑡 |𝜉 𝑤𝑡 , que es una muestra de la
distribución de potencia exponencial oblicua, 𝑆𝐸𝑃(𝜇𝜉 , 𝜎𝜉 , 𝜉, 𝛽), [27] La Tabla 2 resume todos los parámetros hidrológicos y del
con 𝜇𝜉 y , 𝜎𝜉 dados por (A5) y (A6). modelo de error y sus intervalos de incertidumbre previos.
Suponemos priors uniformes para todos los parámetros, que se
[24] 6. Normalizar: 𝑎𝑡 = (𝑆𝐸𝑃𝑡 − 𝜇𝜉 ) / 𝜎𝜉 considera aceptable aquí debido a la gran cantidad de puntos
de datos utilizados (𝑛 = 1825). Con un tamaño de muestra
[25] El algoritmo se repite 𝑛 veces (𝑡 = 1 . . . 𝑛) para obtener más pequeño, se debe prestar más atención a la selección de
𝑛 muestras independientes a partir de la densidad de potencia los antes y su efecto en el posterior. Además de los parámetros
6
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
hidrológicos, es necesario estimar un máximo de cinco entre los valores del parámetro de verosimilitud y máxima que
parámetros del modelo de error a partir de los datos de son pequeños en comparación con los intervalos de
descarga medidos. Sin embargo, como se analizará en los incertidumbre del parámetro del 95% obtenidos en cada caso.
siguientes estudios de casos, el número de parámetros del De los resultados en la Tabla 3, se concluye que el algoritmo
modelo de error varía según cada caso, según lo dicten los MCMC es capaz de inferir de forma simultánea los parámetros
datos. La discusión de los resultados en las siguientes secciones correctos del modelo hidrológico y de error. Estos resultados
se enfocará en el parámetro y la incertidumbre predictiva confirman que tanto el método de inferencia en la sección 2.2,
estimada usando la función de verosimilitud formal basado en el modelo de error de la ecuación (4) y la
generalizada derivada en la ecuación (8). En lo sucesivo, estos correspondiente función de verosimilitud de log de la ecuación
resultados se denominan "GL" (probabilidad generalizada). (8), y el método de simulación en la sección 2.3, se implementan
Para comparar nuestros resultados, incluiremos una correctamente. En las siguientes secciones investigamos si el
comparación con un enfoque de mínimos cuadrados estándar modelo de error definido en la ecuación (4) proporciona una
("SLS"), asumiendo residuos de error gaussianos representación precisa de los errores residuales encontrados
independientes, homoscedásico. en las aplicaciones de precipitación-escorrentía.

Tabla 2. Rangos de incertidumbre anteriores de los parámetrosa 3.2. Primer estudio de caso: Cuenca French Broad
hidrológicos y del modelo de error
3.2.1. Evaluación de modelos de error
[30] Se utilizaron cinco años de forzamiento diario observado
(precipitación, evaporación potencial) y flujo de flujo diario
observado para identificar los parámetros del modelo
hidrológico y de error. La Figura 3 muestra los resultados para
el modelo ajustado utilizando SLS con siete parámetros
hidrológicos y un parámetro de error (varianza de error
constante). Tenga en cuenta que el modelo imita los datos
bastante bien, reproduciendo la mayoría de los eventos de flujo
menor y mayor. Sin embargo, una inspección más cercana de
los residuos del modelo en la Figura 3 revela que las
suposiciones del SLS no son válidas: (1) la varianza del error
aumenta como una función del flujo simulado, lo que sugiere
heterocedasticidad; (2) el histograma de error es más
a
El parámetro de garantía 𝛼𝑆 se establece en cero (es decir, se puntiagudo que el pdf gaussiano asumido, y (3) los errores
supone que la percolación es una función lineal del están significativamente correlacionados con un retraso de
almacenamiento del suelo, consulte la Figura 2). uno, lo que viola la suposición de independencia de SLS. Tales
violaciones también se han informado en otros estudios de
3.1. Datos sintéticos: verificación de estimación y algoritmo escorrentía de lluvia [por ejemplo, Kuczera, 1983; Feyen et al.,
de simulación 2007; Thyer et al., 2009]. Estos errores pueden deberse a una
combinación de medición, entrada de modelo y errores
[28] Antes de presentar nuestros hallazgos utilizando los datos
estructurales del modelo. Por ejemplo, descuidar la
medidos de flujos de flujo, la metodología se prueba primero
acumulación de nieve y los procesos de fusión pueden ser una
usando datos de descargas artificiales. Se generaron series de
razón para la correlación en errores residuales, especialmente
tiempo de datos de flujo diario con el modelo hidrológico de
durante el invierno y la primavera, pero eventualmente
siete parámetros utilizando la precipitación diaria observada y
durante todo el año, ya que los valores de los parámetros
la evaporación potencial de la cuenca francesa de Broad River.
compensan parcialmente los errores estructurales durante la
Este registro de descarga sintética se corrompió
calibración.
posteriormente con errores artificiales matemáticamente
definidos en la ecuación (4) utilizando el algoritmo descrito en
la sección 2.3. Los parámetros hidrológicos y del modelo de
error se dedujeron a partir de los datos del flujo de flujo
sintético dañado utilizando la probabilidad logarítmica de la
ecuación (8) y el algoritmo MCMC en la sección 2.2.

[29] La Tabla 3 presenta resultados para diferentes casos,


incluidos errores heteroscedásticos, correlacionados y no
gaussianos. Nuestro método es capaz de inferir la estructura de
error subyacente y los valores del parámetro del modelo
hidrológico para todos los casos presentados, con desviaciones
7
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
Tabla 3. Resumen de los parámetros hidrológicos y de modelo de error verdaderos e inferidos que utilizan flujo diario generado sintéticamente

a
Los datos sintéticos se generan utilizando el algoritmo descrito en la sección 2.3, y la inferencia se basa en la función de verosimilitud generalizada correspondiente "GL" en la
ecuación (8). Los valores de máxima verosimilitud (bajo encabezados GL) y, a su lado, se dan intervalos del 95%. En cada caso, los valores informados son promedios de 10
repetidos experimentos sintéticos de 5 años.
b
Cases: 1 = errores gaussianos homoscedásticos, no correlacionados; 2 = errores gaussianos heteroscedásticos, no correlacionados; 3 = errores heteroscedásticos,
correlacionados y gaussianos; 4 = errores heteroscedásticos, correlacionados, laplacianos; 5 = errores laplacianos heteroscedásticos, correlacionados e inclinados.

8
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531

Figura 3. Calibración SLS para la cuenca francesa de Broad River: (a) series temporales de predicciones de flujo de máxima
verosimilitud (línea continua) y observaciones (puntos), (b) residuales en función del flujo simulado, (c) supuestos (línea continua) y
el pdf real (cruces) de residuos 𝑎𝑡 , y (d) coeficientes de autocorrelación parcial de residuos 𝑎𝑡 niveles de significación del 95%.

Figura 4. Calibración GL para la cuenca francesa de Broad River: (a) serie temporal de predicciones de flujo de máxima verosimilitud
(línea continua) y observaciones (puntos), (b) residuales en función del flujo simulado, (c) supuesta (línea continua) y el pdf real
(cruces) de residuos 𝑎𝑡 , y (d) coeficientes de autocorrelación parcial de residuos en niveles de significación del 95%.

9
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
[31] Para tener en cuenta las desviaciones de las suposiciones suposiciones de SLS. Como se ve claramente en la Figura 3,
de SLS, se realizó una segunda calibración en la que la estas suposiciones no se sostienen aquí. Una mejor forma de
heterocedasticidad, la anormalidad y las correlaciones de evaluar la idoneidad del modelo de error GL con respecto al
errores se contabilizaron explícitamente utilizando la función modelo de error SLS es comparar sus respectivos valores
de verosimilitud generalizada ("GL") de la ecuación (8). Los máximos de log-verosimilitud (o densidades posteriores). Para
parámetros hidrológicos ahora se aumentan con dos el conjunto de datos de calibración de 5 años, encontramos que
parámetros de varianza (𝜎1 y 𝜎0 ), un parámetro de forma (𝛽) y el modelo de error GL tiene una probabilidad de registro mucho
un coeficiente de autocorrelación de primer orden 𝜙1 ). Esto da mayor que el modelo de error SLS, es decir, 540 versus -1690.
como resultado un modelo que nuevamente se ajusta bastante Esto quizás no sea tan sorprendente ya que el modelo de error
bien a los datos, aunque con un error cuadrático medio (MSE) GL contiene tres parámetros adicionales para el ajuste de datos.
que es dos veces mayor que con SLS (Figura 4). Una explicación Sin embargo, los valores máximos de verosimilitud logarítmica
es que GL pone menos énfasis en ajustar los flujos máximos durante un período de evaluación independiente de 20 años
debido a los errores heteroscedásticos. Además, dado que SLS (1970 para GL versus -6140 para SLS), así como valores para el
minimiza el MSE, siempre producirá valores de MSE más Criterio de Información Bayesiano (a minimizar) [Marshall et al.,
pequeños que otros métodos. La comparación de modelos 2005] (- 997 para GL versus 3440 para SLS) ambos confirman la
basados en MSE supone que los errores satisfacen las superioridad del modelo de error GL.

Figura 5. Histogramas posteriores de parámetros del modelo de error usando GL en la cuenca francesa de Broad River.

Figura 6. Histogramas posteriores de los parámetros del modelo hidrológico usando SLS (negro) y GL (gris) en la cuenca francesa de
Broad River.

[32] Además, la inferencia de parámetros usando GL es heterocedasticidad y la correlación entre errores, y la


consistente con las suposiciones a priori, como se muestra en distribución del error inferido coincide estrechamente con la
las gráficas de diagnóstico en la Figura 4. Se ha eliminado la distribución empírica del modelo derechos residuales de autor.
10
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
Los histogramas posteriores correspondientes de los simplificadores inherentes a SLS. La siguiente pregunta que
parámetros de error se muestran en la Figura 5, lo que indica deseamos abordar es qué efecto tiene la violación de las
que los cuatro parámetros están bien identificados. Tenga en suposiciones de SLS sobre las estimaciones del parámetro
cuenta que curtosis parámetro 𝛽 se acerca a un valor de 1, lo hidrológico y la incertidumbre predictiva.
que significa que los errores siguen una distribución de Laplace
o doble exponencial. Como se muestra en la Figura 4, la [34] La Figura 6 presenta histogramas de parámetros
distribución de Laplace tiene más picos que la distribución de posteriores para los siete parámetros hidrológicos basados en
Gauss, y también tiene colas más pesadas, lo que la hace las estrategias de inferencia SLS y GL. Dos hallazgos importantes
robusta contra los valores atípicos. Nuestros resultados se pueden deducir de estas parcelas. En primer lugar, la
muestran una fuerte evidencia de errores de cola pesada. inferencia de parámetros basada en supuestos de error no
válidos (SLS) arroja estimaciones de parámetros que se desvían
significativamente de las obtenidas con un modelo de error (GL)
más apropiado. Este es el caso más notable para el parámetro
𝑆𝑚𝑎𝑥 , la capacidad de almacenamiento de agua del suelo, que
es un parámetro clave en el modelo para separar la lluvia
efectiva en escorrentía, evaporación y percolación. Las
estimaciones de los parámetros bajo SLS pueden incluso
conducir a valores no físicos, como es el caso del parámetro
𝐼𝑚𝑎𝑥 , que representa la capacidad de interceptación de la
vegetación. Usando SLS, este parámetro se ubica en su límite
superior de 10 mm, mientras que bajo GL se obtienen valores
más realistas de alrededor de 2 mm [Breuer et al., 2003].

[35] El segundo hallazgo en la Figura 6 es que la incertidumbre


del parámetro, medida por el ancho o la extensión de los
histogramas de parámetros posteriores, es subestimada por
SLS en comparación con GL. Este es, por ejemplo, claramente el
caso para los parámetros 𝑄 𝑠𝑚𝑎𝑥 y 𝛼𝐹 Una mayor incertidumbre
bajo los resultados GL de una combinación de factores (1) que
explica la correlación de error reduce el contenido de
información de los datos, (2) el modelo de error
heteroscedástico asigna una mayor incertidumbre a los flujos
máximos y (3) la distribución inferida de Laplace tiene colas más
pesadas que la distribución Gaussiana. La subestimación de la
incertidumbre de parámetros usando SLS también fue
encontrada por Thyer et al. [2009].

[36] La evaluación adicional y la comparación de las


estimaciones de los parámetros por SLS y GL se realizó
mediante períodos de calibración de 5 años con diferentes
puntos de partida. Cada período de calibración se modificó en
1 año, de modo que los períodos subsiguientes tienen 4 años
de datos en común. Se consideraron diez períodos de
calibración diferentes, y para cada conjunto de datos, los
parámetros se dedujeron usando SLS y GL. La experiencia
sugiere que 5 años de datos de flujo diario contienen suficiente
Figura 7. Valores de parámetros de máxima verosimilitud información sobre los parámetros de los modelos conceptuales
(negro) y bandas de incertidumbre del 95% (gris) utilizando SLS de precipitación-escorrentía y, por lo tanto, no se prevén
y GL en la cuenca francesa de Broad River. variaciones significativas en las estimaciones de los parámetros
entre los conjuntos de datos de calibración. Las estimaciones
resultantes de la incertidumbre de los parámetros para cada
uno de los siete parámetros hidrológicos se muestran en la
3.2.2. Parámetro Incertidumbre Figura 7. La robustez de los parámetros se cuantificó calculando
[33] Hasta ahora, los resultados indican que los errores la varianza de los medios de parámetros posteriores, dividida
residuales están mejor representados por un modelo de error por la varianza total de las muestras MCMC posteriores en
que explica explícitamente la heterocedasticidad, la correlación todos los períodos de calibración. Para cada parámetro, esta
y la no normalidad, en comparación con los supuestos relación fue menor para GL (rango, 0.04-0.84) que para SLS
11
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
(rango, 0.22-0.99). Junto con la Figura 7, estos resultados 3.3. Segundo estudio de caso: cuenca del río Guadalupe
indican que las estimaciones de los parámetros GL son
consistentes entre los conjuntos de datos de calibración, [39] En el segundo caso de estudio, estudiamos una cuenca
mientras que las estimaciones de los parámetros SLS son más mucho más seca. El flujo de flujo se caracteriza por periodos
extendidos de flujos cercanos a cero, alternados con flujos pico
sensibles a las variaciones en los datos de calibración. Este
fuertemente no lineales después de eventos de lluvia. Se espera
último confirma los resultados informados por Thyer et al.
[2009]. La solidez de los resultados de inferencia GL se puede que el modelo de escorrentía pluvial simple utilizado aquí no
tenga en cuenta todos los procesos relevantes en esta cuenca,
atribuir a tres factores: (1) al dar cuenta de la
como la generación de exceso de infiltración y la inundación
heterocedasticidad, se da menos peso a los flujos altos,
haciendo que la inferencia sea menos sensible a eventos de repentina [Clark et al., 2008]. Por lo tanto, se anticipa que los
flujo grandes en diferentes conjuntos de datos de calibración; errores residuales serán más complejos que en el primer caso
de estudio, lo que representa un mayor desafío para un análisis
(2) las colas largas de la distribución de Laplace permiten un
de incertidumbre formal. Seguimos un enfoque similar al del
mayor número de grandes errores, lo que de nuevo induce
robustez frente a valores atípicos y variaciones aleatorias en primer caso de estudio, en el que aumentamos gradualmente
eventos de gran flujo; (3) la contabilidad de la autocorrelación la complejidad del modelo de error, empezando por el modelo
más simple, a saber, SLS, hasta que se obtienen resultados
en los errores residuales filtra la medición, la entrada del
satisfactorios mediante controles posteriores y análisis de
modelo y los errores estructurales del modelo, lo que resulta
en estimaciones de parámetros menos sesgadas y más bandas de incertidumbre predictiva.
consistentes [Vrugt et al., 2005]. [40] Las predicciones de modelo y las gráficas de diagnóstico
correspondientes que usan SLS se muestran en la Figura 10.
3.2.3. Incertidumbre predictiva
Como antes, las suposiciones de SLS de varianza constante y
[37] Además de la incertidumbre de los parámetros, se espera residuos normalmente distribuidos se violan claramente.
que las suposiciones sobre los errores residuales tengan Además, los residuos están ligeramente correlacionados en
consecuencias directas para las estimaciones de la rezagos pequeños, pero menos que en el primer caso de
incertidumbre de la predicción. La Figura 8 muestra series estudio. Los resultados en la Figura 10 muestran que el modelo
temporales y cuantiles cuantílicos (QQ) gráficas para de error SLS produce bandas de incertidumbre de predicción
predicciones de flujo utilizando suposiciones de SLS. Es obvio a poco realistas. La situación es especialmente problemática en
partir de estos resultados que SLS produce predicciones de flujo este caso con flujos cercanos a cero, donde SLS da como
de agua inadecuadas. El problema de ignorar la resultado límites de predicción inferiores negativos para la
heterocedasticidad es claramente visible en las gráficas de mayor parte del registro de flujo.
series de tiempo: el uso de una varianza de error constante
(promedio) resulta en una sobreestimación de la incertidumbre [41] A continuación, el análisis se repitió con parámetros de
de predicción para flujos bajos y una subestimación para flujos error adicionales para heterocedasticidad, autocorrelación y
altos. Como el registro del flujo está dominado por flujos bajos, anormalidad (curtosis), siguiendo el mismo enfoque que en el
intercalados con eventos de alto flujo, la característica primer caso de estudio. Los resultados (no mostrados)
dominante de los diagramas QQ de calibración y validación es revelaron que, aunque se cumplen los supuestos de error, las
su curvatura en forma de S, indicativa de una sobreestimación bandas de incertidumbre de predicción son grandes y sin
de la incertidumbre de predicción [Thyer et al., 2009]. Tal sentido. Esto es causado por el gran valor inferido para el
sobreestimación puede incluso llevar a bandas de coeficiente de autocorrelación, que es cercano a 1 en este caso.
incertidumbre de predicción que se vuelven negativas, como es Un valor para 𝜙1 cerca de 1 equivale a una caminata aleatoria,
evidente en el gráfico de serie temporal de la Figura 8. lo que resulta en grandes errores aleatorios. Una posible
explicación para este resultado es que los errores residuales
[38] Por el contrario, la incertidumbre predictiva calculada sin son demasiado severos para ser contabilizados por un modelo
hacer suposiciones simplificadoras de SLS da como resultado simple AR (1). Por lo tanto, también se consideraron modelos
bandas de incertidumbre que, aunque no son perfectas, son AR de orden superior, específicamente AR (2) y AR (4). Sin
más realistas (Figura 9). Ahora, las bandas de predicción a flujos embargo, esto resultó en límites de error similarmente irreales
bajos son más estrechas y los flujos observados más de cerca. como los de un modelo AR (1).
Además, la mayor incertidumbre para los flujos altos se tiene
en cuenta mediante el uso de una varianza de error que [42] Como una alternativa a la contabilidad de las correlaciones
aumenta como una función del flujo de flujo simulado. Las de errores, se buscaron mejoras en la predicción de los valores
gráficas de QQ en la Figura 9 confirman que las predicciones en esperados del flujo introduciendo los factores de sesgo del
GL representan mejor los flujos observados, ya que los gráficos modelo variable en el tiempo 𝜇𝑡 , como en la ecuación (2), para
QQ se aproximan a la línea 1: 1, especialmente para el conjunto compensar los grandes errores residuales. Por lo tanto, el
de datos de validación, mientras que para el conjunto de datos parámetro de sesgo 𝜇ℎ en la ecuación (3) se dedujo junto con
de calibración es aparente una sobre-predicción sistemática. los parámetros del modelo hidrológico y los parámetros del
modelo de error para heterocedasticidad (𝜎0 , 𝜎1 ) y curtosis (𝛽).
12
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
La magnitud de los factores de polarización en la ecuación (2) residuales. Por lo tanto, una ejecución final incluyó los
se limitó a un valor de 10. Al tiempo que se mejoraron los siguientes parámetros del modelo de error: parámetro de
resultados, las bandas de incertidumbre de predicción y los polarización 𝜇ℎ , parámetros de heterocedasticidad (𝜎0 , 𝜎1 ),
diagramas de diagnóstico en este caso (no mostrados) curtosis (𝛽) y sesgo (𝜉), y un coeficiente de autocorrelación de
indicaron la necesidad de dos correcciones adicionales. primer orden 𝜙1 . Para evitar los problemas descritos
Primero, la correlación significativa permaneció entre los anteriormente, el coeficiente de correlación no se dedujo
errores residuales en el desfase 1, sugiriendo la necesidad de automáticamente, sino que se fijó en un valor de 0,4, basado en
incluir un modelo AR. En segundo lugar, las bandas de la inspección de las parcelas de diagnóstico.
incertidumbre de predicción más baja se volvieron negativas,
debido a los bajos flujos generales en esta cuenca, combinados
con el uso de una distribución simétrica para los errores

Figura 8. Incertidumbre predictiva utilizando SLS en la cuenca francesa de Broad River: (a) series de tiempo de observaciones
(puntos) y 95% de bandas de incertidumbre de predicción total (líneas continuas); (b y c) diagramas QQ para períodos de calibración
y validación.

[43] La Figura 11 muestra diagramas de diagnóstico resultantes distribución de error sesgada positivamente, como también se
y predicciones de flujo usando el enfoque GL. En comparación puede observar en la Figura 11c. Las gráficas de diagnóstico en
con los resultados de SLS en la Figura 10, las bandas de la Figura 11 indican además que el modelo de error GL eliminó
incertidumbre de predicción se han mejorado mucho, la heterocedasticidad residual y la correlación de primer orden,
proporcionando una mejor descripción de los valores con alguna correlación menor restante en rezagos mayores. La
observados y permaneciendo positivos a lo largo del registro de Figura 12 resume los histogramas posteriores para todos los
flujo. Además, la distribución de error inferido coincide más modelos hidrológicos y los parámetros del modelo de error
estrechamente con la distribución supuesta. El valor inferido utilizando el enfoque GL. La mayoría de los parámetros están
para el parámetro de asimetría 𝜉 en este caso es bastante bien identificados, a excepción de dos parámetros
aproximadamente 1.3 (Figura 12), lo que indica una (𝑆𝑚𝑎𝑥 y 𝐾𝑆 ) que alcanzan su límite superior, lo que indica que
13
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
se prefieren valores aún mayores para estos parámetros. Una respuesta lentos para el flujo subsuperficial. Finalmente, la
interpretación física podría ser que estos grandes valores Tabla 4 muestra correlaciones posteriores algo elevadas
inferidos para 𝑆𝑚𝑎𝑥 y 𝐾𝑆 son indicativos de zonas vadosas alrededor de 0,9 entre los parámetros 𝑄𝑠𝑚𝑎𝑥 y tanto 𝛼𝐸 como
relativamente secas y profundas en cuencas semiáridas, lo que 𝛼𝐹 , lo que sugiere que uno de estos podría ser fijo en esta
resulta en grandes efectos de almacenamiento y tiempos de cuenca semiárida.

Figura 9. Incertidumbre predictiva utilizando GL en la cuenca francesa de Broad River: (a) serie de tiempo de observaciones (puntos)
y 95% de bandas de incertidumbre de predicción total (líneas continuas); (b y c) diagramas de QQ para períodos de calibración y
validación.

estudios de casos, los supuestos SLS tradicionales de


4. Discusión y conclusiones independencia residual, homocedasticidad y normalidad
fueron claramente violados. Nuestro enfoque relaja estas
[44] Los resultados de ambos estudios de casos confirman el suposiciones y se basa en un modelo de error residual
trabajo previo [por ejemplo, Kuczera, 1983; Vrugt et al., 2008a; estadístico, con la correspondiente función de verosimilitud,
Thyer et al., 2009] que la estimación precisa de la incertidumbre que explica explícitamente la correlación, la heterocedasticidad
de parámetro y predicción depende de una representación y la no normalidad de los errores residuales del modelo.
estadística adecuada de los errores residuales. En ambos

14
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
[45] La aplicación del enfoque a la modelación de las parámetros usando GL se atribuye al uso de un modelo de error
precipitaciones y la escorrentía en la cuenca húmeda (French residual más preciso.
Broad River) dio como resultado resultados alentadores. El
modelo de error parece ser lo suficientemente flexible para [46] Para la cuenca semiárida, los errores residuales son más
describir los errores en este caso. Un modelo autorregresivo de complejos y se introdujeron factores de polarización
primer orden, combinado con un modelo de multiplicativos para compensar algunos de los errores
heterocedasticidad lineal y una distribución de Laplace para los residuales más grandes. Estos errores son causados por una
errores residuales, funcionó bastante bien, como lo revelan los combinación de errores de medición, errores de volumen /
diagramas de diagnóstico de error posterior. Además, este tiempo de lluvia y errores estructurales del modelo. Por
modelo de error y la función de verosimilitud correspondiente ejemplo, podría hipotetizarse que la escorrentía en esta cuenca
generaron estimaciones de parámetros que son robustas para está dominada por el mecanismo de exceso de infiltración (flujo
el registro de datos específico utilizado para la inferencia y superficial de Horton). Esto implicaría que el coeficiente de
arrojaron estimaciones mejoradas de incertidumbre predictiva escorrentía no solo depende de la humedad del suelo, como se
en comparación con SLS. La no-robustez de SLS también fue explica en nuestro modelo hidrológico, sino también de la
expuesta por el trabajo de Thyer et al. [2009]. La solidez de los intensidad de la lluvia. Como se espera que las intensidades de
las precipitaciones varíen de manera significativa

Figura 10. Incertidumbre predictiva y diagramas de diagnóstico usando SLS en la cuenca del río Guadalupe: (a) series de tiempo de
observaciones (puntos) y 95% de bandas de incertidumbre de predicción total (líneas continuas), (b) residuales en función del flujo
simulado (c) supuesto (línea continua) y real (cruces) pdf de residuos 𝑎𝑡 , y (d) coeficientes de autocorrelación parcial de residuos a
niveles de significación del 95%.

durante un solo día, las tasas de lluvia promedio diarias un método simple y parsimonioso (un parámetro adicional)
utilizadas en este estudio no pueden capturar esta dinámica. para tener en cuenta el sesgo del modelo. Los resultados de la
Por lo tanto, se puede requerir un cambio a los datos de lluvia cuenca semiárida también resaltan la importancia de dar
por hora y la adición de un mecanismo de flujo terrestre de cuenta de la asimetría. El uso de una distribución sesgada
Hortonian al modelo para simular adecuadamente la dinámica produce bandas de incertidumbre de predicción más realistas,
del flujo de la cuenca semiárida. Aquí se usaron factores de en el sentido de que se evitan los límites negativos de
sesgo multiplicativos para explicar algunas de estas predicción inferiores, como se obtienen con una distribución
deficiencias. Aunque no es perfecto, este enfoque proporciona simétrica.

15
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531

Figura 11. Incertidumbre predictiva y diagramas de diagnóstico usando GL en la cuenca del río Guadalupe: (a) series de tiempo de
observaciones (puntos) y 95% de bandas de incertidumbre de predicción total (líneas continuas), (b) residuales en función del flujo
simulado (c) supuesto (línea continua) y real (cruces) pdf de residuos 𝑎𝑡 , y (d) coeficientes de autocorrelación parcial de residuos a
niveles de significación del 95%.

Figura 12. Histogramas posteriores de los parámetros del modelo hidrológico y de error usando GL en la cuenca del río Guadalupe.

[47] Observamos además que ambas cuencas proporcionaron ya que se han informado residuos de cola pesada en varios
una fuerte evidencia a favor de una distribución de Laplace otros estudios [por ejemplo, Bates y Campbell, 2001; Schaefli
(simétrica o) para los residuos. La distribución de Laplace et al., 2007; Yang et al., 2007]. La inferencia con un modelo
también puede ser una buena elección en muchos otros casos, aditivo de error laplaciano equivale a la mediana o regresión L1,
16
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
que durante mucho tiempo ha sido defendida por su solidez casos de Bates y Campbell [2001] y Yang et al. [2007]. Los
frente a los valores atípicos [Koenker y Bassett, 1978]. residuos de cola pesada parecen ser bastante comunes en el
modelado hidrológico y se tienen en cuenta utilizando nuestro
[48] El enfoque de modelado e inferencia presentado aquí se enfoque. En segundo lugar, el modelado explícito de la
desvía de los métodos anteriores que se han basado distribución estadística de errores como se realiza aquí es más
principalmente en las transformaciones de Box-Cox para intuitivo que el método de transformación, en el sentido de que
manejar los residuos heteroscedásticos y no gaussianos en el los parámetros del modelo de error tienen una relación directa
modelado hidrológico (Tabla 1). Aunque no proporcionamos con las estadísticas de errores observables. Esto se ilustra
una comparación rigurosa, aún podemos señalar dos ventajas mediante gráficos de diagnóstico en la Figura 3 que sugieren
de nuestro método. En primer lugar, las transformaciones de valores razonables para los parámetros del modelo de error.
Box-Cox son útiles para eliminar la heterocedasticidad y la Por el contrario, los valores de los parámetros de
asimetría; sin embargo, típicamente no representan los transformación de Box-Cox no pueden deducirse fácilmente a
residuos de cola pesada, como lo muestran los estudios de partir de dichos diagramas de diagnóstico.

Tabla 4. Coeficiente de correlación de parámetros posteriores Matriz de los parámetros hidrológicos y de modelo de error utilizando
GL en la cuenca a del río Guadalupe.

a
Correlaciones mayores a 0.6 están subrayadas.

[49] Nuestro enfoque también se desvía de otros estudios que comparación con los enfoques tradicionales que se basan en
se han centrado en separar las diversas contribuciones de error suposiciones poco realistas de residuos de modelos
que componen los residuos del modelo, incluida la medición, el independientes, homoscedásico y distribuidos normalmente.
modelo de entrada y los errores estructurales del modelo [por Aunque nuestra aplicación se centró en la simulación de flujo
ejemplo, Kuczera et al., 2006; Reichert y Mieleitner, 2009; de flujo, la metodología presentada es completamente general
Renard et al., 2010]. Tales estudios son importantes para y también puede ser útil para tratar los errores residuales
probar las hipótesis sobre las posibles causas de las complejos en otros modelos de regresión hidrológica.
desviaciones entre las predicciones del modelo y los datos. Sin
embargo, el desenmarañamiento completo de las diversas
fuentes de error, especialmente la separación de la lluvia y los Apéndice A
errores estructurales del modelo puede ser bastante [51] El apéndice muestra cómo se puede obtener el pdf del
desafiante, como se señala en un estudio reciente de Renard et poder exponencial sesgado (SEP) en la ecuación (6) a partir de
al. [2010]. Nuestro enfoque es menos ambicioso y se enfoca en la potencia exponencial (EP) pdf de Box y Tiao [1992] utilizando
cambio en una descripción estadística correcta de los datos y el método de Fernández y Acero [1998]. Nuestro desarrollo
los residuales totales del modelo, sin separar varias fuentes de sigue a Würtz y Chalabi [2009], quienes implementaron el SEP
error. Esto resulta en un método pragmático para estimar la como parte del paquete fGarch en R. El PDF estandarizado EP
incertidumbre de parámetros y predicciones de los modelos con media cero y desviación estándar de la unidad se puede
hidrológicos sin la necesidad de suposiciones explícitas sobre expresar como:
diversas contribuciones de errores.
𝑓(𝛼|𝛽) = 𝜔𝛽 exp{−𝑐𝛽 |𝑎|2⁄(1+𝛽) }, (𝐴1)
[50] En conclusión, la metodología propuesta en este
documento proporciona una mayor flexibilidad para describir donde 𝛽 es un parámetro de curtosis (−1 < 𝛽 ≤ 1), y 𝜔𝛽 y 𝑐𝛽
los errores residuales en las aplicaciones de precipitación- están dados por [Box y Tiao, 1992; pag. 157],
escorrentía utilizando un enfoque estadístico formal. Esta
flexibilidad se traduce en estimaciones mejoradas de los Γ 1⁄2 [3 (1 + 𝛽)⁄2]
𝜔𝛽 = , (𝐴2)
parámetros y la incertidumbre de predicción total, en (1 + 𝛽)Γ 3⁄2 [(1 + 𝛽)⁄2]
17
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
1⁄(1+𝛽) conjunto se puede escribir como el producto de densidades
Γ[3 (1 + 𝛽)⁄2]
𝑐𝛽 = ( ) , (𝐴3) marginales y condicionales,
Γ[(1 + 𝛽)⁄2]
𝑝(𝒆|𝜼) = 𝑝(𝒆1;𝑝 |𝜼)𝑝(𝒆𝑝+1:𝑛 |𝒆1;𝑝 , 𝜼). (𝐵2)
donde Γ[𝑥] es la función 𝛾 evaluada en 𝑥. Fernández y Steel
[1998] desarrollaron un método general para introducir sesgo [54] El pdf condicional en (B2) se puede expandir
en una densidad simétrica, recursivamente para producir,
2 𝑛
𝑝(𝜀|𝜉) = 𝑓(𝜉 −𝑠𝑖𝑔𝑛(𝜀) 𝜀), (𝐴4)
𝜉 + 𝜉 −1 𝑝(𝒆|𝜼) = 𝑝(𝒆1;𝑝 |𝜼) ∏ 𝑝(𝒆𝑡 |𝒆1;𝑡−1 , 𝜼) , (𝐵3)
𝑡=𝑝+1
donde 𝜉 es un parámetro de asimetría (𝜉 > 0) y 𝑓 denota una
densidad simétrica, en nuestro caso, el EP pdf estandarizado en que, usando el modelo de error en la ecuación (4), da como
(A1). La desviación media y estándar de 𝜀 puede derivarse de la resultado la siguiente expresión,
ecuación (5) en Fernández y Acero [1998], 𝑛

𝜇𝜉 = 𝑀1 (𝜉 − 𝜉 −1 ), (𝐴5) 𝑝(𝒆|𝜼) = 𝑝(𝒆1;𝑝 |𝜼) ∏ 𝜎𝑡−1 𝑝(𝑎𝑡 |𝜼) . (𝐵4)


𝑡=𝑝+1

𝜎𝜉 = √(𝑀2 − 𝑀12 )(𝜉 2 + 𝜉 −2 ) + 2𝑀12 − 𝑀2 , (𝐴6) con densidad 𝑝(𝑎𝑡 |𝜼) dada por la ecuación (6).

donde 𝑀𝑟 es el rth momento absoluto de la densidad simétrica [55] Para las innovaciones gaussianas en, el pdf marginal
𝑓, 𝑝(𝒆1;𝑝 |𝜼) también es gaussiano, lo que resulta en expresiones

cerradas para la función de verosimilitud exacta (ver Newbold
[1974] para los modelos ARMA, y la ecuación (17) en el estudio
𝑀𝑟 = 2 ∫ 𝑠 𝑟 𝑓(𝑠)𝑑𝑠 . (𝐴7) de Sorooshian y Dracup [1980] para AR (1) modelos con
0 innovaciones gaussianas). Sin embargo, con innovaciones no
[52] Para el pdf EP estandarizado en (A1), se obtienen las gaussianas, el pdf marginal suele ser bastante complicado (ver,
siguientes expresiones para 𝑀1 y 𝑀2 , por ejemplo, Damsleth y El-Shaarawi [1989] para modelos
ARMA con innovaciones de Laplace). Un enfoque común, válido
Γ[1 + 𝛽] para tamaños de muestra 𝑛 moderados a grandes que se
𝑀1 = , (𝐴8)
Γ 1⁄2 Γ[3 (1 + 𝛽)⁄2]Γ 1⁄2 [(1 + 𝛽)⁄2] encuentran típicamente en el modelado de precipitación-
escorrentía, aproxima el pdf marginal 𝑝(𝒆1;𝑝 |𝜼) mediante el
𝑀2 = 1, (𝐴9)
condicionamiento en residuales no observados 𝑒𝑡 (𝑡 <
𝑝
lo que nos permite calcular la media 𝜇𝜉 y la desviación estándar 1): 𝑝(𝒆1;𝑝 |𝜼) ≃ 𝑝(𝒆1;𝑝 |𝒆1−𝑝;0, 𝜼) = ∏𝑡=1 𝜎𝑡−1 𝑝(𝑎𝑡 |𝜼) Insertar
𝜎𝜉 en (A5) y (A6). Para obtener una densidad SEP estandarizada, esta aproximación en (B4) produce una función de
con media cero y desviación estándar unitaria, el pdf en (A4) se verosimilitud condicional,
escala mediante la desviación 𝜎𝜉 y 𝜀 se reemplaza por 𝜇𝜉 + 𝑛
𝜎𝜉 𝑎, ℓ(𝜼|𝒀) ≃ ∏ 𝜎𝑡−1 𝑝(𝑎𝑡 |𝜼) , (𝐵5)
𝑡=1
2𝜎𝜉
𝑝(𝜀|𝜉) = 𝑓 (𝜉 −𝑠𝑖𝑔𝑛(𝜇𝜉 +𝜎𝜉 𝑎) (𝜇𝜉 + 𝜎𝜉 𝑎)), (𝐴10)
𝜉 + 𝜉 −1 que, con la ecuación (6), se puede escribir como,
𝑛
La sustitución de (A1) en (A10) produce la densidad SEP 2𝜎𝜉 2⁄(1+𝛽)
estandarizada de la ecuación (6). ℓ(𝜼|𝒀) ≃ ∏ 𝜎𝑡−1 −1
𝜔𝛽 exp {−𝑐𝛽 |𝑎𝜉,𝑡 | }. (𝐵6)
𝜉+𝜉
𝑡=1

apéndice B [56] Tomar la transformación logarítmica de esta expresión


produce la función de verosimilitud logarítmica (condicional)
[53] Derivamos la función de verosimilitud en la ecuación (8) del en la ecuación (8). En (B6) y la ecuación (8), se supone que los
modelo de error supuesto en las ecuaciones (4) - (6). residuales no observados 𝑒𝑡 (𝑡 < 1) son iguales a cero.
Verosimilitud ℓ(𝜼|𝒀) de los parámetros hidrológicos y del
modelo de error 𝜼 se define como el pdf conjunto de las [57] Agradecimientos. Queremos agradecer a tres revisores
observaciones 𝒀 para los parámetros dados 𝜼, anónimos por sus críticas constructivas y a Steven Weijs, Rol
Hut, Ronald van Nooijen y Nick van de Giesen por las fructíferas
ℓ(𝜼|𝒀) ≡ 𝑝(𝒀|𝜼) = 𝑝(𝒆|𝜼), (𝐵1) discusiones. El segundo autor cuenta con el apoyo de J. Robert
Oppenheimer Fellowship del programa de postdoctorado
donde 𝒀 = (𝑌𝟏 … 𝑌𝑛 )′ y 𝒆 = (𝑒1 … 𝑒𝑛 )′ . Dividiendo 𝒆 en dos
′ ′ LANL.
subconjuntos, 𝒆1;𝑝 = (𝑒𝟏 … 𝑒𝑝 ) y 𝒆𝑝+1:𝑛 = (𝑒𝒑+𝟏 … 𝑒𝑛 ) , el pdf

18
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
References Fernandez, C., and M. J. F. Steel (1998), On Bayesian modeling
of fat tails and skewness, J. Am. Stat. Assoc., 93, 359–371.
Ajami, N. K., G. M. Hornberger, and D. L. Sunding (2008),
Sustainable water resource management under hydrological Feyen, L., and S. M. Gorelick (2004), Framework to evaluate the
uncertainty, Water Resour. Res., 44, W11406, worth of hydraulic conductivity data for optimal groundwater
doi:10.1029/2007WR006736. resources management in ecologically sensitive areas, Water
Bates, B. C., and E. P. Campbell (2001), A Markov chain Monte Resour. Res., 41, W03019, doi:10.1029/2003WR002901.
Carlo scheme for parameter estimation and inference in Feyen, L., J. A. Vrugt, B. O. Nuallain, J. van der Knijff, and A. de
conceptual rainfallrunoff modeling, Water Resour. Res., 37(4), Roo (2007), Parameter optimization and uncertainty
937–947. assessment for largescale stream flow forecasting, J. Hydrol.,
332, 276–289.
Beven, K., and J. Freer (2001), Equifinality, data assimilation,
and Uncertainty estimation in mechanistic modeling of Gotzinger, J., and A. Bardossy (2008), Generic error model for
complex Environmental systems using the GLUE methodology, calibration and uncertainty estimation of hydrological models,
J. Hydrol., 249, 11–29. Water Resour. Res., 44, W00B07,
doi:10.1029/2007WR006691.
Beven, K., P. J. Smith, and J. E. Freer (2008), So just why would
a modeler choose to be incoherent, J. Hydrol., 354, 15–32. Jakeman, A. J., and G. M. Hornberger (1993), How much
complexity is warranted in a rainfall‐runoff model?, Water
Box, G. E. P., and G. C. Tiao (1992), Bayesian Inference in
Resour. Res., 29(8), 2637–2649, doi:10.1029/93WR00877.
Statistical Analysis, 588 pp., John Wiley, New York.
Johnson, M. (1979), Computer generation of the exponential
Breuer, L., K. Eckhardt, and H.‐G. Frede (2003), Plant power distribution,
parameter values for models in temperate climates, Ecol.
J. Stat. Comput. Sim., 9(3), 239–240. Kavetski, D., G. Kuczera,
Model., 169(2 3), 237–293.
and S. W. Franks (2006a), Bayesian analysis of input uncertainty
Clark, M. P., A. G. Slater, D. E. Rupp, R. A. Woods, J. A. Vrugt, H. in hydrological modeling: 1. Theory, Water Resour. Res., 42,
V. Gupta, T. Wagener, and L. E. Hay (2008), Framework for W03407, doi:10.1029/2005WR004368.
Understanding Structural Errors (FUSE): A modular framework Kavetski, D., G. Kuczera, and S. W. Franks (2006b), Bayesian
to diagnose differences between hydrological models, Water analysis of input uncertainty in hydrological modeling: 2.
Resour. Res., 44, W00B02, doi:10.1029/2007WR006735. Application, Water Resour. Res., 42, W03408,
doi:10.1029/2005WR004376.
Damsleth, E., and A. H. El‐Shaarawi (1989), ARMA models
with doubleexponentially distributed noise, J. R. Stat. Soc., Ser. Koenker, R., and G. Bassett Jr. (1978), Regression quantiles,
B, 51(1), 61–69. Econometrica, 46(1), 33–50.

Di Baldassarre, G., and A. Montanari (2009), Uncertainty in river Kuczera, G. (1983), Improved parameter inference in
discharge observations: A quantitative analysis, Hydrol. Earth catchment models, 1. Evaluating parameter uncertainty, Water
Syst. Sci., 13, 913–921. Resour. Res., 19(5), 1151–1162,
doi:10.1029/WR019i005p01151.
Duan, Q., et al. (2006), Model Parameter Estimation
Experiment (MOPEX): An overview of science strategy and Kuczera, G., and E. Parent (1998), Monte Carlo assessment of
major results from the second and third workshops, J. Hydrol., parameter uncertainty in conceptual catchment models: The
320, 3–17. Metropolis algorithm, J. Hydrol., 211(1–4), 69–85.

Engeland, K., C. Xu, and L. Gottschalk (2005), Assessing Kuczera, G., D. Kavetski, S. Franks, and M. Thyer (2006),
uncertainties in a conceptual water balance model using Towards a Bayesian total error analysis of conceptual rainfall‐
Bayesian methodology, Hydrol. Sci. J., 50, 45–63. runoff models: Characterizing model error using storm‐
Fenicia, F., H. H. G. Savenije, P. Matgen, and L. Pfister (2007), A dependent parameters, J. Hydrol., 331, 161–177,
comparison of alternative multiobjective calibration strategies doi:10.1016/j.jhydrol.2006.05.010.
for hydrological modeling, Water Resour. Res., 43, W03434,
doi:10.1029/2006WR005098. Mantovan, P., and E. Todini (2006), Hydrological forecasting
Uncertainty assessment: Incoherence of the GLUE
methodology, J. Hydrol., 330, 368–381.

19
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
Marshall, L., D. Nott, and A. Sharma (2005), Hydrological model models, Water Resour. Res., 37(10), 2521–2535,
selection: A Bayesian alternative, Water Resour. Res., 41, doi:10.1029/2000WR900405.
W10422, doi:10.1029/ 2004WR003719.
Thyer, M., B. Renard, D. Kavetski, G. Kuczera, S. W. Franks, and
McMillan, H., and M. Clark (2009), Rainfall‐runoff model S. Srikanthan (2009), Critical evaluation of parameter
calibration using informal likelihood measures within a Markov consistency and predictive uncertainty in hydrological
chain Monte Carlo sampling scheme, Water Resour. Res., 45, modeling: A case study using Bayesian total error analysis,
W04418, doi:10.1029/ 2008WR007288. Water Resour. Res., 45, W00B14,
doi:10.1029/2008WR006825.
Newbold, P. (1974), The exact likelihood function for a mixed
autoregressive‐ moving average process, Biometrika, 61(3), Vrugt, J. A., W. Bouten, H. V. Gupta, and S. Sorooshian (2002),
Toward improved identifiability of hydrologic model
423–426. Reichert, P., and J. Mieleitner (2009), Analyzing input
parameters: The Information content of experimental data,
and structural Uncertainty of nonlinear dynamic models with Water Resour. Res., 38(12), 1312,
stochastic, time‐dependent parameters, Water Resour. Res., doi:10.1029/2001WR001118.
45, W10402, doi:10.1029/2009WR007814.
Vrugt, J. A., H. V. Gupta, W. Bouten, and S. Sorooshian (2003),
Renard, B., D. Kavetski, G. Kuczera, M. A. Thyer, and S. W. A Shuffled Complex Evolution Metropolis algorithm for
Franks (2010), Understanding predictive uncertainty in optimization and Uncertainty assessment of hydrologic model
hydrologic modeling: The challenge of identifying input and parameters, Water Resour. Res.,39(8), 1201,
structural errors, Water Resour. Res., 46, W05521, doi:10.1029/2002WR001642.
doi:10.1029/2009WR008328.
Vrugt, J. A., B. A. Robinson, and V. V. Vesselinov (2005),
Schaefli, B., D. B. Talamba, and A. Musy (2007), Quantifying Improved inverse modeling of flow and transport in subsurface
hydrological modeling errors through a mixture of normal media: Combined parameter and state estimation, Geophys.
distributions, J. Hydrol., 332, 303–315. Res. Lett., 32, L18408, doi:10.1029/2005GL023940.

Vrugt, J. A., H. V. Gupta, S. C. Dekker, S. Sorooshian, T. Wagener,


Schoups, G., J. A. Vrugt, F. Fenicia, and N. C. van de Giesen
and W. Bouten (2006), Application of stochastic parameter
(2010), Inaccurate numerical implementation of conceptual
optimization to the Sacramento Soil Moisture Accounting
Hydrologic models corrupts accuracy and efficiency of MCMC
simulation, Water Resour. Res., doi:10.1029/2009WR008648, Model, J. Hydrol., 325, 288–307.
in press.
Vrugt, J. A., C. J. F. ter Braak, M. P. Clark, J. M. Hyman, and B. A.
Schoups, G., N. C. van de Giesen, and H. H. G. Savenije (2008), Robinson (2008a), Treatment of input uncertainty in hydrologic
Model complexity control for hydrologic prediction, Water modeling: Doing hydrology backward with Markov chain Monte
Resour. Res., 44, W00B03, doi:10.1029/2008WR006836. Carlo simulation, Water Resour. Res., 44, W00B09,
doi:10.1029/2007WR006720.
Smith, T. J., and L. A. Marshall (2008), Bayesian methods in
Hydrologic modeling: A study of recent advancements in Vrugt, J. A., C. J. F. ter Braak, H. V. Gupta, and B. A. Robinson
Markov chain Monte Carlo techniques, Water Resour. Res., 44, (2008b), Equifinality of formal (DREAM) and informal (GLUE)
W00B05, doi:10.1029/ 2007WR006705. Bayesian approaches to hydrologic modeling, Stoch. Env. Res.
Risk A., 23, 1059–1060, doi:10.1007/s00477-008-0274-y.
Sorooshian, S., and J. A. Dracup (1980), Stochastic parameter
estimation procedures for hydrologic rainfall‐runoff models Vrugt, J. A., C. J. F. ter Braak, C. G. H. Diks, B. A. Robinson, J. M.
correlated and heteroscedastic error cases, Water Resour. Hyman, and D. Higdon (2009), Accelerating Markov chain
Res., 16(2), 430–442, doi:10.1029/ WR016i002p00430. Monte Carlo simulation by differential evolution with self‐
adaptive randomized subspace sampling, Int. J. Nonlinear Sci.,
Stedinger, J. R., R. M. Vogel, S. U. Lee, and R. Batchelder (2008),
10, 273–290.
Appraisal of the generalized likelihood uncertainty estimation
(GLUE) method, Water Resour. Res., 44, W00B06,
Würtz, D., and Y. Chalabi (2009), Rmetrics—autoregressive
doi:10.1029/2008WR006822.
conditional heteroscedastic modelling, http://cran.r‐
ter Braak, C. J. F., and J. A. Vrugt (2008), Differential evolution project.org/web/packages/ fGarch/index.html.
Markov chain with snooker updater and fewer chains, Stat.
Comput., 18, 435–446. Yang, J., P. Reichert, and K. C. Abbaspour (2007), Bayesian
Uncertainty analysis in distributed hydrologic modeling: A case
Thiemann, M., M. Trosset, H. V. Gupta, and S. Sorooshian study in the Thur River basin (Switzerland), Water Resour. Res.,
(2001), Bayesian recursive parameter estimation for hydrologic 43, W10401, doi:10.1029/ 2006WR005497.
20
W10531 SCHOUPS AND VRUGT: LIKELIHOOD FUNCTION FOR PARAMETER AND PREDICTIVE INFERENCE W10531
Zhang, Z., T. Wagener, P. Reed, and R. Bhushan (2008),
Reducing Uncertainty in predictions in ungauged basins by
combining hydrologic índices regionalization and
multiobjective optimization, Water Resour. Res., 44, W00B04,
doi:10.1029/2008WR006833.

G. Schoups, Department of Water Management, Delft


University of Technology, Stevinweg 1, PO Box 5048, 2600 GA
Delft, Netherlands. (g.h.w.schoups@tudelft.nl)

J. A. Vrugt, Department of

21

You might also like