Professional Documents
Culture Documents
3) Vies y no vies. Un estimador es no in-sesgado si: E() = , onde el vies es dado por:
vies() = E( ) = E()
ECM () = E( )2 = V () + (vies
2) Las leyes de los grandes numeros explican por que el promedio o media de una muestra
al azar de una poblacion de gran tamano tendera a estar cerca de la media de la
poblacion completa.
Registros: los registros y licencias son particularmente valiosos para los censos
completos, pero se limitan a variables que cambian lentamente, como el nmero de
embarcaciones pesqueras y sus caractersticas.
Cuestionarios: formularios que los encuestados devuelven cumplimentados. Un mtodo
poco costoso que resulta til cuando los ndices de alfabetizacin son altos y los
encuestados colaboran.
Entrevistas: formularios que se cumplimentan a lo largo de una entrevista con el
encuestado. Ms caros que los cuestionarios, pero mejores para preguntas ms
complejas, y cuando se dan unos ndices de alfabetizacin bajos o se encuentra menos
colaboracin.
Observaciones directas: la realizacin de mediciones directas es el mtodo ms preciso
para todas las variables, como las capturas, pero a menudo resulta caro. Muchos
mtodos, como los programas de observacin, se limitan a la pesca industrial.
Presentacin de informes: la principal alternativa a la realizacin de mediciones directas
consiste en pedir a los pescadores y a terceros que presenten informes de sus
actividades. La preparacin de informes presupone la alfabetizacin y requiere espritu
de colaboracin, pero ello puede reforzarse mediante una obligacin legal y mediciones
directas.
Las tcnicas de recogida de la informacin no son un fin en si mismo, sino que dependen de:
Algunas tcnicas se pueden utilizar en distintos diseos, por ejemplo la entrevista se puede
utilizar en: investigacin accin, en estudios de caso, en investigacin etnogrfica, etc.
4.2. Identificacin del estimador determinante (estimador lder) del
tamao de la simulacin.
Por definicin, el valor de una variable cambia conforme avanza la simulacin, aunque se le
debe dar un valor inicial. Cabe recordar que el valor de un parmetro permanece constante; sin
embargo, puede cambiar conforme se estudian diferentes alternativas en otras simulaciones.
Lo anterior se debe a que el modelo se sesga por una serie de valores iniciales hasta que el
modelo llega a un estado estable.
Para manejar este problema, los analistas han seguido varios planteamientos como
De hecho, muchos analistas consideran la simulacin como una forma de prueba de hiptesis
donde cada ejecucin de simulacin ofrece uno o ms datos de muestra que son susceptibles
al anlisis formal a travs de los mtodos estadsticos inferenciales. Los procedimientos
estadsticos que normalmente se usan en la evaluacin de resultados de simulacin incluyen el
anlisis de varianza, anlisis de regresin y pruebas t.
Ejemplo:
1) Comparad los valores del estimador 1 (primera observacin) para los diferentes tamaos
muestrales (n = 2; 10; 50; 500).
Hay una serie de caractersticas deseables en los estimadores para que stos constituyan una
buena aproximacin a los respectivos parmetros. Se trata de rasgos que podran entenderse
como criterios de calidad de los estimadores.
Por ejemplo, la media [D] es un estimador insesgado de , puesto que se cumple, tal y como
vimos en el captulo anterior al estudiar la distribucin muestral del estadstico media, que
E( [D]) =
[D] o bien, [D]. Para cada uno de ellos, el valor esperado resulta ser:
[D]
Cuando E() , decimos que el estimador sesgado tiene un sesgo positivo si E() > , o que
tiene un sesgo negativo si E() < . Un estimador sesgado tender a ofrecer sistemticamente
valores que se alejan en un sentido u otro del parmetro, aunque la muestra sea elegida
aleatoriamente.
2. muestral infinito obtenemos una varianza del estimador nula. Por tanto, un estimador es
consistente si cuando n tiende a infinito se cumple
E() = ; var() = 0
La media es un estimador consistente del parmetro , puesto que se verifican las condiciones
anteriores. Es decir.
[D]
Por tanto, si un estadstico es ms eficiente que otro, significa que vara menos de unas
muestras a otras. Se demuestra que la media es un estimador del parmetro ms eficiente
que la mediana. Del mismo modo, la varianza Sn-12 es un estimador de 2 ms eficiente que
Sn2.
[D]
para cuyo clculo se tienen en cuenta todas las puntuaciones Xi. Otro tanto ocurre con los
estimadores Sn-12 y Sn2 de la varianza. Todos ellos pueden ser considerados estimadores
suficientes de los respectivos parmetros.
Sea H un intervalo cualquiera definido sobre la recta real. Definiremos ahora una variable
ficticia, XH , de la siguiente forma:
De manera que cada observacin de Xt Ileva asociada una observacin -con valor o 1- de la
variable XNr . La funcin de densidad terica -desconocida- de Xt asigna una probabilidad pH
al intervalo H. Esto significa que:
Producir T replicaciones del vector y, implica disponer de una muestra de T observaciones" de
la variable real X. Esta muestra lleva asociada, a su vez, una muestra de tamao T de la
variable Xy .Esta variable sigue una distribucin binaria de parmetro pH , as que la suma de
las T observaciones de XH , ZH = XH^ +. ,.+ X y T , sigue una distribucin binomial b(pH ,^. Es
oportuno aqu hacer una adaptacin al presente contexto del concepto de estimacin precisa
de Finster{ 1987) Definicin 1. ,ZH /T es una estimacin precisa de pN con nivel de imprecisin
A y confianza 1-a (can 0< cx < 1), si
Mtodo estadstico
Mtodo tradicional
Mtodo Estadstico
MTODO ESTADSTICO
El mtodo estadstico requiere que se efecten cierto nmero de observaciones preliminares
(n'), para luego poder aplicar la siguiente frmula:
Siendo:
Ejemplo
7 49
8 64
8 64
7 49
x = 38 x = 290
8
7
8
8
7
N' = 5
Dado que el nmero de observaciones preliminares (5) es inferior al requerido (7), debe
aumentarse el tamao de las observaciones preliminares, luego recalcular n. Puede ser que en
reclculo se determine que la cantidad de 7 observaciones sean suficientes.
1) Realizar una muestra tomando 10 lecturas s los ciclos son <= 2 minutos y 5
lecturas s los ciclos son > 2 minutos, esto debido a que hay ms confiabilidad
en tiempos ms grandes, que en tiempos muy pequeos donde la probabilidad
de error puede aumentar.
2) Calcular el rango o intervalo de los tiempos de ciclo, es decir, restar del tiempo
mayor el tiempo menor de la muestra:
Siendo:
Tomando como base los tiempos contemplados en el ejemplo del mtodo estadstico,
abordaremos el clculo del nmero de observaciones segn el mtodo tradicional.
En primer lugar como el ciclo es inferior a los 2 minutos, se realizan 5 muestras adicionales (6,
8, 8, 7, 8) para cumplir con las 10 muestras para ciclos <= 2 minutos. Las observaciones son
las siguientes:
8
7
8
8
7
6
8
8
7
8
x = 75
8
7
8
8
7
Se calcula el rango:
R (Rango) = 8 - 6 = 2
Por lo cual podemos concluir que ambos mtodos arrojan resultados muy parecidos y que la
eleccin del mtodo se deja a criterio del especialista.
En este caso, la lnea negra horizontal representa el valor fijo de la media desconocida de la
poblacin, . Los intervalos de confianza azules verticales que se sobreponen a la lnea
horizontal contienen el valor de la media de la poblacin. El intervalo de confianza rojo que est
completamente por debajo de la lnea horizontal no lo contiene. Un intervalo de confianza de
95% indica que 19 de 20 muestras (95%) de la misma poblacin generarn intervalos de
confianza que contendrn el parmetro de poblacin.
Utilice el intervalo de confianza para evaluar la estimacin del parmetro de poblacin. Por
ejemplo, un fabricante desea saber si la longitud media de los lpices que produce es diferente
de la longitud objetivo. El fabricante toma una muestra aleatoria de lpices y determina que la
longitud media de la muestra es 52 milmetros y el intervalo de confianza de 95% es (50,54).
Por lo tanto, usted puede estar 95% seguro de que la longitud media de todos los lpices se
encuentra entre 50 y 54 milmetros.
Estimacin de punto
Este valor individual estima un parmetro de poblacin usando los datos de su muestra.
Margen de error
Cuando usted utiliza estadsticos para estimar un valor, es importante recordar que sin importar
lo bien que est diseado su estudio, su estimacin est sujeta a error de muestreo aleatorio.
El margen de error cuantifica este error e indica la precisin de su estimacin.
Usted probablemente ya entiende el margen de error, porque est relacionado con los
resultados de las encuestas. Por ejemplo, una encuesta poltica podra indicar que el nivel de
popularidad de un candidato es de 55% con un margen de error de 5%. Esto significa que el
nivel de popularidad real es +/- 5% y, por lo tanto, se ubica entre 50% y 60%.
Mientras mayor sea el margen de error, ms ancho ser el intervalo y menos seguro podr
estar usted del valor de la estimacin de punto.
El estudio de Monte Carlo para determinar la validez del empleo de la prueba del error estndar
de ajuste como criterio de seleccin en el anlisis de frecuencias. Dicho estadstico se compar
con los estadsticos de prueba de Kolmogorov-Smirnov, Cramer-Von Mises y Anderson-Darling.
Las distribuciones elegidas para el propsito de comparar estos estadsticos fueron la gamma,
Weibull, Gumbel, log-normal y log-logstica. Los resultados obtenidos recomiendan el uso de
muestras con tamao de por lo menos de ms de n=50 para tener un buen desempeo de las
pruebas de Anderson-Darling y error estndar de ajuste. El empleo de las pruebas de
Kolmogorov-Smirnov y Cramer-Von Mises o pruebas Karl-Pearson es del todo recomendable
en hidrologa, ya que para obtener un desempeo aceptable se necesitan muestras ms
grandes de las que normalmente se tienen en esta disciplina.
Otros mtodos usados a menudo son los de funcin de distribucin emprica (FDE), que
incluyen las pruebas de Kolmogorov-Smirnov (KS), Cramer-Von Mises (CVM) y Anderson-
Darling (AD) (p. ej., Laio, 2004; Suhaila & Jemain, 2007; Dan'azumi, Shamsudin, & Aris, 2010;
Shin et al., 2011; Atroosh & Moustafa, 2012). Sin embargo, las pruebas estadsticas de bondad
de ajuste tienen poco poder para rechazar distribuciones equivocadas (Mitosek, Strupczewski,
& Singh, 2002), por lo que en muchos casos, ms de una distribucin puede ser aceptada por
una prueba especfica (Laio, Baldasarre, & Montanari, 2009).
En este caso, el concepto de criterio de seleccin de modelos representa una alternativa a las
pruebas de bondad de ajuste. Pueden definirse diversos criterios de seleccin en funcin de los
estadsticos de bondad de ajuste antes mencionados. Otros criterios de seleccin se basan en
la funcin de verosimilitud, como el criterio de informacin de Akaike (CIA) y el criterio de
informacin Bayesiano (CIB) (Laio et al., 2009). Balasooriya, Low y Wong (2005) evaluaron la
efectividad de los criterios de Akaike, y de Quesenberry y Kent. Encontraron que si bien ambos
criterios tuvieron un buen desempeo, el segundo fue ligeramente mejor; sin embargo, la
dificultad computacional de este criterio hace preferible el empleo del CIA. Los criterios de
seleccin de modelos probabilsticos han recibido poca atencin en la literatura hidrolgica.
Mitosek et al. (2002) consideraron las distribuciones Weibull, gamma, Gumbel y log-normal
como modelos alternativos para la distribucin de caudales pico anuales, y evaluaron estas
distribuciones usando tres ndices: la desviacin absoluta media, la media cuadrtica y la
funcin de verosimilitud normalizada. Tras realizar un estudio de Monte Carlo, concluyeron que
la funcin de verosimilitud normalizada representaba el mejor criterio de seleccin. El Adlouni,
Bobe y Ouarda (2008) utilizaron tcnicas grficas para seleccionar la clase de distribuciones
que proporciona el mejor ajuste a un conjunto de datos. Utilizaron el criterio de clasificacin de
Werner y Upper (2002), quienes dividieron las distribuciones en: a) estables; b) con cola tipo
Parteo; c) regularmente variantes; d) sub-exponenciales; e) con momentos exponenciales
inexistentes.
Estas simulaciones muestran que los criterios de seleccin ayudan a escoger la mejor
distribucin para un anlisis de frecuencias. Se encontr que de los criterios empleados, el
mejor fue AD, seguido por el EEA. Tambin se observ que es difcil discriminar entre dos
distribuciones parecidas. Tambin se encontr que el porcentaje de seleccin correcta (PSC)
de los criterios de seleccin depende del tamao de la muestra n y de la distribucin que
siguen los datos generados.
En general, el criterio de AD resulta con mejores estimaciones para T = 100, aun cuando no
escoge la distribucin correcta. Tambin se observ que tiende a producir estimaciones ms
pequeas que los dems criterios considerados, y que en la mayora de los casos subestima el
valor xT. Para T = 10 no hay grandes diferencias entre los criterios. A partir de los resultados
obtenidos, se recomiendan muestras con tamao de por lo menos n = 50 para tener un buen
desempeo de las pruebas de AD y EEA. El empleo de las pruebas de KS y CVM no se
recomienda a menos que se tengan muestras grandes.
El estadstico de Anderson-Darling
Qu es el estadstico de Anderson-Darling?
El estadstico Anderson-Darling mide qu tan bien siguen los datos una distribucin especfica.
Para un conjunto de datos y distribucin en particular, mientras mejor se ajuste la distribucin a
los datos, menor ser este estadstico. Por ejemplo, usted puede utilizar el estadstico de
Anderson-Darling para determinar si los datos satisfacen el supuesto de normalidad para una
prueba t.
La prueba de Anderson-Darling es usada para probar si una muestra viene de una distribucin
especifica. Esta prueba es una modificacin de la prueba de Kolmogorov- Smirnov donde se le
da ms peso a las colas de la distribucin que la prueba de Kolmogorov-Smirnov.
Donde:
n es el nmero de datos
Para definir la regla de rechazo para esta prueba es necesario, tambin, obtener el estadstico
ajustado para luego compararlo con los valores crticos de la tabla de Anderson- Darling.
Prueba G o prueba del logaritmo de la razn de Verosimilitudes
No debe confundirse con el trmino probabilidad: sta permite, a partir de una serie de parmetros
conocidos, realizar predicciones acerca de los valores que toma una variable aleatoria.
Formula
En los casos anteriores, los eventos considerados tenan una probabilidad p estrictamente mayor
que cero. Pero cuando la nocin de verosimilitud se extiende a variables aleatorias con una funcin
de densidad f sobre, por ejemplo, el eje real, la probabilidad de un evento cualquiera es nula.
Desarrollada en la dcada de los treinta del siglo XX, esta prueba permite al igual
que la prueba Chi-cuadrada determinar la distribucin de probabilidad de una serie
de datos. Una limitante de la prueba de Kolmogorov-Smirnov estriba en que solamente
se puede aplicar al anlisis de variables continuas. El procedimiento general de la
prueba es:
Si las relaciones matemticas o lgicas que comprende el modelo son sencillas, entonces ser
posible utilizar un procedimiento analtico para obtener una solucin o respuesta exacta sobre
las caractersticas de inters del sistema analizado. No obstante, si las relaciones son
complejas, puede ocurrir que no se pueda evaluar analticamente el problema. En este caso,
ser necesario acudir a la simulacin del sistema, evaluando numricamente el modelo y
analizando los datos obtenidos para estimar las caractersticas de dicho sistema.
Los elementos que forman parte del sistema vienen condicionados por el objetivo del estudio
que se pretende realizar, ya que un sistema definido para un estudio determinado puede ser
una parte de un sistema ms amplio definido para otro estudio particular. Por ejemplo, si se
quiere determinar cul es el nmero ms adecuado de operarios y mquinas en la seccin de
mecanizado de una empresa que tiene una determinada cartera de pedidos, estos elementos
sern los que formen parte del sistema a analizar, mientras que, si lo que se desea es estudiar
la capacidad productiva de la empresa, los elementos mencionados anteriormente slo sern
una parte del sistema. A ellos habr que aadir montaje, embalaje, almacenaje, etc.
Tipos de sistemas
Evidentemente, las caractersticas del sistema real que se desea estudiar van a condicionar el
tipo de simulacin que se va a desarrollar. Por lo tanto, conviene hacer una clasificacin de los
sistemas de acuerdo con los aspectos que van a condicionar su anlisis posterior. As, es til
realizar una clasificacin de los sistemas atendiendo a tres aspectos fundamentales:
Sistemas estticos y sistemas dinmicos. Un sistema se considera esttico cuando sus
variables de estado no cambian a lo largo del tiempo, es decir, cuando el tiempo no juega
ningn papel en sus propiedades. Por el contrario, en un sistema dinmico los valores que
toman todas o algunas de sus variables de accin evolucionan a lo largo del tiempo.
Tipos de modelos
Para estudiar un sistema, la forma ms inmediata sera experimentar sobre l. Sin embargo,
esto puede ser desaconsejable, e incluso imposible, por diversos motivos:
La experimentacin sobre el sistema real puede conllevar unos plazos de tiempo muy
dilatados. Es el caso, por ejemplo, de ciertos sistemas sociales o biolgicos.
Necesidad de la simulacin
En los sistemas continuos es frecuente que unas variables de estado representen la tasa o
velocidad de cambio de otras variables de estado. La formulacin matemtica de estos
modelos lleva a la aparicin de ecuaciones diferenciales que indican las relaciones
anteriormente mencionadas. Si el sistema tiene una cierta complejidad, puede ocurrir que
las ecuaciones diferenciales sean no lineales y, por lo tanto, de difcil o imposible resolucin
analtica.
En los sistemas discretos pueden aparecer fenmenos aleatorios que slo se pueden
representar en trminos probabilistas. En este caso, la formulacin matemtica del modelo
contiene relaciones en las que aparecen funciones de distribucin o de densidad de
probabilidad, que dificultan o impiden su resolucin analtica.
Como ya se ha indicado, la catalogacin de un sistema como continuo o discreto depende del
objetivo del estudio y de las variables de estado predominantes. Esto quiere decir que un
mismo sistema puede tener ciertas variables de estado continuas y otras discretas. Por lo
tanto, no es infrecuente encontrar modelos en los que coexisten ecuaciones diferenciales
complejas con variables aleatorias, lo que, evidentemente, complica an ms la resolucin
analtica.
Ventajas de la simulacin
La simulacin permite estudiar un sistema cuya evolucin es muy dilatada en el tiempo (por
ejemplo, un sistema econmico) en un periodo de tiempo reducido. Alternativamente,
tambin permite estudiar de forma detallada la evolucin de un sistema en un corto periodo
de tiempo.
Conclusin
http://revistas.utp.edu.co/index.php/revistaciencia/article/view/3137
http://www.iol.etsii.upm.es/arch/simulacion.pdf
file:///C:/Users/El%20Kostra/Downloads/693-388-140_10.pdf
https://www.ingenieriaindustrialonline.com/herramientas-para-el-ingeniero-industrial/estudio-de-
tiempos/c%C3%A1lculo-del-n%C3%BAmero-de-observaciones/
http://www.didacticaambiental.com/revista/numero10/6.-.pdf
http://support.minitab.com/es-mx/minitab/17/topic-library/basic-statistics-and-
graphs/introductory-concepts/confidence-interval/confidence-interval/
http://campus.fi.uba.ar/course/view.php?id=187
http://www.iol.etsii.upm.es/arch/simulacion.pdf
http://www.redalyc.org/pdf/302/30235208.pdf
http://www.simulacion.com/trabajos-pdf5/prueba-chi-cuadrada-estadistica/prueba-chi-cuadrada-
estadistica.shtml
http://simulacionunilibre.blogspot.mx/p/prueba-anderson-darling.html
http://www.econ.unicen.edu.ar/attachments/1051_TecnicasIISimulacion.pdf
http://www.cyta.com.ar/biblioteca/bddoc/bdlibros/monte_carlo/monte_carlo.htm?iframe=true&width=95
%&height=95%
http://www.scielo.org.mx/scielo.php?pid=S2007-24222014000500012&script=sci_arttext&tlng=en
http://dspace.ucbscz.edu.bo/dspace/bitstream/123456789/4345/3/1368.pdf