Trabajo Colaborativo II Inferencia Estadistica

TRABAJO COLABORATIVO 2
1. Establezca la diferencia entre: Nivel de significacin y potencia de una prueba; pruebas parametricas y pruebas No parametricas. En la prctica, es frecuente un nivel de significacin de 0,05 95% de nivel de confianza, si se escoge el nivel de significacin 0,05 ( 5%), entonces hay unas cinco oportunidades entre 100 de rechazar la hiptesis cuando debiera haberse aceptado, en este caso tenemos un 95% de confianza de que la decisin es correcta, lo cual quiere decir que tal hiptesis tiene una probabilidad 0,05 de ser falsa. La prueba de hiptesis es un procedimiento de toma de decisiones, relacionada principalmente con la eleccin de una accin entre dos conjuntos posibles de valores del parmetro, es decir, en dos hiptesis estadsticas, que son la Hiptesis nula H0 y la Hiptesis alternativa H1 Se denominan pruebas parametricas se basan en distribucin de probabilidad normal, del modelo probabilstico depende la eleccin del estimador y el calculo de la estimacin. Se denominan pruebas no parametricas aquellas que no presuponen una distribucin de probabilidad para los datos, por ello se conocen tambin como de distribucin libre.
2. El tamao de una muestra para realizar inferencia estadstica depende de unos factores, (la confiabilidad, la varianza y el error de estimacin), Explique los criterios que tiene un investigador para la determinacin de estos factores. Siempre que tomamos una muestra, perdemos algo de informacin til con respecto a la poblacin. El error de muestreo se puede controlar si seleccionamos una muestra cuyo tamao sea el adecuado. En general, cuanta ms precisin se quiera, ms grande ser el tamao de la muestra necesaria. Para determinar la confiabilidad, la varianza y el error de estimacin se debe tener en cuenta: Un estimador es una variable aleatoria, y por lo tanto es posible asociarle probabilidades, lo que resulta de suma utilidad como herramienta auxiliar para la toma de decisiones bajo condiciones de incertidumbre. Una estimacin, en cambio, es un valor particular del estimador, calculado en base a una muestra dada. Por tanto, constituye un valor fijo (no aleatorio) que caracteriza a esa muestra en particular, pero que se usa para inferir el valor de un parmetro desconocido. Entre un estimador puntual y uno por intervalos, es preferible usar este ltimo porque tiene asociado una probabilidad que contempla el error que se puede cometer en la aproximacin. Es indispensable entender que es el objetivo de la propuesta de investigacin quin guiar los supuestos para determinar el tamao de muestra, as como lo hace con otros aspectos metodolgicos, entre ellos el tipo de estudio. Adems es importante asegurarse de que el estudio tendr suficiente tamao de muestra para responder a la pregunta de investigacin
Igualmente importante es prever un plan de anlisis estadstico, con el propsito de definir las pruebas o medidas que se utilizarn, porque ellas sern indispensables en la determinacin de la muestra, pues, como ejemplifica en el siguiente cuadro, existen factores especficos que intervienen en el clculo del tamao muestral:
3. Qu significan el error tipo I y el error tipo II. Explique su interpretacin con un ejemplo. Rechazar una hiptesis no significa que sta sea falsa, como tampoco el no rechazarla significa que sea verdadera. La decisin tomada no esta libre de error. Error I: Rechazar una hiptesis que es verdadera. (Rechazamos una hiptesis cuando debiera ser aceptada). Probabilidad de cometer el error tipo I Probabilidad de rechazar Ho cuando es verdadera. (1 - ) Probabilidad de acertar el Ho cuando es verdadera.
Error II: No rechazar una hiptesis que es falsa (Aceptamos una hiptesis que debiera ser rechazada). Probabilidad de cometer el error tipo II Probabilidad de aceptar Ho cuando es falsa. (1 - ) Probabilidad de rechazar Ho cuando es falsa. 4. Explique cuales son los supuestos de homogeneidad, homocedasticidad, independencia y Normalidad, que deben cumplirse para validar un anlisis de varianzas. Cuando se desea conocer la homogeneidad que existe entre tres o ms medias mustrales, se procede a determinar la variabilidad entre esas medias, tcnica que se conoce como .anlisis de varianza. La homocedasticidad es que la varianza de los residuos es constante y no vara en los diferentes niveles del factor. La falta de homocedasticidad se denomina heterocedasticidad. La falta de independencia, se produce fundamentalmente cuando se trabaja con variables aleatorias que se observan a lo largo del tiempo y tiene una gran influencia en las conclusiones del estudio, invalidndolas en la mayora de los casos. Los contrastes para detectar la dependencia se pueden clasificar en dos tipos: los basados en rachas que se utilizan bsicamente cuando se dispone de pocas observaciones y los basados en los coeficientes de auto correlacin. La falta de normalidad afecta poco a la tabla ANOVA y a los contrastes de igualdad de medias, pero si afecta a la estimacin de 2. 5. Comprueben a partir de dos muestras independientes de igual tamao de hombres y mujeres, la opinin de acuerdo o desacuerdo con algn tema de su inters, a travs del contraste de una hiptesis, en la se establezca si existen diferencias de opinin entre los hombres y mujeres sobre el tema de inters consultado. Interprete los resultados a que diere lugar este caso. Para dar respuesta a este caso utilice los pasos para el contraste de una hiptesis. Los pasos necesarios para realizar un contraste relativo a un parmetro q son: 1. Establecer la hiptesis nula en trminos de igualdad
2. Establecer la hiptesis alternativa, que puede hacerse de tres maneras, dependiendo del inters del investigador
en el primer caso se habla de contraste bilateral o de dos colas, y en los otros dos de lateral (derecho en el 2 caso, o izquierdo en el 3) o una cola. 3. Elegir un nivel de significacin: nivel crtico para a
4. Elegir un estadstico de contraste: estadstico cuya distribucin muestral se conozca en H0 y que est relacionado con q y establecer, en base a dicha distribucin, la regin crtica: regin en la que el estadstico tiene una probabilidad menor que a si H0 fuera cierta y, en consecuencia, si el estadstico cayera en la misma, se rechazara H0. Obsrvese que, de esta manera, se est ms seguro cuando se rechaza una hiptesis que cuando no. Por eso se fija como H0 lo que se quiere rechazar. Cuando no se rechaza, no se ha demostrado nada, simplemente no se ha podido rechazar. Por otro lado, la decisin se toma en base a la distribucin muestral en H0, por eso es necesario que tenga la igualdad. 5. Calcular el estadstico para una muestra aleatoria y compararlo con la regin crtica, o equivalentemente, calcular el "valor p" del estadstico (probabilidad de obtener ese valor, u otro ms alejado de la H0, si H0 fuera cierta) y compararlo con a. 6. Establezca las consideraciones que deben hacerse para seleccionar entre un modelo paramrtico o su correspondiente No paramtrico. Las pruebas de hiptesis hacen inferencias respecto a los parmetros de la poblacin, como la media. Estas pruebas paramtricas utilizan la estadstica paramtrica de muestras que provinieron de la poblacin que se est probando. En los modelos paramtricos las poblaciones no siempre son normales. Los estadsticos han desarrollado tcnicas tiles que no hacen suposiciones restrictivas respecto a la forma de las distribuciones de las poblaciones. stas se conocen como pruebas sin distribucin, o pruebas no paramtricas. Las hiptesis de una probabilidad no paramtrica se refieren a algo distinto del valor de un parmetro de poblacin. Cuando trabajamos con muestras pequeas (n < 10) en las que se desconoce si es vlido suponer la normalidad de los datos, conviene utilizar pruebas no paramtricas, al menos para corroborar los resultados obtenidos a partir de la utilizacin de la teora basada en la normal. En general el nico supuesto que se debe cumplir en la mayora de las pruebas no paramtricas para confiar en ellas, es que la muestra haya sido seleccionada en forma probabilstica 7. Una de las opciones que tiene la estadstica para realizar inferencia sobre los parmetros de una poblacin es la prueba de hiptesis. Explique las ventajas y desventajas con respecto al otro mtodo de estimacin. El otro mtodo de estimacin (adems del tradicional) es el mtodo del valor P: En contrastes de hiptesis, en Estadstica, el p-valor est definido como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido, suponiendo que la hiptesis nula es cierta. Es fundamental tener en cuenta que el p-valor est basado en la asuncin de la hiptesis de partida (o hiptesis nula). Se rechaza la hiptesis nula si el valor P asociado al resultado observado es igual o menor que el nivel de significacin establecido, convencionalmente 0,05 0,01, punto que se llama potencia del contraste. Es
decir, el p-valor nos muestra la probabilidad de haber obtenido el resultado que hemos obtenido si suponemos que la hiptesis nula es cierta. Si el p-valor es inferior a la potencia del contraste nos indica que lo ms probable es que la hiptesis de partida sea falsa. Sin embargo, tambin es posible que estemos ante una observacin atpica, por lo que estaramos cometiendo el error estadstico de rechazar la hiptesis nula cuando sta es cierta basndonos en que hemos tenido la mala suerte de encontrar una observacin atpica. Este tipo de errores se puede subsanar rebajando el p-valor, un p-valor de 0,05 es usado en investigaciones habituales sociolgicas mientras que p-valores de 0,01 se utilizan en investigaciones mdicas, en las que cometer un error puede acarrear consecuencias ms graves. Tambin se puede tratar de subsanar dicho error aumentando el tamao de la muestra obtenida, esto reduce la posibilidad de que el dato obtenido sea casualmente raro. Valor P es un valor de probabilidad por lo que oscila entre 0 y 1. As, se suele decir que valores altos de valor P aceptan la H0 o, dicho de forma correcta, no permiten rechazar la H0. De igual manera, valores bajos de valor P rechazan la H0. Es importante recalcar que un contraste de hiptesis nula no permite aceptar una hiptesis, simplemente la rechaza o no la rechaza, es decir que la tacha de verosmil (lo que no significa obligatoriamente que sea cierta, simplemente es lo ms probable que sea cierta que sea falsa) o inverosmil, por lo que se rechaza. El mtodo tradicional Basa su estudio en el estadstico prueba, los valores crticos y la regin crtica, para lo cual se dibuja una grfica que incluye el estadstico prueba, mientras que el otro mtodo se apoya en el estadstico prueba y el valor P. 8. Los dos mtodos No paramrtico para realizar una bondad de ajuste de los datos de una variable con respecto a una distribucin de probabilidad son: El de Chi-cuadrado y el de Kolmogorov - Smirnov. Explique en que condiciones debe usarse cada uno de ellos. EL DE CHI CUADRADO La prueba de independencia Chi-cuadrado, nos permite determinar si existe una relacin entre dos variables categricas. Es necesario resaltar que esta prueba nos indica si existe o no una relacin entre las variables, pero no indica el grado o el tipo de relacin; es decir, no indica el porcentaje de influencia de una variable sobre la otra o la variable que causa la influencia. EL DE KOLMOGOROV - SMIRNOV La prueba de Kolmogorov-Smirnov para una muestra se considera un procedimiento de "bondad de ajuste", es decir, permite medir el grado de concordancia existente entre la distribucin de un conjunto de datos y una distribucin terica especfica. Su objetivo es sealar si los datos provienen de una poblacin que tiene la distribucin terica especificada. Mediante la prueba se compara la distribucin acumulada de las frecuencias tericas (ft) con la distribucin acumulada de las frecuencias observadas (f obs), se encuentra el punto de divergencia mxima y se determina qu probabilidad existe de que una diferencia de esa magnitud se deba al azar.
9. El anlisis de varianza es una tcnica estadstica utilizada para medir el efecto que tiene cada uno de los niveles en que se clasifica una variable sobre otra variable que representa las repuestas a las mediciones
realizadas una experimentacin. Explique las condiciones que se deben imponer a las dos variables y los supuestos que deben cumplirse para que tenga validez el uso de esta tcnica. Una de las principales condiciones que se deben imponer a las variables tiene que ver con interaccin entre los dos factores. Es decir, no es correcto realizar las dos pruebas ANOVA a los factores por separado, pues se desperdicia informacin importante que tiene que ver con la interaccin entre las dos variables. Hay interaccin entre dos factores si el efecto de uno de los factores, cambia en las diferentes categoras del otro factor. El anlisis de varianza admite las siguientes suposiciones: Para cada poblacin la variable de respuesta est normalmente distribuida. le respuesta es la misma para todas las poblaciones. Las observaciones deben ser independientes. 10. Existen dos tipos de modelo de anlisis de varianza: de efectos fijos y de efectos aleatorios. Explique el significado cada uno de ellos en un anlisis de varianza. ANALISIS DE VARIANZA DE EFECTOS FIJOS Es cuando los resultados obtenidos slo son vlidos para esos determinados niveles del factor estudiado y lo que ocurra a otros niveles del factor puede ser diferente. ANALISIS DE VARIANZA DE EFECTOS ALEATORIOS Es cuando los resultados obtenidos son vlidos para cualquier nivel del factor estudiado.

Trabajo Colaborativo II Inferencia Estadistica

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Trabajo Colaborativo II Inferencia Estadistica

Uploaded by

Copyright:

Available Formats

TRABAJO COLABORATIVO 2

You might also like