You are on page 1of 35

ESTADSTICA INFERENCIAL: CONCEPTOS Y APLICACIONES PRCTICAS

Luis Ernesto Cruz Ocaa Mara del Carmen Hernndez Modesto

ndice Pg. 3 4 4 4 5 5 5 6 7 9 9 11 12 13 14 14 14 14 15 16 16 18 21 22 23 24 25 27 29 31 35 36

Introduccin 1. Concepto de Estadstica Inferencial 1.1. Elementos de una prueba estadstica 1.2. Medidas de tendencia central 1.3. Medidas de variabilidad o dispersin de datos 1.4. Poblacin 1.5. Muestra 2. Probabilidad 3. Distribucin normal: modelo de probabilidad 5. Muestreo probabilstico 5.1. Muestreo aleatorio simple 5.2. Muestreo Sistemtico 5.3. Muestreo Estratificado 5.4. Muestreo por conglomerados 6. Muestreo no probabilstico 6.1. Muestro Casual 6.2. Muestreo Intencional o de juicio 6.3. Muestreo por cuotas 7. Pruebas de Hiptesis 8. Pruebas paramtricas 8.1. Pruebas de hiptesis para una media poblacional 8.2. Pruebas de hiptesis para la diferencia entre dos medias poblacionales 8.3. Prueba de hiptesis para la proporcin poblacional 8.4. Prueba de hiptesis para la diferencia entre dos proporciones poblacionales 9. Pruebas para muestras pequeas 9.1. Inferencias con muestras pequeas para una media poblacional 9.2. Inferencias con muestras pequeas para la diferencia entre dos medias de poblacin 9.3. Pruebas para la comparacin de dos variancias de poblacin 10. Prueba Ji-cuadrada 11. Anlisis de variancia (ANOVA) Conclusin Bibliografa

INTRODUCCIN Cul es la importancia de la estadstica dentro del mbito de lo educativo? Y qu relacin tiene la Estadstica con la Pedagoga? stas son las preguntas que constantemente se hacen los estudiantes que dentro de la Licenciatura en Pedagoga se encuentran con la necesidad o aparente obligacin de cursar dos semestres de Estadstica. La Estadstica, cabe mencionar, no es un mero relleno dentro del plan de estudios de la Licenciatura en Pedagoga, sino que se constituye en una verdadera necesidad para la realizacin de diversos proyectos, investigaciones y estudios de corte cuantitativo. Pero no se queda ah, sino que todos los datos que mediante los anlisis estadsticos son recuperados pueden y deben ser utilizados para realizar interpretaciones que van ms all de lo puramente cuantitativo, inmiscuyndose en el rea de lo cualitativo. Dentro de la misma Estadstica es posible encontrar una diferenciacin entre la Estadstica llamada descriptiva que precisamente expresa realidades numricamente, incorporando una serie de datos que pueden servir a diversos propsitos, y la Estadstica Inferencial que se dirige a la toma de decisiones y la realizacin de inferencias, como su nombre lo dice, a partir de los datos que se obtienen. Por lo anterior es posible decir que la Estadstica no se contenta solamente con recopilar datos, sino que los utiliza para realizar acciones a partir de ellos. La Pedagoga, al igual que otras ciencias humanas y sociales, se fundamenta en la Estadstica de diversas maneras con el fin de analizar de forma cuantitativa realidades educativas. La Pedagoga requiere del conocimiento de los fundamentos estadsticos para la incorporacin de datos en su quehacer, de manera que a partir de ellos, se propongan nuevos caminos, nuevas propuestas y soluciones novedosas a problemticas distintas. Reconociendo la importancia de la Estadstica, especficamente de la Estadstica Inferencial, para la Pedagoga es que se realiza el siguiente trabajo que pretende brindar elementos tanto tericos como prcticos. Se propone definir ciertos conceptos y presentar los procedimientos para la realizacin de ciertos problemas estadsticos con ejercicios que los ejemplifiquen. Para esto, el trabajo se divide en 11 breves captulos donde se busca presentar la Estadstica Inferencial, sus conceptos y sus aplicaciones. El recorrido va del concepto de la Estadstica Inferencial como tal, a los conceptos de probabilidad, distribucin normal como modelo de probabilidad, los conceptos de poblacin y muestra. Tambin se presentan los distintos tipos de muestreo probabilsticos y no probabilsticos y las pruebas de hiptesis ms usuales dentro del campo de la Estadstica. Es necesario precisar que por cada tipo de muestreo y prueba de hiptesis es posible encontrar un ejercicio para su mejor comprensin. Al final tambin se puede hallar, la bibliografa bsica utilizada, as como ciertos links en Internet para sucesivas bsquedas. El presente trabajo, cabe repetir, es un acercamiento al campo de la Estadstica Inferencial para mostrar que lo estadstico va de la mano de lo pedaggico y viceversa. No se encuentran peleados, sino que van de la mano hacia el estudio de distintas problemticas.

1. CONCEPTO DE ESTADSTICA INFERENCIAL


La Estadstica Inferencial, es el proceso por el cual se deducen (infieren) propiedades o caractersticas de una poblacin a partir de una muestra significativa. Se dirige a la realizacin de inferencias, esto es, la toma de decisiones basndose en los datos recogidos de una muestra de la poblacin o universo de estudio. La estadstica inferencial comprende las tcnicas con las que, con base nicamente en una muestra sometida a observacin, se toman decisiones sobre una poblacin o proceso estadsticos. Dado que estas decisiones se toman en condiciones de incertidumbre, suponen el uso de conceptos de probabilidad. Mientras que a las caractersticas medidas de una muestra se les llama estadsticas muestrales, a las caractersticas medidas de una poblacin estadstica, o universo, se les llama parmetros de la poblacin. El procedimiento para la medicin de las caractersticas de todos los miembros de una poblacin definida se llama censo. Cuando la inferencia estadstica se usa en el control de procesos, al muestreo, le interesa en particular el descubrimiento y control de las fuentes de variacin en la calidad de la produccin.

1.1. Elementos de un problema estadstico


1. 2. 3. 4. Definicin clara del objetivo del experimento y de la poblacin pertinente. Diseo del experimento o del procedimiento de muestreo. Coleccin y anlisis de los datos. Procedimiento para formular inferencias acerca de la poblacin con base en la informacin muestral. 5. Obtencin de una medida de la bondad o confiabilidad de la inferencia.

1.2. Medidas de tendencia central


Media aritmtica El conjunto de n medidas o mediciones x1, x2, x3,, xn, es igual a la suma de los valores dividida entre n.
n

Media muestral x = xi
i=1

n Media poblacional:

Mediana Un conjunto de mediciones x1, x2, x3,, xn, es el valor de x que se encuentra en el punto medio o centro cuando se ordenan los valores de menor a mayor.

1.3. Medidas de variabilidad o dispersin de los datos


Variancia (varianza) De N mediciones x1, x2, x3,, xN, se define como la media de los cuadrados de las desviaciones de las mediciones respecto a su propia media . La variancia poblacional se denota por 2 y est dada por la frmula.
N

Variancia 2 = (xi - )2
i=1

N Desviacin estndar De un conjunto de mediciones de n mediciones x1, x2, x3,, xN, es igual a la raz cuadrada positiva de la variancia.
n

Desviacin estndar

S= S =

(xi x)2
i=1

n-1

1.4. Poblacin
Conjunto que representa todas las mediciones de inters para quien obtiene la muestra. Consiste en un conjunto de individuos que comparten por lo menos una caracterstica, sea ciudadana comn, la calidad de ser miembros de una asociacin voluntaria o de una raza entre otros. Las poblaciones pueden ser infinitas o finitas. Una poblacin infinita es la que contiene un nmero infinito de unidades elementales. Una poblacin es finita cuando tiene un nmero finito de unidades elementales.

1.5. Muestra
Subconjunto de mediciones seleccionado de la poblacin de inters.

2. PROBABILIDAD
La probabilidad naci gracias a los juegos de azar. En el Renacimiento empiezan a surgir inquietudes entorno a contabilizar el nmero de posibles resultados de un dado lanzado varias veces, o problemas ms prcticos sobre cmo repartir las ganancias de los jugadores cuando el juego se interrumpe antes de finalizar. A los matemticos del siglo XVI como Pacioli, Cardano y Tartaglia se deben las primeras consideraciones sobre los juegos de azar. En 1654 Antoine Gombaud, el caballero de Mr, un jugador compulsivo, pidi a Blaise Pascal que le resolviese el problema del reparto de apuestas cuando se suspenda la partida antes de terminar. La solucin consisti en darse cuenta de que el reparto de las apuestas debe hacerse en funcin de la probabilidad de ganar que tuviese cada jugador en el momento de interrumpirse el juego. Haba nacido la probabilidad. El primero en dar una definicin clsica de probabilidad fue Jakob Bernoulli en 1713, reformulada despus por Abraham De Moivre de la siguiente manera: "...una fraccin en la que el numerador es igual al nmero de apariciones del suceso y el denominador es igual al nmero total de casos en los que es suceso pueda o no pueda ocurrir. Tal fraccin expresa la probabilidad de que ocurra el suceso". El enfoque clsico de la probabilidad est basado en la suposicin de que todos los resultados del experimento son igualmente posibles. La probabilidad se calcula de la siguiente manera: Probabilidad = nmero de posibles resultados del evento nmero total de resultados posibles del evento

La probabilidad se refiere as a la frecuencia relativa de ocurrencia de cualquier resultado o evento dado, esto es, la probabilidad asociada a cualquier evento es el nmero de veces en que dicho evento puede ocurrir en relacin con el nmero total de eventos.

3. DISTRIBUCIN NORMAL: MODELO DE PROBABILIDAD


La distribucin de probabilidad es simtrica respecto a su media. Debido a esta simetra se puede simplificar la tabla de las reas listndolas entre la media y un nmero especificado z de desviaciones estndares a la derecha de . Las reas de la izquierda de la media se pueden calcular utilizando el rea correspondiente e igual a la de la derecha de la media.

La distancia de un valor dado de x a la media es (x - ). Al expresar esta distancia en unidades de desviaciones estndares , se obtiene

z=x-

Existe un correspondencia de uno a uno entre z y x (z = 0 cuando x = ). El valor de z ser positivo cuando x est por arriba de la media, y negativo cuando x sea menor que dicha medida. Su media es igual a cero y su desviacin estndar es igual a 1. El rea bajo la curva es igual al 100 %, el cual es dividido en 50 % a cada lado de la media. Al igual que a cada lado de la media es posible encontrar 3 desviaciones estndares.

50 %

50 %

-3 -2 -1 0 1 2 3 Distribucin Normal Estandarizada Los valores de z son encontrados en la tabla presentada en la pgina anterior. Ejemplo: La Mtra. de la experiencia educativa de Evaluacin de los Aprendizajes desea conocer la probabilidad que hay de que sus alumnos obtengan un promedio entre 7 y 10, si la media de calificaciones ha sido de 9 con una desviacin estndar de 1. 38. Su grupo cuenta con un total de 25 alumnos. z = x - = 7 9 = 1.44

1.38 1.38

z1 = 0.4251 = 42.51 %

z = x - = 10 9 = 0.72

z2 = 0.2642 = 26.42 %

68.92 %

-3 -2 -1 z1

1 z2

2 3

z = 42.51 + 26.42 = 68.92 % es la probabilidad de que los alumnos obtengan entre 7 y 10 de promedio.

4. MUESTREO PROBABILSTICO
El muestreo aleatorio le da a todos y a cada uno de los miembros de la poblacin igual oportunidad de ser seleccionados para la muestra. Esta caracterstica del muestro aleatorio indica que cada miembro de la poblacin debe ser identificado antes de obtener dicha muestra aleatoria, requisito que generalmente se llena obteniendo una lista que incluya a todos y cada uno de los miembros de la poblacin. El muestreo aleatorio simple, puede obtenerse mediante un proceso no muy distinto de la tcnica, actualmente conocida, de poner todos los nombres en un pedazo de papel y luego sacar slo algunos nombres del sombrero con los ojos vendados. Este procedimiento les da oportunidad a todos los miembros de la poblacin de ser seleccionada para la muestra ya que slo incluye un pedazo de papel por persona. Otra forma de seleccionar una muestra es con la utilizacin de la tabla de nmeros aleatorios tal como la tabla H.

5.1 Muestreo Aleatorio Simple


Es aquella que se extrae de la poblacin, de tal modo que en cada etapa del muestreo, cada elemento que permanece en el arreglo de la poblacin tiene una oportunidad de ser escogido. Ordenamiento: es una lista de todos los miembros o unidades en una poblacin. Tabla de nmeros aleatorios: es una formacin no ordenada de enteros, usualmente dispuestos en grupos de dos, cinco o diez dgitos en renglones y columnas. Procedimiento: Hacer una muestra completa del universo. Asignar un nmero a cada individuo del universo. A travs de una tabla de nmeros aleatorios o procedimiento similar, seleccionar un numero de individuos que van a constituir la muestra. Ejemplo: La secretaria de educacin Pblica del Estado de Veracruz realizar un estudio con respecto a la utilidad que le dan maestros y alumnos a la Enciclomedia. Para obtener la muestra se seleccionan 10 escuelas de un total de 20 escuelas urbanas y suburbanas del municipio de Xalapa, Veracruz.

1. Benito Jurez 2. Carlos A. Carrillo 3. Emiliano Zapata 4. Hugo TOP 5. Miguel Hidalgo 6. E. C. Rebsamen 7. Francisco I. Madero 8. Francisco Javier Clavijero 9. Carolino Anaya 10. Josefa Ortiz de Domnguez 11. Amricas 12. Euro hispanoamericana 13. Teresitas 14. Ignacio Allende 15. Simn Bolvar 16. Juan Escuta 17. Ignacio De la Llave 18. Jos Vasconcelos 19. Ricardo Flores Magn 20. Agustn Iturbide Las escuelas seleccionadas por medio de la tabla H, de acuerdo a la tabla siguiente fueron: Rengln 15 15 39 31 1. Benito Jurez 2. Carlos A. Carrillo 3. Miguel Hidalgo 4. E. C. Rebsamen 5. Francisco Javier Clavijero 6. Carolino Anaya 7. Euro hispanoamericana 8. Teresitas 9. Ignacio Allende 10. Simn Bolvar Columna 4 3 9 6 Combinaciones 2 8, 5, 13, 11, 14, 12 9, 1, 6,

Ejemplo de tabla de nmeros aleatorios

5.2 Muestreo Sistemtico


Este procedimiento no requiere de tabla de nmeros aleatorios, ya que se hace el muestreo con una lista de miembros de la poblacin por intervalos fijos. Una muestra sistemtica es obtenida cuando los elementos son seleccionados en una manera ordenada, la manera de la seleccin depende del nmero de elementos incluidos en la poblacin y el tamao de la muestra. El nmero de los elementos en la poblacin es, primero, dividido por el nmero deseado en la muestra. El cociente indicar si cada dcimo, cada onceavo cada centsimo elemento en la poblacin va hacer seleccionado y el primer elemento de la muestra es seleccionado al azar. 10

K=N n Ejemplo: La maestra de taller de lectura y redaccin desea regalar 5 libros de superacin personal a su grupo vespertino que consta de 38 alumnos. Donde el nmero seleccionado es 4. Para seleccionar a los ganadores de los libros realiz el siguiente: K = 38 = 7.6 = 7 5 4 + 7 = 11 11 + 7 = 18 18 + 7 = 25 25 + 7 = 32 Los valores obtenidos corresponden al nmero de lista de los alumnos. 1=4 2 = 11 3 = 18 4 = 25 5 = 32

5.3 Muestreo Estratificado


Los mtodos para seleccionar una muestra se designan como diseos de muestreo, y la muestra obtenida se llama a menudo encuesta por muestras. Un mtodo para reducir los sondeos de la opinin pblica o de los consumidores, es dividir en segmentos, llamados estratos, la regin geogrfica en la cual residen los elementos (personas) de la poblacin. Se seleccionan muestras dentro de cada estrato; despus se combina esta informacin para hacer una inferencia acerca de toda la poblacin. Tambin se puede obtener informacin acerca de las caractersticas de cada estrato. Ejemplo: Proporcional: Es aquella en la cual la fraccin del muestreo es igual para cada estrato. Se desea conocer cual es la opinin de los estudiantes de pedagoga con relacin a la ley del sida. (Se debe obtener una muestra aleatoriamente del 20 %)

11

Generaciones

2003 2004 2005 2006

Numero de porcentaje alumnos en cada estrato 197 20 % 210 20 % 200 20 % 220 20 %

Tamao muestral de cada estrato 39 42 40 22

No proporcional: Es aquella en la cual si existen diferencias en las fracciones de muestreo. Se desea conocer la opinin que tienen los alumnos del rea de humanidades con respecto al presupuesto destinado para educacin. rea de humanidades Facultades Pedagoga Sociologa Filosofa Idiomas Antropologa Letras total Tamao de poblacin 750 420 280 435 200 280 2365 la porcentaje 30 % 20 % 12 % 13 % 13 % 12 % 100 % Tamao muestra 225 84 33 56 26 33 427 de la

5.4. Muestreo por conglomerados


El muestreo por conglomerados reduce el costo del muestreo, pero tambin selecciona gran cantidad de elementos en ellos no es un sustituto ademado para escoger un numero razonable de conglomerados. Las observaciones de los elementos de un conglomerado pueden tender a dar respuestas similares. Este muestreo consiste en seleccionar primero al azar grupos llamados conglomerados de elementos individuales de la poblacin, y tomar en luego los elementos o una submuestra de ellos de cada conglomerado para constituir as la muestra global.

12

6. MUESTREO NO PROBABILSTICO
Es aquel mtodo en el que los miembros de una poblacin no tienen la misma oportunidad de ser escogidos para le muestra. Caractersticas: 1. Se elige la muestra aplicando criterio, es decir, juega un papel decisivo en su seleccin el punto de vista del investigador. 2. Puede ser circunstancial o intencional. 3. Las muestras circunstanciales o intencionales pueden ser representativas, pero no permiten calcular el error del muestreo ni el nivel de confianza de las estimaciones.

6.1. Muestreo Casual


Es el muestreo ms usual y se basa exclusivamente en lo que es ms conveniente para el investigador, simplemente se excluyen de ella los casos ms inconvenientes. Ejemplo: En un universo de escuelas del estado de Oaxaca se toma como muestra total a las escuelas de uno de sus municipios.

6.2. Muestreo Intencional o de juicio


En este tipo de muestra involucra de forma considerable la lgica, el sentido comn a la sano juicio pueden usarse para seleccionar una muestra que sea representativa de una poblacin. Ejemplo: Se desea conocer cul es la eficiencia y rapidez del proceso de inscripcin de la Facultad de Pedagoga. En el universo de estudiantes de la facultad, se toma como muestra a los primeros 40 alumnos que han concluido su inscripcin.

6.3. Muestreo por Cuotas


En el, las diversas caractersticas de una poblacin tales como edad, sexo, clase social o raza son muestreadas de acuerdo con el porcentaje que ocupan dentro de una poblacin. Ejemplo: En la escuela secundaria Federal 2 se desea realizar un estudio acerca de las relaciones entre padres e hijos, se toma como muestra a 30 estudiantes del sexo masculino, 30 del sexo femenino. 13

7. PRUEBA DE HIPTESIS
Elementos de una prueba de hiptesis 1. Hiptesis nula, Ho 2. Hiptesis alternativa, Ha 3. Estadstico de prueba 4. Regin de rechazo Error alfa / Error beta Se comete un error tipo I si se rechaza Ho cuando Ho es verdadera. La probabilidad de cometer un error tipo I se denota mediante . El valor de se denomina nivel de prueba. Se comete un error tipo II si se acepta Ho cuando Ha es verdadera. La probabilidad de cometer un error tipo II se denota mediante Decisin Aceptar Ho Rechazar Ho . Ho es falsa Error tipo II No hay error

Ho es verdadera No hay error Error tipo I

1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno por lo general tiene como resultado un aumento en la probabilidad del otro. 2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I, siempre se puede reducir al ajustar el o los valores crticos. 3. Un aumento en el tamao muestral n reducir y de forma simultnea. 4. Si la hiptesis nula es falsa, es un mximo cuando el valor real del parmetro se aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor hipottico, ser menor .

14

8. PRUEBAS PARAMTRICAS
El valor (0 + C) de una estadstica de prueba que separa las regiones de rechazo y de aceptacin se llama valor crtico de la estadstica.

0 0 + C
Regin de aceptacin Regin de rechazo

La posibilidad de rechazar la hiptesis nula cuando es cierta ser igual al rea bajo la curva normal sobre la regin de rechazo. Una prueba estadstica de una extremidad (o cola) es aquella en que la regin de rechazo se localiza solamente en una cola o extremo de la distribucin muestral de la estadstica de prueba. Mientras que una prueba de dos extremidades o colas es la que sita la regin de rechazo en ambos extremos de la distribucin de muestreo de la estadstica de prueba. El estadstico de prueba utilizado para muestras grandes es el siguiente: z = - 0

8.1. Prueba de Hiptesis para una media poblacional


1. Hiptesis nula: H0 : = 0

2. Hiptesis alternativa: Prueba de una cola Ha : > 0 (o bien Ha : < 0 ) 3. Estadstica de prueba z = x - 0 / n Prueba de dos colas Ha : = 0 o s (desviacin estndar muestral)

15

4. Regin de rechazo Prueba de una cola z > z (o sea, z < -z cuando la hiptesis alternativa Ha : < 0) Prueba de dos colas z > z /2 o bien z < - z /2

0 z

/2 - z /2 0 z /2

/2

Suposiciones: Se seleccionaron aleatoriamente las n observaciones de la muestra de la poblacin y n es grande, por ejemplo n > 30. Ejemplo: La media del promedio general de 120 alumnos de la experiencia educativa Comunicacin y Educacin es de 8.6 con una desviacin estndar de 1.4. Se quiere probar que el promedio de los alumnos de dicha experiencia es mayor a 9.0, utilizando un nivel de significancia de 0.05. H0 : = 9.0 Ha : > 9.0 z = x - 0 = 8.6 9.0 = 0.4 = 3.08 / n 1.4 / 120 0.13

= 0.5 0.4990 0.05


0.4490 z = 1.63

zobt. = 3.08

-3 -2 -1

0 1 2 3 z = 1.63 RA RR

Decisin: No se rechaza la hiptesis nula porque no evidencia estadstica suficiente para demostrar que el promedio de los alumnos de la experiencia educativa Comunicacin y Educacin sea mayor a 9.0.

16

8.2. Prueba de Hiptesis para dos medias poblacionales


1. Hiptesis nula: H0 : (1 - 2) = D0 donde D0 es alguna diferencia especificada que se quiere probar. En muchos casos se desear probar la hiptesis de que no haya una diferencia entre 1 y 2 -es decir, D0 = 0. 2. Hiptesis alternativa: Prueba de una cola Ha : (1 - 2) > D0 (o bien Ha : (1 - 2) < D0) 3. Estadstica de prueba z = (x1 x2) - D0 Prueba de dos colas Ha : (1 - 2) = D0 o s (desviacin estndar muestral)

2 1
n2

n1 4. Regin de rechazo Prueba de una cola z > z (o sea, z < -z cuando la hiptesis alternativa Ha : (1 - 2) < D0)

Prueba de dos colas z > z /2 o bien z < - z /2

0 z

/2 - z /2 0 z /2

/2

Suposiciones: Se seleccionaron las muestras aleatoria e independientemente de dos poblaciones, y n1 > 30 y n2 > 30. Ejemplo: Una profesora desea comparar los resultados de un test de habilidad verbal aplicado en su grupo tanto a mujeres como a hombres. Se pidi la realizacin del test a 14 mujeres y a 11 hombres para su comparacin. Las medias muestrales y las desviaciones muestrales fueron para las mujeres de 85 y 6; mientras que en los hombres fue de 80 y 7. Proporcionan los datos evidencia que indique una diferencia en el promedio de los resultados del test de habilidad verbal entre mujeres y hombres? Se utilizar un nivel de significancia de 0.05. H0 : (1 - 2) = D0

17

Ha : (1 - 2) = D0 z = (x1 x2) - D0 = (85 80) 0 (6)2 + (7)2 14 11 = 5 = 0.71 7.02

2
1

2
1

n1

n2 zobt. = 0.71

= 0.05 / 2 = 0.025 0.4990 0.025


0.4740 z = 1.94

-3 -2 -1 0 1 2 3 z =- 1.94 z = 1.94 RR RR Decisin: No se rechaza la hiptesis nula puesto que no se tiene suficiente evidencia estadstica para expresar que halla diferencia entre el resultado de mujeres y hombres en la aplicacin del test de habilidad verbal.

8.3. Prueba de Hiptesis para la proporcin poblacional


1. Hiptesis nula: H0 : p = p0

2. Hiptesis alternativa: Prueba de una cola Ha : p > p0 (o bien Ha : p < p0 ) 3. Estadstica de prueba z = p - p0 p0 q0 n Prueba de dos colas Ha : p = p0

donde p = x n

4. Regin de rechazo Prueba de una cola z > z (o sea, z < -z cuando la hiptesis alternativa Ha : p < p0) Prueba de dos colas z > z /2 o bien z < - z /2

18

0 Ejemplo: z

/2 - z /2 0 z /2

/2

Aproximadamente 4 de cada 10 alumnos desertan de la Facultad de Arquitectura por falta de recursos econmicos para continuar con los estudios. Para esto, se seleccion una muestra de 350 alumnos para proporcionarles una ayuda econmica. El resultado de esta ayuda fue que 120 alumnos que corran riesgo de desertar continuaron sus estudios. Son los datos suficientes para indicar una discriminacin en la desercin de los estudiantes de Arquitectura? = 0.05 H0 : p = 0.40 Ha : p < 0.40 z = p - p0 = 0.34 0.40 = -0.06 = - 2.30 (0.40) (0.60) 0.026 p0 q0 350 n p = x / n = 120 / 350 = 0.34

0.4990 0.05
0.4490 z = 1.63

zobt. = -2.30

-3 -2 -1 0 1 2 3 z = 1.63 RR Decisin: Se rechaza la hiptesis nula porque se tiene la evidencia estadstica para expresar que hubo una discriminacin con respecto a la desercin de los alumnos de la facultad de Arquitectura.

8.4. Prueba de Hiptesis para la diferencia entre dos Proporciones Poblacionales


1. Hiptesis nula: H0 : (p1 - p2) = D0 donde D0 es una diferencia especificada que se quiere probar. Para muchas pruebas se desear utilizar la hiptesis de que no existe diferencia entre p1 y p2 -es decir, D0 = 0.

19

2. Hiptesis alternativa: Prueba de una cola Ha : (p1 - p2) > D0 (o bien Ha : (p1 - p2) < D0) 3. Estadstica de prueba z = ( p1 p2 ) - D0 p1q1 p2q2 n1 n2 p1 = x1 n1 p2 = x2 n2 Prueba de dos colas Ha : (p1 - p2) = D0

Donde

Ya que se conocen p1 y p2, tendremos que aproximar sus valores para poder calcular la desviacin estndar de (p1 p2) que aparece en el denominador de la estadstica z. Existen aproximaciones para dos casos. 4. Regin de rechazo Prueba de una cola z > z (o sea, z < -z cuando la hiptesis alternativa Ha : (p1 - p2) < D0) Prueba de dos colas z > z /2 o bien z < - z /2

0 Ejemplo: z

/2 - z /2 0 z /2

/2

Los directivos de la facultad de sociologa infieren que la proporcin de alumnos que ingres a la licenciatura en sociologa aument con respecto al ao anterior. Los registros expresan que este ao ingresaron 200 de 630 personas que presentaron el examen de admisin; mientras que el ao anterior ingresaron 220 de 750 personas. Proporcionan los datos evidencia estadstica que indique un incremento de este ao con respecto al ao anterior? = 0.025 H0 : (p1 - p2) = D0 Ha : (p1 - p2) = D0

20

z = ( p1 p2 ) - D0 p1q1 p2q2 n1 n2

(0.32 0.29) 0 (0.32) (0.68) + (0.29) (0.71) 630 750

= 0.03 = 1.20 0.0248

p1 = x1 / n1 = 200 / 630 = 0.32 a = 0.025 / 2 = 0.0125

p2 = x2 / n2 = 220 / 750 = 0.29 zobt. =1.20

0.4990 0.0125
0.4865 z = 2.21 -3 -2 -1 0 1 2 3 z = 2.21 RR

Decisin: No se rechaza la hiptesis nula porque no se tiene suficiente evidencia estadstica para expresar que exista un incremento en el ingreso de estudiantes a la Licenciatura en Sociologa de este ao con respecto al anterior.

21

9. PRUEBAS PARA MUESTRAS PEQUEAS


Distribucin t de Student La distribucin muestral de la estadstica de prueba t tiene forma acampanada o de montculo, y es perfectamente simtrica respecto a t = 0. Tabla de la distribucin t de Student con v grados de libertad.

La variabilidad de t es el resultado de dos cantidades aleatorias, x y s, que son independientes entre s. La variabilidad de t decrece al aumentar n, porque la estimacin s para se basar en ms informacin.

22

La distribucin de t depende del tamao muestral n. El divisor (n 1) de la suma de los cuadrados de las desviaciones, que aparece en la frmula para s2, es el nmero de grados de libertad (g.l.) asociado a s2 y a la estadstica t.

9.1. Inferencias con muestras pequeas para una media poblacional


1. Hiptesis nula: H0 : = 0

2. Hiptesis alternativa: Prueba de una cola Ha : > 0 (o bien Ha : < 0 ) 3. Estadstica de prueba t = x - 0 s/ n Prueba de dos colas Ha : = 0

4. Regin de rechazo Prueba de una cola t > t (o sea, t < - t cuando la hiptesis alternativa Ha : < 0) Prueba de dos colas t > t /2 o bien t < - t /2

0 t

/2 - t /2 0 t /2

/2

Los valores de t, t, t /2 se basan en (n 1) grados de libertad. Estos valores crticos tabulados se pueden encontrar en la Tabla Valores crticos de t Ejemplo: Se tom, aleatoriamente, una muestra de 25 personas de la poblacin total de aspirantes a ingresar a la universidad en la Licenciatura en Antropologa. De la muestra, se produjo una media de 9.1 en el examen de admisin con una desviacin estndar de 1.45. Se desea mostrar que la media poblacional excede de 8.5 con un nivel de significancia de 0.05.

23

H0 : = 8.5 Ha : > 8.5 t = x - 0 s/ n = 9.1 8.5 = 0.6 = 2.07 1.45 / 25 0.29

tobt. = 2.07

g.l. = 25 1 = 24 t = 1.711 t = 1.711 RR

Decisin: Se rechaza la hiptesis nula porque se tiene suficiente evidencia estadstica para expresar que la media poblacional de los aspirantes que presentaron el examen de admisin para la Licenciatura en Antropologa excede de 8.5.

9.2. Inferencias con muestras pequeas para la diferencia entre dos Medias de Poblacin
1. Hiptesis nula: H0 : (1 - 2) = D0 donde D0 es una diferencia especificada que se quiere probar. Para muchas pruebas tal vez se desee probar que no existe diferencia entre 1 y 2 es decir, D0 = 0. 2. Hiptesis alternativa: Prueba de una cola Ha : (1 - 2) > D0 (o bien Ha : (1 - 2) < D0) 3. Estadstica de prueba t = (x1 x2) - D0 Prueba de dos colas Ha : (1 - 2) = D0

1 + 1

n1

n2

Donde

s2 = (xi x1)2 + (xi x2)2


i =1 1=1

n1

n2

n1 + n2 2

24

4. Regin de rechazo Prueba de una cola t > t (o sea, t < - t cuando la hiptesis alternativa Ha : < 0) Prueba de dos colas t > t /2 o bien t < - t /2

0 t

/2 - t /2 0 t /2

/2

Los valores de t, t, t /2 se basan en (n 1) grados de libertad. Estos valores crticos tabulados se pueden encontrar en la Tabla Valores crticos de t Ejemplo: Se realiz una comparacin entre el desempeo de dos grupos de 12 alumnos, de los cuales, un grupo fue sometido a clases extra de Estadstica Inferencial. Por su parte, el otro grupo se mantuvo solamente con la clase ya prevista, sin recibir la ayuda extra. Al trmino del periodo establecido se realiz un prueba con 30 reactivos para ver los resultados de cada grupo, los cules se encuentran ordenados en tabla que se presenta a continuacin. Resultados de alumnos de clases previstas 25 26 18 20 22 14 15 19 28 17 13 16 Resultados de alumnos en clases extra 29 25 20 28 17 19 24 26 15 21 23 24

Con los datos presentados hay evidencia suficiente que seale que el desempeo de los alumnos que participaron de las clases extra tiene un mayor rendimiento que los que no participaron de dichas clases? = 0.05 H0 : (1 - 2) = D0 25

Ha : (1 - 2) > D0 s2 = (xi x1)2 + (xi x2)2= (264.96) + (202.96) = 467.92 = 21.27 i =1 1=1 12 + 12 2 22 n1 + n2 2 t = (x1 x2) - D0 = (19.42 22.58) 0 = 3.16 = 1.68 1 + 1 1.88 4.61 12 12 tobt. = - 1.68 g.l. = 12 + 12 = 24 2 = 22 t = 1.717 t = 1.717 RR
n1 n2

1 + 1

n1

n2

Decisin: No se rechaza la hiptesis nula porque no hay suficiente evidencia estadstica para expresar que los alumnos que participaron en las clases extra de Estadstica Inferencial tengan un mejor rendimiento que aquellos que no participaron en ellas.

9.3. Pruebas para la comparacin de dos variancias de poblacin


1. Hiptesis nula: H0 : 2 = 2
1 2

2. Hiptesis alternativa: Prueba de una cola Ha : 2 > 2


1 2

Prueba de dos colas Ha : 2 = 2


1 2

(o bien Ha : 2 < 2 )
1 2

3. Estadstica de prueba Prueba de una cola F = s1 2 s22 (o bien, F = s22 s12 para Ha : 2 > 2 1 2 ) Prueba de dos colas F = s12 s22 , donde s12 es la mayor variancia muestral

26

4. Regin de rechazo Prueba de una cola F > F Prueba de dos colas F > F /2

Cuando F = s12 / s22, los valores crticos, F y F /2, se basan en v1 = n1 1 y v2 = n2 1 grados de libertad. Estos valores tabulados, para = 0.10, 0.05, 0.025, 0.01 y 0.005, se pueden encontrar em ls Tablas 7, 8, 9, 10 y 11 del Apndice del libro Estadstica para Administradores citado en a Bibliografa.

0 Ejemplo: F

/2

F /2

Un maestro quiere conocer la variabilidad en las calificaciones de dos grupos de la experiencia educativa Psicologa del aprendizaje, para lo cual se toman las siguientes muestras y los datos que arrojaron son los siguientes. n1 = 16 n2 = 13 S12 = 1.74 S22 = 1.86

= 0.05
1

H0 : 2 = 2
2 2

Ha : 2 = 2
1

F = s12 = 1.86 = 1.07 s2 2 1.74 v1 = n1 1 = 16 1 = 15 v2 = n2 1 = 13 1 = 12 = 0.05 / 2 = 0.025 g.l. = 3.18

F = 1.07

g.l. = 3.18

Decisin: No se rechaza la hiptesis nula porque no hay suficiente evidencia estadstica para expresar que existe variabilidad entre las calificaciones de los dos grupos de la experiencia educativa Psicologa del Aprendizaje. 27

10. PRUEBA JI-CUADRADA


1. Hiptesis nula: H0 : 2 = 2
0

2. Hiptesis alternativa: Prueba de una cola Ha : 2 > 2


0

Prueba de dos colas Ha : 2 = 2


0

(o bien Ha : 2 < 2 )
0

3. Estadstica de prueba

X2 = (n 1) s2

2
0

4. Regin de rechazo Prueba de una cola x2 > x2 [(o sea, x2 < x2(1 ) cuando la hiptesis alternativa Ha : 2 < 02), donde x2 y x2(1 ) son los valores de la cola superior e inferior, respectivamente de x2 que ponen en las reas de las colas] Prueba de dos colas x2 > x2 /2 o sea x2 < x2(1 /2), donde x2 /2 y x2(1 /2) son los valores de la cola superior e inferior, respectivamente, de x2 que ponen /2 en las reas de las colas

0 x2

/2

/2

0
x2(1 /2) x2 /2

Los valores de x2 se basan en (n 1) grados de libertad. Estos valores tabulados se pueden encontrar en la Tabla Valores crticos de Ji-cuadrada. Ejemplo:

28

1.- Una muestra aleatoria de n = 30 observaciones de una poblacin normal produjo una varianza muestral igual a 21.4. Proporcionan los datos evidencia suficiente que indique 2 >15. lleve a cabo la prueba con = 0.05. 0= 2 = 2 a = 2 > 15 X2 = (n-1) S2 = (30 1) 21.4 = 620.6 = 41.37 2 15 15 g.l. = n-1 g.l. = 30 1 = 29 = 0.05 = 42.55

Decisin: No se rechaza la hiptesis nula ya que no se cuenta con evidencia estadstica que compruebe que 2 >15.

X2 = 41.37

g.l. = 42.55

29

11. ANLISIS DE VARIANCIA (ANOVA)


En estadstica, anlisis de varianza (ANOVA, segn terminologa inglesa) es una coleccin de modelos estadsticos y sus procedimientos asociados. El anlisis de varianza sirve para comparar si los valores de un conjunto de datos numricos son significativamente distintos a los valores de otro o ms conjuntos de datos. El procedimiento para comparar estos valores est basado en la varianza global observada en los grupos de datos numricos a comparar. Tpicamente, el anlisis de varianza se utiliza para asociar una probabilidad a la conclusin de que la media de un grupo de puntuaciones es distinta de la media de otro grupo de puntuaciones. Suposiciones para la prueba de un anlisis de variancia y los procedimientos de estimacin. 1. Las observaciones dentro de cada poblacin estn distribuidas normalmente con variancia comn s2. 2. Las suposiciones para cada procedimiento de muestreo se especifican para cada diseo en las secciones siguientes. HIPTESIS H0: 1 = 2 = 3 = Ha: Por lo menos dos medias difieren PROCEDIMIENTO 1. Obtener la suma total de cada muestra. 2. Obtener la suma total de todas las observaciones. 3. Obtener la correccin para la media. CM = (Ti)2 ni Ti = total de observaciones de cada muestra ni = nmero total de observaciones

4. Obtener los valores para K= nmero de muestras gltotal = n 1 trat = k 1 error = n k

30

5. Obtener la SCT donde ser necesario 5.1. Obtener SCT = Ti2 CM ni 5.2. Obtener SCTOTAL SCTOTAL = x2 CM 6. Obtener SCE = SCTOTAL SCT 7. Obtener el cuadrado medio de los tratamientos CMT = SCT k1 8.- Obtener cuadrado medio del error CME = S2 = SCE nk 9. Obtener la tabla de ANOVA FUENTE Tratamientos Error Total 10. Obtener F = CMT CME Para localizar valores en tablas: F (v1= k 1) g.l. F (v2 = n k) g.l Ejemplo: Se realiz un anlisis de las calificaciones de tres grupos de la experiencia educativa de Educacin en valores, para lo cual se tomaron tres muestras. Estos son las calificaciones que se obtuvieron de cada alumno de las tres muestras de cada grupo: g.l. k1 nk n1 SC SCT SCE CM CMT = SCT / k -1 CME = SCE / n k F CMT / CME Ti = total de observaciones que reciben tratamiento ni = nmero de observaciones que reciben tratamiento

31

MUESTRA 1 8 7 9 10 9 8 = 51 =6 H0: 1 = 2 = 3 =

MUESTRA 2 5 7 6 10 10 9 = 47 =6

MUESTRA 3 8 9 7 10 8 = 42 =5

Ha: Por lo menos dos medias difieren 51 + 47 + 42 = 140 CM = (Ti)2 = (140)2 = 1152.94 17 ni K=3 gltotal = n 1 = 17 1 = 16 trat = k 1 = 3 1 = 2 error = n k = 17 3 = 14 SCT = Ti2 CM = 1154.46 1152.94 = 1.52 ni (51)2 / 6 + (47)2 / 6 + (42)2 / 5 = 433.5 + 368.16 + 352.8 = 1154.46 SCTOTAL = x2 CM = 1188 1152.94 = 35.06 439 + 391 + 358 = 1188 SCE = SCTOTAL SCT = 35.06 1.52 = 33.54 CMT = SCT = 1.52 = 0.76 k1 31 CME = S2 = SCE = 33.54 = 2.39 n k 17 3 FUENTE Tratamientos Error Total g.l. 31=2 17 3 = 14 17 1 = 16 SC 1.52 33.54 CM 0.76 2.39 F 0.31

32

F = CMT = 0.76 = 0.31 CME 2.39 F (v1= k 1) g.l. = 2 F (v2 = n k) g.l. = 14

= 0.05 F = 3.98

F = 0.31

F = 3.98

Decisin: No se rechaza la hiptesis nula porque no hay evidencia estadstica para expresar que por lo menos dos de las medias maestrales difieran entre las calificaciones de los tres grupos de la experiencia educativa de Educacin en valores.

33

CONCLUSIN La Estadstica es algo ms que una serie de frmulas que pretenden hacer un anlisis puramente numrico de realidades dadas para su estudio. Brinda elementos que invitan a la persona que emplea sus mtodos a la realizacin de interpretaciones a partir de esos datos; as como lo dirige a la formulacin de inferencias y a la toma de decisiones. De acuerdo a su importancia, la Estadstica se encuentra ligada a todas las ciencias no slo exactas, sino tambin las humanas y las sociales; todas aquellas que sustenten sus investigaciones en metodologas cuantitativas. Metodologas que a pesar de que en la actualidad el discurso ms fuerte pregone el predominio de lo cualitativo ante lo cuantitativo, no por eso lo deja de lado, sino que lo retoma y, tomados de la mano, dirigen los procesos de investigacin a mejores anlisis. Anlisis ms completos, menos reduccionistas. La Estadstica le brinda a la Pedagoga un instrumento eficaz para el estudio del fenmeno educativo; instrumento que, sabindolo emplear de la manera correcta, abre toda una gama de posibilidades para los estudios pedaggicos que iran ms all de lo cualitativo o de cuantitativo puramente, sino que se entrecruzaran en estudios cuanti-cualitativos que daran miradas ms completas de una realidad en s misma compleja. La Estadstica Inferencial: sus conceptos y aplicaciones pretendi, en todo momento, ser un acercamiento al estudio de los procedimientos estadsticos para que puedan ser utilizados posteriormente en proyectos, investigaciones o estudios de acuerdo al inters de cada persona. No se pretendi un trabajo que cubriera la totalidad de la Estadstica, sino solamente, que diera ciertos elementos para fomentar el empleo y, porque no, el gusto por la Estadstica en la realizacin de estudios pedaggicos. El recorrido de la Estadstica y la Pedagoga en su unin para el anlisis de diversos acontecimientos que tienen lugar cada contexto social es apenas un comienzo. Es una invitacin para seguir adelante, para continuar con estos procesos de fusin de disciplinas que por pretender ser cientficas, necesitan de otras para tener consistencia y mayor eficacia.

34

BIBLIOGRAFA
MENDENHALL, W. (1990). Estadstica para administradores. Mxico, DF. Grupo Editorial Iberoamericana. WACKERLY, P.; MENDENHALL III, W.; SCHEAFFER, R. (2002). Estadstica matemtica con aplicaciones. Mxico, DF. Thomson. LEVIN, J. (2001). Fundamentos de la Estadstica en la investigacin social. Mxico. Editorial Harla. YOUNG, K. R. (1996). Introduccin a la estadstica aplicada a las ciencias de la conducta. Mxico. Ed. Trillas.

Links en Internet http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap02.html http://masmatematicas.com/estadisticas/probabilidad.html http://www.universidadabierta.edu.mx/SerEst/Apuntes/VelascoRoberto_EstadistI nferencial.htm http://es.wikipedia.org/wiki/An%C3%A1lisis_de_varianza

35

You might also like