You are on page 1of 25

PROBABILIDAD Y

ESTADISTICA
INVESTIGACIN
Nombre del alumno: Erick Toto Cobaxin
Docente: Tonatiuh Sosme Snchez
Ingeniera Electromecnica
2 semestre
202 B
Investigacin:
-Unidad 4 Estadstica inferencial

1
INDICE

Introduccin..Pg.3

4.1. Inferencia estadstica..Pg.5

4.2. Muestreo estadstico...Pg.7

4.3. Estimadores...Pg.12

4.4. Estimacin puntual..Pg.14

4.5. Estimacin por intervaloPg.14

4.6. Errores tipo I y II...Pg.17

4.7. Contraste de hiptesis unilateral y bilateral.Pg.19

Conclusin.Pg.24

Bibliografa.Pg.25

2
INTRODUCCION

La Estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de


datos de una muestra representativa, ya sea para ayudar en la toma de decisiones o para
explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de
ocurrencia en forma aleatoria o condicional. Sin embargo, la estadstica es ms que eso,
es decir, es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin
cientfica.

Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias
sociales, desde las ciencias de la salud hasta el control de calidad. Se usa para la toma de
decisiones en reas de negocios o instituciones gubernamentales.

La estadstica descriptiva: se dedica a la descripcin, visualizacin y resumen de datos


originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica
o grficamente. Ejemplos bsicos de parmetros estadsticos son: la media y la desviacin
estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, grfico circular,
entre otros.

La estadstica inferencial: se dedica a la generacin de los modelos, inferencias y


predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de
las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca
de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a
preguntas si/no (prueba de hiptesis), estimaciones de unas caractersticas numricas
(estimacin), pronsticos de futuras observaciones, descripciones de asociacin
(correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras
tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos.

IMPORTANCIA DE LA ESTADISTICA INFERENCIAL

La Estadstica Inferencial puede dar respuesta a muchas de las necesidades que la


sociedad actual puede requerir. Su tarea fundamental es el anlisis de los datos que se
obtienen a partir de experimentos, con el objetivo de representar la realidad y conocerla.

3
Permite la recoleccin de datos importantes para el estudio de situaciones que se presentan
a diario y permite dar respuesta a los problemas de una forma til y significativa.

La Estadstica Inferencial se centra en tomar una pequea muestra representativa de la


poblacin y a partir de sta, infiere que el resto de la poblacin tiene el mismo
comportamiento.

En caso de que no sea factible realizar un estudio completo por cuestiones de tiempo,
recursos o costo, se puede calcular un tamao de muestra para medir solo algunos
elementos de la poblacin, posteriormente se infiere que el resto de la poblacin se
comporta igual que la muestra tomada.

El hecho es que la ciencia se basa en todo aquello que se pueda constatar empricamente,
es medible, cuantificable y se puede hacer acopio de la informacin para armar cuadros
estadsticos... una vez con la informacin acumulada resultado de diversos experimentos
verificables, se puede inferir a partir de la informacin estadstica..... En las ciencias sociales
ocurre algo semejante en tanto es con los datos que dan las encuestas que se puede armar
o articular la informacin estadstica e inferir resultados a partir de una muestra que deber
ser estadsticamente representativa para que resulte una verdadera inferencia.

Importancia de la toma de muestras.

Es de gran importancia ya que con un muestreo de toda la poblacin se puede examinar y


sacar conclusiones en base a una pequea parte de la misma, dando por sentado que los
resultados obtenidos en la muestra es de hecho representativa de toda la poblacin, una
ventaja muy grande es que es mucho ms sencillo trabajar con una pequea parte de un
todo que con su totalidad. Adems, en ocasiones, el muestreo puede ser ms exacto que
el estudio de toda la poblacin porque el manejo de un menor nmero de datos provoca
tambin menos errores en su manipulacin.

4
4.1 Inferencia estadstica.

La inferencia estadstica es el conjunto de mtodos y tcnicas que permiten inducir, a partir


de la informacin emprica proporcionada por una muestra, cual es el comportamiento de
una determinada poblacin con un riesgo de error medible en trminos de probabilidad.

Los mtodos paramtricos de la inferencia estadstica se pueden dividir, bsicamente, en


dos: mtodos de estimacin de parmetros y mtodos de contraste de hiptesis. Ambos
mtodos se basan en el conocimiento terico de la distribucin de probabilidad del
estadstico muestral que se utiliza como estimador de un parmetro.

La estimacin de parmetros consiste en asignar un valor concreto al parmetro o


parmetros que caracterizan la distribucin de probabilidad de la poblacin. Cuando se
estima un parmetro poblacional, aunque el estimador que se utiliza posea todas las
propiedades deseables, se comete un error de estimacin que es la diferencia entre la
estimacin y el verdadero valor del parmetro. El error de estimacin es desconocido por
lo cual es imposible saber en cada caso cual ha sido la magnitud o el signo del error; para
valorar el grado de precisin asociado con una estimacin puntual se parte de dicha
estimacin para construir un intervalo de confianza. En sntesis, un intervalo de confianza
est formado por un conjunto de valores numricos tal que la probabilidad de que ste
contenga al verdadero valor del parmetro puede fijarse tan grande como se quiera. Esta
probabilidad se denomina grado de confianza del intervalo, y la amplitud de ste constituye
una medida del grado de precisin con el que se estima el parmetro.

Los mtodos de contraste de hiptesis tienen como objetivo comprobar si determinado


supuesto referido a un parmetro poblacional, o a parmetros anlogos de dos o ms
poblaciones, es compatible con la evidencia emprica contenida en la muestra. Los
supuestos que se establecen respecto a los parmetros se llaman hiptesis paramtricas.

Para cualquier hiptesis paramtrica, el contraste se basa en establecer un criterio de


decisin, que depende en cada caso de la naturaleza de la poblacin, de la distribucin de
probabilidad del estimador de dicho parmetro y del control que se desea fijar a priori sobre
la probabilidad de rechazar la hiptesis contrastada en el caso de ser sta cierta.

5
En todo contraste intervienen dos hiptesis. La hiptesis nula (Ho) es aquella que recoge
el supuesto de que el parmetro toma un valor determinado y es la que soporta la carga de
la prueba. La decisin de rechazar la hiptesis nula, que en principio se considera cierta,
est en funcin de que sea o no compatible con la evidencia emprica contenida en la
muestra. El contraste clsico permite controlar a priori la probabilidad de cometer el error
de rechazar la hiptesis nula siendo sta cierta; dicha probabilidad se llama nivel de
significacin del contraste ( ) y suele fijarse en el 1%, 5% o 10%.

La proposicin contraria a la hiptesis nula recibe el nombre de hiptesis alternativa (H1) y


suele presentar un cierto grado de indefinicin: si la hiptesis alternativa se formula
simplemente como 'la hiptesis nula no es cierta', el contraste es bilateral o a dos colas; por
el contrario cuando se indica el sentido de la diferencia, el contraste es unilateral o a una
sola cola.

Cuando se realiza un contraste con el SPSS no se fija el nivel de significacin deseado, el


programa calcula el valor-p o significacin asinttica, que es la probabilidad de que el
estadstico de prueba tome un valor igual o superior al muestral bajo el supuesto de que la
hiptesis nula es cierta. Por tanto, si el valor-p es menor o igual que el nivel de significacin
deseado se rechazar Ho.Un valor-p prximo a cero indica que se rechazar la Ho para
cualquier nivel de significacin.

6
4.2. Muestreo estadstico.

En ocasiones en que no es posible o conveniente realizar un censo (analizar a todos los


elementos de una poblacin), se selecciona una muestra, entendiendo por tal una parte
representativa de la poblacin.

El muestreo es por lo tanto una herramienta de la investigacin cientfica, cuya funcin


bsica es determinar que parte de una poblacin debe examinarse, con la finalidad de
hacer inferencias sobre dicha poblacin.

La muestra debe lograr una representacin adecuada de la poblacin, en la que se


reproduzca de la mejor manera los rasgos esenciales de dicha poblacin que son
importantes para la investigacin. Para que una muestra sea representativa, y por lo tanto
til, debe de reflejar las similitudes y diferencias encontradas en la poblacin, es decir
ejemplificar las caractersticas de sta.

Los errores ms comunes que se pueden cometer son:

1.- Hacer conclusiones muy generales a partir de la observacin de slo una parte de la
Poblacin, se denomina error de muestreo.

2.- Hacer conclusiones hacia una Poblacin mucho ms grandes de la que originalmente
se tom la muestra. Error de Inferencia.

En la estadstica se usa la palabra poblacin para referirse no slo a personas sino a todos
los elementos que han sido escogidos para su estudio y el trmino muestra se usa para
describir una porcin escogida de la poblacin.

TIPOS DE MUESTREO

Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en


general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y
mtodos de muestreo no probabilsticos.

I. Muestreo probabilstico

7
Los mtodos de muestreo probabilsticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas
las posibles muestras de tamao n tienen la misma probabilidad de ser seleccionadas. Slo
estos mtodos de muestreo probabilsticos nos aseguran la representatividad de la muestra
extrada y son, por tanto, los ms recomendables. Dentro de los mtodos de muestreo
probabilsticos encontramos los siguientes tipos:

1.- Muestreo aleatorio simple:

El procedimiento empleado es el siguiente: 1) se asigna un nmero a cada individuo de la


poblacin y 2) a travs de algn medio mecnico (bolas dentro de una bolsa, tablas de
nmeros aleatorios, nmeros aleatorios generados con una calculadora u ordenador, etc.)
se eligen tantos sujetos como sea necesario para completar el tamao de muestra
requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica cuando la
poblacin que estamos manejando es muy grande.

2.- Muestreo aleatorio sistemtico:

Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin,
pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero
aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son
los que ocupa los lugares i, i+k, i+2k, i+3k,..., i+(n-1) k, es decir se toman los individuos de
k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la
muestra: k= N/n. El nmero i que empleamos como punto de partida ser un nmero al azar
entre 1 y k.

El riesgo este tipo de muestreo est en los casos en que se dan periodicidades en la
poblacin ya que al elegir a los miembros de la muestra con una periodicidad constante (k)
podemos introducir una homogeneidad que no se da en la poblacin. Imaginemos que
estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros
son varones y los 5 ltimos mujeres, si empleamos un muestreo aleatorio sistemtico con

8
k=10 siempre seleccionaramos o slo hombres o slo mujeres, no podra haber una
representacin de los dos sexos.

3.- Muestreo aleatorio estratificado:

Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos
y suelen reducir el error muestral para un tamao dado de la muestra. Consiste en
considerar categoras tpicas diferentes entre s (estratos) que poseen gran homogeneidad
respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn la profesin, el
municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de
muestreo es asegurarse de que todos los estratos de inters estarn representados
adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo
aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los
elementos concretos que formarn parte de la muestra. En ocasiones las dificultades que
plantean son demasiado grandes, pues exige un conocimiento detallado de la poblacin.
(Tamao geogrfico, sexos, edades,...).

La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y


puede ser de diferentes tipos:

Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales.

Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la


poblacin en cada estrato.

Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo que
se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se suele
conocer la desviacin.

4.- Muestreo aleatorio por conglomerados:

Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los
elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la
poblacin.

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la


poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades

9
hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son
conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no
naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son reas
geogrficas suele hablarse de "muestreo por reas".

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto nmero


de conglomerados (el necesario para alcanzar el tamao muestral establecido) y en
investigar despus todos los elementos pertenecientes a los conglomerados elegidos.

II. Mtodos de muestreo no probabilsticos

A veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente


costoso y se acude a mtodos no probabilsticos, aun siendo conscientes de que no sirven
para realizar generalizaciones (estimaciones inferenciales sobre la poblacin), pues no se
tiene certeza de que la muestra extrada sea representativa, ya que no todos los sujetos de
la poblacin tienen la misma probabilidad de ser elegidos. En general se seleccionan a los
sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la
muestra sea representativa.

En algunas circunstancias los mtodos estadsticos y epidemiolgicos permiten resolver


los problemas de representatividad aun en situaciones de muestreo no probabilstico, por
ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente
de la poblacin.

Entre los mtodos de muestreo no probabilsticos ms utilizados en investigacin


encontramos:

1.- Muestreo por cuotas:

Tambin denominado en ocasiones "accidental". Se asienta generalmente sobre la base


de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms
"representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto,
semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de
aleatoriedad de aqul.

10
En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos
que renen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 aos,
de sexo femenino y residentes en Gijn. Una vez determinada la cuota se eligen los
primeros que se encuentren que cumplan esas caractersticas. Este mtodo se utiliza
mucho en las encuestas de opinin.

2.- Muestreo intencional o de conveniencia:

Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras


"representativas" mediante la inclusin en la muestra de grupos supuestamente tpicos. Es
muy frecuente su utilizacin en sondeos preelectorales de zonas que en anteriores
votaciones han marcado tendencias de voto.

Tambin puede ser que el investigador seleccione directa e intencionadamente los


individuos de la poblacin. El caso ms frecuente de este procedimiento el utilizar como
muestra los individuos a los que se tiene fcil acceso (los profesores de universidad
emplean con mucha frecuencia a sus propios alumnos).

3.- Bola de nieve:

Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y as hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se
hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de
enfermos, etc.

4.- Muestreo Discrecional A criterio del investigador los elementos son elegidos sobre lo
que l cree que pueden aportar al estudio.

11
4.3. Estimadores

En una poblacin cuya distribucin es conocida pero desconocemos algn parmetro,


podemos estimar dicho parmetro a partir de una muestra representativa.

Un estimador es un valor que puede calcularse a partir de los datos muestrales y que
proporciona informacin sobre el valor del parmetro. Por ejemplo la media muestral es un
estimador de la media poblacional, la proporcin observada en la muestra es un estimador
de la proporcin en la poblacin.

Una estimacin es puntual cuando se obtiene un slo valor para el parmetro. Los
estimadores ms probables en este caso son los estadsticos obtenidos en la muestra,
aunque es necesario cuantificar el riesgo que se asume al considerarlos. Recordemos que
la distribucin muestral indica la distribucin de los valores que tomar el estimador al
seleccionar distintas muestras de la poblacin. Las dos medidas fundamentales de esta
distribucin son la media que indica el valor promedio del estimador y la desviacin tpica,
tambin denominada error tpico de estimacin, que indica la desviacin promedio que
podemos esperar entre el estimador y el valor del parmetro.

Ms til es la estimacin por intervalos en la que calculamos dos valores entre los que se
encontrar el parmetro, con un nivel de confianza fijado de antemano.

Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene
al parmetro que se est estimando.

Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero


valor del parmetro. Se indica por 1-a y habitualmente se da en porcentaje (1-a) 100%.
Hablamos de nivel de confianza y no de probabilidad ya que una vez extrada la muestra,
el intervalo de confianza contendr al verdadero valor del parmetro o no, lo que sabemos
es que si repitisemos el proceso con muchas muestras podramos afirmar que el (1-a) %
de los intervalos as construidos contendra al verdadero valor del parmetro.

Los dos problemas fundamentales que estudia la inferencia estadstica son el "Problema
de la estimacin" y el "Problema del contraste de hiptesis". Cuando se conoce la forma

12
funcional de la funcin de distribucin que sigue la variable aleatoria objeto de estudio y
slo tenemos que estimar los parmetros que la determinan, estamos en un problema de
inferencia estadstica paramtrica; por el contrario, cuando no se conoce la forma funcional
de la distribucin que sigue la variable aleatoria objeto de estudio, estamos ante un
problema de inferencia estadstica no paramtrica. Nosotros nos vamos a limitar a
problemas de inferencia estadstica paramtrica, donde la variable aleatoria objeto de
estudio sigue una distribucin normal, y slo se estimarn los parmetros que la
determinan, la media y la desviacin tpica.

Estadstico:

Son los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacin
de los parmetros.

Parmetro:

Se llama parmetros poblacionales a cantidades que se obtienen a partir de las


observaciones de la variable y sus probabilidades y que determinan perfectamente la
distribucin de esta, as como las caractersticas de la poblacin, por ejemplo: La media, ,
la varianza

Los Parmetros poblacionales son nmeros reales, constantes y nicos.

Son las medidas o datos que se obtienen de la poblacin, es decir, simplemente es el valor
poblacional de las caractersticas de una poblacin. La proporcin de determinados
sucesos, P.

Parmetros mustrales

Los Parmetros mustrales son resmenes de la informacin de la muestra que nos


"determinan" la estructura de la muestra. Los Parmetros mustrales no son constantes
sino variables aleatorias pues sus valores dependen de la estructura de la muestra que no
es siempre la misma como consecuencia del muestreo aleatorio. A estas variables se les
suele llamar estadsticos.

Los estadsticos se transforman en dos tipos: estadsticos de centralidad y estadsticos de


dispersin.

13
4.4. Estimacin puntual

Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una
frmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado
grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la
talla media de los individuos. Lo ms importante de un estimador, es que sea un estimador
eficiente. Es decir, que sea insesgado (ausencia de sesgos) y estable en el muestreo o
eficiente (varianza mnima)

La estadstica provee tcnicas que permiten obtener conclusiones generales a partir de un


conjunto limitado pero representativo de datos. Cuando inferimos no tenemos garanta
de que la conclusin que obtenemos sea exactamente correcta. Sin embargo, la estadstica
permite cuantificar el error asociado a la estimacin.

La mayora de las distribuciones de probabilidad dependen de cierto nmero de parmetros.

Salvo que estos parmetros se conozcan, deben estimarse a partir de los datos.

El objetivo de la estimacin puntual es usar una muestra para obtener nmeros que, en
algn sentido, sean los que mejor representan a los verdaderos valores de los parmetros
de inters.

4.5. Estimacin por intervalos

En estadstica, se llama intervalo de confianza a un par de nmeros entre los cuales


se estima que estar cierto valor desconocido con una determinada probabilidad de
acierto. Formalmente, estos nmeros determinan un intervalo, que se calcula a
partir de datos de una muestra, y el valor desconocido es un parmetro poblacional.
La probabilidad de xito en la estimacin se representa con 1 - y se
denomina nivel de confianza. En estas circunstancias, es el llamado error

14
aleatorio o nivel de significacin, esto es, una medida de las posibilidades de fallar
en la estimacin mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varan conjuntamente, de forma que


un intervalo ms amplio tendr ms posibilidades de acierto (mayor nivel de
confianza), mientras que para un intervalo ms pequeo, que ofrece una estimacin
ms precisa, aumentan sus posibilidades de error.

Para la construccin de un determinado intervalo de confianza es necesario conocer


la distribucin terica que sigue el parmetro a estimar, . Es habitual que el
parmetro presente una distribucin normal. Tambin pueden construirse intervalos
de confianza con la desigualdad de Chebyshov.

En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin de un


parmetro poblacional que sigue una determinada distribucin de probabilidad, es
una expresin del tipo [1, 2] tal que P [1 2] = 1 - , donde P es la funcin
de distribucin de probabilidad de .

Intervalo de confianza para la media de una poblacin


De una poblacin de media y desviacin tpica se pueden
tomar muestras de elementos. Cada una de estas muestras tiene a su vez una
media ( ). Se puede demostrar que la media de todas las medias muestrales
coincide con la media poblacional:

Pero adems, si el tamao de las muestras es lo suficientemente grande, la


distribucin de medias muestrales es, prcticamente, una distribucin
normal (o gaussiana) con media y una desviacin tpica dada por la siguiente

expresin: . Esto se representa como sigue: .

Si estandarizamos, se sigue que:

En una distribucin Z ~ N (0, 1) puede calcularse fcilmente un intervalo dentro del


cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo

15
hallar z1 y z2 tales que P [z1 z z2] = 1 - , donde (1 - ) 100 es el porcentaje
deseado.

Se desea obtener una expresin tal que

En esta distribucin normal de medias se puede calcular el intervalo de confianza


donde se encontrar la media poblacional si slo se conoce una media muestral (
), con una confianza determinada. Habitualmente se manejan valores de confianza
del 95 y del 99 por ciento. A este valor se le llamar (debido a que es el
error que se cometer, un trmino opuesto).

Para ello se necesita calcular el punto o, mejor dicho, su versin

estandarizada o valor crtico junto con su "opuesto en la

distribucin" Estos puntos delimitan la probabilidad para el intervalo, como


se muestra en la siguiente imagen:

Dicho punto es el nmero tal que:

Y en la versin estandarizada se cumple que:

As:

16
Haciendo operaciones es posible despejar para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:

Obsrvese que el intervalo de confianza viene dado por la media muestral el

producto del valor crtico por el error estndar .

Si no se conoce y n es grande (habitualmente se toma n 30):

, donde s es la desviacin tpica de una muestra.

Aproximaciones para el valor para los niveles de confianza estndar son 1,96
para y 2,576 para .

4.6. Errores tipo I y II

El error tipo I se define como el rechazo de la hiptesis nula Ho cuando sta es


verdadera. Tambin es conocido como nivel de significancia.

Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera


del 5%. Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel
de significancia sera del 10%.

17
Ahora supngase que la verdadera rapidez promedio de combustin es diferente de
50 cm/s, aunque la media muestral caiga dentro de la regin de aceptacin. En
este caso se acepta Ho cuando sta es falsa. Este tipo de conclusin recibe el
nombre de error tipo II.

El error tipo II error se define como la aceptacin de la hiptesis nula cuando


sta es falsa.

Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones


diferentes que determinan si la decisin final es correcta o errnea.

Decisin Ho es verdadera Ho es falsa

Aceptar Ho No hay error Error tipo II

Rechazar Ho Error tipo I No hay error

1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la


probabilidad de uno por lo general tiene como resultado un aumento en la
probabilidad del otro.
2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error
tipo I, siempre se puede reducir al ajustar el o los valores crticos.

3. Un aumento en el tamao muestral n reducir y de forma simultnea.

4. Si la hiptesis nula es falsa, es un mximo cuando el valor real del


parmetro se aproxima al hipottico. Entre ms grande sea la distancia entre

el valor real y el valor hipottico, ser menor

18
4.7. Contraste de hiptesis unilateral y bilateral

Cuando nos interesa decidir si una proposicin, una conjetura o suposicin acerca
de un parmetro poblacional (hiptesis) es verdadera o falsa, el procedimiento de
toma de decisin acerca de sta se denomina contraste de hiptesis.

Los contrastes de hiptesis o de significacin permiten verificar la veracidad de


alguna hiptesis establecida acerca de una poblacin, determinando si los valores
difieren significativamente de los esperados por la hiptesis, o si las diferencias
observadas se deben al azar.

Una hiptesis estadstica es una suposicin que se plantea respecto a un problema


o a una poblacin, con el fin de rechazarla o no.
En los contrastes de hiptesis se distinguen dos hiptesis estadsticas: la hiptesis
nula designada por H0, conocida tambin como hiptesis de no diferencia, que es
la que se establece en principio con el nico propsito de rechazarla o "anularla"; y
una segunda, la hiptesis de investigacin o alterna, Ha, que es complementaria de
la primera. Cuando se habla de contrastar una hiptesis nula contra una alterna,
esto siempre se hace suponiendo que la nula es verdadera.

En general la forma de las hiptesis nula y alterna es:

H0: parmetro poblacional = ( , ) valor supuesto


Ha: parmetro poblacional ( > , < ) valor supuesto

19
TIPOS DE HIPTESIS Y REGIN CRTICA O DE RECHAZO

La hiptesis nula de no diferencia (=) contra una alterna de diferencia () es una


hiptesis bilateral o de dos colas porque el rechazo de H 0 puede ocurrir hacia un
lado u otro; es decir, puede ser diferente porque es menor o porque es mayor que
el valor supuesto o.
H0: = 0 vs. Ha: 0

Las hiptesis nulas del tipo () o () son hiptesis unilaterales o de una sola cola, la
primera es unilateral superior o de cola derecha y la segunda es unilateral inferior o
de cola izquierda. Esto es:

H0: 0 vs. Ha: > 0 es una hiptesis unilateral superior o de cola


derecha, porque se rechaza H0 en el caso de que se obtengan valores muy por
encima del valor supuesto.

Mientras que H0: 0 vs. Ha: < 0 es una hiptesis unilateral inferior o
de cola izquierda, porque se rechaza H0 en el caso de que se obtengan valores muy
por debajo del valor supuesto.

La regin crtica o regin de rechazo es la regin que contiene los resultados menos
favorables a H0, en el supuesto de que H0 sea verdadera y la regin de no rechazo
es la que contiene los valores ms favorables a H0. Estas regiones estn separadas
por los valores crticos del estadstico de contraste que corresponden a un nivel de
significacin dado.

Segn sea el tipo de hiptesis se tendrn regiones crticas para los dos lados
(bilaterales o de dos colas) o para un solo lado (unilaterales o de una cola), Ver
figura 9.1.

20
ESTADSTICO DE PRUEBA O ESTADSTICO DE CONTRASTE

Una vez que se han formulado las hiptesis nula, H0, y alterna, Ha, se debe realizar
un procedimiento de contraste por medio del cual se toma una decisin basada en
la muestra aleatoria seleccionada de la poblacin en estudio. Para llevar a cabo este
procedimiento es necesario seleccionar un estadstico de contraste, calcularlo con
base en la muestra y luego tomar la decisin de rechazar o no H0, dependiendo de
si este estadstico es o no consistente con H0. Es decir, si el valor calculado del
estadstico es muy diferente del valor supuesto en H0, suponiendo que sta es
cierta, entonces se rechaza H0. Sin embargo, si el valor calculado del estadstico de
contraste es consistente con lo supuesto en H0, entonces no hay razn suficiente
para rechazar H0 en favor de la Ha. En resumen, el estadstico de contraste es una
variable aleatoria cuya distribucin se conoce, en el supuesto de que H0 es
verdadera y sirve para tomar la decisin de rechazar o no H0.

21
TIPOS DE ERRORES

El procedimiento de contrastar una hiptesis nula contra una alterna sobre la base
de informacin obtenida de la muestra conduce a dos tipos de errores posibles,
debido a fluctuaciones al azar en el muestreo. Si la hiptesis nula es en realidad
verdadera, pero los datos de la muestra son incompatibles con ella y se rechaza, se
comete un Error Tipo I. Por otro lado, si la hiptesis nula es falsa y los datos de la
muestra conllevan a no rechazarla, se comete un Error Tipo II. En el cuadro
siguiente se resumen estos tipos de errores:

Decisiones
Eventos No rechazar Rechazar H0
H0
H0 V no error Error Tipo I
(confianza) P(E.T.I) =
H0 F Error Tipo II no error
P(E.T.II) = (potencia)

Las probabilidades de cometer errores Tipo I y II se pueden considerar como los


riesgos de decisiones incorrectas. La probabilidad de cometer un error Tipo I (de
rechazar una hiptesis nula dado que sta es verdadera) se llama nivel de
significacin y se denota por (alfa). La probabilidad de cometer un error Tipo II (de
no rechazar una hiptesis nula dado que sta es falsa) no tiene nombre en
particular, pero se denota por (beta). La probabilidad de no rechazar una hiptesis
nula verdadera es la confianza, 1 , con la cual se trabaj para hacer estimaciones
por intervalo. Cuando se rechaza una hiptesis nula falsa se ha tomado una decisin
correcta y la probabilidad de hacerlo se denomina potencia o poder de la prueba y
es 1 . En smbolos esto se expresa de la siguiente manera:

22
P(E.T.I) = P(Rechazar H0H0 V) =
P(No rechazar H0H0 V) = Confianza = 1
P(E.T.II)=P(No rechazar H0H0 F) =
P(Rechazar H0H0 F) = Potencia = 1

El nivel de significancia lo fija el investigador, y en la prctica se usa el 1%, el 5%


o el 10%.

Un procedimiento de contraste ideal debera tener = 0 y = 0. Sin embargo, en la


prctica, una vez fijado n esto no es posible, por lo que se debe procurar que tanto
como sean lo ms pequeos posible.

PROCEDIMIENTO DE CONTRASTE

Los pasos a seguir en un contraste de hiptesis son:

1.- Describir las caractersticas de la poblacin acerca de la cual se va a


probar la hiptesis (establecer si se cumplen los supuestos del
contraste).
2.- Formular las hiptesis nula y alterna (H0 y Ha).
3.- Escoger un nivel de significacin o probabilidad de Error Tipo I, .
4.- Seleccionar el estadstico de contraste cuya distribucin muestral sea
conocida en el supuesto de que H0 sea verdadera, pero sin hacer
clculos todava
5.- Determinar la regin crtica o de rechazo, misma que depende del tipo
de hiptesis, de la probabilidad del Error Tipo I y del estadstico de
contraste.
6.- Calcular el estadstico de contraste.
7.- Tomar una decisin de rechazar H0 o no rechazarla.
8.- Dar una conclusin al problema.

23
Conclusin

La estadstica inferencial es una rama de la estadstica que estudia el


comportamiento y propiedades de una muestra para poder generalizar unos
resultados obtenidos, basndose en la probabilidad este tipo de estadstica
permitir al investigador recolectar datos importantes para el estudio de situaciones
y dar respuestas a los problemas de una forma til y significativa.

Como respuestas a estos resultados es inferr si el evento ocurrir o no mediante la


aplicacin de estudios como: mtodos de muestreo, probabilidad y sus tipos de
probabilidad y distribuciones muestrales todas estas tcnicas exige que la muestra
de la poblacin sea aleatoria. Cabe destacar que la estadstica inferencial puede
proporcionar una serie de mtodos importantes la cual puede estudiar un sin
nmeros de datos.

Se puede decir que la estadstica inferencial es importante para simular situaciones,


controlar procesos y verificar las posibles respuestas a condiciones controladas, en
una empresa puede reducir costos ya que puede anticipar lo que puede suceder y
tomar previsiones, a esperar a que pase y no estar preparado.

24
Bibliografas

http://www.ub.edu/aplica_infor/spss/cap4-1.htm
http://www.estadistica.mat.uson.mx/Material/elmuestreo.pdf
http://www.dm.uba.ar/materias/probabilidades_estadistica_C/2011/1/PyEC132011.
pdf
http://probabilidadyestadisticaitsav.blogspot.mx/2012/06/52-estimaciones-
puntuales-y-por.html
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap02.html
http://colposfesz.galeon.com/inferencia/teoria/conhip.htm

25

You might also like