Professional Documents
Culture Documents
Prueba de Uniformidad
Chi-Cuadrado
-De ajuste e independencia
Las pruebas chi-cuadrado son un grupo de contrastes de hiptesis que sirven para
comprobar afirmaciones acerca de las funciones de probabilidad (o densidad) de
una o dos variables aleatorias.
Estas pruebas no pertenecen propiamente a la estadstica paramtrica pues no
establecen suposiciones restrictivas en cuanto al tipo de variables que admiten, ni
en lo que refiere a su distribucin de probabilidad ni en los valores y/o el
conocimiento de sus parmetros.
Se aplican en dos situaciones bsicas:
a) Cuando queremos comprobar si una variable, cuya descripcin parece
adecuada, tiene una determinada funcin de probabilidad. La prueba
correspondiente se llama chi-cuadrado de ajuste.
b) Cuando queremos averiguar si dos variables (o dos vas de clasificacin) son
independientes estadsticamente. En este caso la prueba que aplicaremos ser la
chi-cuadrado de independencia o chi-cuadrado de contingencia.
Chi-cuadrado de ajuste
En una prueba de ajuste la hiptesis nula establece que una variable X
tiene una cierta distribucin de probabilidad con unos determinados valores de los
parmetros. El tipo de distribucin se determina, segn los casos, en funcin de:
Valor de la variable
x1
x2
x3
...
xi
...
xk
Frecuencias observadas
O1
O2
O3
...
Oi
...
Ok
Frecuencias esperadas
E1
E2
E3
...
Ei
...
Ek
Estadstico de contraste
Se acepta la hiptesis nula si
, el percentil 1 de la distribucin
chi-cuadrado con grados de libertad.
Cabe sealar que en las pruebas chi-cuadrado lo corriente es que
pretendamos comprobar que una variable tiene una cierta distribucin y, por tanto,
habitualmente, nos vemos obligados a colocar nuestra propia hiptesis en la
hiptesis nula. nicamente podremos colocar nuestra hiptesis en la alternativa en
el caso excepcional de que pretendamos demostrar que cierto tratamiento produce
una distorsin de la distribucin bsica de la variable en estudio.
El nmero de grados de libertad de la variable chi-cuadrado se calcula de la
siguiente forma:
A priori, tendr tantos grados de libertad como parejas frecuencia
observada - frecuencia esperada.
A esta cantidad se debe restar el nmero de restricciones lineales
impuestas a las frecuencias observadas, es decir, el nmero de parmetros
que es necesario calcular directamente a partir de los valores observados
para establecer los valores esperados. Este nmero es, como mnimo, uno
ya que siempre tendremos que calcular el nmero total de observaciones
de la muestra.
Una condicin bsica para que podamos llevar a cabo una prueba chicuadrado es que las frecuencias de las distintas clases deben ser suficientemente
altas como para garantizar que pequeas desviaciones aleatorias en la muestra
no tengan importancia decisiva sobre el valor del estadstico de contraste.
Las reglas que determinan cuando es posible o no realizar el contraste
varan mucho de unos autores a otros. En un extremo de mxima rigidez se
encuentran aquellos que opinan que no se puede realizar la prueba cuando alguna
de las frecuencias, observadas o esperadas, sea menor que 5. En el otro extremo
se encuentran quienes opinan que, para que la prueba sea viable ninguna de las
frecuencias esperadas debe ser menor que 1 y no ms del 25% pueden ser
menores que 5; en lo que refiere a las frecuencias observadas no existiran lmites.
La autora de este texto simpatiza ms con la segunda postura, no slo por
razones prcticas, sino porque lo razonable es que la distribucin esperada est
adecuadamente definida y, por tanto, no debe incluir valores muy bajos; sin
embargo, los valores extremos en la distribucin observada simplemente reflejan
diferencias importantes entre la distribucin supuesta por la hiptesis nula y la
real.
Sea cual sea el criterio que elijamos, si resultara que la prueba no es viable
podramos recurrir a englobar los valores o clases de valores con sus vecinos ms
prximos y pasar as a engrosar sus frecuencias. Este procedimiento no puede
llevarse hasta el absurdo pero proporciona una salida digna a situaciones
complejas. En casos excepcionales se pueden englobar valores que no sean
vecinos porque exista algn nexo lgico de conexin entre ellos.
Cuando sea necesario agrupar valores, los grados de libertad no se deben
calcular hasta que tengamos establecidas definitivamente las parejas de
frecuencias observadas y esperadas con las que calcularemos el estadstico de
contraste
Por tanto, todo lo que necesitamos sern unas estimas de las funciones de
probabilidad de ambas variables por separado (f(x) y f(y)) y de la funcin de
probabilidad conjunta (f(x,y))
Empezaremos la prueba tomando una muestra de parejas de valores sobre
la que contaremos la frecuencia absoluta con la que aparece cada combinacin de
valores (xi,yj) o de grupos de valores (i,j) (Oij) La tabla siguiente, en la que se
recogen estos datos, es en realidad nuestra estimacin de la funcin de
probabilidad conjunta multiplicada por el nmero total de datos (T).
y, por tanto,
es el valor esperado de
Oij (Eij)
Tal como pasaba en la prueba anterior, si las variables son independientes,
es decir, si las frecuencias Eij son realmente los valores esperados de las
frecuencias Oij, se puede calcular un parmetro que depende de ambas que tiene
distribucin chi-cuadrado,
Por otra parte, si las variables no son independientes, las diferencias entre
las series de frecuencias observadas y esperadas sern mayores que las
atribuibles al efecto del azar y, al estar elevadas al cuadrado en el numerador de la
expresin anterior, sta tender a ser mayor que lo que suele ser el valor de una
variable chi-cuadrado.
Estadstico de contraste
Se acepta la hiptesis nula si
, el percentil 1 de la distribucin
chi-cuadrado con grados de libertad.
- Estadstica
- Pruebas Paramtricas
- Pruebas No Paramtricas
-Distribucin De Probabilidad
- Prueba De Hiptesis
- Toma De Decisiones En La Gerencia
Ejemplo prueba de Chi-cuadrado:
Con = 0.10
Tenemos una muestra de 30 nmeros aleatorios:
0.0
0
0.8
0.7
5
0.0
0.6
3
0.8
0.2
0
0.0
0.
34
0.
0.
99
0.
0.
91
0.
0.
33
0.
0.8
7
0.3
0.7
9
0.0
9
0.2
1
2
0.1
5
5
0.0
0
5
0.7
4
29
0.
14
99
0.
18
22
0.
77
19
0.
59
0
0.0
2
1
0.6
7
Intervalo
[0, 0.2)
[0.2, 0.4)
[0.4, 0.6)
[0.6, 0.8)
[0.8, 1.0)
suma:
Oi
1
7
1
6
6
3
Ei
6
6
6
6
6
3
Los Oi (frecuencias observadas) son los valores en la muestra que caen en el iesimo intervalo. Lo Ei son las frecuencias esperadas. En este caso como estamos
contrastando con una uniforme y los intervalos tienen todos la misma amplitud,
estas son 30/5 = 6 (se espera la misma cantidad de observaciones por intervalo).
Como hay un intervalo, el [0.4, 0.6), en donde Oi < 5, hay que agruparlo y
calculando los elementos que intervienen.
i
1
2
3
4
Intervalo
[0, 0.2)
[0.2, 0.4)
[0.4, 0.8)
[0.8, 1.0)
suma:
Oi
Ei
1
7
7
6
3
(Oi
6
6
1
26
3
2.
0.
17
2.
08
0.
00
4.
Dado que 4.92 6.25 2decimos que no hay evidencia de que la muestra no
provenga de una distribucin uniforme.
Conclusin
Para m La prueba del chi cuadrado es un clculo que se utiliza para ver qu tanto
se parece la distribucin observada con los resultados tericos, para determinar si
un suceso es al azar o tiene alguna tendencia. Como el ejemplo que comento el
maestro de la moneda que es de que si lanzas una moneda, en teora tienes 50%
de probabilidad de cara o cruz en cada uno. Si la lanzas y te sale un resultado
ms seguido que el otro, entonces puedes determinar mediante el chi cuadrado
que los resultados no son al azar. Para interpretar este dato, el resultado que te
salga lo tienes que comparar con un "nivel de tolerancia" que quieras dar al error
en una distribucin. Entre ms alta sea el valor de la chi cuadrada, ser mayor la
probabilidad de que los datos tengan una tendencia.
Las pruebas estadsticas vistas en clase son un poco confusas por las frmulas y
como son varios tipos de mtodos para sacar nmeros pseudoaleatorios y sacar
diferentes cosas como la uniformidad, variancia etc.
la prueba de la chi cuadrada tienes que seguir varios pasos y a veces te enredas
pero lo visto en clase con lo investigado son los mismos pasos a seguir .
CHI CUADRADA
Se usa cuando se trabaja con variables nominales (categoras o grupos).
Responder la pregunta: si las frecuencias observadas, difiere de la frecuencia
esperada.
Utiliza los recuentros.
Para m los mtodos son buenos y cada una se usa respectivamente segn el
problema que se te presente el mtodo de la chi me gusto ms ya que tiene un
poco de todo aunque me confundo porque depende de los nmeros que tienes
que usar una formula diferente segn los dgitos.
Prueba de independencia
Prueba de corrida arriba y abajo
Prueba de Corridas
Una prueba de Corridas es un mtodo que nos ayuda a evaluar el carcter de
aleatoriedad de una secuencia de nmeros estadsticamente independientes y
nmeros uniformemente distribuidos. Es decir dado una serie de nmeros
determinar si son o no aleatorios.
Existen dos versiones de la prueba de corridas:
2.
3.
H0 : Hiptesis Nula
Criterio de Aceptacin |Z| Z 1 - /
2 . La secuencia de nmeros es independiente y por lo tanto la
secuencia es aleatoria
Conclusin
Al realizar la investigacin a m se me facilito usar la prueba de corrida porque es
ms fcil juntar los nmeros y en la prueba de pker tienes que observar cada
uno para ver donde lo tienes que clasificar como: Par, dos pares, tercia, una tercia
y un par, pker quintilla, pker y todos diferentes.
Aunque la prueba de corridas tiene dos tipos y se basa en el nmero de corridas
arriba o abajo que aumentan o disminuyen. Tal como la define esta prueba, una
corrida consiste en uno o ms puntos consecutivos en la misma direccin. Una
corrida nueva comienza cada vez que hay un cambio de direccin (bien sea
ascendente o descendente) en la secuencia de datos.
Cuando el nmero de corridas observado es:
Mayor que el nmero de corridas esperado, entonces puede tratarse de una
oscilacin.
Menor que el nmero de corridas esperado, entonces puede tratarse de una
tendencia.
Cada uno de los mtodos se usa depende del problema que tienes pero son muy
buenos los dos la prueba de las corridas se me hace mejor ya que el de poker es
un poco tedioso ir buscando cada uno de los dgitos a cual corresponde y si el de
de corridas se basa en todos los nmeros que tienes en conjunto y as busca el
mejor resultado .