You are on page 1of 15

Introduccin

Existen algunos mtodos disponibles para verificar varios aspectos de la calidad


de los nmeros pseudoaleatorios. Si no existiera un generador particular de
nmeros aleatorios disponible, se le recomienda al analista usar estos mtodos
cuando se realice una simulacin.
Las dos propiedades ms importantes esperadas en los nmeros aleatorios son
uniformidad e independencia. La prueba de uniformidad puede ser realizada
usando las pruebas de ajuste de bondad disponibles. Por ejemplo, un numero
estadstico suficiente de nmeros aleatorios pueden ser usados para verificar la
distribucin de los nmeros contra la distribucin uniforme terica usando ya sea
el mtodo Chi-Cuadrada o el mtodo Kolmogomorov-Smirnov(KS) para nmeros
aleatorios. Este tipo de prueba es denominada "Prueba de frecuencia".

Prueba de Uniformidad
Chi-Cuadrado
-De ajuste e independencia
Las pruebas chi-cuadrado son un grupo de contrastes de hiptesis que sirven para
comprobar afirmaciones acerca de las funciones de probabilidad (o densidad) de
una o dos variables aleatorias.
Estas pruebas no pertenecen propiamente a la estadstica paramtrica pues no
establecen suposiciones restrictivas en cuanto al tipo de variables que admiten, ni
en lo que refiere a su distribucin de probabilidad ni en los valores y/o el
conocimiento de sus parmetros.
Se aplican en dos situaciones bsicas:
a) Cuando queremos comprobar si una variable, cuya descripcin parece
adecuada, tiene una determinada funcin de probabilidad. La prueba
correspondiente se llama chi-cuadrado de ajuste.
b) Cuando queremos averiguar si dos variables (o dos vas de clasificacin) son
independientes estadsticamente. En este caso la prueba que aplicaremos ser la
chi-cuadrado de independencia o chi-cuadrado de contingencia.

Chi-cuadrado de ajuste
En una prueba de ajuste la hiptesis nula establece que una variable X
tiene una cierta distribucin de probabilidad con unos determinados valores de los
parmetros. El tipo de distribucin se determina, segn los casos, en funcin de:

La propia definicin de la variable, consideraciones tericas al margen de esta y/o


evidencia aportada por datos anteriores al experimento actual.
A menudo, la propia definicin del tipo de variable lleva implcitos los
valores de sus parmetros o de parte de ellos; si esto no fuera as dichos
parmetros se estimarn a partir de la muestra de valores de la variable que
utilizaremos para realizar la prueba de ajuste.
Como en casos anteriores, empezaremos definiendo las hiptesis.

Hiptesis nula: X tiene distribucin de probabilidad f(x) con parmetros y 1,...,


yp
Hiptesis alternativa: X tiene cualquier otra distribucin de probabilidad.

Es importante destacar que el rechazo de la hiptesis nula no implica que


sean falsos todos sus aspectos sino nicamente el conjunto de ellos; por ejemplo,
podra ocurrir que el tipo de distribucin fuera correcto pero que nos hubisemos
equivocado en los valores de los parmetros.
Obviamente, necesitaremos una muestra de valores de la variable X. Si la
variable es discreta y tiene pocos valores posible estimaremos las probabilidades
de dichos valores mediante sus frecuencias muestrales; si la variable es continua
o si es una discreta con muchos o infinitos valores estimaremos probabilidades de
grupos de valores (intervalos).
Metodolgicamente, la prueba se basa en la comparacin entre la serie de
frecuencias absolutas observadas empricamente para los valores de la variable
(Oi) y las correspondientes frecuencias absolutas tericas obtenidas en base a la
funcin de probabilidad supuesta en la hiptesis nula (Ei).
As pues, una vez calculadas las frecuencias absolutas de cada valor o
intervalo de valores, obtendremos el nmero total de observaciones de la muestra
(T) sumando las frecuencias observadas

Para calcular las frecuencias esperadas repartiremos este nmero total de


observaciones (T) en partes proporcionales a la probabilidad de cada suceso o

grupo de sucesos. Para ello calcularemos dichas probabilidades utilizando la


funcin de probabilidad definida en la hiptesis nula f(x), de modo que, cada valor
Ei tendr la siguiente expresin:

Por tanto, tendremos los siguientes datos para la prueba:

Valor de la variable

x1

x2

x3

...

xi

...

xk

Frecuencias observadas

O1

O2

O3

...

Oi

...

Ok

Frecuencias esperadas

E1

E2

E3

...

Ei

...

Ek

Si la hiptesis nula es cierta, las diferencias entre valores observados y


esperados (que siempre existirn por tratarse de una muestra aleatoria) son
atribuibles, exclusivamente, al efecto del azar. En estas condiciones, se puede
calcular un parmetro que depende de ambos, cuya distribucin se ajusta a una
chi-cuadrado.

Si, por el contrario, la hiptesis nula fuera falsa los Ei ya no seran,


realmente, los valores esperados de las frecuencias; por tanto, las diferencias
entre los valores "esperados" y los observados reflejaran no slo el efecto del
azar sino tambin las diferencias entre los Ei y la autntica serie de valores
esperados (desconocida) Como consecuencia, las diferencias de los numeradores
de la expresin anterior tienden a ser ms grandes y, por estar elevadas al
cuadrado, la suma de cocientes ser positiva y mayor que lo que se esperara para
los valores de una chi-cuadrado.

Por tanto, el parmetro anterior ser el estadstico de contraste de la prueba


de hiptesis y la regin crtica se encontrar siempre en la cola derecha de la
distribucin chi-cuadrado. Evidentemente, esta prueba ser siempre de una sola
cola.

Estadstico de contraste
Se acepta la hiptesis nula si
, el percentil 1 de la distribucin
chi-cuadrado con grados de libertad.
Cabe sealar que en las pruebas chi-cuadrado lo corriente es que
pretendamos comprobar que una variable tiene una cierta distribucin y, por tanto,
habitualmente, nos vemos obligados a colocar nuestra propia hiptesis en la
hiptesis nula. nicamente podremos colocar nuestra hiptesis en la alternativa en
el caso excepcional de que pretendamos demostrar que cierto tratamiento produce
una distorsin de la distribucin bsica de la variable en estudio.
El nmero de grados de libertad de la variable chi-cuadrado se calcula de la
siguiente forma:
A priori, tendr tantos grados de libertad como parejas frecuencia
observada - frecuencia esperada.
A esta cantidad se debe restar el nmero de restricciones lineales
impuestas a las frecuencias observadas, es decir, el nmero de parmetros
que es necesario calcular directamente a partir de los valores observados
para establecer los valores esperados. Este nmero es, como mnimo, uno
ya que siempre tendremos que calcular el nmero total de observaciones
de la muestra.

Una condicin bsica para que podamos llevar a cabo una prueba chicuadrado es que las frecuencias de las distintas clases deben ser suficientemente
altas como para garantizar que pequeas desviaciones aleatorias en la muestra
no tengan importancia decisiva sobre el valor del estadstico de contraste.
Las reglas que determinan cuando es posible o no realizar el contraste
varan mucho de unos autores a otros. En un extremo de mxima rigidez se
encuentran aquellos que opinan que no se puede realizar la prueba cuando alguna
de las frecuencias, observadas o esperadas, sea menor que 5. En el otro extremo
se encuentran quienes opinan que, para que la prueba sea viable ninguna de las

frecuencias esperadas debe ser menor que 1 y no ms del 25% pueden ser
menores que 5; en lo que refiere a las frecuencias observadas no existiran lmites.
La autora de este texto simpatiza ms con la segunda postura, no slo por
razones prcticas, sino porque lo razonable es que la distribucin esperada est
adecuadamente definida y, por tanto, no debe incluir valores muy bajos; sin
embargo, los valores extremos en la distribucin observada simplemente reflejan
diferencias importantes entre la distribucin supuesta por la hiptesis nula y la
real.
Sea cual sea el criterio que elijamos, si resultara que la prueba no es viable
podramos recurrir a englobar los valores o clases de valores con sus vecinos ms
prximos y pasar as a engrosar sus frecuencias. Este procedimiento no puede
llevarse hasta el absurdo pero proporciona una salida digna a situaciones
complejas. En casos excepcionales se pueden englobar valores que no sean
vecinos porque exista algn nexo lgico de conexin entre ellos.
Cuando sea necesario agrupar valores, los grados de libertad no se deben
calcular hasta que tengamos establecidas definitivamente las parejas de
frecuencias observadas y esperadas con las que calcularemos el estadstico de
contraste

Chi-cuadrado de contingencia o independencia


La prueba chi-cuadrado de contingencia sirve para comprobar la
independencia de frecuencias entre dos variables aleatorias, X e Y.
Las hiptesis contrastadas en la prueba son:
Hiptesis nula: X e Y son independientes.
Hiptesis alternativa: X e Y no son independientes (No importa cual sea la
relacin que mantengan ni el grado de esta.

La condicin de independencia, tal como fue definida en la pgina anterior


era: X e Y son independientes si y slo si para cualquier pareja de valores x e y la
probabilidad de que X tome el valor x e Y el valor y, simultneamente, es igual al
producto de las probabilidades de que cada una tome el valor correspondiente.

Por tanto, todo lo que necesitamos sern unas estimas de las funciones de
probabilidad de ambas variables por separado (f(x) y f(y)) y de la funcin de
probabilidad conjunta (f(x,y))
Empezaremos la prueba tomando una muestra de parejas de valores sobre
la que contaremos la frecuencia absoluta con la que aparece cada combinacin de
valores (xi,yj) o de grupos de valores (i,j) (Oij) La tabla siguiente, en la que se
recogen estos datos, es en realidad nuestra estimacin de la funcin de
probabilidad conjunta multiplicada por el nmero total de datos (T).

Para obtener las estimas de las funciones de probabilidad marginales


debemos sumar por filas y por columnas los valores de las frecuencias conjuntas.
Las sumas de filas (Fi) son, en cada caso, el nmero de veces que hemos
obtenido un valor de X (xi) en cualquier combinacin con distintos valores de Y, es
decir, son nuestra estima de la funcin de probabilidad de X multiplicada por el
nmero total de observaciones; anlogamente, las sumas de columnas (C j) son
nuestra estima de la funcin de probabilidad de Y multiplicada por el nmero total
de observaciones.
El nmero total de observaciones lo podemos obtener como la suma de
todas las frecuencias observadas o, tambin, como la suma de las sumas de filas
o de las sumas de columnas:

As pues, si las variables fueran independientes debera cumplirse que

Naturalmente, nadie espera que esta condicin se cumpla exactamente


debido al efecto de los errores de muestreo aleatorio. Por tanto, nuestro problema
consiste en distinguir entre las diferencias producidas por efecto del muestreo y
diferencias que revelen falta de independencia.
Podemos convertir la ecuacin anterior a frecuencias absolutas
multiplicando por T:

Si X e Y son independientes, Oij debe ser igual a

bajo la hiptesis de independencia,

y, por tanto,

es el valor esperado de

Oij (Eij)
Tal como pasaba en la prueba anterior, si las variables son independientes,
es decir, si las frecuencias Eij son realmente los valores esperados de las
frecuencias Oij, se puede calcular un parmetro que depende de ambas que tiene
distribucin chi-cuadrado,

Por otra parte, si las variables no son independientes, las diferencias entre
las series de frecuencias observadas y esperadas sern mayores que las
atribuibles al efecto del azar y, al estar elevadas al cuadrado en el numerador de la
expresin anterior, sta tender a ser mayor que lo que suele ser el valor de una
variable chi-cuadrado.

Por tanto, el parmetro anterior ser el estadstico de la prueba de hiptesis


y la regin crtica se encontrar siempre en la cola derecha de la distribucin chicuadrado. Nuevamente, esta prueba ser siempre de una sola cola.

Estadstico de contraste
Se acepta la hiptesis nula si
, el percentil 1 de la distribucin
chi-cuadrado con grados de libertad.

Tal como ocurra en la prueba anterior lo corriente es que queramos


demostrar que dos variables son independientes, es decir, que, habitualmente, nos
veremos obligados a colocar nuestra hiptesis en la hiptesis nula.
El nmero de grados de libertad de la chi-cuadrado que sirve de contraste
se calcula de la siguiente forma:
A priori tendremos tantos grados de libertad como combinaciones de
valores xi, yj tengamos (I J)
A este nmero tendremos que restarle I debido a que, para calcular las
frecuencias esperadas, necesitamos calcular las I sumas de filas en la tabla
anterior. Conocidas las sumas de filas obtenemos el nmero total de
observaciones sin perder ningn grado de libertad.
A continuacin, necesitaremos calcular, a partir de las frecuencias
observadas J - 1 de las sumas de columnas; la restante podemos obtenerla
restando la suma de las anteriores del total de observaciones (T).
En resumen, el nmero de grados de libertad de la prueba es el producto
del nmero de filas menos uno por el nmero de columnas menos uno.

En cuanto a la magnitud mnima necesaria de las frecuencias observadas y


esperadas, rigen las mismas normas que en el caso de la prueba de ajuste. En
este caso, si nos viramos obligados a juntar valores para sumar frecuencias,
debemos unir columnas o filas completas (y contiguas). Obviamente, los grados
de libertad no deben calcularse hasta que no se hayan realizado todas las

agrupaciones necesarias y quede claro cual es el nmero de filas y columnas de la


tabla definitiva.
Como hemos visto, esta prueba no hace ninguna suposicin acerca del tipo
de distribucin de ninguna de las variables implicadas y utiliza nicamente
informacin de la muestra, es decir, informacin contingente. Esta es la razn por
la que, habitualmente, se le llama chi-cuadrado de contingencia.
LAS APLICACIONES DE LA DISTRIBUCIN DE LAS PROBABILIDADES DEL
CHI CUADRADO

- Estadstica
- Pruebas Paramtricas
- Pruebas No Paramtricas
-Distribucin De Probabilidad
- Prueba De Hiptesis
- Toma De Decisiones En La Gerencia
Ejemplo prueba de Chi-cuadrado:
Con = 0.10
Tenemos una muestra de 30 nmeros aleatorios:
0.0
0
0.8

0.7
5
0.0

0.6
3
0.8

0.2
0
0.0

0.
34
0.

0.
99
0.

0.
91
0.

0.
33
0.

0.8
7
0.3

0.7
9
0.0

9
0.2
1

2
0.1
5

5
0.0
0

5
0.7
4

29
0.
14

99
0.
18

22
0.
77

19
0.
59

0
0.0
2

1
0.6
7

De donde obtenemos la siguiente tabla:


i
1
2
3
4
5

Intervalo
[0, 0.2)
[0.2, 0.4)
[0.4, 0.6)
[0.6, 0.8)
[0.8, 1.0)
suma:

Oi
1
7
1
6
6
3

Ei
6
6
6
6
6
3

Los Oi (frecuencias observadas) son los valores en la muestra que caen en el iesimo intervalo. Lo Ei son las frecuencias esperadas. En este caso como estamos

contrastando con una uniforme y los intervalos tienen todos la misma amplitud,
estas son 30/5 = 6 (se espera la misma cantidad de observaciones por intervalo).
Como hay un intervalo, el [0.4, 0.6), en donde Oi < 5, hay que agruparlo y
calculando los elementos que intervienen.
i
1
2
3
4

Intervalo
[0, 0.2)
[0.2, 0.4)
[0.4, 0.8)
[0.8, 1.0)
suma:

Oi

Ei
1
7
7
6
3

(Oi
6
6

1
26
3

2.
0.
17
2.
08
0.
00
4.

Dado que 4.92 6.25 2decimos que no hay evidencia de que la muestra no
provenga de una distribucin uniforme.

Conclusin
Para m La prueba del chi cuadrado es un clculo que se utiliza para ver qu tanto
se parece la distribucin observada con los resultados tericos, para determinar si
un suceso es al azar o tiene alguna tendencia. Como el ejemplo que comento el
maestro de la moneda que es de que si lanzas una moneda, en teora tienes 50%
de probabilidad de cara o cruz en cada uno. Si la lanzas y te sale un resultado
ms seguido que el otro, entonces puedes determinar mediante el chi cuadrado
que los resultados no son al azar. Para interpretar este dato, el resultado que te
salga lo tienes que comparar con un "nivel de tolerancia" que quieras dar al error
en una distribucin. Entre ms alta sea el valor de la chi cuadrada, ser mayor la
probabilidad de que los datos tengan una tendencia.
Las pruebas estadsticas vistas en clase son un poco confusas por las frmulas y
como son varios tipos de mtodos para sacar nmeros pseudoaleatorios y sacar
diferentes cosas como la uniformidad, variancia etc.
la prueba de la chi cuadrada tienes que seguir varios pasos y a veces te enredas
pero lo visto en clase con lo investigado son los mismos pasos a seguir .

CHI CUADRADA
Se usa cuando se trabaja con variables nominales (categoras o grupos).
Responder la pregunta: si las frecuencias observadas, difiere de la frecuencia
esperada.
Utiliza los recuentros.
Para m los mtodos son buenos y cada una se usa respectivamente segn el
problema que se te presente el mtodo de la chi me gusto ms ya que tiene un
poco de todo aunque me confundo porque depende de los nmeros que tienes
que usar una formula diferente segn los dgitos.

Prueba de independencia
Prueba de corrida arriba y abajo
Prueba de Corridas
Una prueba de Corridas es un mtodo que nos ayuda a evaluar el carcter de
aleatoriedad de una secuencia de nmeros estadsticamente independientes y
nmeros uniformemente distribuidos. Es decir dado una serie de nmeros
determinar si son o no aleatorios.
Existen dos versiones de la prueba de corridas:

Prueba de corridas arriba y abajo (ascendente y descendente).

Prueba de corridas arriba y abajo de la media (promedio).

III.6.1 1Prueba de corridas Arriba y Abajo para nmeros estadsticamente


independientes
Si tenemos una secuencia de nmeros de tal manera que a cada uno de los
nmeros siga otro mayor la secuencia dada ser ascendente (arriba).
Si cada nmero va seguido por otro menor, la secuencia ser descendente
(abajo).
Si cada nmero va seguido por otro menor, la secuencia ser descendente
(abajo).

Pasos para evaluar una prueba de corridas:


1.

Primeramente le asignaremos un signo a cada nmero de la secuencia


ya sea + - , eso depender de los siguiente

2.

Si a un nmero le sigue otro mayor, se le asigna +. Esto es si Xi < Xi +1


el signo asignado ser (+). Siendo Xi un nmero de la muestra o
secuencia de nmeros.

3.

Si el nmero siguiente es menor, se le da un signo -. Esto es si Xi > Xi


+1 el signo asignado ser (-).

4. Se continuar con la comparacin de los nmeros y la asignacin de su


signo correspondiente hasta N-1. Es decir hasta el penltimo numero
de la secuencia, ya que al ltimo nmero le sigue un evento nulo(no es
posible compararlo con otro nmero).

Para comprender mejor el mtodo ejemplificaremos con la siguiente secuencia


de nmeros:
59,12,19,05,59,58,83,18,36,00,61,47,24,41,42,98,23,67,84,43,29,71,88,74,60,10,46,23,15,11,78,3
1,11,91,99,57,28,18,32,21,12,95,38,76,07,96,33,63,10,05

De acuerdo al mtodo (prueba de corridas arriba y abajo) se evaluar 59<12,


como no lo es se le asignar un signo -. Seguiremos comparando 12<19, ya
que si lo es se le asigna un signo
+.
Se contina con la evaluacin quedando de la siguiente manera:
-+-+-+-+-+- -+++-++- -++- - -+- - -+--++---+--+-+-+-+- -

Una vez encontrado los signos de cada nmero de la secuencia dada se


procede a calcular el total de corridas que resulta de la suma de suma de
corrida ascendente con la descendente.
Una corrida se define como una sucesin de eventos similares, precedidos y
seguidos por un evento diferente.
En este ejemplo tendamos un total de corridas de 33.
Sea a = 33 el nmero total de corridas en una secuencia. La media a y la
varianza

oa de a estn dadas por:

Para N>20, es posible aproximarse razonablemente a la distribucin de a


mediante una
Distribucin normal con la media y la varianza que se dan en las anteriores
ecuaciones.
Por lo comn, esa aproximacin sera apropiada para comprobar la aleatoriedad
de los
Nmeros generados por un generador de nmeros aleatorios, puesto que se
pueden producir
varios centenares de nmeros antes de aplicar una prueba.
Podemos rechazar una hiptesis de que una secuencia de nmeros es
aleatoria, porque
hay un nmero excesivo o demasiado bajo de corridas. Por ende se requiere
una prueba de colas
para determinar si se ha presentado alguno de esos extremos. Como estadstica
de la prueba Utilizaremos:

H0 : Hiptesis Nula
Criterio de Aceptacin |Z| Z 1 - /
2 . La secuencia de nmeros es independiente y por lo tanto la
secuencia es aleatoria

H1 : Hiptesis Alternativa Criterio de rechazo |Z| > Z1-a/2 .La


secuencia de nmeros No es Independiente y por lo tanto la secuencia No es
aleatoria.
Sustituyendo la media a y la varianza oa , tenemos que:

Si se define el nivel de significancia por medio de = 0.05, entonces, Z1-a/2


ser igual a 1- 0.05/2 = 0.975, buscando este valor en las tablas de Z
encontramos que tiene un valor de 1.96 entonces, si el valor absoluto de Z
calculada es mayor o igual a la Z de las tablas se rechazar la hiptesis de la
independencia de los nmeros (propiedad de los nmeros pseudoaleatorios).
Esto es:
Z calculada =0.00 < Z0.975 =1.96

Estaremos rechazando la hiptesis de que los nmeros dados no son


estadsticamente independientes. Debido a la falsedad de la comparacin
llegamos a la aceptacin de la hiptesis alternativa
Nota:
Una secuencia de nmeros puede ser no aleatoria si se tienen demasiadas o muy
pocas corridas.
Si tenemos una secuencia de N nmeros, el nmero mximo de corridas
posibles es N-1. El
Numero minimo posible es siempre uno.

Conclusin
Al realizar la investigacin a m se me facilito usar la prueba de corrida porque es
ms fcil juntar los nmeros y en la prueba de pker tienes que observar cada
uno para ver donde lo tienes que clasificar como: Par, dos pares, tercia, una tercia
y un par, pker quintilla, pker y todos diferentes.
Aunque la prueba de corridas tiene dos tipos y se basa en el nmero de corridas
arriba o abajo que aumentan o disminuyen. Tal como la define esta prueba, una
corrida consiste en uno o ms puntos consecutivos en la misma direccin. Una
corrida nueva comienza cada vez que hay un cambio de direccin (bien sea
ascendente o descendente) en la secuencia de datos.
Cuando el nmero de corridas observado es:
Mayor que el nmero de corridas esperado, entonces puede tratarse de una
oscilacin.
Menor que el nmero de corridas esperado, entonces puede tratarse de una
tendencia.

Cada uno de los mtodos se usa depende del problema que tienes pero son muy
buenos los dos la prueba de las corridas se me hace mejor ya que el de poker es
un poco tedioso ir buscando cada uno de los dgitos a cual corresponde y si el de
de corridas se basa en todos los nmeros que tienes en conjunto y as busca el
mejor resultado .

You might also like