You are on page 1of 7

CONTRASTES DE HIPTESIS

Cuando nos interesa decidir si una proposicin, una conjetura o suposicin acerca
de un parmetro poblacional (hiptesis) es verdadera o falsa, el procedimiento de
toma de decisin acerca de sta se denomina contraste de hiptesis.

Los contrastes de hiptesis o de significacin permiten verificar la veracidad de


alguna hiptesis establecida acerca de una poblacin, determinando si los valores
difieren significativamente de los esperados por la hiptesis, o si las diferencias
observadas se deben al azar.

Una hiptesis estadstica es una suposicin que se plantea respecto a un


problema o a una poblacin, con el fin de rechazarla o no.
En los contrastes de hiptesis se distinguen dos hiptesis estadsticas: la hiptesis
nula designada por H0, conocida tambin como hiptesis de no diferencia, que es
la que se establece en principio con el nico propsito de rechazarla o "anularla"; y
una segunda, la hiptesis de investigacin o alterna, Ha, que es complementaria
de la primera. Cuando se habla de contrastar una hiptesis nula contra una
alterna, esto siempre se hace suponiendo que la nula es verdadera.

En general la forma de las hiptesis nula y alterna es:

H0: parmetro poblacional = ( , ) valor supuesto


Ha: parmetro poblacional ( > , < ) valor supuesto

TIPOS DE HIPTESIS Y REGIN CRTICA O DE RECHAZO


La hiptesis nula de no diferencia (=) contra una alterna de diferencia () es
una hiptesis bilateral o de dos colas porque el rechazo de H0 puede ocurrir hacia
un lado u otro; es decir, puede ser diferente porque es menor o porque es mayor
que el valor supuesto qo.
H0: q = q0 vs. Ha: q q0

Las hiptesis nulas del tipo () o () son hiptesis unilaterales o de una sola cola,
la primera es unilateral superior o de cola derecha y la segunda es unilateral
inferior o de cola izquierda. Esto es:

H0: q q0 vs. Ha: q > q0 es una hiptesis unilateral superior o de cola derecha,
porque se rechaza H0 en el caso de que se obtengan valores muy por encima del
valor supuesto.

Mientras que H0: q q0 vs. Ha: q < q0 es una hiptesis unilateral inferior o de cola
izquierda, porque se rechaza H0 en el caso de que se obtengan valores muy por
debajo del valor supuesto.

La regin crtica o regin de rechazo es la regin que contiene los resultados


menos favorables a H0, en el supuesto de que H0 sea verdadera y la regin de no
rechazo es la que contiene los valores ms favorables a H0. Estas regiones estn
separadas por los valores crticos del estadstico de contraste que corresponden a
un nivel de significacin dado.

Segn sea el tipo de hiptesis se tendrn regiones crticas para los dos lados
(bilaterales o de dos colas) o para un solo lado (unilaterales o de una cola), Ver
figura 9.1.

ESTADSTICO DE PRUEBA O ESTADSTICO DE CONTRASTE


Una vez que se han formulado las hiptesis nula, H0, y alterna, Ha, se debe
realizar un procedimiento de contraste por medio del cual se toma una decisin
basada en la muestra aleatoria seleccionada de la poblacin en estudio. Para
llevar a cabo este procedimiento es necesario seleccionar un estadstico de
contraste, calcularlo con base en la muestra y luego tomar la decisin de rechazar
o no H0, dependiendo de si este estadstico es o no consistente con H0. Es decir, si
el valor calculado del estadstico es muy diferente del valor supuesto en H0,
suponiendo que sta es cierta, entonces se rechaza H0. Sin embargo, si el valor
calculado del estadstico de contraste es consistente con lo supuesto en H0,
entonces no hay razn suficiente para rechazar H0 en favor de la Ha. En resumen,
el estadstico de contraste es una variable aleatoria cuya distribucin se conoce,
en el supuesto de que H0 es verdadera y sirve para tomar la decisin de rechazar
o no H0.

Anlisis de varianza (ANOVA)

El anlisis de la varianza (ANOVA) es una potente herramienta estadstica, de


gran utilidad tanto en la industria, para el control de procesos, como en el
laboratorio de anlisis, para el control de mtodos analticos.
Los ejemplos de aplicacin son mltiples, pudindose agrupar, segn el objetivo
que persiguen, en dos principalmente: la comparacin de mltiples columnas de
datos y la estimacin de los componentes de variacin de un proceso. Nos
ocupamos en este artculo de la primera de ellas. Comparacin de mltiples
poblaciones
La comparacin de diversos conjuntos de resultados es habitual en los
laboratorios analticos. As, por ejemplo, puede interesar comparar diversos
mtodos de anlisis con diferentes caractersticas, diversos analistas entre s, o
una serie de laboratorios que analizan una misma muestra con el mismo mtodo
(ensayos colaborativos). Tambin sera el caso cuando queremos analizar una
muestra que ha estado sometida a diferentes tratamientos o ha estado
almacenada en diferentes condiciones.
En todos estos ejemplos hay dos posibles fuentes de variacin: una es el error
aleatorio en la medida y la otra es lo que se denomina factor controlado (tipo de
mtodo, diferentes condiciones, analista o laboratorio,...). Una de las herramientas
estadsticas ms utilizadas que permite la separacin de las diversas fuentes de
variacin es el anlisis de la varianza (ANOVA, del ingls Analysis of Variance)
[Massart, 1997].
El ANOVA tambin puede utilizarse en situaciones donde ambas fuentes de
variacin son aleatorias. Un ejemplo sera el anlisis de algn compuesto de un
vino almacenado en un depsito. Supongamos que las muestras se toman
aleatoriamente de diferentes partes del depsito y se realizan diversos anlisis
replicados. Aparte de la variacin natural en la medida tendremos una variacin en
la composicin del vino de les diferentes partes del depsito.

Cuando tengamos un factor, controlado o aleatorio, aparte del error propio de la


medida, hablaremos del ANOVA de un factor. En el caso de que estuvisemos
desarrollando un nuevo mtodo colorimtrico y quisiramos investigar la influencia
de diversos factores independientes sobre la absorbancia, tales como la
concentracin de reactivo A y la temperatura a la que tiene lugar la reaccin,

entonces hablaramos de un ANOVA de dos factores. En los casos donde tenemos


dos o ms factores que influyen, se realizan los experimentos para todas las
combinaciones de los factores estudiados, seguido del ANOVA. Se puede deducir
entonces si cada uno de los factores o una interaccin entre ellos tienen influencia
significativa en el resultado. Para utilizar el ANOVA de forma satisfactoria deben
cumplirse tres tipos de hiptesis, aunque se aceptan ligeras desviaciones de las
condiciones ideales:
1. Cada conjunto de datos debe ser independiente del resto.
2. Los resultados obtenidos para cada conjunto deben seguir una distribucin
normal.
3. Las varianzas de cada conjunto de datos no deben diferir de forma significativa.

Evaluacin de bondad de ajuste


En este trabajo se estudia el comportamiento de medidas de bondad de ajuste de
modelos logit marginales para datos binarios correlacionados. Algunas de ellas son de
carcter descriptivo, basadas generalmente en la nocin de prdida incurrida al usar un
modelo aproximado para describir la realidad, y otras constituyen estadsticas globales de
bondad de ajuste. En general son extensiones naturales de las disponibles para el caso
de modelos logit clsicos, es decir bajo el supuesto de independencia de las
observaciones. Para la evaluacin de estas medidas se realiza un estudio por simulacin
mediante la utilizacin de un algoritmo simple de generacin de datos con estructura
de asociacin.
Intra-unidad constante. Entre las estadsticas de tipo descriptivo se destaca el buen
comportamiento de la extensin del criterio de Akaike, la cual constituye una medida til
para seleccionar el mejor subconjunto de covariables a incluir en el modelo. En lo que se
refiere a los tests globales de bondad de ajuste, la extensin de la prueba chi cuadrado de
Pearson y la basada en la suma no ponderada de residuos son las que presentan en
general mejor comportamiento en cuanto al control del error tipo I, si bien la potencia
resulta baja.

Clave:
Datos binarios correlacionados; Modelos marginales; Bondad de ajuste

Intervalos de confianza para mtodos de regresin


lineal
Para la construccin de los intervalos de confianza para los coeficientes de
regresin se debe asumir que los errores

son normalmente distribuidos,

independientes con
y
Este supuesto hace que variable
sea tambin una variable normal ya que es una funcin de una variable normal,
con

y varianza

Debido a que el estimador de mnimos cuadrados


entonces

es una funcin de

es normalmente distribuido con

Como

Entonces la distribucin marginal de cualquier coeficiente de regresin


normal con

Donde

es el

elemento de la matriz

es

. Luego

Es una cantidad pivotal para la construccin del intervalo de confianza para


cuya distribucin de probabilidad es
Donde

con

grados de libertad.

obtenido de la tabla de Anova. Por tanto un intervalo de

confianza
,

del

por

ciento

para

el

coeficiente

de

regresin

, es

Ejemplo
Los intervalos de confianza del 95% para los parmetros son:
Parmetro

Estimado

Error estndar

Lmite inferior

Lmite superior

-94,552

9,96343

-120,164

-68,9402

2,80155

0,300978

2,02786

3,57524

1,07268

0,0932349

0,833014

1,31235

You might also like