You are on page 1of 77

INSTITUTO UNIVERSITARIO DE TECNOLOGA

Dr. FEDERICO RIVERO PALACIO

ES TAD S TIC A I I

C a r a ca s, a g o st o 2 0 0 6
1

R ep b l i ca Bo l i v ari an a d e Ven ez u el a
M i n i s t e r i o d e E d u c a c i n S u p e r i o r
F u n d a c i n M i s i n S u c re

M i n i s t r o d e Ed u c a c i n S up e r i o r
S amuel Moncada Acosta
V i c e mi n i s t r a d e Po l t i c a s A c a d mi c a s
Maruja Romero Ypez

Asesor d e Con ten id o


P rof. S usana Coves
D i s e a d o ra In s tru cc i o n a l
P r o f . Lu i s a M r q u e z

UNIDADES CURRICULARES ESPECIALIZADAS

E S T AD S TI CA II

Trabajo Acompaado
Trabajo Independiente
Horas por semana
Total horas por trimestre

horas
3
3
6
42

UNIDAD
TEMTICA
Participacin en
desarrollo
endgeno

Compromiso
social

Habilidades y Destrezas
Relaciones
asertiva.s

Elaborar
normas y
procedmientos

Formular
proyectos

Elab edos
financ.

Elab informes.
Administ

Conocimientos
Identificar
problemas o
necesidades

Tcnicas y
procedimientos
contables

Desarrollo
econmico y
social

Tcnicas y
principios de
mercadeo

Elaboracin de
normas o
procedimientos
Marco Legal y
fiscal para la
administracin

Grales. del
proceso
administrativo

Competencias a desarrollar

COMPETENCIAS

Actitudes y valores

1. Probabilidad

2. Estimacin
Puntual
3. Prueba de
Hiptesis
4. Regresin y
Correlacin

T
Taabbllaa ddee C
Coonntteenniiddooss

Programa instruccional
Introduccin
Contenidos de Repaso. Teora de conjuntos
UNIDAD 1 PROBABILIDAD
Experimento, Resultado y Evento
Distribuciones de probabilidad
o Probabilidad binomial
o Probabilidad normal
o Aproximacin de la distribucin normal a la binomial
UNIDAD 2 ESTIMACIN PUNTUAL
Poblacin y muestra
Mtodos de muestreo
Teorema del lmite central
Estimadores
o Estimador puntual
o Intervalos de confianza
o Determinacin de parmetros para la media y la proporcin
o Caractersticas de un buen estimador
Clculo del tamao de la muestra
UNIDAD 3 PRUEBA DE HIPTESIS
Qu es una hiptesis?
Qu es una prueba de hiptesis?
Procedimiento para probar una hiptesis
Prueba para una o dos colas
Pruebas para media y proporcin
UNIDAD 4 REGRESIN Y CORRELACIN
Variable dependiente e independiente
Diagrama de dispersin
Coeficiente de correlacin

Respuestas
Bibliografa
Anexos

Pg.
4
6
7
13
16
18
19
23
29
30
32
32
34
35
35
36
37
39
41
44
46
46
46
50
51
59
61
62
62

PPR
RO
OG
GR
RA
AM
MA
A IIN
NSST
TR
RU
UC
CC
CIIO
ON
NA
AL
L
Objetivo General:
Analizar situaciones organizacionales a travs de estadsticos idneos que permitan
considerar el efecto y la interaccin entre los diferentes factores que intervienen en la
toma de decisiones administrativas.
Sinopsis de Contenidos:
UNIDAD 1. PROBABILIDAD
Objetivo: Aplicar los conceptos de probabilidad que permitan reducir los riesgos en la
toma de decisiones
Conceptos bsicos:
Probabilidad
Experimento, resultado y evento
Espacio muestral
Punto muestral
Sucesos y sus probabilidades
Distribuciones de probabilidad
Variable aleatoria
Valor esperado
Probabilidad binomial
Probabilidad normal
Concepto, propiedades e importancia
Funcin de probabilidad
reas bajo la curva
Tablas
Ajuste de la distribucin normal a la distribucin experimental y a
la binomial
UNIDAD 2. ESTIMACIN PUNTUAL
Objetivo: Calcular los intervalos de confianza de los estimadores para la toma de
decisin
Poblacin y muestra
Mtodos de muestreo
Muestro aleatorio simple
Muestreo aleatorio sistemtico
Muestreo aleatorio estratificado
Muestreo por conglomerados
Estimadores
Caractersticas de los estimadores
Intervalos de confianza para la media y la proporcin
Determinacin del tamao de la muestra

UNIDAD 3. PRUEBA DE HIPTESIS


Objetivo: Aplicar con propiedad y de forma pertinente a situaciones administrativas la
prueba de hiptesis
Qu es una hiptesis
Qu es una prueba de hiptesis
Contraste de hiptesis
Paramtricas (Media aritmtica y proporcin)
Para una poblacin
Para dos poblaciones
UNIDAD 4. REGRESIN Y CORRELACIN
Objetivo: Aplicar e interpretar el coeficiente de correlacin y determinacin con el
propsito de obtener la relacin o variacin entre dos variables
Variables dependiente e independientes
Grfico de dispersin
Coeficiente de correlacin
Correlacin lineal
Coeficiente de determinacin
Modelo de anlisis de regresin lineal
Recta de mnimos cuadrados
Error estndar de estimacin

IIN
NT
TR
RO
OD
DU
UC
CC
CII
N
N
La Estadstica es la ciencia que se preocupa de la recoleccin de datos, su
organizacin y anlisis, as como de las predicciones que, a partir de estos datos,
pueden hacerse. Esas predicciones se realizan a travs de la estadstica inferencial
cuyo objetivo es sacar conclusiones generales para toda la poblacin a partir del
estudio de una muestra.
La Inferencia Estadstica es la parte de la estadstica matemtica que se encarga del
estudio de los mtodos para la obtencin del modelo de probabilidad (forma funcional y
parmetros que determinan la funcin de distribucin) que sigue una variable aleatoria
de una determinada poblacin, a travs de una muestra (parte de la poblacin) obtenida
de la misma.
Los dos problemas fundamentales que estudia la inferencia estadstica son el
"Problema de la estimacin" y el "Problema del contraste de hiptesis" Cuando se
conoce la forma funcional de la funcin de distribucin que sigue la variable aleatoria
objeto de estudio y slo tenemos que estimar los parmetros que la determinan,
estamos en un problema de inferencia estadstica paramtrica, este tipo de problemas
son las que abordaremos en este material, el cual est conformado por cuatro unidades
sobre: Probabilidad, estimacin puntual, prueba de hiptesis y por ltimo correlacin y
regresin.

C
Coonntteenniiddooss ddee R
Reeppaassoo
Uniones, Intersecciones y Relaciones entre Eventos
Un conjunto es toda reunin de objetos. Con frecuencia es de utilidad identificar cmo
pueden relacionarse los conjuntos entre s. Con frecuencia es de utilidad identificar
cmo pueden relacionarse los conjuntos entre s. Se asume que se han identificado dos
conjuntos A y B. Cada uno contiene numerosos elementos. Es completamente posible
que algunos elementos. Es completamente posible que algunos elementos estn en
ambos conjuntos. Por ejemplo, se asume que el conjunto A consta de todos los
estudiantes de la clase de estadstica, y el conjunto B consta de todos los estudiantes
de la universidad que estn especializndose en economa. Aquellos elementos
(estudiantes) que estn en ambos conjuntos son los especialistas en economa de la
clase de estadstica. Tales estudiantes constituyen la interseccin entre A y B, que se
escribe A B y se lee como A interseccin B, consta de los elementos que son
comunes tanto a A como a B. Un diagrama de Venn es una herramienta til para
mostrar la relacin entre conjuntos, observemos:
A
Todos los
estudiantes la
clase

B
Todos los
especialistas en
economa

A B) A interseccin de B
Especialistas en economa en la clase
Notacin
Por lo regular se usan letras maysculas para representar a los conjuntos, y letras
minsculas para representar a los elementos de un conjunto dado. Si
es un conjunto,
y

todos sus elementos, es comn escribir:

para definir a tal conjunto


. La notacin empleada para definir al conjunto
se llama
notacin por extensin. Para representar que un elemento pertenece a un conjunto
, escribimos
Si todos los elementos

(lase

en

). La negacin de

de un conjunto

pueda ser expresada como una proposicin


notacin por comprensin, y se puede definir

se escribe

satisfacen alguna propiedad, misma que


, con la indeterminada

, usamos la

donde el smbolo

se lee "tal que", y puede ser remplazado por una barra

ejemplo, el conjunto

. Por

puede definirse por


.

El smbolo

representa al conjunto de los nmeros naturales.

Complemento de un conjunto
Dado un conjunto

, se representa por

al complemento de

, el cual es un

conjunto que verifica la proposicin


para cualquiera que
sea el elemento . As pues,
est formado por todos los elementos que no son del
conjunto
.
Igualdad entre conjuntos. Subconjuntos y Superconjuntos
Igualdad de conjuntos
Dos conjuntos
y
se dicen iguales, lo que se escribe
si constan de los
mismos elementos. Es decir, siempre que para cualquiera que sea el elemento , se
verifique

Subconjuntos y Superconjuntos
Un conjunto
se dice subconjunto de otro
elemento de
, es decir, cuando se verifique

, si todo elemento de

es tambin

,
sea cual sea el elemento . En tal caso, se escribe
.
Cabe sealar que, por definicin, no se excluye la posibilidad de que si
, se
cumpla A = B. Si
tiene por lo menos un elemento que no pertenezca al conjunto
,
pero si todo elemento de
es elemento de
, entonces decimos que
es un
subconjunto propio de
, lo que se representa por
.
Si
es un subconjunto de
, decimos tambin que
es un superconjunto de
, lo
que se escribe
. As pues
,
y tambin

significando

que

,
es superconjunto propio de

.
10

Por el principio de identidad, es siempre cierto


, para todo
elemento , por lo que todo conjunto es subconjunto (y tambin superconjunto) de s
mismo.
Vemos que
es una relacin de orden sobre un conjunto de conjuntos, pues
para todo
,y
es reflexiva.
,y
es antisimtrica
,y
es transitiva
Operaciones con conjuntos: Unin, Interseccin, Diferencia y Diferencia Simtrica.
Sean
y
dos conjuntos.
Unin
Los elementos que pertenecen a
oa
o a ambos
y
, forman otro conjunto,
llamado unin de
y
, escrito
. As pues, se tiene
.
Interseccin
Los elementos comunes entre
y
, representado por

y
:

forman un conjunto denominado interseccin de

.
Si dos conjuntos
conjuntos disjuntos.

son tales que

, entonces

se dicen

Ejemplos: si tenemos los conjuntos


Entonces:

Diferencia
Los elementos de un conjunto
que no se encuentran en otro conjunto
otro conjunto llamado diferencia de
y
, representado por,
:

, forman

.
Vemos que
,
de manera que

11

. Pero tambin

,
de modo que

Diferencia simtrica
Se define la diferencia simtrica de dos conjuntos por

Cuantificadores
Los cuantificadores sirven para indicar cuantos elementos de un conjunto dado cumplen
con cierta propiedad. Tales cuantificadores son:
El cuantificador universal, representado por
. Este cuantificador se emplea para
afirmar que todos los elementos de un conjunto cumplen con determinada propiedad.
Se escribe
.
La proposicin anterior suele usarse como la equivalente de
El cuantificador existencial se usa para indicar que al menos un elemento de un
conjunto
cumple con una propiedad. Se escribe:

La proposicin del cuantificador existencial suele interpretarse como la equivalente de la


proposicin
Se definen

Aplicaciones
Sean
y
dos conjuntos. Un subconjunto
, lo que se representa por

, se dice aplicacin de

en

siempre que se verifiquen

12

Si

, el elemento

antecedente de

por

por

, y el elemento

. Se emplea la notacin

por

se llama

Sea una aplicacin


imagen de

se dice imagen de

, y por tanto

Sean las aplicaciones

para representar a la

.
y

. Se define

,
y se dice que

es el producto de composicin de las aplicaciones

Vemos que
y

por lo que

13

Unidad I

Probabilidad
Objetivo:
Conocer los conceptos de probabilidad a fin de establecer las posibles relaciones entre
eventos que permitirn reducir riesgos en a toma de decisiones en a practica
profesional

Contenidos:
Probabilidad normal
Conceptos Bsicos
Probabilidades
Experimentos, resultados y evento
Espacio muestral
Punto muestral
Sucesos y sus probabilidades
Distribuciones de probabilidad
Variable aleatoria
Valor esperado
Probabilidad binomial
Probabilidad normal

14

No s cuando
podr realizarse el
sueo de Bolvar
pero nosotros
iremos poniendo las
piedras
Augusto
Sandino

Probabilidad
Probabilidad es un concepto que en administracin nos permite trabajar en funcin de
nuestras expectativas con la ocurrencia algn resultado, esto significa que hacemos
proyecciones sobre la posibilidad de xito o fracaso de un suceso, lo que a su vez
genera una reduccin de riesgos y de incertidumbre en la toma de decisiones.
Probabilidad es una palabra que empleamos de forma cotidiana, y, efectivamente
cuando preguntamos Qu probabilidad hay de que est listo para hoy? Suponemos
que la persona que va a contestar nos dar una respuesta que nos permitir
proyectarnos y predecir eventos a futuro; si la respuesta es no creo por que tienes
varias personas por delante eso nos va programando para dos acciones que impedirn
que ese evento interrumpa nuestro accionar. As mismo pasa en administracin, pues
un administrador debe considerar todos los escenarios posibles a la hora de decidir las
acciones que debe emprender una organizacin, a fin de minimizar la incertidumbre y
reducir riesgos.
El propsito de esta unidad es ofrecer en una primera parte los conceptos bsicos
sobre probabilidad y luego la aplicacin de dichos conceptos en la construccin de las
distribuciones de probabilidad, que es una lista que contiene todos los resultados de un
experimento y la probabilidad de ocurrencia de cada uno de ellos.

15

UNIDAD I. PROBABILIDAD

Probabilidad
Es la posibilidad de que algo va a ocurrir, es medida entre 1 y 0. Mientras mayor sea la
probabilidad de que el evento ocurra, la probabilidad asignada estar ms cerca de
uno, si hay certeza del que el evento va a ocurrir la probabilidad es de 1, y por el
contrario la posibilidad de que no ocurra es de 0.
Existen tres formas de enfocar la probabilidad: el modelo de frecuencia relativa, el
modelo subjetivo y el modelo clsico. El modelo de frecuencia relativa utiliza datos que
se han observado empricamente, registra la frecuencia con que ha ocurrido algn
evento en el pasado y estima la probabilidad de que el evento ocurra nuevamente con
base en estos datos histricos. La probabilidad de un evento con base en el modelo de
frecuencia relativa se determina mediante:

P (E)=

Nmero de veces que ha ocurrido el evento en el pasado


Nmero total de observaciones

Si por ejemplo durante el ao pasado hubo 200 nacimientos en un hospital local, de los
cuales 122 fueron varones el modelo de frecuencia relativa revela que la probabilidad
de que el prximo nacimiento o un nacimiento seleccionado al azar sea una nia se
obtiene dividiendo el nmero de nias que naci el ao anterior dividido entre le nmero
total de nacimientos:

P(nia )

78
0,39
200

Si consideramos en el concepto anterior de probabilidad, en el cual es establece que la


si la probabilidad es cercana a uno es tiene mayores oportunidades de ocurrencia, en
nacimiento de una nia en ese hospital es un evento poco probable.
El modelo subjetivo se utiliza cuando se desea asignar probabilidad a un evento que
nunca ha ocurrido, por ejemplo la probabilidad de que una mujer sea elegida como
Presidente de Venezuela, como no hay datos confiables se analizan las opiniones y las
tendencias para obtener una estimacin subjetiva.
El ltimo y tercer modelo de probabilidad es el clsico relacionado con mayor
frecuencia a las apuestas y juegos de azar. La probabilidad clsica se basa en la
suposicin de que los resultados de un experimento sean igualmente probables. La
probabilidad de un evento por medio de este modelo se determina mediante.

P(E)=

Nmero de formas en las que puede ocurrir un evento


Nmero total de resultados posibles
16

Para ejemplificar observemos la aplicacin de la ecuacin


P(cara)= Nmero de formas en las que el evento puede ocurrir / Nmero total de
posibles resultados
1
P(cara) 0,5
2
En este ejemplo slo hay una posibilidad de que salga cara, y dos posibles resultados,
que salga cara o que salga sello. Segn el resultado de la ecuacin existen iguales
posibilidades de que salga cara o sello, pues la probabilidad se halla en medio de 0 y 1.
Aun sin conocer a fondo la probabilidad clsica, se puede estar consciente de que la
probabilidad de obtener una cara en el lanzamiento de una moneda es de la mitad.

Tipos de
Probabilidad

Probabilidad
Objetiva

Modelo Clsico

Probabilidad

Modelo de
Frecuencia
Relativa

Modelo Subjetivo

Experimento
Seguramente asocias la palabra experimento a las ciencias fsicas donde nos
imaginamos a alguien mezclando qumicos y manipulando tubos de ensayos, sin
embargo, en administracin se realizan experimentos para conocer los posibles
resultados de una accin. Se dice que experimento es toda accin definida que conlleva
a un resultado nico bien definido que tiene dos o ms posibles resultados y no se sabe
cul va a ocurrir.
Resultado
Una consecuencia particular de un experimento.
Evento
Una coleccin de uno o ms resultados. De acuerdo a como se relacionan los eventos
de un experimento se pueden clasificar en: mutuamente excluyentes, colectivamente
exhaustivos, independientes o complementarios.
Mutuamente excluyente: la ocurrencia de cualquiera de los eventos implica que
ninguno de los otros eventos puede ocurrir al mismo tiempo. Como ejemplo tenemos el
lanzamiento de una moneda en la cual si sale cara garantiza que no puede salir sello.

17

Colectivamente exhaustivo: por lo menos uno de los eventos tiene que ocurrir, un
ejemplo es el lanzamiento de un dado, los resultados posibles son 1,2,3,4,5 y 6 y existe
la certeza que uno de ellos va a ocurrir.
Independientes: son eventos en los que la ocurrencia de uno no tiene nada que ver con
la ocurrencia del otro, por ejemplo lanzar un dado y una moneda a la vez, el resultado
del lanzamiento del dado no afecta al de la moneda.
Complementarios: son los eventos en los que si un evento no ocurre debe ocurrir el
otro. Una buena representacin de estos eventos la podemos apreciar al lanzar un dado
podemos decir que un evento A es sacar un nmero par, pero si esto no ocurre, el
complemento es sacar un nmero impar. En estos casos los eventos se denominan A
y no A.
Existe una ltima categora que son los eventos compuestos consiste en la coocurrencia de dos o ms eventos aislados. Las operaciones de conjuntos de
interseccin y unin implican eventos compuestos. De esta manera si se lanza una
moneda y un dado a la vez el resultado es un evento compuesto y se puede calcular la
probabilidad de tal evento. Los eventos compuestos son ms interesantes e incluso
ms tiles en la administracin ya que por medio de ellos pueden estudiarse las
relaciones entre dos sucesos que ocurren de forma paralela.
Para que visualicemos mejor las definiciones de experimento, resultado y evento,
observemos el siguiente cuadro:

Experimento: Tirar un dado


Obtener un 1
Obtener un 2
Todos los resultados
Obtener un 3
posibles
Obtener un 4
Obtener un 5
Obtener un 6
Obtener un nmero par
Algunos eventos posibles
Obtener un nmero mayor que 4
Obtener el nmero 3 o uno menor
En el experimento del lanzamiento de un dado hay seis posibles resultados, pero hay
muchos eventos posibles.
Ejercicio 1:
Clasifica los siguientes eventos:
El lanzamiento de dos monedas a la vez ___________________________________
Que un vuelo de avin salga retrasado ____________________________________
Que un beb sea varn ________________________________________________
Que la comida de hoy no quede salada ____________________________________
Que en la prxima temporada de bisbol Magallanes sea el campen____________

18

Espacio de Muestras y Eventos


Los elementos de bsicos de la teora de probabilidades son los resultados del proceso
o fenmenos bajo estudio. Cada tipo posible de ocurrencia se denomina un evento. Un
evento simple puede describirse mediante una caracterstica sencilla. La complicacin
de todos los eventos posibles se llama espacio muestral. Un evento conjunto es un
evento que tiene dos o ms caractersticas.
Para calcular la probabilidad de cualquier resultado es necesario primero determinar el
nmero total de resultados posibles; en un dado, por ejemplo, los resultados posibles
son 1,2,3,4,5,6. Llamemos a este conjunto U, ya que es el espacio muestral o universo
de posibles resultados. El espacio muestral incluye todos los posibles resultados en un
experimento que son de inters para el experimentador. Los elementos primarios de U
son llamados elementos o puntos mustrales. Se escribe, entonces, U = {1,2,3,4,5,6}
Vemoslo representado en un diagrama de Venn:

Cada
elemento
dentro del
conjunto es
un punto
muestral

2
3

4
5

El conjunto de los
nmeros del 1 al 6, es el
espacio muestral
U = {1,2,3,4,5,6}

Aclarando la imagen anterior decimos que un evento es un subconjunto de U; cualquier


elemento de un conjunto es tambin un subconjunto del conjunto. Algunas veces
puede ser complicado determinar un espacio muestral, sin embargo para ello nos
apoyamos en la teora de conjuntos. Los conjuntos pueden definirse listando todos los
miembros de conjunto y estableciendo una regla de inclusin de los elementos en l.

Distribuciones de Probabilidad
Una distribucin de probabilidad aporta el rango completo de valores susceptibles de
ocurrir con base en un experimento. Una distribucin de probabilidad es similar a una
distribucin de frecuencia, con la diferencia que no describe el pasado sino muestra que
tan probable es que ocurra un evento. Dado que esta clase de distribuciones se ocupan
de las expectativas son modelos de gran utilidad para hacer inferencias y tomar
decisiones en condiciones de incertidumbre.
Variable Aleatoria.
Una variable aleatoria es aquella que asume diferentes valores, a consecuencia de los
resultados de un experimento aleatorio, cada uno de los cuales tiene una determinada
probabilidad. Por ejemplo si contamos la cantidad de alumnos inasistentes a las clases
de estadstica II durante un mes, el nmero de ausencias es la variable aleatoria. Si esa
variable toma slo valores enteros, se dice que es de tipo discreto, tal es el caso del
ejemplo anterior, sera imposible decir que faltaron 3,5 estudiantes. Pero si por el
19

contrario la variable puede tomar valores fraccionarios se dice que es de tipo continuo.
Un ejemplo de una variable aleatoria discreta es el peso de los perros que recibe un
veterinario en su consulta, 50.5 Kg, 25.6 Kg, etc.
Una variable aleatoria es una variable cuyo
valor es el resultado de un evento aleatorio.

Supongamos que tenemos una variable aleatoria x, y que esta puede tomar los valores
x1, x2 , x3 ...xn que pueden ser discretos o continuos; cada uno de estos valores tiene
cierta probabilidad que en la prctica se desconoce; sin embargo, a travs de
planteamientos tericos podemos obtener dichas probabilidades, a las cuales
designamos por f(x); al desarrollo que toman estos valores de f(x), es lo que se llama
distribuciones de probabilidad de la variable aleatoria x. Estas distribuciones de
probabilidad toman diferentes formas o tipos, sin embargo, las ms importantes son la
distribucin binomial y la distribucin normal.
Valor Esperado.
El valor esperado es un concepto fundamental en el estudio de las distribuciones de
probabilidad. Desde hace muchos aos este concepto ha sido aplicado ampliamente en
el negocio de seguros y en los ltimos veinte aos ha sido aplicado por otros
profesionales que casi siempre toman decisiones en condiciones de incertidumbre. Para
obtener el valor esperado de una variable aleatoria discreta, multiplicamos cada valor
que sta puede asumir por la probabilidad de ocurrencia de ese valor y luego sumamos
los productos. Es un promedio ponderado de los resultados que se esperan en el futuro.

Probabilidad Binomial
Es una distribucin de probabilidad que emplea las variables aleatorias discretas, su
principal caracterstica es que slo existen dos resultados posibles para cada
experimento, gracias a ello su nombre binomial; adems posee las siguientes
propiedades:
1. Slo debe haber dos resultados posibles. Uno se identifica como xito y el otro como
fracaso, pero este resultado no trae una connotacin de bueno o malo, es decir, un
xito no significa que el resultado sea deseable.
2. La probabilidad de que una observacin se clasifique como xito, p, es constante de
observacin a observacin. Por tanto, la probabilidad de que una observacin se
clasifique como fracaso, q= 1-p, es constante sobre todas las observaciones.
3. Cada observacin puede clasificarse en una o dos categoras mutuamente
excluyentes y colectivamente exhaustivas. El resultado de cualquier observacin es
independiente del resultado de cualquier observacin.
4. El experimento puede repetirse muchas veces, pues un experimento no afecta al
otro.

20

Como ya se mencion el smbolo p representa la probabilidad de un xito y el smbolo


q ( 1- p ) representa la probabilidad de un fracaso. Para representar cierto nmero de
xitos, utilizaremos el smbolo r y para simbolizar el nmero total de ensayos
emplearemos el smbolo n.
Entonces tenemos que:
P
Q
r
n

Probabilidad de xito.
Probabilidad de fracaso.
Nmero de xitos deseados.
Nmero de ensayos efectuados.

Calcular la probabilidad de r xitos en n ensayos segn la formula binomial se calcula


as:

n!
p r q nr
r!(n r )!

Recordemos que el s mbolo factorial! Significa, por


ejemplo que es 3! = 3*2*1 = 6
Los matemticos definen 0! = 1.
Las calculadoras cientficas traen la funcin factorial!

Es necesario saber que las observaciones o experimentos pueden ser con o


sin reemplazo, para comprender mejor estas definiciones leamos el siguiente
ejemplo: Queremos conocer la probabilidad de que salga una esfera roja de
una bolsa que contiene 4 esferas, 3 azules y 1 roja. Si el experimento es con
reemplazamiento, al meter la mano en la bolsa y extraer la pelota se observa
el color y se vuelve a depositar en la misma; por el contrario, si el experimento
es sin reemplazamiento se extrae la bola, se observa el color y se deja afuera
para continuar con los siguientes resultados. Es importante resaltar que los
experimentos con reemplazo se convierten en infinitos.

Cmo se construye una Distribucin de Probabilidad Binomial


Para elaborar una distribucin de probabilidad binomial es necesario conocer el nmero
de ensayos y la probabilidad xito de cada ensayo, por ejemplo si un estudiante
presenta una prueba de seleccin conformada por 20 preguntas y cada una tiene 5
opciones de respuestas, se dice que habrn 20 ensayos (las preguntas); y si dentro de
las 5 opciones de respuesta slo una es la correcta, podemos decir que del 100% de
posibilidades cada estudiante tiene 20% de posibilidad de responder sin saber, es decir,
una persona sin conocimientos tiene una probabilidad de 0,20 de aprobar la prueba
acertando las respuestas.

21

Ejemplo:
La Lnea rea Conviasa tiene 5 vuelos diarios a Barquisimeto. Supongamos que la
probabilidad de que alguno de los vuelos salga retrasado es de 0.20 Cul es la
probabilidad de que ninguno de los vuelos hoy salga retrasado?
n!
Utilicemos la frmula P
p r q n r , considerando que n=5 vuelos, y p=0,20
r!(n r )!
No olvides que q=1-p

n!
5!
120
p r q nr
0,20 0 0,80 5
1(0,3277) 1(0,3277) 0,3277
r!(n r )!
0!(5 0)!
1(120)

La probabilidad de que ninguno de los vuelos salga retrasado es de 0,32; si retomamos


que el concepto de probabilidad, el cual se mide dentro del rango 0-1 podemos afirmar
que es baja la probabilidad de que ningn vuelo salga retrasado. Ahora bien si
queremos tener una estimacin de cuantos vuelos saldrn retrasados entonces
construimos la distribucin de probabilidad binomial, para ello sustituiremos r por los
valores 1,2,3,4,y 5. Como ya sustituimos la ecuacin con el valor r=0, a continuacin se
muestra el desarrollo del ejercicio con r=1 y r=5.

n!
5!
120
p r q nr
0,2010,80 4
0,2(0,4096) 5(0,08) 0,4096
r!(n r )!
1!(5 1)!
1(24)
n!
5!
120
p r q nr
0,20 5 0,80 0
0,0032(1) 1(0,0032) 0,0032
r!(n r )!
5!(5 5)!
120(1)

Ejercicio 2:
Ahora realiza t la ecuacin sustituyendo r por los valores 2, 3 y 4. En la tabla de la
Distribucin Binomial, que se te presenta a continuacin, se muestran los resultados
para que verifiques tu ejercicio:

Distribucin Binomial para n=5, p=0,20


Nmero de Vuelos con
Retraso
0
1
2
3
4
5
Total

Probabilidad
0.3277
0.4096
0.2048
0.0512
0.0064
0.0003
1.0000

22

La distribucin binomial tambin se puede expresar de forma grfica

Probabilidad

Distribucin de Probabilidad Binomial


0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0

0,4096

Recuerdas los grficos de


barras estudiados en
Estadstica I, ahora tambin
los puedes utilizar para
graficar la Distribucin de
Probabilidad Binomial.

0,3277

0,2048

0,0512
0,0064 0,0003
Vuelos retrasados

Ejercicio 3:
Imaginemos una escuela primaria donde los alumnos llegan tarde a menudo. Cinco
alumnos estn en el jardn de nios. La directora lleva tiempo estudiando el problema,
habiendo llegado a la conclusin de que hay una probabilidad de 0.4 de que un alumno
llegue tarde y de que los alumnos lleguen independientemente uno de otro Cmo
trazamos una distribucin binomial de probabilidad que ilustre las probabilidades de que
0,1,2,3,4 5 estudiantes lleguen tarde simultneamente?

Medidas de tendencia central y de dispersin para la distribucin binomial.


La distribucin binomial tiene un valor esperado o media ( ) y una desviacin estndar
que nos permite determinar que tan alejados estn los datos de la media o promedio
(). Podemos representar la media de una distribucin binomial de la siguiente forma:
=np
donde :
n= nmero de ensayos.
p= probabilidad de xitos.
Y la desviacin estndar de la siguiente forma:
n. p.q
donde :
n= nmero de ensayos.
p= probabilidad de xito.
q= probabilidad de fracaso.

Recuerda que la Desviacin


Estandar se determina
calculndole la raz cuadrada
de la Varianza( 2 ), por lo que
inferimos que

2 (npq)

23

Ejemplo:
Una mquina empaquetadora que produce 20% de paquetes defectuosos. Si se extrae
una muestra aleatoria de 10 paquetes, podremos calcular la media y la desviacin
estndar de la distribucin binomial de ese proceso en la forma que sigue:
= np = 10*0.2 = 2 Media.
= npq = (10) (0.2) (0.8) = 1.6 = 1.265 Desviacin estndar.

Probabilidad normal
De todas las distribuciones de probabilidad la normal es la ms importante. Esta
distribucin es frecuentemente utilizada en las aplicaciones estadsticas; su propio
nombre indica su extendida utilizacin, justificada por la frecuencia o normalidad con la
que ciertos fenmenos tienden a parecerse en su comportamiento a esta distribucin.
Muchas variables aleatorias continuas presentan una funcin de densidad cuya grfica
tiene forma de campana. En otras ocasiones, al considerar distribuciones binomiales,
tipo B(n,p), para un mismo valor de p y valores de n cada vez mayores, se ve que sus
polgonos de frecuencias se aproximan a una curva en "forma de campana".
La distribucin normal de probabilidad es una distribucin de probabilidad continua
tanto simtrica como mesocrtica. La curva de probabilidad de probabilidad que
representa a la distribucin normal de probabilidad tiene forma de campana

Leptocrtica
Ambas mitades de la
campana son idnticas
Mesocrtica

Platicrtica

Media, mediana y moda son iguales

La distribucin normal de probabilidad es importante para la inferencia estadstica


porque:
Se sabe que las medidas obtenidas en muchos procesos aleatorios siguen
esta distribucin.
Las probabilidades normales suelen servir para aproximar otras
distribuciones como la binomial.
Las distribuciones estadsticas como la media muestral y la proporcin
muestral tienen distribucin normal cuando el tamao de muestra es
grande, independientemente de la poblacin de origen.
24

Propiedades de la Distribucin Normal


La distribucin normal tiene varias propiedades tericas importantes, entre las cuales
estn:
1. Tiene forma de campana, es simtrica en apariencia y posee un solo pico en el
centro de la distribucin.
2. Sus mediciones de tendencia central (media, mediana, moda) son iguales y se
ubican en el pico.
3. Su dispersin media es igual a 1.33 desviaciones estndar. El valor de su alcance
intercuartil puede diferir ligeramente de 1.33 desviaciones estndar.
4. La curva normal desciende suavemente en ambas direcciones a partir del valor
central. Es asinttica, lo que significa que la curva se acerca cada vez ms al eje de
las X pero jams llega a tocarlo. Es decir, las colas de la curva se extienden de
manera indefinida en ambas direcciones.
Pero Qu es Simetra y Asimetra?
Para saber si una distribucin es simtrica, hay que precisar con respecto a qu. Un
buen candidato es la mediana, ya que para variables continuas, divide al histograma de
frecuencias en dos partes de igual rea. Podemos basarnos en ella para, de forma
natural, decir que una distribucin es simtrica si el lado derecho de la grfica (a
partir de la mediana) es la imagen por un espejo del lado izquierdo

Cuando la variable es discreta, decimos que es simtrica, si lo es con respecto a la


media. Se podra pensar que definir la simetra con usando la mediana para variables
continuas y usando la media para variables discretas es una eleccin arbitraria. En
realidad esto no es as, pues si una variable es continua, coinciden los ambos criterios
de simetra (con respecto a la media y a la mediana). Es ms, se tiene que media y
mediana coinciden para distribuciones continuas simtricas. Por otro lado, en el caso de
variables discretas, la distribucin es simtrica si el lado derecho del diagrama se
obtiene por imagen especular desde la media. En este caso coincide la media con la
mediana si el nmero de observaciones es impar.
25

Si la variable es continua simtrica y unimodal, coinciden la media, la mediana y la


moda.
Dentro de los tipos de asimetra posible, vamos a destacar los dos fundamentales
Asimetra positiva:
Si las frecuencias ms altas se encuentran en el lado izquierdo de la media, mientras
que en derecho hay frecuencias ms pequeas (cola).
Asimetra negativa:
Cuando la cola est en el lado izquierdo.

Simetra y Asimetra en la Curva Normal

La importancia de la distribucin normal viene dada por tres razones:


1. Numerosos fenmenos continuos parecen seguirla o pueden aproximarse mediante
sta.
2. podemos usarla para aproximar diversas distribuciones de probabilidad discreta y
evitar as pesados clculos
3. Proporciona la base de la inferencia estadstica clsica debido a su relacin con el
teorema del lmite central.
26

Cmo se construye una Distribucin de Probabilidad Normal


Construir una distribucin de probabilidad, tal y como lo hicimos con la binomial sera
imposible debido a que la probabilidad normal est determinada por la media ( ) y la
desviacin estndar ( ). Lo bueno es que podemos utilizar un solo dato de la familia de
distribuciones normales para dar respuestas a todos los problemas que decidamos
resolver con este tipo de distribucin. La que tiene una media de 0 y una desviacin
estndar de 1 se le conoce como distribucin normal estndar. Todas las distribuciones
normales pueden convertirse a distribucin normal estndar restando la media de cada
observacin y dividiendo por la desviacin estndar, utilizando un valor z.
Valor Z:
La distancia entre un valor seleccionado, designado X, y la media ,
dividida por la desviacin estndar.
X
Z

Donde:
X: es el valor de cualquier observacin o medicin especfica.
: es la media de la distribucin.
: es la desviacin estndar de la distribucin

reas bajo la curva normal.


La primera aplicacin de la distribucin normal supone encontrar el rea bajo la curva
normal entre una media y un valor seleccionado designado como x. No importa cules
sean los valores de y para una distribucin de probabilidad normal, el rea bajo la
curva es 1,00; de manera que podemos pensar en reas bajo la curva como si fueran
probabilidades. Matemticamente:
Aproximadamente el 68% de todos los valores de una poblacin normalmente
distribuida se encuentran dentro + 1 desviacin estndar de la media.
Aproximadamente 95,5% de todos los valores de una poblacin normalmente
distribuida se encuentran dentro de + 2 desviaciones estndar de la media.
Aproximadamente 99,7% de todos los valores de una poblacin normalmente
distribuida se encuentran dentro de + 3 desviaciones estndar de la media.
Las tablas estadsticas indican porciones del rea bajo la curva normal que estn
contenidas dentro de cualquier nmero de desviaciones estndar (ms, menos) a partir
de la media.
No es posible ni necesario tener una tabla distinta para cada curva normal posible. En
lugar de ello, podemos utilizar una distribucin de probabilidad normal estndar para
encontrar reas bajo cualquier curva normal. Con esta tabla podemos determinar el
rea o la probabilidad de que la variable aleatoria distribuida normalmente est dentro

27

de ciertas distancias a partir de la media. Estas distancias estn definidas en trminos


de desviaciones estndar.
Para cualquier distribucin normal de probabilidad, todos los intervalos que contienen el
mismo nmero de desviaciones estndar a partir de la media contendrn la misma
fraccin del rea total bajo la curva para cualquier distribucin de probabilidad normal.
Ejemplo

(Tomado
continua.shtml)

de

http://www.monografias.com/trabajos26/distribucion-continua/distribucion-

El Instituto Especializado Materno Perinatal desea conocer la probabilidad de que al


hacer una prueba de hemoglobina en gestantes adolescentes que acuden a la
institucin en el tercer trimestre del embarazo, se obtenga un resultado menor a 11
mg/dl; para lo cual toma una muestra al azar de 30 gestantes menores de 19 aos,
cuya edad gestacional este comprendida entre 28 40 semanas.
Datos:
n = 30 x =10.547 = 0.718
Base de datos: Nivel de Hemoglobina en gestaciones de adolescentes en el 3er.
Trimestre del embarazo. n = 30
10.9 11.2 9.8 11.6 9.9 10.0 11.2 10.2 10.8 9.5 10.0 10.9 11.5 10.4 10.9
10.3 11.7 11.2 9.8 10.4 11.4 11.3 10.5 10.2 11.1 10.6 9.9 8.9 10.8 9.5
Prueba estadstica : Distribucin Normal Estndar o Z
Si sabemos que:
Media: 10.55
Desviacin Estndar: 0.71
Clculo del estadstico z :
X - m 11- 10.55 0.45 = 3.75
z = Sx = 0,71/ 30 = 0.12
P(X<11) confirmado en la tabla de la funcin normalizada z =3.75
La Funcin de Normalizacin, z = 0.64
Tenemos los siguientes datos:
Distribucin

Distribucin

Normal Estndar

Normal

11

Media

10.55

Desviacion Estandar

0.71

0.64

28

De estos datos podemos hacer la siguiente tabla de distribuciones


X

f(X)

f(Z)

8.42

0.0013

-3

0.0013

9.13

0.0227

-2

0.0227

9.84

0.1591

-1

0.1591

10.55

0.5019

0.5019

11.26

0.8432

0.8432

11.97

0.9778

0.9778

11.26

0.8432

0.8432

Curva de la distribucin normal estndar en comparacin con la Normal:

Interpretacin:
La probabilidad de que el valor de hemoglobina en una gestante adolescente que curse
el tercer trimestre del embarazo sea menor a 11 mg/dl es de 0.64. Es decir, el 64% de
las gestantes adolescentes que acuden a maternidad de Lima sufren de anemia
asociada a la gestacin.
Ejercicio 4:
El costo de una chupetas de diferentes marcas tiene una distribucin aproximadamente
normal con una media de 500 y una desviacin estndar de 10Cul es el valor z para
un valor x de 520 y otro de 490?

Uso de la tabla de distribucin de probabilidad normal estndar.


En esta tabla, el valor z est derivado de la frmula:
z = (x - m ) / s
29

en la que:
x = valor de la variable aleatoria que nos preocupa
m = media de la distribucin de la variable aleatoria
s = desviacin estndar de la distribucin
z = nmero de desviaciones estndar que hay desde x a la media de la distribucin.
Por qu utilizamos z en lugar del nmero de desviaciones estndar? Las variables
aleatorias distribuidas normalmente tienen unidades diferentes de medicin: bolvares,
dlares, pulgadas, kilogramos, segundos, etc. Como vamos a utilizar una tabla,
hablamos en trminos de unidades estndar (que en realidad significa desviaciones
estndar), y denotamos a stas con el smbolo z.
La tabla de distribucin de probabilidad normal estndar da los valores de nicamente
la mitad del rea bajo la curva normal, empezando con 0,0 en la media. Como la
distribucin normal de probabilidad es simtrica, los valores verdaderos para una mitad
de la curva son verdaderos para la otra.

Defectos de la distribucin normal de probabilidad.


Los extremos de la distribucin normal se acercan al eje horizontal, pero nunca llegan a
tocarlo. Esto implica que existe algo de probabilidad (aunque puede ser muy pequea)
de que la variable aleatoria pueda tomar valores demasiado grandes. No perderemos
mucha precisin al ignorar valores tan alejados de la media. Pero a cambio de la
conveniencia del uso de este modelo terico, debemos aceptar el hecho de que puede
asignar valores empricos imposibles.

La Distribucin Normal como una Aproximacin de la Distribucin Binomial.


Aunque la distribucin normal es continua, resulta interesante hacer notar que algunas
veces puede utilizarse para aproximar a distribuciones discretas, debido a que generar
una distribucin binomial para muestras grandes puede llevar mucho tiempo es ms
eficiente hacer una aproximacin de la distribucin normal a la binomial
Una distribucin binomial B(n,p) se puede aproximar por una distribucin normal,
siempre que n sea grande y p no est muy prxima a 0 o a 1. La aproximacin consiste
en utilizar una distribucin normal con la misma media y desviacin tpica que la
distribucin binomial. En la prctica se utiliza la aproximacin cuando:

En cuyo caso:
Y tipificando se obtiene la normal estndar correspondiente:

30

Unidad II

Estimacin Puntual

Objetivo:
Calcular los intervalos de confianza de los estimadores para la toma de decisin.

Contenidos:
Poblacin y muestra
Mtodos de muestreo
Muestro aleatorio simple
Muestreo aleatorio sistemtico
Muestreo aleatorio estratificado
Muestreo por conglomerados
Estimadores
Intervalos de confianza para la media y la proporcin
Determinacin del tamao de la muestra

31

Vive como si
fueras a morir
maana.
Aprende como si
fueras a vivir
siempre.
Mohandas Gandhi

Estimacin Puntual
En administracin es usual realizar estudios en los que se aborden diversas
poblaciones, sin embargo acceder a cada miembro de esas poblaciones es un trabajo
imposible de realizar, por ello se seleccionan muestras que nos den una evidencia de lo
que gusta, opina, etc. una poblacin, no obstante el hecho de no poseer los datos
reales nos obliga a estimarlos, para ello existen los estimadores. En esta unidad
encontrars algunos aspectos relacionados con los estimadores puntuales y sus
intervalos de confianza.

32

UNIDAD II. ESTIMACIN PUNTUAL


Poblacin y Muestra
La poblacin es el grupo total de individuos u objetos que se consideran, y la muestra
es una parte o subconjunto de dicha poblacin.
Mtodos de Muestreo
El muestreo es una herramienta para inferir algo respecto a una poblacin mediante la
seleccin de una muestra de esa poblacin. En muchas oportunidades el muestreo es
la nica herramienta para determinar algo con respecto a la poblacin por:
1. Es costoso abordar a todos los integrantes de la poblacin
2. La idoneidad de los resultados de la muestra, es decir, para muchos estudios no
es esencial indagar sobre la totalidad de la poblacin pues con una muestra se
obtiene los datos necesarios sin afectar significativamente los resultados
3. Es dificultoso poner se en contacto con todos los miembros de una poblacin.
4. La naturaleza destructivas de ciertas pruebas, como lo es el caso de las pruebas
de control de calidad, si se toma un objeto para determinar su punto mximo de
flexin, el cual al pasarlo se rompe, si tomamos a toda una poblacin (produccin
e un da, por ejemplo) eliminaramos por completo todos los elementos de la
poblacin.
En repetidas ocasiones se ha enfatizado la necesidad de seleccionar una muestra
representativa de la poblacin. Una muestra que tergiverse la poblacin representar un
error de muestreo y producir estimados imprecisos de loa parmetros de la poblacin.
Hay dos fuentes bsicas de muestreo. La primera es sencillamente mala suerte. Debido
a la cuestin de suerte, la muestra puede contener elementos que no sean
caractersticos de la poblacin. El destino puede que dictar ciertas selecciones en la
muestra sea atpicamente ms grandes que la mayora de los de la poblacin y en tal
caso resultaran una sobreestimacin del parmetro. O quizs muchos de los elementos
muestrales tienden a ser ms pequeos de lo que tpicamente se encuentra en la
poblacin y en tal caso resultara una subestimacin.
Un asegunda fuente de error de muestreo es el sesgo muestral. El sesgo resulta de la
tendencia a favorecer la seleccin de ciertas muestras sobre otras en la recoleccin de
los datos de la muestra. La seleccin de la muestra puede terminar en error. Por tanto,
es sabio garantizar que la recoleccin de los datos de la muestra siga un mtodo que
haya comprobado su capacidad para minimizar dicho error.
Mtodos de Muestreo Probabilstica
Existen dos tipos de muestras: Las probabilsticas y las no probabilsticas.
Qu es una muestra probabilstica: Muestra seleccionada de tal forma que cada artculo
o persona de la poblacin tienen la misma probabilidad de ser incluida en la muestra. Si
por el contrario se utilizan mtodos no probabilsticas no todos los artculos tienen la
33

misma probabilidad de ser incluidos por lo tanto se corre el riesgo de que los resultados
estn sesgados, lo que significa que los resultados no sean representativos a la
poblacin.

Muestreo Aleatorio Simple


Una muestra aleatoria simple puede obtenerse simplemente enumerando las
observaciones sobre pedazos idnticos de papel, colocndolos en un sombrero y
sacando el nmero deseado de modo que cada uno de los elementos o personas en la
poblacin tenga las mismas probabilidades de ser incluidos. Adems, tambin puede
hablarse de la tabla de nmeros aleatorios.
Muestreo Sistemtico
Una muestra sistemtica se forma seleccionando cada i-simo tem de la poblacin. Si
se determina que i es igual a 10, una muestra sistemtica consta de cada dcima
observacin en la poblacin. La poblacin debe ordenarse o enumerarse en forma
aleatoria. La primera seleccin debe determinarse aleatoriamente, y si i= 10, entonces
estar en alguna de las primeras 10 observaciones. El punto inicial exacto puede
identificarse bien sea seleccionando un nmero entre 1 y 10 sacado de un sombrero, o
utilizando una tabla de nmeros aleatorios. En cualquiera de los casos se selecciona de
all en adelante cada dcima observacin.
Este muestreo es ventajoso porque no requiere de un experto altamente calificado para
contar hasta 10 y registrar el resultado. Adems el mtodo permite flexibilidad ya que
puede establecerse que i sea 10, 100, 1000 o cualquier otro nmero deseado. La
determinacin del valor apropiado para i tambin es muy fcil. Si se desea seleccionar
una muestra de tamao 100 de una poblacin de 1000. El peligro principal que debe
evitarse es la ocurrencia de un patrn en el ordenamiento de la poblacin. Por ejemplo
enumerar a la poblacin alfabticamente.

Muestreo Estratificado
Una muestra estratificada se divide una poblacin en subgrupos llamados estratos, y se
selecciona una muestra para cada uno de ellos, forzando las proporciones de la
muestra de cada estrato para que est conforme al patrn poblacional. Se emplea
comnmente cuando la poblacin es heterognea, o dismil, aunque ciertos grupos
homogneos puedan aislarse. De esta forma el investigador puede incrementar la
precisin ms all del obtenido por una muestra aleatoria simple de tamao similar.

Muestreo por Conglomerados


El muestreo por conglomerados ofrece ciertas ventajas sobre otros mtodos. Consiste
en dividir toda la poblacin en conglomerados o grupos y luego seleccionar una muestra
de estos conglomerados. Todas las observaciones en estos conglomerados
seleccionados estn incluidas en la muestra. Este procedimiento con frecuencia es
34

ms fcil y rpido que el muestreo aleatorio simple o estratificado. Tambin es posible


combinar el muestreo estratificado con el muestreo por conglomerados.
Error en el muestreo: Es la diferencia de un estadstico de la muestra y un parmetro de
la poblacin.
Teorema del Lmite Central
El Teorema del Lmite Central dice que si tenemos un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribucin (cualquiera que
ste sea), la suma de ellas se distribuye segn una distribucin normal. Por ejemplo:
la variable "tirar una moneda al aire" sigue la distribucin de Binomial. Si lanzamos la
moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre
si) se distribuye segn una distribucin normal. Este teorema se aplica tanto a suma de
variables discretas como de variables continuas.
Los parmetros de la distribucin normal son:
Media: n * m (media de la variable individual multiplicada por el nmero de variables
independientes)
Varianza: n * s2 (varianza de la variable individual multiplicada por el nmero de
variables individuales)
Teorema del Lmite Central:
No importa el tipo de distribucin de la poblacin. Si las muestras son
suficientemente grandes (n 30), la distribucin en el muestreo se
puede aproximar a la distribucin normal. Aplicando las propiedades
de la distribucin normal ase puede obtener la probabilidad de que la
media muestral est entre ciertos valores o el intervalo centro del cual
caera una proporcin fija de la muestra. Para esto se procede de igual
manera que una distribucin normal utilizando la frmula de Z para la
distribucin muestral:
X x X x
Z

Veamos ahora dos ejemplos:


Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el
valor 0. Cada lanzamiento es una variable independiente, con media 0,5 y varianza
0,25. Calcular la probabilidad de que en estos 100 lanzamientos salga ms de 60 caras.
La variable suma de estas 100 variables independientes se distribuye, por tanto, segn
una distribucin normal.
Media = 100 * 0,5 = 50
Varianza = 100 * 0,25 = 25
Para ver la probabilidad de que salgan ms de 60 caras calculamos la variable normal
tipificada equivalente:
35

X x

60 50
2
5

(*) 5 es la raz cuadrada de 25, o sea la desviacin tpica de esta distribucin


Por lo tanto:
P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salga ms de 60 caras es
tan slo del 2,28%.
La renta media de los habitantes de un pas se distribuye uniformemente entre 4,0
millones de bolvares. y 10,0 millones bolvares. Calcular la probabilidad de que al
seleccionar al azar a 100 personas la suma de sus rentas supere los 725 millones Bs..
Cada renta personal es una variable independiente que se distribuye segn una funcin
uniforme. Por ello, a la suma de las rentas de 100 personas se le puede aplicar el
Teorema del Lmite Central.
La media y varianza de cada variable individual es:
m = (4 + 10 ) / 2 = 7
s2 = (10 - 4)2 / 12 = 3
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya media y
varianza son:
Media: n * m = 100 * 7 = 700
Varianza : n * s2 = 100 * 3 = 300
Para calcular la probabilidad de que la suma de las rentas sea superior a 725 millones
ptas, comenzamos por calcular el valor equivalente de la variable normal tipificada:
X x 725 700
Z

1,44
x
17,3
Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749
Es decir, la probabilidad de que la suma de las rentas de 100 personas seleccionadas al
azar supere los 725 millones de bolvares es tan slo del 7,49%
Ejercicio 5
En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada
clase es del 10%. A lo largo del ao tienes 100 clases de esa asignatura. Cul es la
probabilidad de tener que salir a la pizarra ms de 15 veces?

Estimadores
Estimador puntual:
Es un valor que se calcula a partir de la informacin de la muestra, y que se usa para
estimar el parmetro de la poblacin. Cuando no poseemos los datos de una poblacin
es necesario estimar la media de la poblacin, para ello utilizamos un nmero nico. A
ese nmero se le conoce como estimador puntual. No obstante un estimador puntual
slo se refiere a una parte de la historia. Si bien no se espera que es estimador puntual
36

est prximo al parmetro de la poblacin, se deseara expresar que tan cerca est,
para ello sirve el intervalo de confianza.
Un estimador puntual es el valor numrico de una estadstica muestral empleado para
estimar el valor de un parmetro de la poblacin o proceso. Una de las caractersticas
ms importante de un estimador es que sea insesgado. Un estimador insesgado es
una estadstica muestral cuyo valor esperado es igual al parmetro por estimar. A
continuacin se presentan algunos de los estimadores puntales de uso ms frecuente:
Parmetro de la Poblacin
Media,
Diferencia entre las medias de dos poblaciones,

1 2

Proporcin,
Diferencia entre las
poblaciones, 1 2
Varianza,
Desviacin estndar,
2

poblaciones

de

dos

Estimador

X1 - X 2
p
p 1 p 2
s2
s

El estimador puntual utiliza un valor de la muestra para estimar el parmetro


de la poblacin. Este valor variar de una muestra a otra porque en cada
muestra slo se selecciona una parte de la poblacin. La utilidad del
estimador puntual est condicionada a la compaa de un estimador del error.

Estimacin por Intervalos, un intervalo es un rango de valores dentro del cual se estima
est el parmetro de la poblacin.

Intervalo de Confianza:
EL intervalo de confianza es un rango de valores que se construyen a partir de datos de
la muestra de modo que el parmetro ocurre dentro de dicho rango con una
probabilidad especfica. La probabilidad especfica se conoce como nivel de confianza.
La media de la muestra es un estimador puntual de la media de la poblacin, por lo que
si una tienda desean estimar la edad promedio de las personas que compran equipos
de computacin, con tan solo tomar una muestra aleatoria de los compradores recientes
pueden determinar la edad de la poblacin, por lo tanto la media de la muestra estima la
media de la poblacin.
Cuando el tamao de la muestra, n, es por lo menos de 30, generalmente se acepta
que el teorema del lmite central asegurar una distribucin normal de las medias de las
muestras. Esta consideracin es importante. Si las medias de las muestras tienen una
distribucin normal, es posible usar la distribucin normal estndar, es decir, z, en
nuestros clculos. Los intervalos de confianza de 95 y 99 por ciento se calculan de la
siguiente forma cuando n es igual o mayor que 30.
37

Intervalo de confianza de 95 % para una media x 1,96


Intervalo de confieanza de 99 % para una media x 2,58

s
n
s
n

1,96 y 2,58 son valores z que corresponden al 95 y 99% de las observaciones


respectivamente, pero si lo que se desea es calcular un intervalo de confianza para una
media la frmula es:
s
xz
n

Intervalo de Confianza para una Proporcin de la Poblacin


La determinacin de un estimador puntual y de un de intervalo para una proporcin de
la poblacin es similar a los mtodos que se describieron en la seccin anterior. Un
estimador puntual para la proporcin de la poblacin se encuentra al dividir el nmero
de xitos en la muestra entre el nmero que se muestreo. Por ejemplo, supongamos
que 100 personas de las 400 que se muestrearon dijeron que les gustaba ms un
nuevo refresco que otro, la mejor estimacin de la proporcin de la poblacin que
favorece el nuevo refresco es 0.25 o 25% que resulta de dividir 100/400. La proporcin
es la fraccin del nmero de xitos con relacin al nmero muestreado. Veamos su
frmula:

X
, donde:
n
X= nmero de xitos
N= tamao de la muestra
Cmo se calcula el intervalo de confianza para proporcin de la poblacin
P z p
P (X xitos)=

Donde p es el error estndar estimado de la proporcin


Estudios para determinar parmetros
Con estos estudios pretendemos hacer inferencias a valores poblacionales
(proporciones, medias) a partir de una muestra.

Estimar una proporcin:


Si deseamos estimar una proporcin, debemos saber:
a) El nivel de confianza o seguridad (1-a ). El nivel de confianza prefijado da lugar a un
coeficiente (Za ). Para una seguridad del 95% = 1.96, para una seguridad del 99% =
2.58.
b) La precisin que deseamos para nuestro estudio.

38

c) Una idea del valor aproximado del parmetro que queremos medir (en este caso una
proporcin). Esta idea se puede obtener revisando la literatura, por estudio pilotos
previos. En caso de no tener dicha informacin utilizaremos el valor p = 0.5 (50%).
Ejemplo: A cuantas personas tendramos que estudiar para conocer la prevalencia de
diabetes?
Seguridad = 95%; Precisin = 3%: Proporcin esperada = asumamos que puede ser
prxima al 5%; si no tuvisemos ninguna idea de dicha proporcin utilizaramos el valor
p = 0,5 (50%) que maximiza el tamao muestral:

donde:
Za 2 = 1.962 (ya que la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1 0.05 = 0.95)
d = precisin (en este caso deseamos un 3%)

Si la poblacin es finita, es decir conocemos el total de la poblacin y desesemos


saber cuntos del total tendremos que estudiar la respuesta seria:

donde:
N = Total de la poblacin
Za2 = 1.962 (si la seguridad es del 95%)
p = proporcin esperada (en este caso 5% = 0.05)
q = 1 p (en este caso 1-0.05 = 0.95)
d = precisin (en este caso deseamos un 3%).
A cuntas personas tendra que estudiar de una poblacin de 15.000 habitantes para
conocer la prevalencia de diabetes?
Seguridad = 95%; Precisin = 3%; proporcin esperada = asumamos que puede ser
prxima al 5% ; si no tuviese ninguna idea de dicha proporcin utilizaramos el valor p =
0.5 (50%) que maximiza el tamao muestral.

Segn diferentes seguridades el coeficiente de Za vara, as:


Si la seguridad Za fuese del 90% el coeficiente sera 1.645
Si la seguridad Za fuese del 95% el coeficiente sera 1.96
Si la seguridad Za fuese del 97.5% el coeficiente sera 2.24
Si la seguridad Za fuese del 99% el coeficiente sera 2.576
Estimar una media:
Si deseamos estimar una media: debemos saber:
El nivel de confianza o seguridad (1-a ). El nivel de confianza prefijado da lugar a un
coeficiente (Za ). Para una seguridad del 95% = 1.96; para una seguridad del 99% =
2.58.
39

La precisin con que se desea estimar el parmetro (2 * d es la amplitud del intervalo de


confianza).
Una idea de la varianza S2 de la distribucin de la variable cuantitativa que se supone
existe en la poblacin.

Ejemplo: Si deseamos conocer la media de la glucemia basal de una poblacin, con


una seguridad del 95 % y una precisin de 3 mg/dl y tenemos informacin por un
estudio piloto o revisin bibliogrfica que la varianza es de 250 mg/dl

Si la poblacin es finita, como previamente se seal, es decir conocemos el total de la


poblacin y desearamos saber cuantos del total tendamos que estudiar la respuesta
sera:

(Tomado de http://www.fisterra.com/material/investiga/8muestras/8muestras.htm)

Error estndar la proporcin de la muestra


Es una medicin de la variabilidad de la distribucin muestral de las medias muestras.
Se calcula por:
Error estndar de la media con desviacin estndar de la poblacin conocida

n
Donde:
x = es el error de la media llamado tambin desviacin estndar de la distribucin
muestra de medias
= es la desviacin estndar de la poblacin
n= es el tamao de la muestra
En la mayora de los casos se desconoce la desviacin estndar de la poblacin, por lo
que se le estima por la desviacin estndar de la muestra, ello implica que en la frmula
presentada anteriormente se reemplaza (desviacin estndar de la muestra) por s
(desviacin estndar de la muestra). Vale la pena acotar que mientras ms mayor sea
el valor de n el error en el muestreo es menor

Caractersticas de un buen estimador


Cuando se tiene una frmula para estimar y se aplica a una muestra aleatoria, el
resultado es aleatorio, es decir los estimadores son variables aleatorias.
Por ejemplo si se recibe un embarque de objetos que pueden:

40

estar listos para usarse

defectuosos.

Podemos seleccionar al azar algunos de ellos para darnos una idea de la proporcin de
defectuosos en el embarque. El parmetro de inters es la proporcin de defectuosos
en toda la poblacin, pero lo que observamos es la proporcin de defectuosos en la
muestra. El valor de la proporcin en la muestra es una variable aleatoria cuya
distribucin est emparentada directamente con la binomial (si se tratara del nmero de
defectuosos, sera binomial).
Como cualquier variable aleatoria, el estimador tiene

Distribucin de probabilidad.

Valor esperado.

Desviacin estndar / varianza.

Valor esperado de un estimador y sesgo


El valor esperado de un estimador nos da un valor alrededor del cual es muy probable
que se encuentre el valor del estimador. Para poner un ejemplo, si supiramos que el
valor esperado de una estadstica es 4, esto significara que al tomar una muestra:

No creemos que el valor de la estadstica vaya a ser 4.

Pero tampoco creemos que el valor de la estadstica vaya a estar lejos de 4.

Ya que es muy probable que el valor del estimador est cerca de su valor esperado,
una propiedad muy deseable es que ese valor esperado del estimador coincida con el
del parmetro que se pretende estimar. Al menos, quisiramos que el valor esperado no
difiera mucho del parmetro estimado. Por esa razn es importante la cantidad que,
tcnicamente llamamos sesgo. El sesgo es la diferencia entre el valor esperado del
estimador y el parmetro que estima.
Si el sesgo 0, se dice que el estimador es instigado y sta es una caracterstica buena
para un estimador. Un estimador que es instigado tiene una alta probabilidad de tomar
un valor cercano al valor del parmetro.
Varianza de un estimador
Otra propiedad importante de un estimador es su varianza (o su raz cuadrada, la
desviacin estndar). La importancia de la desviacin estndar es que nos permite
darle un sentido numrico a la cercana del valor del estimador a su valor esperado.

41

Entre menor sea la desviacin estndar (o la varianza) de un estimador, ser ms


probable que su valor en una muestra especfica se encuentre mas cerca del valor
esperado. Para aclarar esto, considere dos estimadores T1 y T2, suponga que ambos
son instigados y suponga que la varianza de T1 es menor que la de T2 Qu quiere
decir esto? Simplemente que en un entorno fijo del valor del parmetro, los valores de
T1 son ms probables que los de T2. O sea que vamos a encontrar a T1 ms cerca del
valor del parmetro que a T2. Esto hace que nuestras preferencias estn con T1.
Cuando un estimador tiene una varianza menor que otro decimos que el estimador es
ms eficiente.

El mejor estimador es el que se acerca al parmetro poblacional, sus


caractersticas son:

No debe tener sesgo: cuando el valor esperado del estadstico usado como
estimador es igual al parmetro de la poblacin que se desea estimar, se dice
que ese estimador es insesgado.
Eficiencia: la eficiencia tiene relacin directa con el dato obtenido del error, a
menor error mayor es la eficiencia del estimador. Si las distribuciones de
muestreo de dos estadsticos tienen la misma media(o esperanza), el de
menor varianza se llama un estimador eficiente de la media, mientras que el
otro se llama un estimador ineficiente, respectivamente. De tal forma que si
podemos hallar un estimador con una varianza que resulte menor que la
varianza de cualquier otro estimador, tomaremos aquel como base para una
medida de eficiencia y diremos que ese es un estimador eficiente.
Consistencia: Un estimador tiene consistencia en la medida en que el tamao
de la muestra aumenta, ello nos acerca al parmetro de la poblacin.
Suficiencia: Si un estimador utiliza toda la informacin contenida en la
muestra acerca del parmetro que va a estimar, se dice que es un estimador
suficiente.

Clculo del tamao de la muestra


A la hora de determinar el tamao que debe alcanzar una muestra hay que tomar en
cuenta varios factores: el tipo de muestreo, el parmetro a estimar, el error muestral
admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar un
caso sencillo de clculo del tamao muestral delimitemos estos factores.
Para la Media

La diferencia entre la media de la muestra y la media de la poblacin es un error


muestral. Por lo tanto,
( X )
Z
donde( X )
( X ) e error _ muestral z

n
n
Z
Por lo tanto, e
de all se despeja n para calcular el tamao de la muestra
n
42

z 2 2
e2
Z 2 2
Para una poblacin finita n0
e2
Para una poblacin infinita n

Para determinar el tamao de la muestra a partir de la distribucin muestral de la media


se requiere conocer:
El nivel de confianza deseado, z
El error muestral permitido, e
La desviacin estndar,

Para la Proporcin
Para poblacin infinita, partiendo de la frmula z

ps p
pq
n

e
pq
n

. Se llega a: n

z 2 pq
e2

Para poblacin finita hay que tomar en cuenta el factor de correccin, n0

Z 2 pq
e2

En resumen:
Parmetro. Son las medidas o datos que se obtienen sobre la poblacin.
Estadstico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una
estimacin de los parmetros.
Error Muestral, de Estimacin o Standard. Es la diferencia entre un estadstico y su
parmetro correspondiente. Es una medida de la variabilidad de las estimaciones de
muestras repetidas en torno al valor de la poblacin, nos da una nocin clara de hasta
dnde y con qu probabilidad una estimacin basada en una muestra se aleja del valor
que se hubiera obtenido por medio de un censo completo. Siempre se comete un error,
pero la naturaleza de la investigacin nos indicar hasta qu medida podemos
cometerlo (los resultados se someten a error muestral e intervalos de confianza que
varan muestra a muestra). Vara segn se calcule al principio o al final. Un estadstico
ser ms preciso en cuanto y tanto su error es ms pequeo. Podramos decir que es la
desviacin de la distribucin muestral de un estadstico y su fiabilidad.
Nivel de Confianza. Probabilidad de que la estimacin efectuada se ajuste a la
realidad. Cualquier informacin que queremos recoger est distribuida segn una ley de
probabilidad (Gauss o t de Student), as llamamos nivel de confianza a la probabilidad
de que el intervalo construido en torno a un estadstico capte el verdadero valor del
parmetro.
43

Varianza Poblacional. Cuando una poblacin es ms homognea la varianza es menor


y el nmero de entrevistas necesarias para construir un modelo reducido del universo, o
de la poblacin, ser ms pequeo. Generalmente es un valor desconocido y hay que
estimarlo a partir de datos de estudios previos.

44

Unidad III

Prueba de Hiptesis

Objetivo:
Aplicar con propiedad y de forma pertinente a situaciones administrativas la
prueba de hiptesis

Contenidos:

Qu es una hiptesis
Qu es una prueba de hiptesis
Contraste de hiptesis
Paramtricas (Media aritmtica y proporcin)
Para una poblacin
Para dos poblaciones

45

El que aprende y aprende y


no practica lo que aprende es
como el que ara y ara y nunca
siembra.
Platn

Prueba de Hiptesis
Siempre las personas, en diversas oportunidades y circunstancias, hemos realizado
afirmaciones considerando experiencias previas, conocimientos superficiales de algo,
etc. Esas afirmaciones las llamamos hiptesis, y esas hiptesis pueden ser aceptadas o
rechazadas; sin embargo en estadstica para poder aceptar o rechazar una hiptesis se
deben realizar una serie de clculos que sustenten la veracidad o no de ese supuesto,
para ello existe la prueba de hiptesis.
La prueba de hiptesis es un procedimiento mediante el cual se prueba
estadsticamente si una hiptesis es verdadera o no. En esta unidad encontrars los
pasos para realizar una prueba de hiptesis en funcin de la media aritmtica y la
proporcin para una y dos poblaciones

46

UNIDAD III. PRUEBA DE HIPTESIS


Qu es una hiptesis?
Una hiptesis es una afirmacin acerca de un parmetro de la poblacin. Luego, se
utilizan los datos para verificar que tan razonable es una afirmacin, en otras palabras,
la hiptesis es el establecimiento de una tesis a la que con elementos estadsticos se le
prueba la veracidad Las hiptesis estadsticas se pueden contrastar con la informacin
extrada de las muestras y tanto si se aceptan como si se rechazan se puede cometer
un error.
Hiptesis estadstica
Asuncin relativa a una o varias poblaciones, que puede ser cierta o no.
Enunciado acerca de un parmetro de la poblacin que se desarrolla con el
propsito de realizar pruebas.

Qu es una Prueba de Hiptesis?


La prueba de hiptesis es un procedimiento en el cual se dan evidencias para afirmar o
negar una hiptesis. El primer paso para realizar una prueba de hiptesis es
estableciendo la afirmacin o suposicin sobre un parmetro de una poblacin, como
por ejemplo la media. Una hiptesis podra ser que los estudiantes de una aldea de
Misin Sucre invierten en promedio Bs. 2000 diarios en pasaje. Para comprobar la
validez de la hiptesis Bs 2.000 , es preciso elegir una muestra de la poblacin
(algunos estudiantes de la aldea planteada en la hiptesis) y preguntarles cuanto dinero
invierten diariamente en pasaje, calcularle la media y aceptar o rechazar la hiptesis;
supongamos que la media resulta ser de Bs. 1990, al ser una cifra tan cercana a2.000
se considera como vlida la hiptesis, ya que la diferencia de Bs. 10 puede deverse a
un error de muestreo.
Prueba de Hiptesis:
Procedimiento que se basa en la evidencia de las muestras y en la teora de
probabilidad para determinar si la hiptesis es un enunciado razonable.

Procedimiento para probar una hiptesis


Existen cinco pasos que sistematiza una prueba de hiptesis, y cuando se llega al paso
5 se est listo para rechazar o aceptar la hiptesis. Veamos los pasos representados en
el siguiente diagrama:
47

Paso 1
Establecer las
hiptesis nula y
alternativa

Paso 2
Seleccionar un
nivel de
significancia
hiptesis nula y
alternativa

Paso 3
Identificar la
estadstica de
prueba

Paso 4
Formular la regla
de decisin

No rechazar H0

Rechazar H0 y
Aceptar H1

Paso 5
Tomar una
muestra, llegar a
una decisin

Paso 1: Plantear la hiptesis nula (H0) y la hiptesis alternativa (H1)


El primer paso consiste en plantear la hiptesis que se prueba, a la cual llamamos
hiptesis nula, y se denomina H0, la letra mayscula H significa hiptesis, y el subndice
cero supone sin diferencia. Por lo general, la hiptesis nula incluye un termino no
que significa que no hay cambio. La hiptesis nula se rechaza o acepta, pero la
hiptesis nula no se rechaza a menos que los datos de prueba proporcionen evidencias
convincentes que es falsa.
Se debe recalcar adems que si no se rechaza la hiptesis nula, con base en los datos
de la muestra, no es posible decir que la hiptesis nula sea cierta. En otras palabras, la
imposibilidad de rechazar la hiptesis nula no demuestra que H 0 sea verdadera;
significa que no fue posible de rechazar H0. Para demostrar la hiptesis nula sera
necesario conocer el parmetro de la poblacin y recabar los datos con la poblacin en
pleno; como eso es prcticamente imposible, la nica alternativa es tomar una muestra
de la poblacin.
Hiptesis nula
Una afirmacin respecto del valor de un parmetro de la poblacin

La hiptesis alternativa describe una conclusin a la que se llegar si se rechaza la


hiptesis nula. Se escribe H1, el H sub1 tambin se le conoce como hiptesis de
investigacin. La hiptesis alternativa se acepta si los datos de la muestra proporcionan
suficiente evidencia estadstica de que la hiptesis nula es falsa.
Hiptesis alternativa
Una afirmacin que se acepta si los datos de la muestra
evidencian suficientemente que la hiptesis nula es falsa.

48

Paso 2: Seleccionar el nivel de significancia


El nivel de significancia es designado con la letra alfa ( ) del alfabeto griego, tambin
se le conoce como nivel de riesgo, y ste quizs sea un termina ms apropiado, pues
es este nivel es el riesgo que se asume al rechazar la hiptesis nula cuando de hecho
es verdadera. No hay un nivel de significancia que se aplique a todas las pruebas, el
investigador toma la decisin de utilizar cualquier valor entre 1 y 0, es decir, entre 0 y
10 por ciento.
Por que se coment al inicio que el nivel de significancia se poda llamar tambin de
riesgo, porque de acuerdo al nivel de significancia que se establezca se puede cometer
el error de rechazar una hiptesis verdadera, observemos este ejemplo planteado por
Lind, Mason y Marchal (2003):
Suponga que una firma que fabrica computadoras personales utiliza
una gran cantidad de tarjetas de circuitos impresos. Los
proveedores concursan para abastecer las tarjetas y, a quien
presenta la cotizacin ms baja, se le otorga un contrato
considerable. Suponga tambin que el contrato especifica que el
departamento de control de calidad del fabricante de las
computadoras har un muestreo de todos los embarques de tarjetas
de circuitos que reciba. Si ms del 6 por ciento de las tarjetas
de la muestra estn por debajo de la norma, el embarque ser
rechazado. La hiptesis nula es que los embarques de las tarjetas
que se reciben contienen 6 por ciento o menos de tarjetas por
debajo de la norma. La hiptesis alternativa es que est
defectuoso ms del 6% de las tarjetas.
El embarque de 50 tarjetas del lote que se recibi rebel que
cuatro de ellas, es decir, un 8%, estaban por debajo de la norma,
entonces la decisin de regresar las tarjetas al proveedor es
correcta. Suponga que las 4 tarjetas seleccionadas en la muestra
de 50 eran las nicas defectuosas en todo el embarque de 4.000
tarjetas. Entonces, slo 1/10 de 1 por ciento estaban defectuosas
(4/4000=0,001). En ese caso, menos del 6% de todo el embarque
estaba por debajo de la norma y el rechazo del mismo fue un
error.

En la prueba de hiptesis anterior se rechaz la hiptesis nula cuando debi haberse


aceptado, este error se denomina de tipo I y se le designa por la letra alfa ( ). La
probabilidad de cometer otro de error llamado tipo II es designado con la letra beta ( ).
Accin
Acepto
H0
Rechazo
H0

H0
Es verdadera
Decisin
correcta
Error tipo I

H0
Es falsa
Error tipo II
Decisin
correcta
49

Error tipo I: Rechazar una hiptesis verdadera.


Error tipo II: No rechazar una hiptesis nula que es falsa

Paso 3: Calcular el estadstico de prueba


Para la prueba de hiptesis se utiliza Z como estadstica de prueba, a pesar de que
existen muchas otras pruebas estadsticas. En la prueba de hiptesis para la media
X x
( ) , la estadstica de prueba z se calcula por: Z

n
El valor z se basa en la distribucin de muestreo de X
, que tiene una distribucin normal cuando la muestra es razonablemente grande con
una media X igual a y una desviacin estndar X , que es igual a
posible determinar la diferencia entre X y

. As es
n

es importante desde el punto de vista

estadstico, al encontrar cuantas desviaciones estndar separan a X de


la formula de z.

, utilizando

Paso 4: Formular la regla de decisin


Una regla de decisin es una afirmacin de las condiciones bajos las que se rechaza la
hiptesis la y bajo las que no se rechaza. El rea de rechazo define la ubicacin de
todos aquellos valores que son tan grandes o tan pequeos que la probabilidad de que
ocurran bajo una hiptesis nula verdadera es bastante remota. En el grfico que se
muestra a continuacin el valor crtico es 1,65 es divide la zona de rechazo o
aceptacin de la hiptesis

Regin de rechazo

Probabilidad de 0,95

Probabilidad de 0,05
Valor Crtico

Valor Crtico
Punto de divisin entre la regin en que se rechaza la hiptesis nula
y la regin en la que no se rechaza

50

Los valores crticos determinan la zona de rechazo. Para hallarlos se divide entre dos
el 95%. En la tabla z (revisar anexos), el rea de 0,95/2=0,4750 lo que indica un valor
de 1.96. El 5% restante est distribuido entre las dos colas, son 2,5% en cada zona de
rechazo. Es posible encontrar los valores crticos al otro lado de la cola:

Paso 5: Tomar una decisin


Este ltimo paso consiste en decidir si rechazar o no la hiptesis nula. La regla de
decisin es: No se rechaza la hiptesis nula si los valores z estn entre 1,96 . Se
rechaza si el valor z es menor que -1,96 o mayor que +1,96.

Prueba de una o dos colas


Una prueba es de una cola cuando la hiptesis alterna, H1, establece una direccin,
como:
H0 : el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres.
H1 : el ingreso medio de las mujeres es mayor que el de los hombres.
Distribucin de muestreo para el valor estadstico z, prueba de una cola, nivel de
significancia de .05

51

Una prueba es de dos colas cuando no se establece una direccin especfica de la


hiptesis alterna H1, como:
H0: el ingreso medio de las mujeres es igual al ingreso medio de los hombres.
H1: el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.
Distribucin de muestreo para el valor estadstico z, prueba de dos colas, nivel de
significancia de 0.05

Prueba para la media poblacional: muestra grande, desviacin estndar


poblacional conocida
Cuando se hace una prueba para la media poblacional de una muestra grande y se
conoce la desviacin estndar, el estadstico de prueba est dado por:

Ejemplo:
Una cooperativa fabricante de salsa de tomate indican en su etiqueta que el contenido
de la botella es de 16 onzas. Cada hora se toma una muestra de 36 botellas y se pesa
el contenido. La muestra de la ltima hora tiene un peso medio de 16.12 onzas con una
desviacin estndar de .5 onzas. Est el proceso fuera de control para un nivel de
significancia de .05?
Paso 1: establezca la hiptesis nula y alterna
Paso 2: establezca la regla de decisin:

Paso 3: calcule el valor del estadstico de prueba: H0 se rechaza si z <- 1.96 o z > 1.96
Paso 4: decisin sobre H0: no se rechaza H0 porque 1.44 es menor que el valor crtico
1.96

52

Si se desconoce la desviacin estndar de la poblacin y el tamao de la muestra es


n 30
X
Z

n
Ejemplo en la cual se indica el procedimiento para la prueba de hiptesis

(Tomado de

monografas.com)

El jefe de la Biblioteca Especializada de la Facultad de Ingeniera Elctrica y Electrnica


de la UNAC manifiesta que el nmero promedio de lectores por da es de 350. Para
confirmar o no este supuesto se controla la cantidad de lectores que utilizaron la
biblioteca durante 30 das. Se considera el nivel de significancia de 0.05
Datos:
Da Usuarios

Da

Usuarios Da

Usuario

356

11

305

21

429

427

12

413

22

376

387

13

391

23

328

510

14

380

24

411

288

15

382

25

397

290

16

389

26

365

320

17

405

27

405

350

18

293

28

369

403

19

276

29

429

Se trata de un problema con una media poblacional: muestra grande y desviacin


estndar poblacional desconocida.
Paso 01: Seleccionamos la hiptesis nula y la hiptesis alternativa
Ho: 350
Ha: 350
Paso 02: Nivel de confianza o significancia 95%
0.05
Paso 03: Calculamos o determinamos el valor estadstico de prueba
De los datos determinamos: que el estadstico de prueba es t, debido a que el numero
de muestras es igual a 30, conocemos la media de la poblacin, pero la desviacin
estndar de la poblacin es desconocida, en este caso determinamos la desviacin
estndar de la muestra y la utilizamos en la formula reemplazando a la desviacin
estndar de la poblacin.
53

x
s
n

Calculamos la desviacin estndar muestral y la media de la muestra empleando


x 372,8
52,414
Es importante que sepas que en el
programa Excel de Microsoft Office puedes
calcular diversos estadsticos como la
media, la desviacin estndar entre
otros, de forma muy fcil y rpida.

Paso 04: Formulacin de la regla de decisin.


La regla de decisin la formulamos teniendo en cuenta que esta es una prueba de dos
colas, la mitad de 0.05, es decir 0.025, esta en cada cola. el rea en la que no se
rechaza Ho esta entre las dos colas, es por consiguiente 0.95. El valor critico para 0.05
da un valor de Zc = 1.96.
Por consiguiente la regla de decisin: es rechazar la hiptesis nula y aceptar la
hiptesis alternativa, si el valor Z calculado no queda en la regin comprendida entre 1.96 y +1.96. En caso contrario no se rechaza la hiptesis nula si Z queda entre -1.96 y
+1.96.
Paso 05: Toma de decisin.
En este ultimo paso comparamos el estadstico de prueba calculado Z = 2.38 y lo
comparamos con el valor critico de Zc = 1.96. Como el estadstico de prueba calculado
cae a la derecha del valor critico de Z, se rechaza Ho. Por tanto no se confirma el
supuesto del Jefe de la Biblioteca.
Si el tamao de la muestra es n 30 se utiliza la distribucin t de Student:
x x
t n 1

x
s n
Prueba para dos medias de poblacin
En este caso se trabaja con las medias de poblaciones. El objetivo es probar si es
razonable llegar a la conclusin de que las dos medias de la poblacin son iguales (y
por lo tanto que las dos poblaciones tienen una media comn), o que la diferencia entre
ambas medias de muestra es tan grande que se debera concluir que las medias de la
poblacin no son iguales. Esto tiene muchas utilidades, por ejemplo sirve para un jefe
de planta conocer el rendimiento promedio de los trabajadores del turno de la maana
difiere al del los trabajadores del turno de la noche.
En estos casos es necesario seleccionar muestras aleatorias de las dos poblaciones,
calcular las medias de cada muestra y determinar si es razonable que ambas sean
54

iguales. Para este caso se siguen igualmente los cinco pasos planteados pero habr
una diferencia en la frmula para la estadstica z:
Z

X1 X 2
s12 s 22

n1 n2

Ejemplo Prueba de hiptesis con dos poblaciones


(tomado de www.monografas.com)

En el HMI Ramos Larrea, se realiz un estudio para comparar la efectividad de dos


tratamientos diferentes para la diarrea aguda, se seleccionaron 15 nios de 1 a 2 aos
de edad con diarrea aguda, fueron divididos en dos subgrupos, al subgrupo A se le dio
como tratamiento SRO y al subgrupo B se le dio como tratamiento SRO+Cocimiento de
arroz. Despus de tres das de tratamiento, se registr la frecuencia de evacuaciones
de los nios. Los resultados fueron los siguientes:
GRUPO
A
3

GRUPO
B
4

Proporcionan los datos evidencias suficientes que indique que la efectividad de los dos
tratamientos no es la misma? Utilice un nivel de significacin de 0.05.
Solucin:
1. Planteamiento de hiptesis:
Ho: 1 = 2
H1: 1 2
2. Nivel de significancia de: = 0.05
3. Prueba estadstica:
X X2
Z 1

s12 s 22

n1 n2

3,85 2,71
2,85 2
7

7,42 2

1,14
1,16 7,86

1,14
9,02

1,14
0,38
3

El valor 0,38 se busca en la tabla de valores z dentro de la columna de valor de


significacin de 0.05, ello nos da 0,6736, valor muy por encima de . Ahora con este
dato revisamos la zona de rechazo para tomar la decisin.
Con los supuestos:
Las poblaciones se distribuyen normalmente
Las muestras han sido seleccionadas al azar.
55

Criterios de decisin:

Se rechaza la hiptesis nula (Ho), se acepta la hiptesis alterna (H1) a un nivel de


significancia de = 0.05. La prueba resulto ser significativa. La evidencia estadstica no
permite aceptar la hiptesis nula. La evidencia estadstica disponible permite concluir
que probablemente existe diferencia entre los dos tratamientos empleados en casos de
diarrea aguda.

Pruebas respecto de las proporciones


Como lo hemos venido trabajando para probar una hiptesis calculamos un valor z y lo
comparamos con un valor crtico de Z con base al nivel de significancia seleccionado. El
valor p para probar hiptesis es un mtodo alternativo en caso de variables discretas. El
valor p tambin es aplicado a hiptesis de una cola o de dos colas.
Un ejemplo de las hiptesis que podemos manejar con la prueba de proporcin son:

Los miembros de la Comisin Acadmica Nacional del plan deformacin


Administracin informa que el 80% de los estudiantes certificados como Asistentes
Administrativos entran al mercado laboral desempendose en actividades afines
con su acreditacin.
El representante de una importante cadena de farmacias afirma que la mitad de sus
ventas se realizan por los autoservicios.

Estas preguntas abarcan los datos de una escala nominal de mediacin, si recordamos
Estadstica I esta escala se caracteriza por tener categoras sin un orden valor de
jerarquizacin, por ejemplo la raza, la religin, etc.
Proporcin (p)
Una fraccin, relacin o porcentaje que indica la parte de la
poblacin o muestra que tiene una caracterstica de inters
particular.

Nmero _ de _ xitos _ en _ la _ muestra


Nmero _ muestreado

56

Un ejemplo de proporcin es que 87 personas de 100 afirmaron tener mascotas en su


casa. La proporcin de la muestra es 87/100=0,87 o 87%. Para probar una hiptesis
sobre una proporcin de una poblacin se elige una muestra aleatoria de la poblacin
que cumpla con las suposiciones binomiales explicadas. Esta prueba es apropiada
cuando tanto np como n(1-p) son al menos de 5.n (n=tamao de la muestra,
p=proporcin de la poblacin)
Se establece el nivel de significancia y se procede a calcular el valor z
Prueba de hiptesis para una proporcin poblacional
pP
z
, donde:

P es la proporcin de la poblacin
p es la proporcin de la muestra
n tamao de la muestra
p es el error estndar de la proporcin de la poblacin. Se calcula por
Prueba de hiptesis para una proporcin z

p(1 p) / n

pP
p(1 P)
n

Por ltimo se toma la decisin.


Ejemplo:
Una encuesta aplicada en Caracas a 2.000 personas revel que 1550 de ellas realizas
compras en los megamercados realizados quincenalmente a la Av. Bolvar. La
proporcin de 0,775 (1550/2000=0.775) est bastante cerca de 0,80 para llegar a la
conclusin de la mayora de la poblacin de Caracas compra sus alimentos en los
megamercados con regularidad.
Z es una estadstica de prueba normalmente distribuida cuando la hiptesis es verdad y
las dems suposiciones tambin son verdaderas.
P es 0,775, la proporcin de la muestra
N es 2000, el nmero de encuestados
P es 0,80, la proporcin hipottica de la poblacin

pP
p(1 P)
n

1550
0,80
2000
2,80
0,80(1 0,80)
2000

El valor z -2,80 est en la zona de rechazo, de modo que la hiptesis nula queda
rechazada en el nivel 0,05.

57

Ejercicio:
Se dan las siguientes hiptesis
H0= p 0.70
H1=p>0.70
Una muestra de 100 observaciones revel que p=0.75. En el nivel de significancia de
0,05Es posible rechazar la hiptesis nula?
Prueba para la Diferencia entre dos Proporciones Poblacionales
En este tipo de pruebas interesa saber si dos proporciones de la poblacin son iguales.
A continuacin se presentan algunos ejemplos:
Una cooperativa de ropa casual elabor un nuevo diseo de camisas para
caballeros, el nuevo modelo se le mostr a un grupo de posibles compradores
menores de 30 aos y a otros mayores de 60 aos. La cooperativa desea saber si
existe diferencia en la proporcin de personas de ambos grupos a quienes les gusta
el nuevo diseo.
Una aerolnea est investigando sobre el miedo a volar entre adultos, de forma
especfica quieren saber si existe alguna diferencia significativa entre la proporcin
de hombres y de mujeres.
Prueba de proporciones de dos muestras z

p1 p 2
pc (1 pc pc (1 pc )

n1
n2

Donde:
n1 es el nmero en la primera muestra
n2 es el nmero en la segunda muestra
p1 es la proporcin en la primera muestra que posee la caracterstica
p2 es la proporcin en la segunda muestra que posee la caracterstica
pc es la proporcin conjunta que posee la caracterstica en la muestra combinada, se
calcula con la siguiente frmula:
X X2
Nmero _ total _ de _ xitos
1
Proporcin conjunta pc
Nmero _ total _ de _ las _ muestras
n1 n2
Donde:
X1 es el nmero que posee la caracterstica en la primera muestra
X2 es el nmero que posee la caracterstica en la segunda muestra
Ejemplo
Una fbrica de perfumes desarrollo una nueva fragancia llamada Rojo. Varias pruebas
indican que tiene una muy buena aceptacin en el mercado, sin embargo interesa saber
si el perfume lo prefieren mujeres jvenes o maduras. Se tomar una muestra aleatoria
de mujeres jvenes y maduras y se les realizar una prueba dndoles a oler varios
perfumes entre ellos Rojo y se les piden que indiquen el que ms les guste.
H0 no hay diferencia entre la proporcin de mujeres jvenes y maduras que prefieren
Rojo. La hiptesis alterna es que ambas proporciones no son iguales.
58

Ho: p1 p2
H1: p1 p2
Seleccionemos el nivel de significancia, utilizaremos el 0.05
n1: mujeres jvenes=100
X1: las que prefirieron Rojo=20
n2: mujeres maduras=200
X2: las que prefirieron rojo=100

p1

X1
20

0.20
n1 100

p2

X 2 100

0.50
n2
200

La proporcin conjunta o ponderada


X X 2 200 100 120
pc 1

0.40
n1 n2
100 200 300
Observemos que la proporcin conjunta de 0.40 est ms cerca de 0.50 que de 0.20.
Esto se debe a que el muestreo incluy ms mujeres maduras.
p1 p 2
0.20 0.50
0.3
z

5.0
pc (1 pc pc (1 pc )
0.4(1 0.4) 0.40(1 0.4) 0.06

100
200
n1
n2
El valor z calculado de -5 est en el rea de rechazo, es decir, que la hiptesis de que
es igual la proporcin de mujeres jvenes y maduras que prefieren Rojo se rechaza, por
lo que se acepta la hiptesis alternativa.
Ejercicios: Realzalos y comprtelos con tu grupo de estudio y tu profesor asesor.
1. De 150 adultos que probaron unos caramelos nuevos de sabor a durazno, 87 les
parecieron muy buenos. De 200 nios a 123 les gustaron muchsimo. Utilizando un
nivel de significancia de 0.10 se puede concluir que existe una diferencia
significativa en la proporcin de adultos contra la de nios que consideran el nuevo
sabor como excelente.
a. Cul es la hiptesis nula y la alternativa
b. Cual es la probabilidad de un error tipo I
c. Es una prueba de una o dos colas, por qu
d. Cual es el valor crtico
e. Debera rechazarse la hiptesis nula
2. Las hiptesis son: H0: p1 p2 y H1: p1 p2 . Una muestra de 200 observaciones de
la primera poblacin indic que X1 es 170. Una muestra de 150 observaciones de la
segunda poblacin revel que X2 es de 110. Use el nivel de significancia de 0.05
para probar la hiptesis.

59

Unidad IV

Regresin y
Correlacin

Objetivo:
Interpretar el coeficiente de correlacin y determinacin con el propsito de
obtener la relacin o variacin entre dos variables.

Contenidos:
Variables dependiente e independientes
Grfico de dispersin
Coeficiente de correlacin
Correlacin lineal
Coeficiente de determinacin
Modelo de anlisis de regresin lineal
Recta de mnimos cuadrados
Error estndar de estimacin

60

Lo maravilloso de
aprender algo es que nadie
puede arrebatrnoslo.
B.B.King

Regresin y Correlacin
La regresin y la correlacin son las dos herramientas estadsticas ms eficaces que se
pueden utilizar para solucionar problemas comunes en la administracin por el hecho
de que se emplean para identificar y cuantificar la relacin entre dos o ms variables.
El anlisis de regresin consiste en estimar el valor de la variable dependiente a partir
de un valor conocido, el cual denominamos variable independiente a travs de la
ecuacin de regresin. Existen dos tipos de anlisis de regresin el simple y el mltiple.
El anlisis de regresin simple indica el valor de una variable dependiente estimado a
partir de una variable independiente. Mientras que el anlisis de regresin mltiple se
ocupa de la estimacin del valor de una variable dependiente con base a dos o ms
variables independientes.
El anlisis de correlacin mide la magnitud de la relacin entre las variables. As
podemos precisar que la regresin establece la relacin y la correlacin la amplitud de
esa relacin.

61

UNIDAD IV. REGRESIN Y CORRELACIN


Variable Dependiente e Independiente
La palabra variable la asociamos con cambio, en estadstica denominamos variable a
un dato que puede asumir cualquier valor, es decir, cambiante. Si seguimos utilizando la
semntica, el significado de las palabra dependiente es algo que sucede como
consecuencia de otro evento, e independiente por su parte es el antnimo, lo contrario a
dependiente.
Considerando la exposicin previa, la variable independiente es aquella que ocurre sin
control y la dependiente es un resultado de la independiente, la variable dependiente
se mide, la independiente se manipula o controla. En regresin y correlacin como lo
que se desea es conocer la relacin entre variables, la variable dependiente es la que
se desea explicar mientras que la independiente es la variable explicativa. Se dice que
una variable depende de la otra. Se puede decir que Y depende de X en donde Y y X
son dos variables cualquiera. Esto se puede escribir as:
Y es una funcin de X => Y f (X )
Debido a que Y depende de X, Y es la variable dependiente y X la variable
independiente. Es importante identificar cual es la variable dependiente y cul es la
variable independiente en el modelo de regresin. Esto depende de la lgica y de lo que
el estadstico intente medir. Por ejemplo, si el coordinador de una aldea de Misin Sucre
decide analizar la relacin entre las calificaciones de los estudiantes de estadstica II y
el tiempo que pasan estudiando para dicha materia, al recolectar la informacin se
puede presumir que las notas dependen de la cantidad y calidad del tiempo que los
participantes dedican a estudiar; por lo tanto las notas son la variable dependiente y el
tiempo de estudio la variable independiente.

Ejercicio:
A continuacin escribe cuatro casos en los cuales reflejes las variables dependiente e
independiente:
Caso

Variable
dependiente

Variable
independiente

Cuando hayas hecho la actividad comprtela con tu grupo de estudio

62

La variable dependiente o tambin llamada variable


de respuesta es aquella que se va a predecir.
La variable independiente o de prediccin es la que
da la base de estimacin.

Diagrama de Dispersin

Para recordar
Las medidas de tendencia central (estudiadas en Estadstica I)
carecen de significado si a la par no se realiza el clculo de las
medidas de dispersin para poder observar cuanto difieren unos
valores de otros.
Un diagrama de dispersin es una grfica en la que cada punto trazado representa un
par de valores observados de las variables independiente y dependiente. El valor de la
variable independiente X se identifica respecto del eje horizontal, mientras que el valor
de la variable dependiente Y se identifica respecto del eje vertical.

Un diagrama de dispersin refleja la


relacin entre dos variables.

Correlacin Lineal
En ocasiones nos puede interesar estudiar si existe o no algn tipo de relacin entre
dos variables aleatorias. Por ejemplo, podemos preguntarnos si hay alguna relacin
entre las notas de la asignatura Estadstica I y las de Matemticas I. Una primera
aproximacin al problema consistira en dibujar en el plano un punto por cada alumno:
la primera coordenada de cada punto sera su nota en estadstica, mientras que la
segunda sera su nota en matemticas. As, obtendramos una nube de puntos la cual
podra indicarnos visualmente la existencia o no de algn tipo de relacin (lineal,
parablica, exponencial, etc.) entre ambas notas.
Otro ejemplo, consistira en analizar la facturacin de una empresa en un periodo de
tiempo dado y de cmo influyen los gastos de promocin y publicidad en dicha
facturacin. Si consideramos un periodo de tiempo de 10 aos, una posible
representacin sera situar un punto por cada ao de forma que la primera coordenada
de cada punto sera la cantidad en euros invertidos en publicidad, mientras que la
segunda sera la cantidad en euros obtenidos de su facturacin. De esta manera,
63

obtendramos una nube de puntos que nos indicara el tipo de relacin existente entre
ambas variables. En particular, nos interesa cuantificar la intensidad de la relacin lineal
entre dos variables.
El parmetro que nos da tal cuantificacin es el coeficiente de correlacin lineal de
Pearson r, cuyo valor oscila entre 1 y +1 :

Correlacin de Pearson
Definicin. Creado por Kart Pearson en el siglo XIX, es una tcnica estadstica que
permite evaluar el grado o nivel de relacin entre dos variables, en otras palabras, es
una herramienta que permite evaluar en que medida el comportamiento de una variable
dependiente se ve afectada por la accin directa de una variable independiente. Por
ejemplo, si queremos establecer la razn del incremento de las ventas al detal en el
mes de diciembre (variable dependiente), es muy probable que encontremos una
correlacin elevada si la cruzamos con la variable independiente ingreso familiar. La
correlacin lineal adquiere valores entre -1 y 1.
0= correlacin nula.
+1= Correlacin directamente proporcional perfecta
-1= Correlacin inversamente proporcional perfecta

Correlacin directamente proporcional.


La CDP se traduce en afirmar que a medida que aumenta la magnitud de la variable
independiente, lo hace igualmente la magnitud de la variable dependiente, un ejemplo
sencillo de ello lo encontramos si revisamos la correlacin entre las variables ingreso
familiar y gasto en alimentacin, as, a medida que aumente el ingreso familiar, se
espera un incremento en los gastos de alimentacin de una familia promedio. Se habla
de una correlacin directamente proporcional perfecta cuando la formula de producto
momento de Pearson da un resultado de 1, esto en la realidad nunca ocurre, (ver
correlaciones espurias y variables extraas), ya que es muy difcil que el
comportamiento de una variable se vea nicamente afectada por el comportamiento de
otra, de all el auge que actualmente tiene la estadstica multivariada que estudia la
correlacin entre una Vd y varias Vi.
Grafico. Diagrama de Dispersin. r= +1

64

Variables extraas o correlaciones espurias. Cuando se


estudia la correlacin entre dos variables hay que tener
presente la influencia de muchas otras variables conocidas y
desconocidas y controlables o no controlables, llamadas
variables extraas; por ejemplo, una variable dependiente
como las reservas internacionales de un pas puede verse
afectada en gran parte por el control de las divisas que un
estado ejecuta; sin embargo hay otras variables como el
gasto pblico, las tragedias naturales, el nivel de
inflacin, etc., que tambin pueden incidir en mayor o menor
medida sobre dicha variable dependiente.

Correlacin inversamente proporcional.


La CIP indica, que a medida que el valor de una variable aumente, el valor de la otra
disminuye, un ejemplo de esto lo encontramos si correlacionamos las variables altitud y
concentracin de oxigeno, vemos as como a medida que aumenta la altitud, disminuye
la concentracin de oxigeno en el aire, de all por ejemplo la dificultad con la que se
respira en el pico Bolvar. Se habla de una correlacin inversamente proporcional
perfecta cuando la formula de producto momento de Pearson da un resultado de -1,
esto en la realidad nunca ocurre, (ver correlaciones espurias y variables extraas), ya
que como en el caso de la correlacin directamente proporcional perfecta es muy difcil
que una variable se vea nicamente influenciada por otra.

Grafico. Diagrama de dispersin. r= -1

Interpretacin de la Correlacin
El coeficiente de correlacin como previamente se indic oscila entre 1 y +1
encontrndose en medio el valor 0 que indica que no existe asociacin lineal entre las
dos variables a estudio. Un coeficiente de valor reducido no indica necesariamente que
65

no exista correlacin ya que las variables pueden presentar una relacin no lineal como
puede ser el peso del recin nacido y el tiempo de gestacin. En este caso el r
infraestima la asociacin al medirse linealmente. Los mtodos no paramtrico estaran
mejor utilizados en este caso para mostrar si las variables tienden a elevarse
conjuntamente o a moverse en direcciones diferentes.
La significancia estadstica de un coeficiente debe tenerse en cuenta conjuntamente
con la relevancia clnica del fenmeno que estudiamos ya que coeficientes de 0.5 a 0.7
tienden ya a ser significativos como muestras pequeas. Es por ello muy til calcular el
intervalo de confianza del r ya que en muestras pequeas tender a ser amplio. La
estimacin del coeficiente de determinacin (r2) nos muestra el porcentaje de la
variabilidad de los datos que se explica por la asociacin entre las dos variables.
La correlacin elevada y estadsticamente significativa no tiene que asociarse a
causalidad. Cuando objetivamos que dos variables estn correlacionadas diversas
razones pueden ser la causa de dicha correlacin: a) pude que X influencie o cause Y,
b) puede que influencie o cause X, c) X e Y pueden estar influenciadas por terceras
variables que hace que se modifiquen ambas a la vez. El coeficiente de correlacin no
debe utilizarse para comparar dos mtodos que intentan medir el mismo evento, como
por ejemplo dos instrumentos que miden la tensin arterial. El coeficiente de correlacin
mide el grado de asociacin entre dos cantidades pero no mira el nivel de acuerdo o
concordancia. Si los instrumentos de medida miden sistemticamente cantidades
diferentes uno del otro, la correlacin puede ser 1 y su concordancia ser nula.
Valores que asume y como interpretarlos.
0= correlacin nula, no existe relacin entre A y B
+1= Correlacin directamente proporcional perfecta,
a medida que aumenta A, aumenta B
-1= Correlacin inversamente proporcional perfecta,
a medida que aumenta A, disminuye B

Coeficiente de Correlacin
El coeficiente de correlacin es un grupo de tcnicas para medir la magnitud de la
relacin entre dos variables, para ello se suele graficar todos los datos en un diagrama
de dispersin
Un coeficiente de Correlacin es una
medida de la magnitud de la relacin
lineal entre dos variables.

66

Para determinar el valor numrico del coeficiente de correlacin usamos la frmula


siguiente

n( XY ) ( X )( Y )

n( X

) ( X ) 2 n( Y 2 ) ( Y ) 2

Donde:
n: es el nmero de pares de observaciones
X : es la suma de las variables X

Y : es la suma de las variables Y


( X ): es la suma de los cuadrados de la variable X
( X )2 : es la suma de las variables X elevadas al cuadrado
( Y ) : es la suma de los cuadrados de la variable Y
( Y )2: es la suma de las variables Y elevada al cuadrado
XY : es la suma de los productos de X y Y
2

Sin embargo la correlacin que se halle entre dos variables puede deberse a una
casualidad o un error de muestreo para verificar que esto no sea as se aplica una
prueba de significanca del coeficiente de correlacin, esto se realiza calculando un
valor t y aplicando la prueba de hiptesis, slo que en esta oportunidad utilizaremos la
tabla de valores t (ver anexos) para verificar si la hiptesis plantead queda dentro o
fuera del rea de rechazo.
Prueba t para el coeficiente de correlacin

r n2
1 r2

con n-2 grados de libertad

La regla de decisin para la prueba de hiptesis con un nivel de significancia de 0,05:

Regin de rechazo

-2,306

Regin de rechazo

+2,306
67

El Coeficiente de Determinacin
El coeficiente de determinacin es una medida ms precisa, se obtiene elevando al
cuadrado el coeficiente de correlacin. Es una proporcin de la variacin total de la
variable dependiente Y que se explica por, o se debe a, la variacin en la variable
independiente X.

Modelo de Anlisis de Regresin Lineal


Anlisis de Regresin
Es un modelo matemtico para expresar la relacin entre dos variables y estima el valor
de la variable dependiente Y basndonos en el valor de la variable independiente X.
Anlisis de Regresin
Es una ecuacin que define la relacin entre dos variables.

Principio de los mnimos cuadrados


Este mtodo proporciona un mejor ajuste y consiste en determinar la ubicacin de la
lnea de regresin. Este principio es el mejor porque la suma de los cuadrados de las
desviaciones verticales respecto de ella es la mnima. La forma general de la ecuacin
de regresin es:
Y ' a bX

Donde:
Y: se lee Y prima, es el valor predictorio de la variable Y para un valor de X
seleccionado.
a: es la interseccin con el eje Y. Es el valor estimado de Y cuando X=0. Otra manera
de expresar este es: a es valor estimado de Y donde la lnea de regresin cruza el eje Y
cuando X es cero.
b: es la pendiente de la lnea, o el cambio de la lnea de regresin en Y por cada
cambio en una unidad (ya sea aumentando o disminuyendo) de la variable
independiente X.
X: es el valor que se escoge para la variable independiente.
A los valores a y b de la ecuacin de regresin se les conoce como coeficientes
estimados de regresin o coeficientes de regresin.

Pendiente de la lnea de regresin b

n( XY ) ( X )( Y )
n( X 2 ) ( X ) 2

68

Interseccin con el eje Y a

Y b X
n

Donde:
X: es un valor de la variable independiente
Y: es un valor de la variable dependiente
n: es el nmero de elementos de la muestra

Error estndar de Estimacin


Es una medida que describe que tan precisa es la prediccin de Y con la base en X o,
inversamente, que tan inexacta puede ser la estimacin. El error estndar de estimacin
se denota con la letra sx.y. La desviacin estndar mide la dispersin alrededor de la
media; el error estndar de estimacin mide dispersin alrededor de la lnea de
regresin.
Error Estndar de Estimacin
Una medida de dispersin de los valores observados alrededor de la lnea
de regresin.

El error estndar se calcula mediante la ecuacin que presentaremos a continuacin.


Sin embargo observemos que la ecuacin es muy parecida a la de desviacin estndar
de la muestra, con la diferencia que Y es sustituida por Y
Error estndar de estimacin S x. y

(Y Y ' )

n2
O tambin podemos emplear la siguiente frmula:

S x. y

a( Y ) b( XY
n2

Suposiciones la emplear el Anlisis de Regresin Lineal


a. Para cada valor X hay un grupo de valores Y, y estos valores Y estn distribuidos
normalmente.
b. Todas las medias de estas distribuciones normales de Y estn sobre la lnea de
regresin.
c. Las desviaciones estndar de estas distribuciones normales son iguales.

69

d. Los valores de Y son estadsticamente independientes. Este significa que al


seleccionar una muestra, el valor Y escogido para una X determinada no
depende del valor de Y para ningn otra X.

70

Respuestas
Ejercicio 1:
Clasifica los siguientes eventos:
a. El
lanzamiento
de
dos
monedas
a
la
vez
________Independiente______________
b. Que un vuelo de avin salga retrasado __ Mutuamente excluyente y
Complementario
c. Que un beb sea varn __Mutuamente excluyente y colectivamente exhaustivo
d. Que la comida de hoy no quede salada __Mutuamente excluyente y
Complementario
e. Que en la prxima temporada de bisbol Magallanes sea el campen
Colectivamente exhaustivo
Ejercicio 2

n!
5!
120
p r q nr
0,20 2 0,80 3
0,04(0,512) 10(0,0204) 0,2048
r!(n r )!
2!(5 2)!
2(6)

n!
5!
120
p r q nr
0,20 3 0,80 2
0,008(0,64) 10(0,0051) 0,0512
r!(n r )!
3!(5 3)!
6(2)

n!
5!
120
p r q nr
0,20 4 0,801
0,0016(080) 5(0,0012) 0,0064
r!(n r )!
4!(5 4)!
24(1)

Ejercicio 3
P= 0.4
Q= 0.6
N= 5
Realicemos el clculo de cada valor de R:
Para R= 0 obtenemos que: P(0) = 5!/ 0!(5-0)! (0.4 )0 (0.6)5, P(0) = 0.07776
Para R= 1 obtenemos que: P(1) = 5!/ 1!(5-1)! (0.4 )1 (0.6)4, P(1) = 0.2592
Para R=2 obtenemos que: P(2) = 5!/ 2!(5-2)! (0.4 )2 (0.6)3, P(2) = 0.3456
Para R= 3 obtenemos que: P(3) = 5!/ 3!(5-3)! (0.4 )3 (0.6)2 P(3) = 0.2304
Para R= 4 obtenemos que: P(4) = 5!/ 4!(5-4)! (0.4 )4 (0.6)1 P(4) = 0.0768
Para R= 5 obtenemos que: P(5) = 5!/ 5!(5-5)! (0.4 )5 (0.6)0, P(5) = 0.01024

71

Ejercicio 4:

510 500
1
10

490 500
1
10

Ejercicio 5
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9
La media y la varianza de cada variable independiente es:
m = 0,10
s2 = 0,10 * 0,90 = 0,09
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya media y
varianza son:
Media : n * m = 100 * 0,10 = 10
Varianza : n * s2 = 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos el valor
equivalente de la variable normal tipificada:
Luego:
P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475
Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo largo del
curso es tan slo del 4,75%.

72

Bibliografa
Berenson, M. y Levine, D (1996) Estadstica Bsica en Administracin. Pretince
Hall:Mxico. Mxico DF.
Gonzalez, E. (2000) Estadstica General. Ediciones de la biblioteca UCV: Carcas,
Venezuela.
Kazmier, L. (1998) Estadstica aplicada a la Administracin y a la Economa. Mc Graw
Hill: Mxico DF, Mxico.
Lind, D., Mason, R. y Marchal, W. (2001) Estadstica para Administracin y Economa.
Mc Graw Hill Interamericana: Mxico D.F. Mxico
Salama, D. (2002) Estadstica. Metodologa y aplicaciones. Editorial Torino: Caracas,
Venezuela.
Webster, A. (2000) Estadstica Aplicada a los Negocios y a la Economa. Irwin-Mc Graw
Hill: Santa f de Bogot, Colombia.

73

ANEXOS

74

TABLA DE DISTRIBUCIN NORMAL TIPIFICADA N(0,1)

75

Manejo de Tablas. Casos Ms Frecuentes (Zonas de aceptacin o rechazo)

76

Distribucin t de Student

77

You might also like