Professional Documents
Culture Documents
com
ALUMNA DE LA MAESTRIA EN “SALUD PÚBLICA CON MENCIÓN EN SALUD REPRODUCTIVA”
UNIVERSIDAD NACIONAL FEDERICO VILLARREAL.
Usted alumna de la maestría en Salud Publica con mención en Salud Reproductiva, está
interesada en investigar si las charlas tienen un efecto favorable en el sentido de que las
mujeres se decidan a ser sometidas a la esterilización.
Ante este tipo de situaciones en la cual uno se encuentra todos los días, tenemos que acudir
a las Distribuciones de Probabilidades. En nuestro ejemplo, la variable Deseo ser
esterilizada, es una variable cualitativa, discreta. Por lo tanto se requieren de las
Distribuciones de Probabilidades Discretas. Que es la que estudiaremos en este trabajo.
VARIABLE ALEATORIA
Una variable se dice que es aleatoria, si los posibles valores que puede tomar son
determinados por el azar. En otras palabras se sabe qué valores puede tomar la variable
pero no se tiene certeza de su ocurrencia, sólo se sabe que puede ocurrir con una cierta
probabilidad. Por ejemplo, en una epidemia de cólera, se sabe que una persona cualesquiera
puede enfermar o no (eventos), pero no se sabe cuál de los dos eventos va a ocurrir.
Solamente se puede decir que existe una probabilidad de que la persona enferme.
Las variables aleatorias se clasifican:
1. Discretas: aquellas que resultan de contar el número de casos en los que el evento de
interés ocurre, por ejemplo: número de hijos de una familia, número de veces que llega
una paciente al servicio de emergencia, etc.
2. Continuas: aquellas que resultan producto de una medición, por ejemplo: el peso, el
nivel de hemoglobina, etc.
Antes de hacerles la pregunta sobre su deseo de ser esterilizadas, puede considerar las
posibles respuestas:
X = 0 Ninguna desearía ser esterilizada
X = 1 Sólo una de las mujeres desearía
X = 2 Dos mujeres desearían
X = 3 Las tres mujeres desearían
Antes de verificar las respuestas de las 3 mujeres seleccionada; no sabe cuántas estarán de
acuerdo en ser esterilizadas, pero si conociera las probabilidades de ocurrencia de cada uno
de los posibles valores de la variable podría predecir su ocurrencia con una cierta
probabilidad. El conjunto de las probabilidades de ocurrencia de los posibles valores de la
variable aleatoria se denomina distribución de probabilidades.
En nuestro ejemplo:
X Probabilidad
0 0.125
1 0.375
2 0.375
3 0.125
A esto se le llama distribución de probabilidades discreta. Discreta porque la variable
X deseo ser esterilizada es discreta.
1.1.-VARIABLES ALEATORIAS
Puntuación obtenida al lanzar un dado. Es una variable aleatoria pues cada posible
resultado se puede expresar mediante un número.
Edad de una persona elegida al azar.
Altura de un árbol.
Número de caras al lanzar tres monedas.
Número de personas en una muestra de 50 que comen frutas habitualmente.
En los últimos ejemplos, tal como están planteados no serían variables aleatorias, pero a
veces podemos asociarles valores para que sí lo sean. Por ejemplo, si yo digo que el suceso
"le gusta el teatro" vale 1 y el suceso "no le gusta el teatro" vale 0, ya tendría definida una
variable aleatoria sobre el experimento elegir una persona, que valdría 1 si le gusta el teatro
y 0 si no le gusta.
El concepto de variable aleatoria surge ante la necesidad de cuantificar los resultados de los
experimentos aleatorios para poder realizar un estudio matemático de dichos resultados.
El concepto de variable aleatoria y variable estadística es muy similar, solo que en variables
estadísticas contamos y partimos de datos concretos, mientras que en variables aleatorias
partimos de lo que puede pasar antes de realizar el experimento.
Así pues, con variables aleatorias, también hacemos la división en discretas y continuas, las
representamos con los mismos gráficos y podemos calcular los mismos parámetros. La
diferencia estribará en que en las variables estadísticas miramos las frecuencias (absolutas
o relativas) y en las variables aleatorias miraremos las probabilidades de ocurrencia de cada
suceso.
1.2.-VARIABLES ALEATORIAS DISCRETAS
Una variable aleatoria se dirá discreta si el conjunto de valores que toma es un conjunto
numerable, es decir, que sólo puede tomar unos valores concretos. Dicho conjunto lo
denotaremos por: {x1, x2, x3,...., si}
Toda variable aleatoria discreta tiene asociada una función de probabilidad, que a cada valor,
le marca la probabilidad de que la variable tome dicho valor. Esta probabilidad viene a jugar
el mismo papel que la frecuencia relativa en los temas de estadística.
Antes que nada, vamos al construir el espacio muestral del experimento lanzar tres monedas.
Éste sería:
Valores Función de
de la probabilidad
variable pi = P[𝑋 =
Lo que significa que el valor esperado en el Xi 𝑥i]
1 1
lanzamiento de un dado es 3,5
6
2 1
6
3 1
6
Y si queremos calcular la desviación típica, haríamos la raíz 4 1
cuadrada de ese resultado y obtendríamos, 1.708
6
5 1
6
Ejemplo: Calcula la esperanza y la varianza de la variable número 6 1
de caras del ejemplo 2 6
xi 0 1 2 3
1/8 =
pi 3/8 = 0.375 3/8 = 0.375 1/8 = 0.125
0.125
E(X) =0·0,125 + 1·0,375 + 2·0,375 + 3·0,125 = 1,5.
Ejercicios
1.- En la siguiente tabla se presenta la distribución del número de hijos de un grupo de 100
parejas:
Nº de hijos 0 1 2 3 4 5 7
Nº de parejas 15 40 23 10 7 4 1
Xi -2 -1 0 1 2 3
pi 0.08 0.21 0.1 0.23 0.04
3.- ¿Cuál es el dinero que espera ganar un jugador que lanza dos dados de quinielas (o sea,
solo con tres caras, 1, X y 2) y recibe 90 dólares si salen dos doses; 45 dólares si sale un
dos y paga 81 dólares si no sale dos?
VALOR ESPERADO
Se llama también esperanza matemática. Se trata de un operador matemático que al ser
aplicado a la función probabilidad permite el cálculo de ese valor en el caso discreto, mientras
que en el caso continuo se lo aplica a la función frecuencia.
Esperanza matemática
Por ejemplo, el valor esperado cuando tiramos un dado equilibrado de 6 caras es 3,5.
Podemos hacer el cálculo
Los nombres de esperanza matemática y valor esperado tienen su origen en los juegos
de azar y hacen referencia a la ganancia promedio esperada por un jugador cuando hace
un gran número de apuestas.
Ejemplos
1 Si una persona compra una papeleta en una rifa, en la que puede ganar de 5.000 dólares
o un segundo premio de 2000 dólares con probabilidades de: 0.001 y 0.003. ¿Cuál sería el
precio justo a pagar por la papeleta?
E(x) = 5000 · 0.001 + 2000 · 0.003 = 11 dólares
2 Un jugador lanza dos monedas. Gana 1 o 2 pesos si aparecen una o dos caras. Por otra
parte pierde 5 pesos si no aparece cara. Determinar la esperanza matemática del juego y
si éste es favorable.
E = {(c,c);(c,x);(x,c);(x,x)}
p(+1) = 2/4
p(+2) = 1/4
p(−5) = 1/4
Desviación típica
x pi x·pi x 2 · pi
6 1 6
DISTRIBUCION BINOMIAL
Esta distribución se basa en el proceso de Bernoulli. Se denominan procesos de tipo
Bernoulli, a todo experimento consistente en una serie de pruebas repetidas,
caracterizadas por tener resultados que se pueden clasificar en si verifican o no cierta
propiedad o atributo, siendo aleatorios e independientes.
Para identificar un proceso Bernoulli en una serie de pruebas repetidas, se deben verificar
tres condiciones:
1. Resultados dicotómicos: Los resultados de cada prueba se pueden clasificar en
“éxito” si verifican cierta condición, o “fracaso” en el caso contrario.
2. Independencia de las pruebas: El resultado de una prueba cualquiera es
independiente del resultado obtenido en la prueba anterior, y no incide en el resultado
de la prueba siguiente.
3. Estabilidad de las pruebas: La probabilidad p de obtener un resultado considerado
como un éxito se mantiene constante a lo largo de toda la serie de pruebas.
Cuando en un proceso del tipo Bernoulli se desea saber la probabilidad de obtener
exactamente r éxitos, en una serie de n pruebas, con una probabilidad de éxito p, se puede
aplicar la fórmula de la probabilidad binomial:
n x
P( x) p (1 p) n x
x
X = 0, 1, 2,……, n.
n n!
x (n x)! x!
Todo experimento aleatorio con estas características se dice que sigue el modelo de la
distribución binomial, y a la variable X que expresa el número de éxitos obtenidos en las n
repeticiones de la prueba, se le llama variable aleatoria binomial y se representa por B(n,
p); donde "n" es el número de repeticiones de la prueba y "p" la probabilidad de éxito.
De la manera que está planteado el problema sólo hay dos posibles resultados, o acierta
(éxito, pues me preguntan sobre los aciertos) o no acierta (fracaso) y la probabilidad de
acierto en cada prueba es la misma, 1 / 3.
Para calcular esa probabilidad, observamos que X = 6 significa 6 aciertos y 4 fallos, o sea (1
/ 3) 6 · (2 / 3) 4. Además hay que tener en cuenta cómo repartir los 6 aciertos a lo largo de las
10 preguntas; no importa el orden y no se pueden repetir las preguntas, por tanto
combinación sin repetición de 10 elementos tomados de 6 en 6.Luego la probabilidad pedida
es:
General, si X sigue una distribución B(n, p), la función de probabilidad viene dada por la
fórmula:
Donde, n, debe ser un entero positivo y p debe pertenecer al intervalo 0 ≤ p ≤ 1, por ser
una proporción. Su media y su varianza, vendrán dadas por las siguientes expresiones
Var(X) = n*p*(1 – p)
Ejercicios TAREA
*Todos los ejercicios hay que empezarlos definiendo una variable y relacionando la
probabilidad pedida con valores de la variable.
1.- La probabilidad de que una pieza fabricada por una empresa sea defectuosa es 0.1. Halla
la probabilidad de que en una muestra de 100 piezas se encuentren tres defectuosas.
3.- El 60% de los licenciados de una facultad encuentran trabajo el primer año después de
acabar la carrera. De los 150 licenciados en un curso, ¿cuántos se espera que se coloque
en el primer año? ¿Cuál es la desviación típica?
4.- Un laboratorio ha comprobado que el 25% de los que toman un determinado antibiótico
sufren efectos secundarios. De una muestra de ocho enfermos que toman dicho antibiótico,
halla la probabilidad de que sufran efectos secundarios:
a. Al menos seis
b. Más de dos
c. Menos de la mitad
d. A lo más 3
e. Todos
f. Halla el número de enfermos esperado con efectos secundarios.
5.- Suponiendo que el 43% de los españoles tengan Rh -, si tomamos una muestra de siete
personas, ¿qué probabilidad hay de que todas sean Rh-? ¿Y de que cuatro sean Rh+?
Características de una B(n, p):
Si p está próximo a cero, los valores pequeños tienen probabilidad alta y lo mayores
tienen probabilidad prácticamente 0. Es decir, la distribución está tirada a la izquierda.
Comprueba que los tres puntos anteriores se cumplen sea cual sea el valor de n.
Una máquina fabrica piezas defectuosas con una probabilidad de 0,05. Calcula la
probabilidad de que al fabricar 20 piezas 6 seis sean defectuosas. ¿Y de que sean 3 las
defectuosas? ¿Y que todas sean buenas?
15
P( x 0) (0.20) 0 (1 0.20)150 0.0352
0
15
P( x 1) (0.20)1 (1 0.20)151 0.1319
1
15
P( x 2) (0.20) 2 (1 0.20)15 2 0.2309
2
Entonces: P(x<3) = 0.0352 + 0.1319 + 0.2309 = 0.398
1. En cada prueba del experimento sólo son posibles dos resultados: el suceso A (éxito) y su
contrario 𝐴̅
2. La probabilidad del suceso A es constante, es decir, que no varía de una prueba a otra.
Se representa por p.
3. El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.
Distribución binomial
La distribución binomial se suele representar por B(n, p).
n es el número de pruebas de que consta el experimento.
p es la probabilidad de éxito.
La probabilidad de es 1− p, y la representamos por q.
𝑛
P(X = k) = ( ) ∗ 𝑝𝑘 ∗ 𝑞 𝑛−𝑘
𝑘
n es el número de pruebas (10) k = es el número de éxitos (6).
p es la probabilidad de éxito. (0.5)
q es la probabilidad de fracaso. (1 – 0.5)
𝑛 𝑛!
El número combinatorio ( )=
𝑘 𝑘!(𝑛−𝑘)!
Ejemplo
La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los
lectores ya la han leído. Un grupo de 4 amigos son aficionados a la lectura:
4 4∗3∗2! 12
p(X = 2) = ( ) ∗ 0.82 ∗ 0.24−2 = * 0.64 * .04 = ∗ .64 + .04 = 0.1536
2 2!(2)! 2
2. ¿Y cómo máximo 2?
p(x ≤ 2) = p(x = 0) + p(x = 1) + p(x = 2)
4 4 4
= ( ) ∗ 0.80 ∗ 0.24 + ( ) ∗ 0.81 ∗ 0.23 + ( ) ∗ 0.82 ∗ 0.22 = 0.1808
0 1 2
Media, varianza y desviación típica de la distribución binomial
Media µ=n*p
Varianza σ2 = n * p * q
Desviación típica σ √𝑛 ∗ 𝑝 ∗ 𝑞
Ejemplo
La probabilidad de que un artículo producido por una fábrica sea defectuoso es 0.02. Se
envió un cargamento de 10.000 artículos a unos almacenes. Hallar el número esperado de
artículos defectuosos, la varianza y la desviación típica.
DISTRIBUCIÓN HIPERGEOMÉTRICA.
Los experimentos que tienen este tipo de distribución tienen las siguientes características:
En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad a de
objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin
reemplazo, ¿cuál es la probabilidad de obtener x objetos defectuosos?
Solución:
𝐶𝑥𝑎 ∗ 𝐶𝑛−𝑥
𝑁−𝑎
p(x,n) = =
𝑐
Donde: p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados
𝐶𝑥𝑎 ∗ 𝐶𝑛−𝑥
𝑁−𝑎
Muestras de n objetos en donde hay x que son defectuosos y n-x buenos
𝐶𝑥𝑎 ∗ 𝐶𝑛−𝑥
𝑁−𝑎
= S= Todas las muestras posibles de seleccionar de n objetos
tomadas de entre N objetos en total = espacio muestral
Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si
se seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos?
Solución:
N = 10 objetos en total
a = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra
Ejemplos:
Solución:
a = 6 tabletas de narcótico
n = 3 tabletas seleccionadas
p (viajero sea arrestado por posesión de narcóticos) = p (de que entre las 3 tabletas
seleccionadas haya 1 o más tabletas de narcótico)
p (el viajero sea arrestado por posesión de narcóticos) = 1 – p (de que entre las tabletas
seleccionadas no haya una sola de narcótico)
b) p (no sea arrestado por posesión de narcóticos)
Solución:
a) N = 10 proyectiles en total
n = 4 proyectiles seleccionados
b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan
p(al menos 2 no exploten) = p (2 o más proyectiles no exploten) = p(x = 2 o 3; n=4) =
a)¿Cuál es la probabilidad de que una mesera se rehúse a servir bebidas alcohólicas
únicamente a dos menores de edad si verifica aleatoriamente sólo 5 identificaciones de entre
9 estudiantes, de los cuales 4 no tienen la edad suficiente?
N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a personas
menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad
corregir
b) ¿Cuál es la probabilidad de que como máximo 2 de las identificaciones pertenezcan a
menores de edad?
N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a personas
menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad
a) ¿Cuál es la probabilidad de que se embarque una caja que tiene tres artículos
defectuosos?
b) ¿Cuál es la probabilidad de que una caja que contiene sólo un artículo defectuoso se
regresa para verificación?
1.5. DISTRIBUCIÓN POISSON
Introducción
Llamada así por su autor Simeón Denis Poisson, probabilista del siglo XIX, pues fue el
primero en describirla. Es una generalización de la distribución binomial cuando sobre un
. Se define una variable aleatoria que representa el número de éxitos independientes
que ocurren para intervalos de medida específicos (tiempos, lugares, espacios), además
con una probabilidad de ocurrencia pequeña.
Esos intervalos de medida pueden referirse a: Tiempo: (Segundo, minuto, hora, día,
semana, etc.) Área: (Segmento de línea, pulgada cuadrada, Centímetro cuadrado, etc.).
Volumen:( Litro, galón, onza, etc.)
Ejemplo
Criterios o propiedades
Definición
Los resultados de las probabilidades individuales para valores de serán más pequeños
conforme la variable aleatoria toma valores cada vez más grandes.
Cuando en una distribución binomial se realiza el experimento un número "n" muy elevado
de veces y la probabilidad de éxito "p" en cada ensayo es reducida, entonces se aplica el
modelo de distribución de Poisson:
“p * n " < 10
“λ " = n * p (es decir, el número de veces " n " que se realiza el experimento multiplicado
por la probabilidad " p " de éxito en cada ensayo)
Veamos un ejemplo:
Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor que 10,
entonces aplicamos el modelo de distribución de Poisson.
p = 0.02
λ = (0.02)(300) = 6
e = 2,71828
k=3
63
P(x =3) = e-6 *
3!
Luego,
P (x = 3) = 0,0892
Por lo tanto, la probabilidad de tener 3 accidentes de tráfico en 300 viajes es del 8,9%
Otro ejemplo:
9.65
P(x =3) = e-9.6 *
5!
Luego,
P (x = 5) = 4,602
Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recién nacidos es del 4,6%.
X = 0, 1, 2,…., n
(2.71828) 5 53
P( x 3) 0.1404 14.04%
3!
Matemáticamente:
1. Probabilidad.
Hay una equivalencia en operar con probabilidades y operar con conjuntos, debido a que
ambas cosas siguen el álgebra de Boole.
Si tenemos por ejemplo un conjunto formado por las mujeres muy inteligentes y otro
formado por las mujeres muy atractivas, (ambos conjuntos pequeños, tal y como sugieren
las respectivas distribuciones normales de probabilidad), entonces el subconjunto formado
por las mujeres muy inteligentes que son además muy atractivas será la intersección de
ambos conjuntos, y este subconjunto intersección será de un tamaño menor o como mucho
igual que los conjuntos de mujeres atractivas y de mujeres inteligentes por separado, pues
es obvio que si es difícil encontrar a una atractiva, más difícil es encontrar a una que sea
además inteligente.
Por el contrario, si se quiere encontrar a una que sea inteligente o que sea atractiva (no
necesariamente las dos cosas, sino solamente una de ellas), será la unión de los dos
conjuntos, resultando en un conjunto mayor.
p·q <= p
p·q <= q
Por el contrario, la probabilidad de encontrar una mujer que sea o inteligente o atractiva
será la suma de probabilidades p+q = 0’45:
p+q >= p
p+q >= q
Por último, la probabilidad del complemento de p (el conjunto que no tiene elementos en p)
es 1-p: restar la probabilidad de p a la probabilidad del suceso seguro que es 1.
Resumiendo las operaciones del álgebra de Boole con sus equivalentes numéricos de
probabilidad y de conjuntos:
4. Un estereotipo corregido.
Obsérvese también que las siguientes probabilidades en el ejemplo anterior son la misma:
O sea, todas las combinaciones que se pueden hacer con las dos variables estadísticas
(inteligencia y belleza) y sus dos extremos de probabilidad.
Dicho de otra forma, el tópico de que una guapa es tonta es una tontería. Lo que quiere
decir ese tópico es que es más difícil encontrar a una guapa inteligente que una guapa
NORMAL. Pero es igual de probable que sea guapa e inteligente a que sea guapa y tonta o
a que sea fea e inteligente, o tonta y fea. Y lo más probable es que no sea ninguna de esas
cosas, sino normal en todo, del montón. Lo mismo con los hombres, claro.
Una distribución binomial variable discreta la podemos aproximar a una normal, variable continua
cuando n es grande.
Distribución binomial
Problemas aproximar distribución binomial a normal
Manejo de la tabla normal. Casos frecuentes
Ejemplos de uso de la tabla normal. Cuando la variable z es mayor o igual que un número positivo,
menor o igual que un número negativo, entre dos valores positivos, cálculo de la probabilidad en
cada caso. Estudio de los casos más frecuentes.
Sin embargo, si tenemos en cuenta que el área total bajo la gráfica ha de ser 1, deducimos de la figura
que:
Por simetría cambiamos los dos valores negativos a positivos y calculamos sus probabilidades.
Ejercicios
Una estimación es puntual cuando se usa un solo valor extraído de la muestra para estimar el
parámetro desconocido de la población. Al valor usado se le llama estimador.
A veces es conveniente obtener unos límites entre los cuales se encuentre el parámetro con un
cierto nivel de confianza, en este caso hablamos de estimación por intervalos.
Prueba de hipótesis
Hipótesis estadísticas
Contrastes de hipótesis
Bilateral H0=k H1 ≠ k
H0≥ k H1 < k
Unilateral
H0 ≤k H1> k
Contraste bilateral
Se presenta cuando la hipótesis nula es del tipo H0: μ = k (o bien H0: p = k) y la hipótesis alternativa,
por tanto, es del tipo H1: μ≠ k (o bien H1: p≠ k).
o bien:
Se sabe que la desviación típica de las notas de cierto examen de Matemáticas es 2,4. Para una
muestra de 36 estudiantes se obtuvo una nota media de 5,6. ¿Sirven estos datos para confirmar la
hipótesis de que la nota media del examen fue de 6, con un nivel de confianza del 95%?
2. Zona de aceptación
3. Verificación.
4. Decisión
Contraste unilateral
Caso 1
La hipótesis nula es del tipo H0: μ ≥ k (o bien H0: p ≥ k).
La hipótesis alternativa, por tanto, es del tipo H1: μ < k (o bien H1: p < k).
Valores críticos
1−α α zα
o bien:
Un sociólogo ha pronosticado, que en una determinada ciudad, el nivel de abstención en las próximas
elecciones será del 40% como mínimo. Se elige al azar una muestra aleatoria de 200 individuos, con
derecho a voto, 75 de los cuales estarían dispuestos a votar. Determinar con un nivel de significación
del 1%, si se puede admitir el pronóstico.
2. Zona de aceptación
3.Verificación.
4.Decisión
Aceptamos la hipótesis nula H0. Podemos afirmar, con un nivel de significación del 1%, que la La
abstención será como mínimo del 40%.
Caso 2
La hipótesis alternativa, por tanto, es del tipo H1: μ > k (o bien H1: p > k).
El nivel de significación α se concentra en la otra parte o cola.
o bien:
Un informe indica que el precio medio del billete de avión entre Canarias y Madrid es, como
máximo, de 120 € con una desviación típica de 40 €. Se toma una muestra de 100 viajeros y se
obtiene que la media de los precios de sus billetes es de 128 €.
¿Se puede aceptar, con un nivel de significación igual a 0,1, la afirmación de partida?
H0 : μ ≤ 120
H1 : μ > 120
2.Zona de aceptación
3. Verificación.
4. Decisión
Error de tipo I. Se comete cuando la hipótesis nula es verdadera y, como consecuencia del
contraste, se rechaza.
Error de tipo II. Se comete cuando la hipótesis nula es falsa y, como consecuencia del contraste se
acepta.
H0 Verdadera Falsa
ERROR DE TIPO I
Rechazar Decisión correcta
Probabilidad = α
La probabilidad de cometer Error de tipo II depende del verdadero valor del parámetro. Se hace
tanto menor cuanto mayor sea n.
ANALISIS DE CORRELACION
(Simple)
El principal objetivo del análisis de correlación es determinar qué tan intensa es la relación entre dos
variables. Una medida de esta relación es el coeficiente de correlación ( r ) el cual puede tomar valores en una
escala desde –1 hasta +1 inclusive como se indica enseguida.
Si r toma los valores de –1 o de +1 indica correlación perfecta como se indica en los siguientes
diagramas de dispersión.
y y
r = -1 r = +1
x x
Donde:
n es el número de pares de observaciones (x, y)
EJEMPLO:
El director de personal de una empresa debe entrevistar y seleccionar nuevo personal para el área de
ventas. Ha diseñado una prueba que ayude a seleccionar los mejores aspirantes. Con la finalidad de
verificar la validez de su prueba, como instrumento de predicción de las ventas semanales, eligió al
azar cinco vendedores experimentados y aplicó la prueba a cada uno (esta muestra es pequeña para
fines didácticos, en la práctica debe tomarse una muestra mucho mayor).
Se piensan entonces que las ventas semanales dependen de la puntuación de prueba por lo cual se
toman las ventas como variable dependiente ( y ) y la puntuación de prueba como variable independiente ( x ).
Examen
El diagrama de dispersión de los datos anteriores se muestra a continuación:
Ventas 14
Semanales 12
10
1 2 3 4 5 6 7 8 9 10 11 x
puntuación de prueba
Puntuación de Ventas
Prueba ( X ) Semanales ( Y )
X² XY Y²
4 5 16 20 25
7 12 49 84 144
3 4 9 12 16
6 8 36 48 64
5( 274 ) – ( 30 )( 40 ) 170 .
Para el ejemplo anterior el coeficiente de correlación es = ( 0.88 )² = 0.77 e indica que el 77% de la
variación total en las ventas semanales se explica por, o se debe a, la variación en las puntuaciones de prueba.
Ejercicios
Propuestos
Se define a la regresión lineal como una relación fundamental entre dos o más variables
correlacionadas y se usa para pronosticar una variable con base en la otra. Por lo general la relación se obtiene
de dos datos observados. En la regresión lineal la relación entre variables forma una línea directa.
La línea de regresión lineal es de la forma y’ = a + bx, donde y’ es la variable dependiente que queremos
resolver; a es la intersección de y’; b es la dependiente y x es la variable independiente (en el análisis de series
de tiempo, x representa unidades de tiempo).
La regresión lineal es útil para pronósticos a largo plazo de sucesos importantes y para la planificación
agregada. Por ejemplo, sería muy útil para pronosticar la demanda de familias de productos. Aunque es
probable que durante un periodo varié bastante la demanda para un producto específico de la familia, la
demanda para toda la familia es sorpresivamente regular.
La restricción principal para usar los pronósticos de regresión lineal es que, supuestamente, los datos
pasados y las proyecciones caen sobre una línea recta. Aunque esto limita su aplicación, algunas veces, si
usamos un periodo más breve puede usarse el análisis de regresión lineal. Por ejemplo, si existe una tendencia
de crecimiento y usamos un período de diez o veinte años la tendencia se pierde entre todos los datos y será
baja la proyección para el año siguiente. Sin embargo, si sólo usamos los últimos años, el pronóstico será más
preciso. Es una parte del procedimiento de regresión lineal se estima lo adecuado del ajuste en la línea con
los datos.
La regresión lineal se usa tanto para pronósticos de series de tiempo como para pronósticos de
relaciones causales cuando la variable dependiente (por lo general el eje vertical de un gráfico) cambia como
resultado del tiempo (el eje horizontal en el gráfico), se trata de un análisis de series de tiempo. Si una variable
cambia debido al cambio de otra variable, estamos ante una relación causal (como el incremento en el número
de muertes por cáncer en el pulmón con respecto a las personas que fuman).
El método de mínimos cuadrados trata de ajustar a la línea a los datos que minimicen la suma de los
cuadrados de la distancia vertical entre cada punto de datos y su punto correspondiente a la línea.
y’ = a + bx
Donde:
x periodo de tiempo.
a es el valor de y’ cuando x es = 0.
b es la pendiente de la línea.
y b x n xy x y
a b
n n x² x ²
EJEMPLO 1.
Pronostique las ventas para los periodos 13, 14 y 15 si las ventas de los 12 periodos anteriores son los
que se indican a continuación.
33,350 359.6153(78)
a 441.66
12
V $5000
E 4000
Pronósticos de Venta
N 3000
T 2000
A 1000
S 500
Línea de Regresión
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
PERIODO ( X )
El error estándar de estimación, o sea, la calidad de ajuste de la línea a los datos anteriores es:
y i y 'i ²
Sy ' i 1
363.9
n2
Sy '
y ² a y b xy
n2
EJEMPLO 2.
Volviendo a las puntuaciones de prueba y las ventas semanales de los cinco vendedores, las sumas y
otros datos básicos para despejar o evaluar a y b aparecen en la tabla siguiente:
Ventas
semanales
Puntuación (niveles de
de prueba. dólares)
Vendedor X Y X² XY Y²
Sr. Amber 4 5 16 20 25
Sra. Smith 3 4 9 12 16
Sr. Malcolm 6 8 36 48 64
SOLUCION:
Las sumas de la tabla anterior se utilizan para ilustrar los cálculos para a y b en la ecuación de regresión:
n xy x y 5274 (30)( 40)
b
n x² x ²
= = 1.133
5(210) (30)²
Por tanto, la ecuación de regresión es y’ = 1.202 + 1.133x (en miles de dólares). Las ventas
pronosticas para un candidato a un puesto en ventas, que calificó 6 en la puerta del director de
personal es $8000, que se obtiene por y’ = a + bx = 1.202 + 1.133(6) = 1.202 + 6.798 = 8.000 (en
miles de dólares).
EJERCICIO:
Datos: Calcular el pronóstico para los meses de enero, febrero y marzo del año siguiente.
E F M A M J J A S O N D E F M A M J J A S O N D E F M
68 55 63 82 87 63 77 78 62 78 74 62 74 80 96 74 71 71 66 86 85 89 91 103