You are on page 1of 7

Universidad Diego Portales Estadística I

Facultad de Economía y Negocios Prof. Carlos Pitta Arcos

Fórmulas Estadísticas

Capítulo 2

Recuerde: Hay k Categorías; n Datos en una muestra, N datos en una población.

Frecuencia Relativa de Clase (f) 𝐹𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝐶𝑙𝑎𝑠𝑒


𝑓=
𝑛
¿Cuántas Clases k? 𝑘= 𝑛
Ancho de Clase (AC) 𝐷𝑎𝑡𝑜 𝑀𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑀𝑒𝑛𝑜𝑟
𝐴𝐶 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝐶𝑙𝑎𝑠𝑒𝑠
Marca de Clase o punto medio (M) 𝐿í𝑚𝑖𝑡𝑒 𝐼𝑛𝑓𝑒𝑟𝑖𝑜𝑟 + 𝐿í𝑚𝑖𝑡𝑒 𝑆𝑢𝑝𝑒𝑟𝑖𝑜𝑟
𝑀=
2
Frecuencia Acumulada (fai) 𝑖

𝑓𝑎𝑖 = 𝑓𝑟𝑖
𝑗 =1

Capítulo 3
𝑛
Media (Población ; Muestra 𝑋) 𝑖=1 𝑥𝑖
𝑋=
𝑛
i-ésimo percentil (p) 𝑝
𝑖= 𝑛
100
Rango (R) 𝑅 = 𝐷𝑎𝑡𝑜 𝑀𝑎𝑦𝑜𝑟 − 𝐷𝑎𝑡𝑜 𝑀𝑒𝑛𝑜𝑟
Varianza (Población S2 y divida por N; Muestra 𝑛 2 𝑛 2
𝑖=1 𝑥𝑖 − 𝜇 𝑖=1 𝑥𝑖 − 𝑋
2 y divida por n-1) 𝜎2 = ; 𝑆2 =
𝑁 𝑛−1
Desviación Estándard (Población S2 y divida por 𝑛 2 𝑛 2
𝑥𝑖 − 𝜇 𝑥𝑖 − 𝑋
N; Muestra 2 y divida por n-1) 𝜎= 𝑖=1
;𝑆 = 𝑖=1
𝑁 𝑛−1
Coeficiente de Variación (Población; Muestra) 𝜎 𝑆
100; 100
𝜇 𝑋
Coeficiente de Variación (Población; Muestra) 𝜎 𝑆
100; 100
𝜇 𝑋
Valores Z 𝑥𝑖 − 𝑋
𝑧𝑖 =
𝑆
Outliers (Valores Atípicos) 𝐶𝑢𝑎𝑙𝑞𝑢𝑖𝑒𝑟 𝑣𝑎𝑙𝑜𝑟 𝑚á𝑠 𝑎𝑙𝑙á 𝑑𝑒 ± 3𝑆 ó ± 3𝜎
𝑛
Media Ponderada (Donde wi son los pesos) 𝑖=1 𝑤𝑖 𝑥𝑖
𝑋= 𝑛
𝑖=1 𝑤𝑖
𝑛
Media Datos Agrupados 𝑖=1 𝑓𝑖 𝑀𝑖
𝑋=
𝑛
Varianza Datos Agrupados 𝑛 2
𝑖=1 𝑓𝑖 𝑀𝑖 − 𝑋
𝑆2 =
𝑛−1
Universidad Diego Portales Estadística I
Facultad de Economía y Negocios Prof. Carlos Pitta Arcos

Moda Datos Agrupados. Aquí: IM=Intervalo Modal, 𝑓𝑖+1


intervalo que registra la mayor frecuencia 𝑀𝑜 = 𝐿𝑖−1 + 𝑎
Li-1= Límite inferior del IM 𝑓𝑖+1 + 𝑓𝑖−1 𝑖
fi+1 = Frecuencia del intervalo inmediato posterior al IM
fi-1 = Frecuencia del intervalo inmediato previo al IM
ai = Amplitud del IM
Percentiles Datos Agrupados. Aquí: Pp=Punto Percentil, 𝑝∙𝑛
− 𝑁𝑖−1
𝑃𝑝 = 𝐿𝑖−1 + 100
p=percentil; IM=Intervalo Modal, intervalo que registra la
mayor frecuencia, o aquel en donde hacemos un corte 𝑎𝑖
𝑓𝑖
Li-1= Límite inferior del IM; Ni-1= Frecuencia acumulada
previa a IM; fi = Frecuencia del IM ; ai = Amplitud del IM

Descomposición de Varianza:

2
Intravarianza=𝜎𝑑𝑒𝑛𝑡𝑟𝑜 = 𝜎𝑤2

2
Intervarianza=𝜎𝑒𝑛𝑡𝑟𝑒 = 𝜎𝑏2

Ejemplo: Suponga que tenemos dos grupos de datos:

Grupo A Grupo B Y queremos calcular la varianza total usando las fórmulas de Intervarianza e
7 11 Intravarianza. Procedemos como sigue:
9 14
11 17
Universidad Diego Portales Estadística I
Facultad de Economía y Negocios Prof. Carlos Pitta Arcos

PASO 1, Calcule las medias y las varianzas para cada grupo:

Grupo A Grupo B
X1=(7+9+11)/3 = 9 X2=(11+14+17)/3 = 14

S1=[(7-9)2+(9-9)2+(11-9)2]/3=2,7 S2=[(11-14)2+(14-14)2+(17-14)2]/3=6,0
n1=3 n2=3

PASO 2, Calcule la IntraVarianza

PASO 3, Calcule la media global

PASO 4, Calcule la InterVarianza

PASO 5, La suma de: IntraVarianza + InterVarianza = Varianza Total.

Compruebe usted mismo (Calculando la varianza total para todos los datos) que la Varianza Total =
4,35 + 6,25 = 10,6

EJERCICIOS A CUBRIR EN AYUDANTIA

COVARIANZA == Problema # 1, Solemne 1, 2009

Inter + Intravarianza == Problema # 2, Solemne 1, 2009

Moda Agrupados == Problema # 3, Solemne 1, 2008

Covarianza y Dispersion Relativa == Problema # 1, Solemne 1, 2008


Universidad Diego Portales Estadística I
Facultad de Economía y Negocios Prof. Carlos Pitta Arcos

AYUDANTÍA ESPECIAL

Problema # 1. TEMA: Covarianza (Problema # 1, Solemne 1, 2009). Se presenta la siguiente


información relacionada a productividad y remuneraciones en una empresa:

REMUNERACIONES (MILES) a) Determine si para


PRODUCTIVIDAD los trabajadores de esta
(PUNTOS) 120-180 180-240 240-300 300-360 empresa la productividad y
20-40 8 5 3 0 los sueldos presentan alguna
40-60 6 7 9 10 relación, y de qué tipo.
60-80 1 6 8 12 b) Don José Moreno
80-100 0 7 9 15 trabaja en dicha empresa,
tiene un puntaje de productividad de 78,35 puntos y percibe un sueldo de $297.560. Basada en una
correspondencia en términos relativos entre las variables en estudio, la empresa decide bajar el
sueldo al Sr. Moreno. ¿Debe reclamar el Sr. Moreno por esta medida?

RESPUESTA (a). Este es un problema típico de Covarianza, y lo que hay que hacer es calcularla y
en base al resultado responder.

Lo primero que tenemos que hacer es separar las Variables y calcular sus primeros momentos:

Productividad fi Mi fiMi fi*(Mi-X) fi*(Mi-X)^2 (fi*Mi-X)


20-40 16 30 480 -540.377 18250.481 416.226
40-60 32 50 1600 -440.755 6070.773 1536.226
60-80 27 70 1890 168.113 1046.743 1826.226
80-100 31 90 2790 813.019 21322.570 2726.226
SUMAS 106 6760 46690.566
X 63.774
S2 440.477
S 20.988
COVARIANZA

Remuneraciones fi Mi fiMi fi*(Mi-X) fi*(Mi-X)^2


120-180 15 150 2250 -1647.1698 180877.892 1990.189
180-240 25 210 5250 -1245.283 62029.192 4990.189
240-300 29 270 7830 295.471698 3010.466 7570.189
300-360 37 330 12210 2596.98113 182278.676 11950.189
SUMAS 106 27540 428196.226
X 259.811
S2 4039.587
S 63.558
Universidad Diego Portales Estadística I
Facultad de Economía y Negocios Prof. Carlos Pitta Arcos

Esto es para poder llegar a calcular los producto cruzados, componente critico de la formula de
covarianza:
𝑐𝑜𝑣 𝑥, 𝑦 = 𝑀 𝑋 ∙ 𝑌 − 𝑀(𝑋) ∙ 𝑀(𝑌)
En donde M se refiere a los primeros momentos, esperanzas o medias.
𝑓𝑖𝑀𝑖
𝑀 𝑌 =
𝑓𝑖

Suma de Productos cruzados:

192962401/106^2=17,173.585  M[X,Y]

La covarianza entonces es: 17,173.585-(259.811)*(63.774) = 604.485

La covarianza es positiva, por lo que podemos argumentar que ambas variables se encuentran
relacionadas de manera directa, lo que en este contexto significa: ROLLO PERSONAL.

RESPUESTA (b). Tenemos que calcular los puntajes típicos en ambas distribuciones y decidir.
𝑥 𝑖 −𝑥 78.35−63.774
En PRODUCTIVIDAD: 𝑍𝑖 = = = 0.695
𝑠 20.998

𝑥 𝑖 −𝑥 297.56−259.81
En SUELDOS: 𝑍𝑖 = = = 0.594
𝑠 63.558

IDEA: Se esperaría que las distribuciones típicas fueran las mismas tanto para productividad como
para sueldos (si suponemos que los sueldos están en función de la productividad). En este caso, la
distribución del Sr. Moreno es superior en productividad a la distribución en sueldos, por lo que la
medida es injusta y debería reclamar.
Universidad Diego Portales Estadística I
Facultad de Economía y Negocios Prof. Carlos Pitta Arcos

Problema # 2. TEMA: Inter e Intra Varianza (Problema # 2, Solemne 1, 2009).

Un estudio a 50 empresas exportadoras que han firmado contratos con carriers telefónicos provee
los siguientes resultados:

Facturacion Empresas Existe un nuevo carrier interesado en entrar al mercado telefónico y


0-40 5 promociona los siguientes descuentos por sobre su facturación actual (lo
40-80 10 que le pagan a otros carriers actualmente):
80-120 11
a) Empresas que facturan hasta 50 UF, descuento del 5%
120-160 16
b) Empresas que facturan entre 50 y 120 UF, descuento fijo de 2.5
160-200 5
UF más un descuento del 2.5%
200-240 3
c) El resto (las que facturan más de 120 UF) un descuento del 3.1%

Un ejecutivo de cuenta asegura qué, según dicha promoción, la mayor fuente de variabilidad en la
facturación de larga distancia se debe a la diferencia observada entre los estratos. ¿Es correcto?

RESPUESTA. Estrategia: Cómo se pregunta sobre variabilidad y estratos, se trata de una pregunta
típica de Inter e Intravarianza. Lo primero que hay que hacer es identificar los estratos de la
promoción. Entonces, habrá 3 estratos: 1) 0-50; 2) 50-120; y 3) 120 y más. Sin embargo, hay que
crearlos usando las categorías de la tabla:

Estrato 1 Estrato 2 Estrato 2 Ahora solo hay que


Facturacion Empresas Facturacion Empresas Facturacion Empresas calcular las
0-40 5 50-80 ? = 7.5 120-160 16 interrogantes de la
40-50 ? = 2.5 80-120 11 160-200 5 tabla, de acuerdo a la
200-240 3 información provista.
Para ello usamos nuestra fórmula para calcular percentiles:

𝑝∙𝑛 𝑝 ∙ 50
− 𝑁𝑖−1 −5
𝑃𝑝 = 𝐿𝑖−1 + 100 𝑎𝑖 ==> 50 = 40 + 100 ∙ 40 ==> 𝑝 = 15%
𝑓𝑖 10

Lo que significa que el 15% de las empresas facturan hasta 50 UF. 15% de 50 empresas es 7.5,
información que nos sirve para llenar la interrogación. Prosiguiendo de la misma forma podemos
calcular qué:

El 15% de las Empresas Facturan cómo máximo 50 UF

El 37% de las Empresas facturan entre 50 y 120 UF

El 48% de las Empresas facturan entre más de 120 UF

Esos cortes nos servirán posteriormente para calcular la intravarianza


Universidad Diego Portales Estadística I
Facultad de Economía y Negocios Prof. Carlos Pitta Arcos

Ahora que tenemos llenas las tablas de los estratos, procedemos a calcular las varianzas para cada
una de ellas.

Ahora debemos calcular todos los elementos para calcular la inter e intravarianza, como las medias y
las desviaciones por estratos y la Media Global:
𝑋1 ∙𝑃𝑝 +𝑋2 ∙𝑃𝑝+𝑋3 ∙𝑃𝑝 15∗26.91+37∗81.16+48∗153.92
𝑋= 𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙
= 100
= 107.70

Estrato1 Estrato2 Estrato3 Antes de proceder, sin embargo, debemos recordar


Xi 28.333 85.811 158.333 que en el estrato 1 hemos “eliminado” 2.5 empresas,
S^2 138.889 295.289 797.222 es decir, el 2.5/50 = 5% del total de empresas, por lo
S 11.785 17.184 28.235 que debemos ajustar tanto las medias como las
Xtotal 111.999 varianzas para reflejar esta modificación. Además de
las empresas “eliminadas” en el estrato 2, 2.5 de las
cuales corresponden al estrato 1, y además debemos restar parte de la media que corresponde al
estrato 1.Haciendo los cálculos correspondientes, nuestra nueva tabla de Medias y Varianzas es la
siguiente:

Estrato1 Estrato2 Estrato3


85.811-2.5-
Xi 0.95*28.33=26.91 0.025X1=81.16 158.333*0.97X3=153.42
S^2 138.889 295.289 797.222
17.184-
S 0.95*11.785=11.19 0.025*S2=16.75 28.235*0.97S3=27.35
Xtotal 107.70

2 2 𝑆12 𝑃𝑝 + 𝑆22 𝑃𝑝 + 𝑆32 𝑃𝑝 15 ∗ 11.192 + 37 ∗ 16.752 + 48 ∗ 27.352


𝜎𝑑𝑒𝑛𝑡𝑟𝑜 = 𝜎𝑖𝑛𝑡𝑟𝑎 = = = 481.64
𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑜 100

2 2 (𝑋1 − 𝑋)2 𝑃𝑝 + (𝑋2 − 𝑋)2 𝑃𝑝 + (𝑋3 − 𝑋)2 𝑃𝑝


𝜎𝑒𝑛𝑡𝑟𝑒 = 𝜎𝑖𝑛𝑡𝑒𝑟 =
𝑝𝑒𝑟𝑐𝑒𝑛𝑡𝑖𝑙 𝑎𝑐𝑢𝑚𝑢𝑙𝑎𝑑𝑜
15 ∗ (26.91 − 107.7)2 + 37 ∗ (81.16 − 107.7)2 + 48 ∗ (153.42 − 107.7)2
=
100
= 2224.67

Dado que Intervarianza<Intravarianza, la afirmacion del ejecutivo es correcta.

You might also like