You are on page 1of 55

Estadística

TEMARIOS

 Profesor
 Objetivos
 Reglas
 Contenidos a desarrollar en el curso
 Políticas
Objetivos :
CURSO
INSTITUCIONAL

Formar profesionales de EXCELENCIA, Analizar información aplicando


socialmente responsables, líderes, técnicas estadísticas con el objeto de
emprendedores, CON PRINCIPIOS Y elaborar conclusiones que faciliten la
VALORES MORALES y éticos, QUE toma de decisiones en situaciones
CONTRIBUYAN al desarrollo científico, complejas que se caracterizan por
tecnológico, social, económico, ambiental y
estar sometidas a distintos grados de
político del país; y, hacer investigación,
incertidumbre
innovación, transferencia de tecnología y
extensión de calidad PARA SERVIR A LA
SOCIEDAD
Reglas

 Asistencia a clases y cumplimiento de trabajos


 Celular en silencio
 Comunicación en clase, consultoría
programadas y a través del SIDWEB
Contenido a desarrollar en el curso

Syllabus ESTG1005
Sistema de Calificación

TEORÍA PRÁCTICA
Primer Parcial Segundo Parcial Tercer Parcial Califiación Única
Actividades Examen Actividades Examen Examen Actividades

100% 100% 100% 100%

TEORÍA + PRÁCTICA =
CALIFICACIÓN
Propuesta de la estructura en
Estadística 3 / 1 / 5
Componen Compone
te nte
Teórico Práctico

80% 20%
Actividades -
1er Parcial 2do Parcial Talleres 60%
Examen 50% 50% Proyecto
Control de 40%
lectura 10% 10%
Lecciones 30% 30%
Deberes 10% 10%
100% 100%
* Nota: Solo se ingresa la
nota una vez en el
segundo Parcial
Estadística
Tipo de datos y Escalas
de medición
1-11
Tipos de Datos

Dato

Cualitativo Cuantitativo
(Categórico) (Numérico)

Ejemplos:
 Estado civil Discreto Continuo
 Partido político
 Color de ojos
(Categorías definidas) Ejemplos: Ejemplos:
 Número de hijos  Peso
 Defectos por hora  Voltaje
(Valores contados) (Medidas de
carácterísticas)
1-12
Tipos de Datos

 Datos de Serie de Tiempo


 Datos observados y ordenados en el tiempo

 Datos Transversales
 Datos observados en un solo punto del tiempo
1-13
Tipos de Datos

Ventas (Miles de Dólares)


2003 2004 2005 2006 Datos de
Atlanta 435 460 475 490 Serie de
Boston 320 345 375 395 Tiempo

Cleveland 405 390 410 395


Denver 260 270 285 280

Datos Transversales
1-14 Datos de Serie de Tiempo

Datos observados y ordenados en el tiempo

http://www.eluniverso.com/noticias/2015/11/01/nota/5215826/sales-carnes-procesadas-
pueden-generar-cancerigenos
1-15
Escala de medión
1-16
Niveles de Medición de Datos

ESCALA - NOMINAL

ESCALA - ORDINAL
1-17
Niveles de Medición de Datos

ESCALA - INTERVALO

ESCALA - RAZÓN
Población y muestra
 Población: Conjunto
bien definido de N-
entes, cuyas
*características nos
proponemos a
Muestra investigar
Población

 Muestra:
subconjunto de la
población

La información obtenida
de la muestra nos permite
Unidad de
inferir las propiedades o
investigación características de toda la
población, con errores
Observación
medibles y acotables
Definiciones Claves

Una población es el conjunto completo de objetos en


consideración y referidos como el marco
 La unidad muestral es cada objeto o individuo en el marco
 Un parámetro es una medida de resumen que describe una
característica de la población

Una muestra es un subconjunto de la población, seleccionado


para ser analizado
 Un estadístico es una medida de resumen, calculada de la muestra
para describir una característica de la población

1-19
Datos e información

Procesamiento
de la información

Dato Información
Tabulación
Mediciones no de datos
procesadas Gráficos
- Numéricas Medidas
- Categóricas
Procesamiento de los datos
a) Ordenamiento de datos – Estadístico de Orden

𝑋 1 = min 𝑋1 ,𝑋2 , … . , 𝑋𝑛
𝑋 𝑛 = m𝑎𝑥 𝑋1 ,𝑋2 , … . , 𝑋𝑛

1-21
Procesamiento de los datos
b) Tabulación de los datos
Procesamiento de los datos
b) Tabulación de los datos

No. de Clase Marca de Frecuenci Frecuenci Frecuenci Frecuenci


Clase clase a a Relativa a a Relativa
Absoluta Absoluta Acumula
Acumula da
da

1 [𝑎1 , 𝑎2 ) (𝑎1 + 𝑎2 )/2 𝑓1 𝑓1 /n 𝐹1 𝐹1 /n


2 [𝑎2 , 𝑎3 ) (𝑎2 + 𝑎3 )/2 𝑓2 𝑓2 /n 𝐹2 = 𝑓1 +𝑓2 𝐹2 /n
3
,
k [𝑎𝑘 , 𝑎𝑘+1 ) (𝑎𝑘 + 𝑎𝑘+1 )/2 𝑓𝑘 𝑓𝑘 /n 𝐹𝑘 = 𝐹𝑘
=1
𝑓1 +𝑓2+…+𝑓𝑛 n
1-23
Procesamiento de los datos
b) Tabulación de los datos

Como se definen las clases o intervalos

Condiciones
Exhaustivos
Mutuamente excluyentes
Igual longitud

1-24
Procesamiento de los datos
b) Tabulación de los datos

No. de Clase Marca Frecuen Frecuen Frecuen Frecuen


Clase de clase cia cia cia cia
Absoluta Relativa Absoluta Relativa
Acumula Acumula
da da
Procesamiento de los datos
c) Gráficos

Histogramas
Polígono de frecuencias

Ojiva: Distribución de
frecuencias acumulada
Histogramas
Polígono de frecuencias
Ojiva: Distribución de
frecuencias acumulada
Cuantiles y Medidas de
tendencia central y
dispersión
Datos sueltos
Medidas de Resumen

Describiendo Numéricamente los Datos

Medidas de tendencia Central Medidas de Posición Variación/ Medidas de dispersión


Rango
Media
Percentiles
Rango
Mediana Intercuartílico
Cuartiles
Moda Varianza
Deciles
Media Ponderada Desviación
Estándar
Coeficiente de
Variación
Medidas de tendencia Central

Media Mediana Moda Media Ponderada


Punto medio Punto de mayor frecuencia
w
n

 xi M W i
xi
i 1
x  Condicione s
n


N

xi
w i
1

  i 1 0  wi  1
N

**Media
Cortada
Medidas de tendencia Central
Para datos agrupados

Media Mediana Moda Media Ponderada

 w
n
M xi

W
xi i

i 1
x  Condicione s
n Punto medio Punto de mayor
N
frecuencia w 1

i
xi
  i 1 0  wi  1
N
Punto de
equilibrio

**Media
Acotada
Media Ponderada

 Usado cuando los valores son agrupados por frecuencia o


importancia relativa

Media Ponderada de Días para Culminar


Ejemplo: Muestra de 26
proyectos de reparación
Días para Frecuencia XW 
w x
i i

(4  5)  (12  6)  (8  7)  (2  8)
Culminar
w i
4  12  8  2
5 4
164
6 12   6.31 días
26
7 8
8 2
3-35
Medidas de Posición - Cuantiles

Percentiles
Los cuartiles dividen a los datos ordenados en cuatro grupos iguales:

25% 25% 25% 25%


Cuartiles Q1 Q2 Q3
Notar que el segundo cuartil (el 50mo percentil), Q2, es la mediana
IQR (rango intercuartílico) = Q3 – Q1

Deciles
Medidas de Posición - Cuantiles
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
% % % % % % % % % % % % % % % % % % % % % % % % % % %
Percentiles
P1 P2 P99

Los cuartiles dividen a los datos ordenados en cuatro grupos iguales:

25% 25% 25% 25%


Cuartiles
Q1 Q2 Q 3 que, no más del 25% por ciento
Primer Cuartil = es un valor Q1 de la muestra, tal
de las observaciones ordenadas toman valores menores o iguales a Q1

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
Deciles
D1 D2 D3 D4 D5 D6 D7 D8 D9
Diagrama de Caja

* *
Valores “Valor más pequeño” “Valor más grande”
Atípicos (Límite Inferior) Q1 Q2 Q3
(Límite Superior)

El límite inferior es El límite superior es


Q1 – 1.5 (Q3 – Q1) Q3 + 1.5 (Q3 – Q1)

 Dibujar una caja desde Q1 a Q3


 Trazar una línea vertical en la mediana
 Trazar líneas (bigotes) hacia el valor más pequeño y más grande (dentro de los
límites calculados)
3-39
 Identificar los valores atípicos fuera de los límites calculados
Detención de valores atípicos o datos
aberrantes

 𝒔𝒊 𝒆𝒔 𝒖𝒏 𝒗𝒂𝒍𝒐𝒓 𝑴𝒆𝒏𝒐𝒓 𝑎𝑙 max 𝑋 1 , 𝑄1 − 1,5𝑅𝐼

 𝒔𝒊 𝒆𝒔 𝒖𝒏 𝒗𝒂𝒍𝒐𝒓 𝑴𝑨𝒀𝑶𝑹 𝑎𝑙 m𝑖𝑛 𝑋 𝑛 , 𝑄3 + 1,5𝑅𝐼


Determinación de los cuantiles a través de la Ojiva
Forma de una Distribución
Describir cómo los datos están distribuídos
Simetrica or asimétrica
A mayor diferencia entre la media y la mediana, mayor es la asimetría de la
distribución

Asimétrica a la Simétrica Asimétrica a la


Izquierda Derecha

Media < Mediana Media = Mediana Mediana < Media


(Cola larga hacia la izquierda) (Cola larga hacia la derecha)
3-42
Forma de una Distribución y de su Gráfico de Caja
y Bigote
Asimétrica a Asimétrica a
la Izquierda Simétrica la Derecha

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3

3-43
Variaciones
Misma media pero diferentes
desviaciones estándar:
Datos A
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 3.338

Datos B
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 0.9258
Datos C
Media = 15.5
11 12 13 14 15 16 17 18 19 20 21 s = 4.57
3-44
Variación

Rango Varianza Desviación Coeficiente de


Estándar Variación
Varianza
Poblacional Desviación
Estándar
Poblacional
Rango
Intercuartílico

Varianza
Muestral Desviación
Estándar
Muestral
Variación

Rango Varianza Desviación Coeficiente de


Estándar Variación
R  X  n   X 1  Varianza
Poblacional Desviación s
Estándar V  100
N
Poblacional x
 (x  μ)
2
Rango i
i1

2
Intercuartílico σ σ σ
2

N
RI  Q  3   Q 1 
Varianza
Muestral Desviación
Estándar
n Muestral
 (x i  x )
2

s
2
i 1 s
s 
2

n -1
Variación

 Las medidas de variación dan información sobre la dispersión o variabilidad de los


datos

 Valor pequeño
 Menos variación
 Valor grande
 Más variación

Mismo centro,
diferente variación
3-47
Medidas de Variación
El presidente de la corporación solicita al gerente de producción información sobre la
producción de los últimos 5 días de las plantas A y B. Se registran los siguientes
resultados:

A 15 25 35 20 30
B 23 26 25 24 27

El gerente de producción elabora un resumen el cual presenta al presidente:


En base a la información proporcionada, ¿Qué puede concluir el presidente?
¿Cuál es la realidad?

Media Mediana
A 3-48 25 25
B 25 25
Cuantiles y Medidas de
tendencia central y
dispersión
Datos agrupados
Medidas y desviación para datos agrupados

Y
K
Media fi Varianza
 (Y i  y ) f i
2
i
i 1
y  s 
2 i 1

n n -1

Yi = i-ésima marca de
clase
Coeficiente de Variación

 Muestra la variación relativa a la media.


 Expresado siempre en porcentaje (%).
 Especialmente relevante para comparar la variabilidad de dos
distribuciones con distintas medias.
 Usado para comparar dos o más conjuntos de datos medidos en
diferentes unidades o niveles
Población Muestra

σ   s 
CV  
 μ 
  100% CV   
 x   100%
   
3-51
Comparación de Coeficientes de
Variación
 Acción A:
Precio promedio del año pasado = $50
Desviación estándar = $5
 s  $5

CVA    * 100%  * 100%  10%

 x  $50 Ambas acciones tienen
la misma desviación
estándar, pero la
 Acción B: Acción B es menos
variable relativo a su
Precio promedio del año pasado = $100 precio

Desviación estándar
s  = $5 $5

CVB    * 100%  * 100%  5%

 x  $100
3-52
Valores centrados y
estandarizados
Valores Estandarizados

 Un valor estandarizado se refiere al número de desviaciones


estándar en que el valor difiere de su media.

 Un valor estandarizado también es conocido como valor z.

 Pueden ser usados para comparar conjuntos de datos, al menos de


intervalo, incluso de escala distinta.

 Serán vistos en mayor detalle en los próximos capítulos.

3-55
Valores Estandarizados Poblacionales

x μ
z 
σ
Donde:
 x = valor original del dato
 μ = media poblacional
 σ = desviación estándar poblacional
 z = valor estandarizado

(número de desviaciones estándar en que x difiere de μ)

3-56
Valores Estandarizados Muestrales

x  x
z 
s
Donde:
 x = valor original del dato
 x = media muestral
 s = desviación estándar muestral
 z = valor estandarizado
(número de desviaciones estándar en que x difiere de x )

3-57
Valor Estandarizado: Ejemplo

 Los puntajes de CI en una población tienen distribución en forma de campana con


media μ = 100 y desviación estándar σ = 15

Encontrar el valor estandarizado (z-score)


para una persona con un CI de 121.

Respuesta: x μ 121  100


z    1.4
σ 15

Alguien con CI de 121 está a 1.4 desviaciones


estándar sobre la media

3-58
Deberes
1,-Ejercicios Propuestos
 1,1 primera muestra  1,53
 1,3,1,4 1,5, 1,6  1,54
 1,17  1,55
 1,24  1,56
 1,41

2,- Sea una muestra X, de Tamaño n, en la que se investiga una característica X,


definimos
𝒀𝒊 = 𝜶𝑿𝒊 + 𝜷 Calcule la media

Leer: Distribución Empírica de una Muestra pg 37-40


Estadística Descriptiva Multivariada – Varianzas y Covarianzas 40 -45
Datos cualitativos pg. 48- 52

You might also like