Professional Documents
Culture Documents
ETAPA ANALIZAR
Jesús Restrepo A
EAFIT-2010
Herramientas a aplicar
5 por qué’s
Estadística básica
Análisis gráfico
Gráfico de torta
Gráfico de barras
Histogramas
Boxplots
Diagrama de pareto
Serie de tiempo
Multivariación
Gráficos de dispersión
Estadística inferencial
2
Una mirada preliminar a los
datos
•Ganar conocimiento
Tomando registros
Con encuestas
En presencia de datos:
·Observar
· Verificar
POBLACIÓN
Conjunto completo de los individuos o elementos de
interés.
MUESTRA:
Sub-conjunto seleccionado de la población
Población y muestras
Muestra
Población
Muy costoso.
No es práctico
Es imposible
Intervalos de confianza
Medidas de la dispersión
Manipulación descarada
Ignorancia
En marzo de 1947 un periódico de Nueva York tituló "Douglas aircraft ganó 2 Millones" otro en cambio tituló: "Douglas
aircraft perdió 2 millones". Ajá y entonces? Bueno aquí lo que pasó es que la Douglas había recibido 4 millones de
devolución por impuestos pagados por anticipado
Durante la Segunda Guerra murieron en accidentes en Estados Unidos 375.000 personas. En el frente de batalla
murieron 408.000. Esto parece sugerir que no era mucho más peligroso el frente de batalla que la ciudad. Que piensa
usted?
Dado que más del 87% de la gente muere en la cama; se podría afirmar que la cama es el lugar mas peligroso del
mundo?. Sólo el 0.0016% de las personas mueren esquiando. Entonces, es más peligroso estar en la cama que
esquiar?
De acuerdo con Yaroslavski, ministro de salud de la Unión Soviética en los años 30's, el número de médicos en Rusia
aumentó de 1.380 en 1897 a 12.000 en 1935. Será esta una buena forma de comparar la efectividad que tuvo el
régimen para aumentar los médicos?
A mediados de 1949, los Chinos nacioanalistas argumentaban que no estaban todavía derrotados por los
Comunistas: "Los Nacionalistas retienen todavía aproximadamente la mitad del area de la China", decían.
Lástima que no dijeran que era en el otro 50% donde estaba la mayoría de la población, de los recursos, la
infraestructura y el desarrollo de la China.
Mal uso de la estadística (2)
CAMBIO EN LA COMPOSICIÓN DE LOS GRUPOS
Los alumnos de una cierta promoción de la Universidad Nacional de Medellín tenían un promedio de edad de 87
años y al siguiente año el promedio había descendido a 85. Será que ser ex- alumno de la UNM lo hace a uno
rejuvenecer?.
La tasa de muertes por tuberculosis es muchísimo más alta en Arizona que en cualquier otro estado. Parecería
que Arizona tiene el peor clima para la tuberculosis. Pues no!. Es todo lo contrario, y por esa misma razón, las
personas enfermas de tuberculosis buscan vivir allí. Lamentablemente allí mueren también.
En 1936, la revista Literary Digest pronosticó que el presidente de los Estados Unidos sería Landon (vs
Rooselvelt), luego de recibir 10 millones de llamadas de sus suscriptores. Como se sabe, la predicción resultó
ser un fiasco total. Dónde cree usted que estuvo el problema?
CORRELACIÓN
En un estudio sobre escolares, un profesor descubrió que existe una correlación entre el tamaño del pie y la
calidad de la escritura. Comente este hallazgo.
Se ha reportado una correlación positiva entre el aumento de nidos de cigüeñas y el aumento de nacimientos en
Europa. No crean que las cigüeñas traen los niños, lo que sucedes es que el aumento de población aumenta el
número de edificaciones con lo que aumenta también la disponibilidad de sitios para que las cigüeñas hagan
sus nidos.
Durante la Segunda Guerra, en la campaña de Italia se encontró una correlación positiva entre los panfletos
lanzados y los terrenos recuperados. Si bien esto es consistente con la hipótesis de que los panfletos eran muy
efectivos, también lo es con otras hipótesis como que los panfletos se lanzaban antes de comenzar una gran
ofensiva.
Mal uso de la estadística (3)
LA DISPERSIÓN NO IMPORTA?
Una conocida marca de crema dental reporta que su utilización reduce las caries 23%. Esto lo certifica ante notaría. Pero
cuidado... Estos resultados pueden provenir de la estadística y ser certificados y sin embargo ser incorrectos. Si elegimos
una muestra pequeña para el experimento pueden suceder 3 cosas: No pasa nada, las caries aumentan (en cuyos 2 casos
la prestigiosa crema dental archiva los resultados donde nadie los vea) o puede producirse un mejoramiento y una gran
campaña publicitaria. Los 3 casos empero, pudieron haberse producido al azar. Con una muestra grande, los efectos del
azar son bien reducidos. Ojo con la letra menuda donde se reportan los tamaños de las muestras y los errores posibles.
El editor de una revista ordenó una investigación sobre el humo expedido por diferentes tipos de marcas de cigarrillo,
econtrándose que los cigarrilos Old Gold producían menos sustancias dañinas que los demás. La diferencia sin embargo no
era apreciable, como para que Old Gold hiciera lo que hizo: una enorme campaña publicitaria citando estos resultados sin
cifras.....
AFIRMACIONES TENDENCIOSAS
"La tercera parte las estudiantes de la Universidad de John HopKins se casan un su primer año con miembros de la
facultad". Esta afirmación crea una prevención que no está garantizada por los hechos. Sólo 3 mujeres estaban estudiando
en esa Universidad (años 30's)
El jefe de radares del Mediterráneo en la Segunda Guerra se quejaba sin éxito que sólo tenía 7 mecánicos. En vista que no
le autorizaban personal adicional escribió a la sección de personal: "El mes pasado el 14% de los mecánicos se volvieron
locos por exceso de trabajo". Inmediatamente le aumentaron la planta de personal.
En Palo Alto California, el 25 de julio de 1946, cayó 90 veces más agua en un dia que durante todos los meses precedentes
de julio desde 1910. En 6 horas cayó 19 veces más agua que en 26784.
Bueno, en realidad el "diluvio" consitió sólamente de 4.8 milímetros, pero eso no es todo. En los 36 previos meses de julio
había caido solamente una lluvia de 0.25 mm.
Y ahora que?
Ahora sí…..
Abrámosle la
puerta a la
estadística
Clasificación de la estadística
•CLASIFICA
•RESUME
DESCRIPTIVA
•PRESENTA
•CREA HIPÓTESIS
•PLANEA OBSERVACIONES
ANALÍTICA •ANALIZA
•FUNDAMENTA DECISIONES
Presentación de información
Ventas del model RX 2001 (MUS$) MONEDAS
Total ventas=11.8 MUS$ Marzo 12 TRM 2264.01
Com pra Pe s os Col US$ 1
Euro 2106.43 1.0748
Libra esterlina 1060.01 2.1358
25%
Marco alemán 1077.08 2.102
46% Florín holandés 956 2.3682
Marco suizo 1366.74 1.6565
9% Yen 18.93 119.6172
Dólar Canadiense 1464.43 1.546
20%
Fuente: IOA, 2001 Lira 1.09 2083.33
Zona Norte Zona Centro Zona Este Zona Sur Peseta 12.66 178.8901
Fuent e:B anco de la Rep.
80 200
60 150 6
equipos)
Frec (#
100 5
40 4
MUS$
50
3
20 0 2
0 <8 10 12 15 20 30 50 80 >80 1
Rango de peso
MODA
MEDIANA
PROMEDIOS
Aritmético
Geométrico
Armónico
Medidas de tendencia central
Media aritmética
es la suma de los valores dividida por el número de valores
Mediana
Es el elemento central en el conjunto de observaciones dispuesta en orden de
magnitud
Características de la mediana
1 Todo conjunto de datos tiene una mediana
2. No es sensible a los valores extremos
Medidas de dispersión
VARIANZA
DESVIACIÓN ESTÁNDAR
RANGO
RANGO INTERCUARTIL
Medidas de dispersión
S= desviación estándar de la muestra, = desviación estándar de la población.
(x )
2
VARIANZA
2
(x )
2
DESVIACIÓN ESTÁNDAR
N
s
COEFICIENTE DE VARIACIÓN cv
x
Identificación de valores atípicos
3 SIGMAS
1.5 IQR
Un ejemplo...
Estadística descriptiva-reservas pasajeros
•Planeación
•Muestreo y experimentación
Errores
Tamaño de muestras
Intervalos de confianza
•Análisis
•Inferencia
•Conclusiones
Teoría elemental de la probabilidad
s
xz
n
Tamaño de la muestra y error de la
estimación
PASOS
Determinar el nivel de confianza y el valor de z
Propiedades
1
f ( x)
ECUACIÓN (1/2)[x )/ ]2
DE LA CURVA NORMAL e
2
EN RESUMEN….
$ 6
16 $
Revisión de 21 26
1 Establecer y 11
Interesado Desarrolle Transición al
Justificación y verificar Datos mostrados
Causas princip. Implementación y Propietario del
Plan del proyecto requerimientos gráficamente
confirmadas Planes de comm. proyecto
del cliente
8
$ 23
13 28
3 Alinear el equipo 18 Revisión de
Desarrollar plan para Monitorear la
Revisar y Con el problema Generar posibles Interesado
Recolección de datos implementación y
aprender de Y objetivos del soluciones Implement.
De X’s clave; sistemas de control
trabajos previos Proyecto; Benchmarking Aprobada
Recordar datos de procesos
Confirme el plan
√ √ √
19 24
$
9 14 29
Revisión de Evaluar riegos y Iniciar implementación Confirme resultados;
4 Análisis gráfico;
Interesado Alternativas; De solucion (es) Actualice
Movilizar al Identificar posibles
Plan Seleccionar solución (es) aprobadas conocimiento
equipo causas principales
confirmado Actualizar FMEA compartido
√
20
10 15 25 30
Revisión de
5 Identificar X´s clave; Valide Diseñar sistemas Celebre las
Interesado
Desarrollar Mapa del proceso estadísticamente De control para mejoras y reconozca
Q-Solutions
SIPOC FMEA; matriz –XY Las causas Procesos (PCP) 34
al equipo
Aprobadas
Lean opps principales
¿Por Qué Analizar?
Establecer objetivos
Medición
Fluctuación
Tiempo
36
Aproximarse al Análisis
Causa y Efecto/
Diagramas de Espina de Estudios de Diseño de
Pescado Capacidad de Experimentos
10%
Other Proceso
Gráficos de
40%
Hours of 15%
Operation Item Check
35%
Torta Billing
Prueba de Hipótesis
(Y)
Gráficos de
Number
Diagramas de
of
Employees
(X)
Dispersión
PARETO CHART
Histogramas 400
350
300 Gráficos de Control
250
200
150
100
0 15 30
Gráficos de Múltiples
Gráficos de Líneas Measurement
RUN CHART
Variables
de Tendencia Average
Time or Sequence
Estratificación 38
Diagrama de Espina de Diagrama causa-efecto
Torta
Efecto
Causas Potenciales (Xs) Resultado
(Y)
2 4
4 HORAS DOWN POR LUBRICANTES-2004
5
34 954 1155
19% 23%
10
2900
58%
15
PALAS TRACTORES TALADROS
Gráfico d Pareto
Diagrama causa-efecto
Torta
¿QUÉ ES? Gráfico de barras
Pareto
• La gráfica de Pareto es una Histograma
gráfica de barras verticales Serie de tiempo
ordenadas de la mayor a la Box Plot
menor.
Pareto Costo de rellenos 2004
1600
1200 80
1000
• Ayuda a enfocarse en esas
Percent
60
KUS$
800
pocas categorías que tienen la 600 40
400
mayor contribución al impacto 200
20
TO LI
• Gráficas de Pareto secuenciales LE
Count 529 454 108 106 69 68 59 60
son útiles para identificar Percent 36.4 31.2 7.4 7.3 4.7 4.7 4.1 4.1
Cum % 36.4 67.7 75.1 82.4 87.1 91.8 95.9 100.0
causas raíces. 42
Histograma
Diagrama causa-efecto
Torta
Histograma Gráfico de barras
Pareto
Histograma
1
ayuda a entender si la variación 0
10 15 20 25 30 35
es esperada (causas normales/ DURACION DEL CICLO DE OT EN EL 2005
no normales/ comunes).
Analizar Patrones en Histogramas
44
Gráfica de línea-Serie de tiempo
Serie de tiempo
¿QUÉ ES?
• Una gráfica simple que muestra los datos en el orden que van
ocurriendo.
45
Analizando los Patrones de un gráfica de línea
median Cambios
Tendencia
Ciclo
Anómalo
Mismo valor
46
Diagrama causa-efecto
Torta
3.0
2.5
Horas Durac
2.0
1.5
1.0
0.862069
0.653226 0.607759 0.594828
0.5 0.439516 0.516129
0.16129 0.224138
0.0 47
Hora 4a5 5a6 6a7 7a8 4a5 5a6 6a7 7a8
Tipo CT_1 D-N N-D
Unas recomendaciones para el análisis
48
Causa raíz de los problemas
Cómo llegar a las causas raíz de los
problemas?
Perdimos
$Mxx Estructura de Arbol / Diagrama de Causa y Efecto:
Derrame Tapón PM
Combustible Corregir
Aceite Suelto No se Hizo
Causado por
No hay análisis
Falta de Poco PMs no causa-raíz
sentido entrenamiento actualizados
de
urgencia No hay auditoria
No se No hay de los procesos
solucionan estándares
problemas de
Responsabilidad cuando se preparación Falta general de
necesita procedimientos
Bajo nivel de
cumplimiento
de PMs
Partes dañadas
Carcazas
Pobre
Alineamiento desarrollo de
Engranes Refrigerante
herramientas viejo
Eje Metal Partes
desgastado dañadas End of coil
issues 50
Máquinas Material
Encontrar las causas raíz -Los
5 por qué
Encontrar la causa raíz es necesario para identificar
soluciones efectivas
D efinimos
M edimos
A nalizamos y encontramos causas
M ejorar
C ontrolar
52