Professional Documents
Culture Documents
Otros Gráficos
Conocido también como BOXPLOT. Es un importante gráfico del análisis exploratorio de datos. Al
igual que el histograma, permite tener una idea visual de la distribución de los datos. Permite
determinar si hay simetría, ver el grado de variabilidad existente y detectar los "outliers" (datos muy
diferentes al conjunto de información), es decir la existencia de posibles datos discordantes.
Además, el Boxplot es bien útil para comparar grupos Es un diagrama que muestra la distancia en
que se encuentran los datos y cómo están distribuidos equitativamente.
La caja: Zona rectangular que está limitada por el primer cuartil y por el tercer cuartil. En dicha zona
está contenido el 50% de los datos.
Bigote: Segmento lineal que nace en la caja y se extiende a la izquierda a la derecha, el segmento
que representa cada bigote esta contenido el 25% de los datos aproximadamente. El bigote de la
izquierda se extiende hasta el valor de la observación mayor o igual que Q1 - 1.5 RIQ. El bigote de
la derecha se extiende hasta el valor de la observación menor o igual que Q3 + 1.5 RIQ.
(*): Representación que indica la presencia de un valor atípico o extremo. Un dato se considera
atípico si se alejan de la caja en más de 1.5 veces la distancia entre Q3 y Q1 (o rango intercuartílico);
es decir un datos se considera atípico, o extremo, si su valor es menor que Q1 - 1.5 RI, o si es mayor
que Q3 + 1.5 RIQ.
1
2 MEDIDAS DESCRIPTIVAS
62 68 72 92 86 76 52 76 82 78 82 74 88 66
58 74 78 84 96 76
Siendo los datos números de dos cifras, vemos que hay datos en los grupos del 50, 60, 70,
80 y 90. El primer dígito de cada dato debe utilizarse como tallo y el segundo como hoja. Se
traza una línea vertical y se colocan los tallos a su izquierda, en columna. Luego se coloca
cada hoja junto a su tallo hasta completar la lectura de todos los datos. La presentación de
tallo y hojas es la siguiente.
Si los datos tuviesen cifras decimales, al construir el diagrama de tallo y hojas, el punto
decimal se pierde por tal razón se acostumbra indicar las unidades que los datos del tallo
representan. Así, si los datos de arriba fuesen decimales 6.2 6.8 ........7.6, debajo del
diagrama se pondría "Unidad = 0.1".
2
3 MEDIDAS DESCRIPTIVAS
Gráfico de puntos
8 9 10 11 12 13 14 15 16
Rendimiento - Variedad Kent