You are on page 1of 3

1 MEDIDAS DESCRIPTIVAS

Otros Gráficos

1.- El Gráfico de Cajas


El gráfico de cajas está basado en la representación de los cuartiles de una distribución de datos, y
tienen como propósito evaluar la asimetría y la presencia de valores atípicos o extremos en la
distribución de los datos.

Conocido también como BOXPLOT. Es un importante gráfico del análisis exploratorio de datos. Al
igual que el histograma, permite tener una idea visual de la distribución de los datos. Permite
determinar si hay simetría, ver el grado de variabilidad existente y detectar los "outliers" (datos muy
diferentes al conjunto de información), es decir la existencia de posibles datos discordantes.
Además, el Boxplot es bien útil para comparar grupos Es un diagrama que muestra la distancia en
que se encuentran los datos y cómo están distribuidos equitativamente.

Los componentes de un gráfico de cajas son:

La caja: Zona rectangular que está limitada por el primer cuartil y por el tercer cuartil. En dicha zona
está contenido el 50% de los datos.

Bigote: Segmento lineal que nace en la caja y se extiende a la izquierda a la derecha, el segmento
que representa cada bigote esta contenido el 25% de los datos aproximadamente. El bigote de la
izquierda se extiende hasta el valor de la observación mayor o igual que Q1 - 1.5 RIQ. El bigote de
la derecha se extiende hasta el valor de la observación menor o igual que Q3 + 1.5 RIQ.

(*): Representación que indica la presencia de un valor atípico o extremo. Un dato se considera
atípico si se alejan de la caja en más de 1.5 veces la distancia entre Q3 y Q1 (o rango intercuartílico);
es decir un datos se considera atípico, o extremo, si su valor es menor que Q1 - 1.5 RI, o si es mayor
que Q3 + 1.5 RIQ.

1
2 MEDIDAS DESCRIPTIVAS

2.- Gráficas de tallo y hojas


Es una forma semigráfica de representar una distribución de frecuencias de una variable
numérica.

Vamos a construir un diagrama de tallo y hojas para el siguiente conjunto de 20 puntajes


de ingreso a la universidad:

62 68 72 92 86 76 52 76 82 78 82 74 88 66
58 74 78 84 96 76

Siendo los datos números de dos cifras, vemos que hay datos en los grupos del 50, 60, 70,
80 y 90. El primer dígito de cada dato debe utilizarse como tallo y el segundo como hoja. Se
traza una línea vertical y se colocan los tallos a su izquierda, en columna. Luego se coloca
cada hoja junto a su tallo hasta completar la lectura de todos los datos. La presentación de
tallo y hojas es la siguiente.

Diagrama de tallo y hoja #1


Tallo unidad = 10
Hoja unidad = 1

Frecuencia Tallo Hoja


2 5 28
3 6 268
8 7 24466688
5 8 22468
2 9 26
20

Proporciona una idea de la distribución de la variable en estudio.

Si los datos tuviesen cifras decimales, al construir el diagrama de tallo y hojas, el punto
decimal se pierde por tal razón se acostumbra indicar las unidades que los datos del tallo
representan. Así, si los datos de arriba fuesen decimales 6.2 6.8 ........7.6, debajo del
diagrama se pondría "Unidad = 0.1".

2
3 MEDIDAS DESCRIPTIVAS

3.- Gráficas de puntos


Una gráfica de puntos es aquella donde se marca cada valor de un dato como un punto a lo largo de
una escala de valores. Los puntos que representan valores iguales se apilan.

Gráfico de puntos

8 9 10 11 12 13 14 15 16
Rendimiento - Variedad Kent

You might also like