You are on page 1of 15

Unidad 2.

Representacin numrica y grfica de datos Presentacin de la unidad En la unidad anterior, conociste las dos grandes divisiones de la estadstica: la que se dedica a la recoleccin, presentacin y categorizacin de datos, llamada estadstica descriptiva y la que se dedica a realizar hiptesis con base en dichos datos, la inferencial. Tambin aprendiste a determinar el espacio de estudio (es decir, la poblacin) y las variables que se van a estudiar de acuerdo al problema planteado. En esta unidad estudiars la estadstica descriptiva y aprenders cmo organizar y presentar los datos obtenidos mediante el muestreo en poblaciones. Cuando se realiza un trabajo que requiere a la estadstica, se disean instrumentos para obtener los datos deseados. Existen muchos mtodos para recolectar informacin, pero los ms frecuentes son:

Otra de las tcnicas ms recurridas en estadstica para recolectar informacin son los experimentos, revisa en qu consisten.

Un experimento es una prueba que se realiza para determinar las caractersticas o comportamientos de una cosa. Por ejemplo, experimentar mediante el sentido del gusto, qu alimentos te parecen ms salados. Tambin, experimento se define como el proceso que se realiza para verificar una serie de hiptesis relacionadas con un determinado fenmeno, en el cual se determinan las caractersticas o comportamientos del fenmeno que se analiza. Por ejemplo, un experimento para determinar la velocidad de la luz en el vaco. La diferencia entre la primera y la segunda definicin es que en la segunda se parte de una hiptesis mientras que en la primera no necesariamente. En el primer ejemplo, experimentas los sabores de los alimentos sin antes predecir cul ser ms salado. En el segundo ejemplo, la hiptesis, a partir de estudios anteriores, es que la velocidad de la luz en el vaco es de 300 000 km/seg. Por lo tanto, el experimento verifica si esta hiptesis es cierta o no y en l cabe un margen de error experimental. Los datos que se recopilan, usando alguna tcnica de las que acabamos de describir u otra, son organizados de acuerdo a los parmetros de la estadstica descriptiva que estudiars en esta unidad. Propsitos de la unidad En esta unidad: Identificars algunos conceptos que se utilizan en estadstica descriptiva. Organizars datos en diferentes tipos de tablas y elaborars varios tipos de grficas. Competencia especfica Utiliza las tcnicas de representacin numrica y grfica para representar informacin a travs de la organizacin de los datos obtenidos de una muestra o poblacin. 2.1. Organizacin de datos y distribucin de frecuencias Introduccin La descripcin estadstica organiza los datos y los presenta en forma de tablas y grficas. Esta rea slo describe, resume, organiza y representa los datos obtenidos de una poblacin o muestra de la poblacin, sin elaborar inferencias ni obtener conclusiones. La organizacin de datos se realiza a travs de tablas que se utilizan para simplificar la presentacin y distribucin de estos datos.

A continuacin, conocers que existen diferentes tipos de presentacin de datos y con base en ellos, distintas clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta. Actividad 1: Datos agrupados y datos no agrupados Antes de comenzar con el tema de tablas de datos, realiza la siguiente actividad: Organzate junto con tus compaeros(as) de grupo, en un equipo de 6 integrantes y nombren un responsable del mismo. De manera individual, investiga en fuentes confiables qu son los datos agrupados y lo datos no agrupados. Comparte la informacin con el resto del equipo. De manera grupal, elaboren un resumen donde expliquen en qu consisten estos tipos de datos incluyendo, por lo menos, dos ejemplos para cada uno; y publquenlo en la wiki Datos agrupados y datos no agrupados. Nota: No olviden incluir el nombre de todos los integrantes del equipo y las fuentes de donde obtuvieron la informacin. Para ingresar a la wiki: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 1: Datos agrupados y no agrupados. 2.1.1. Frecuencias Antes de comenzar con el tema, es importante que consideres lo siguiente:

Frecuencia o Frecuencia absoluta La frecuencia o frecuencia absoluta es el nmero de veces que se repite un valor dentro de un conjunto de datos, se denota como fi. Por ejemplo, supongamos que tienes la siguiente serie de datos: 3, 2, 5, 7, 3, 7, 7, 5, 2, 7, 3. Si los organizas en una tabla, tendras:

Dato 2 3 5 7 Total de datos (N)

Frecuencia 2 (porque se repite 2 veces) 3 (porque se repite 3 veces) 2 (porque se repite 2 veces) 4 (porque se repite 4 veces) 11

Frecuencia absoluta acumulada La frecuencia absoluta acumulada es la suma de las frecuencias de las variables hasta el rengln i, se representa como Fi. Tambin es conocida como frecuencia acumulada. Siguiendo con el ejemplo anterior: Dato 2 3 5 7 Total de datos (N) Frecuencia 2 3 2 4 11 Frecuencia acumulada 2 (hasta aqu tienes 2 datos 5 (la suma de la frecuencia del primer dato con la del segundo dato 2+3) 7 (frecuencia de 2+frecuencia de 3+frecuencia de 5) 11 (frecuencia de 2+frecuencia de 3+frecuencia de 5 frecuencia de 7)

La frecuencia relativa acumulada es la suma de las frecuencias relativas hasta el rengln i. Se representa como Hi, observa el ejemplo: Dato Frecuencia relativa acumulada 2 0.1818 (hasta este rengln slo tienes esta frecuencia relativa) 3 0.4545 (se suma la frecuencia relativa del primer dato con la del segundo dato 0.1818+0.2727) 5 0.6363 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5) 7 0.9999 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5+la frecuencia relativa de 7) Total de datos (N) Frecuencia Frecuencia acumulada 2 Frecuencia relativa 0.1818

0.2727

0.1818

11

0.3636

11

Ejemplo de organizacin de frecuencias En la siguiente pantalla observars una tabla con la organizacin de frecuencias, los datos presentados son los siguientes: 18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23. No. rengl n 1 2 Datos obtenid os de la variable 7 18 Frecuenc ia fi Frecuencia acumulada Fi Otra forma para obtener Fi f1 = F1=2 F1+f2=F2=8 Frecuencia relativa hi Frecuenci a relativa acumulad a Hi h1=H1=0. 0625 h1+h2=H2 = 0.2500 h1+h2+h3 = H3=0.500 0 h1+h2+h3 +h4 =H4=0.62 50 h1+h2+h3 + h4+h5=H5 =0.8430 h1+h2+h3 + h4+h5+h6 = H6=1.000 0

f1= 2 f2= 6

f1=F1= 2 f1+f2= F2= 8

h1=f1/N=0.0625 h2=f2/N=0.1875

23

f3= 8

f1+f2+f3= F3=16

F2+f3=F3=16

h3=f3/N=0.2500

41

f4= 4

f1+f2+f3+f4= F4=20

F3+f4=F4=20

h4=f4/N=0.1250

47

f5= 7

f1+f2+f3+f4+f5= F5=27

F4+f5=F5=27

h5=f5/N=0.2187

52

f6= 5

f1+f2+f3+f4+f5+ f6= F6=32

F5+f6=F6=32

h6=f6/N=0.1563

Total

N=32

1.0000

Actividad 2: Frecuencias Descarga el archivo Frecuencias y resuelve el problema que se te presenta. Guarda tu archivo como EB_U2_FR_XXYZ y comprtelo en la base de datos con el resto de tus compaeros(as). Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB.

En la entrada que agregues, escribe tus dudas o dificultades al momento de realizar la tabla. Revisa las entradas de tus compaeros(as) y comntalas tratando de complementar la informacin o de resolver sus inquietudes. Compara tus tablas con las de tus compaeros(as). Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 2: Frecuencias. Da clic en el icono para descargar el documento. EB_U2_Frecuencias.doc Es importante que realices esta actividad porque la ocupars ms adelante. 2.1.2. Intervalos Otro concepto muy utilizado en estadstica descriptiva es el de intervalo. Conoce qu es y los dems conceptos asociados. Intervalos Conjunto de valores agrupados entre dos nmeros, conocidos como lmites, en este caso, lmites del intervalo. Intervalo de clase Se llama intervalo de clase a la expresin que denota un intervalo. Amplitud del intervalo La amplitud del intervalo es la distancia que hay entre los lmites superior e inferior del intervalo. Se calcula restando el valor del lmite inferior al valor del lmite superior. Frontera de clase Son los puntos medios entre los lmites de intervalos consecutivos. Las fronteras de clase se utilizan para recuperar los datos entre el lmite superior de un intervalo y el lmite inferior del siguiente. Marca de clase Tambin conocida como punto medio de clase, es el resultado de la suma de los lmites inferior y superior del intervalo, dividido entre dos. Ejemplo de intervalos Observa cmo se representan los conceptos relacionados con los intervalos, coloca el cursor sobre las palabras resaltadas. Dados los nmeros 15 y 25, tendras que: El intervalo corresponde a todos los nmeros que se encuentran entre 15 y 25. El intervalo de clase sera: 15-25 Los lmites del intervalo son: Lmite inferior=15

Lmite superior=25 La amplitud del intervalo 15-25 sera: 25 menos 15, es decir, 10. Es recomendable que todos los intervalos tengan la misma amplitud, por lo que se puede restar el dato menor al dato mayor y dividir el resultado entre el nmero de intervalos. La frontera de clase: dados los intervalos 4-14, 15-25 y 26-36, las fronteras de clase seran: 3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por ltimo, 25.5 y 36.5 para el tercer intervalo. La marca de clase del intervalo 15-25 es igual a: 15+25=40/2=20. Es recomendable que la marca del intervalo coincida con alguno de los datos, aunque esto no es necesario ni siempre se logra; sobre todo cuando los intervalos tienen la misma amplitud. 2.1.3. Construccin de intervalos de clase La formacin de clases o intervalos de clase, que se representa con (k), depende, generalmente, del tamao del rango de la poblacin o muestra. Lo que se debe hacer para determinar los intervalos de clase es lo siguiente. Paso 1. Calcular el rango Se identifica el nmero mayor (Xn) y el nmero menor (X1) en los datos. El rango es el resultado de restar el nmero menor al nmero mayor; esto es: 240 R= Xn X1 Por ejemplo: Para una serie de datos que van desde el 18 hasta el 56,se tiene lo siguiente: Xn= 56 X1= 18 por lo tanto, R= Xn X1= 56 18= 38 Paso 2. Determinar el nmero de intervalos que se desea tener No existe una regla para determinar el nmero de intervalos, pero generalmente se suelen crear entre 5 y 20 intervalos. La decisin la toma el investigador. Siguiendo con el ejemplo, se van a construir 7 intervalos. Entonces k= 7 Paso 3. Dividir el rango entre el nmero de intervalos que se desea tener Recuerda que es recomendable elegir un nmero entre 5 y 20 para los intervalos y dividir el rango entre el nmero deseado de intervalos. Siguiendo con el ejemplo: Si son 7 intervalos 38/7 = 5.428

sta ser la amplitud de los intervalos. Cuando no es un nmero entero, se escoge el entero sin decimales. Paso 4. Formacin de intervalos: Los intervalos se forman comenzando un nmero antes del primer dato. Intervalos: 17 a 22 (se cuenta 5 desde 18 hasta 22) 23 a 28 (el siguiente intervalo comienza a partir del lmite superior del intervalo anterior) 29 a 34 35 a 40 41 a 46 47 a 52 53 a 58

Nota. No importa que el ltimo intervalo exceda el ltimo dato. Ejemplo de construccin de intervalos El director de una consultora en desarrollo de software desea conocer el nmero de incidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Para ello registra los siguientes datos: 35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28, 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20. Observa cada paso: Calcular el rango: R=XnX1=60-20=40 Determinar el nmero de intervalos entre 5 y 20: Elegir 8 intervalos. Dividir el rango entre el nmero de intervalos: 40/8=5 Se forman los intervalos: Comenzar por un nmero anterior al lmite inferior: 1924, 25-30, 31-36, 37-42, 43-48, 49-54, 55-60 Revisa el video Construccin de intervalos que se encuentra en la seccin Material de apoyo. Actividad 3: Intervalos Descarga el archivo Intervalos y resuelve el problema elaborando los intervalos de clase de los datos que se presentan y la tabla de frecuencias correspondiente. Guarda tu documento como EB_U2_IN_XXYZ, en formato Word 97-2003, y envaselo al (a la) Facilitador(a). Sustituye las XX por las dos primeras letras de tu

primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB. Para enviar tu documento: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 3: Intervalos. Da clic en el icono para descargar el documento. EB_U2_Intervalos.doc Es importante que elabores esta actividad porque la ocupars para realizar las actividades siguientes. 2.1.4. Tablas de datos Existen diferentes tipos de tablas para presentar datos, las ms utilizadas son: Tabla de datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. Conoce en qu consiste cada una: Tablas de datos Una tabla de datos es la forma ms sencilla de organizar un conjunto de datos y se utiliza cuando la informacin que necesitas son los datos mismos. Se organizan en columnas o renglones y se registran las mediciones o datos obtenidos. Ejemplo: Imagina que la medicin de temperatura a lo largo del da da como resultado los siguientes valores (en grados Celsius): 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7

A partir de estos valores construyes la siguiente tabla:

2.1.5. Tablas de frecuencias Las tablas de frecuencia aportan mayor informacin que las tablas de datos, ya que estn construidas con las categoras de la variable que se est midiendo y su frecuencia. Ejemplo: Un experimento da como resultado los siguientes valores: 1, 2, 2, 2, 1, 1, 5, 4, 3, 2, 2, 1, 3, 4, 5, 6, 2, 3, 4, 5, 5, 4, 3, 3, 2 Si agrupas los datos por categoras, segn la frecuencia o nmero de veces que aparece cada dato, tendras la siguiente tabla:

Las tablas de frecuencias pueden construirse anexando las columnas correspondientes a la frecuencia acumulada, la frecuencia relativa y frecuencia relativa acumulada. 2.1.6. Tablas por intervalos de clase En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores correspondientes a cada variable. Ejemplo: En una encuesta sobre el desempleo en el rea metropolitana de la ciudad de Mxico, se organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de cada intervalo, teniendo un total de 23,700 desempleados.

2.1.7. Tablas de doble entrada Estas tablas proporcionan informacin referente a dos variables o eventos relacionados entre s. La informacin se distribuye poniendo en los renglones de la tabla la informacin de una de las variables y en las columnas la informacin de la otra variable. Ejemplo: Se cuenta el nmero de cirugas realizadas por edades en una muestra de 100 personas, los resultados son los siguientes:

En el ejemplo las variables relacionadas son la edad y el nmero de cirugas. Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables relacionadas son los rangos contra el valor de las variables en dicho rango. Por ejemplo, imagina que mides la temperatura de un lquido con respecto al tiempo de calentamiento. En el rengln colocas los tiempos y en las columnas la temperatura obtenida. Puedes considerar la tabla como una tabla de frecuencias o como una tabla de doble entrada:

2.2. Representacin grfica de los datos Introduccin El tema anterior present diferentes formas de organizar o de tabular datos y la distribucin de frecuencias. Ahora estudiars la representacin grfica de los datos. Las grficas son representaciones visuales de los datos que se muestran en una tabla. Existen diferentes tipos de grficas, cada una de ellas se elabora con base en el tipo de informacin que se quiere representar.

2.2.1. Histograma El histograma es la representacin grfica de una variable continua. Se elabora en un sistema de coordenadas rectangulares. El eje horizontal se utiliza para representar la variable independiente, es decir, la escala de medicin o fronteras de clase. El eje vertical representa la escala de frecuencias. Si los intervalos de clase tienen el mismo ancho, las alturas de las barras sern proporcionales a las frecuencias. El histograma permite apreciar visualmente la distribucin y dispersin de las mediciones. 2.2.2. Grfica de barras Este tipo de grfica se utiliza para datos de tipo ordinal, nominal y discreto. En stas se muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por el rea de la barra. Esta grfica muestra las discontinuidades en las mediciones por medio de espacios vacios entre las barras. La grfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

Un histograma y una grfica de barras son muy semejantes, la diferencia radica en que el histograma no presenta separacin entre las barras. 2.2.3. Grfica de lneas Una grfica de lneas tambin se construye en un sistema coordenado rectangular y muestra la relacin entre las variables mediante puntos conectados por lneas continuas. La frecuencia de cada valor medido es representada por la altura del punto.

En el eje horizontal se representa la variable y en el eje vertical, la frecuencia. Se determinan los puntos de corte del valor de la variable con su frecuencia y se unen, obtenindose la grfica de lnea.

2.2.4. Grfica de reas o de pastel Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. Esta grfica muestra la relacin entre las variables dividiendo un crculo (o pastel) en sectores (o rebanadas). Tambin, se utilizan para representar la distribucin de frecuencias, pero es el rea de cada sector la proporcional a los valores medidos. Para trazar la grfica, se hace una distribucin proporcional de las frecuencias del problema con respecto a la circunferencia, determinando sectores circulares para cada categora. Medicin en cm 30 30.1 30.2 30.3 30.4. 30.5 30.6 30.7 30.8 30.9 Frecuencia Frecuencia acumulada 3 3 7 10 12 22 18 40 23 63 21 84 17 101 11 112 5 117 1 118 Porcentaje 3% 6% 10% 15% 19% 18% 14% 9% 4% 1%

Histograma En esta figura se muestra el histograma de las mediciones en cm vs la frecuencia, nota como el ancho de las clases es el mismo.

2.2.4. Grfica de reas o de pastel Grfica de pastel En la grfica de pastel se muestra dentro de cada rebanada la medicin en cm y el porcentaje que corresponde a la frecuencia relativa.

Grfica de lnea En esta figura se muestra la frecuencia acumulada mediante una grfica de lnea.

Actividad 4: Grficas Los parmetros que has visto hasta aqu, la organizacin numrica de los datos en tablas y las representaciones grficas de stas, pueden ser realizados de forma manual, pero existen programas informticos como Excel, software libre y programas especializados para estadstica, que permiten realizar todos estos trabajos. Realiza la siguiente actividad: 1. Retoma los problemas que realizaste en la Actividad 2: Frecuencias, con los datos de la tabla elabora las grficas que revisaste en este tema e inclyelas en el mismo documento. 2. Entra a la base de datos "Grficas" y publica tu archivo con la nomenclatura EB_U2_GR_XXYZ. Sustituye las XX por las dos primeras letras de tu primer nombre, la Y por la inicial de tu apellido paterno y la Z por la inicial de tu apellido materno. Revisa que el peso de tu archivo no sea mayor a 4 MB. 3. Comparte con tus compaeros(as) el procedimiento que seguiste para graficar los datos del problema, si utilizaste algn software comenta cul. Agrega una conclusin sobre la utilidad de la representacin grfica de datos. 4. Consulta las aportaciones de tus compaeros(as) y comntalas, tratando de complementar las ideas que exponen y tus propias ideas. Para ingresar a la actividad: En la ruta (parte superior izquierda del aula) da clic en Estadstica. Se enlistarn las actividades, da clic en la Actividad 4: Grficas.

You might also like