You are on page 1of 7

Introduccin a la Estadstica.

09/11/11

pg: 1

Nota: En esta breve introduccin no se tratan las medidas de dispersin (varianza, desviacin tpica,), ni la estadstica bidimensional.

Introduccin a la Estadstica para Informtica


ESTUDIO ESTADISTICO El estudio estadstico consiste en obtener conclusiones de un determinado fenmeno investigando en un elevado nmero de casos en los que el fenmeno ha tenido lugar. Nos permitir prever cmo se comporta el fenmeno en el futuro. El estudio estadstico de un fenmeno consta de las siguientes etapas: - Recopilacin de datos - Ordenacin y anlisis de los mismos. - Obtencin de conclusiones. - Decisiones finales. Nos centraremos prioritariamente en la 2 y 3 etapa.

POBLACION Y MUESTRA Poblacin es el conjunto formado por todos los elementos (o individuos) a los que se pretende aplicar el estudio. Muestra es un conjunto reducido de elementos tomados de la poblacin. La muestra debe ser representativa de la poblacin de modo que los elementos heterogneos de sta se encuentren representados en cantidades proporcionales. ej.: Si deseamos conocer la tendencia del voto en unas elecciones, la poblacin sern los ciudadanos con derecho al voto. La muestra puede estar formada por unos 2000 ciudadanos elegidos de una forma representativa; Esto es, no podemos elegirlos en una sola ciudad, ni de una sola condicin social,... Debe tenerse cuidado de que la muestra represente proporcionalmente las diferentes "clases" de la sociedad (desde el punto de vista econmico, geogrfico,...)

ESTADISTICA Estadstica es la ciencia que nos proporciona los mtodos necesarios para realizar el estudio estadstico de un fenmeno. La Estadstica descriptiva estudia la forma de analizar todos los datos de un colectivo, describindola por medio de tablas y grficos y resumindola al mximo por medio de los parmetros estadsticos. La Estadstica inferencial trata de generalizar, para todo un conjunto (poblacin), los

Introduccin a la Estadstica.

09/11/11

pg: 2

resultados obtenidos al estudiar una parte del mismo (muestra)

INDIVIDUO U OBJETO, CARACTER , VARIABLE. Individuo u objeto es cada uno de los elementos de la poblacin. Carcter es la propiedad/es que vamos a estudiar. Variable estadstica son las variables que toman valores para los diferentes individuos, cuantificando los caracteres a estudiar. Las variables estadsticas pueden ser: - Cualitativas si el carcter que estudian no es cuantificable (intencin de voto, predilecciones musicales, de marcas,...) - Cuantitativas continuas si el carcter que estudian puede tomar cualquier valor (p.ej. altura) - Cuantitativas discretas si el carcter que estudian slo puede tomar determinados valores (edad, nmero de vehculos vendidos en un concesionario,...) Ejemplo: Deseamos estudiar los lugares de nacimiento, altura y nmero de hermanos de los alumnos de una clase. La poblacin son los alumnos de la clase. Los caracteres que vamos a estudiar son: lugar de nacimiento, altura y nmero de hermanos. Las variables estadsticas sern: - Lugar de nacimiento: es una variable cualitativa. - Altura: es una variable cuantitativa continua. - N de hermanos: es una variable cuantitativa discreta.

INTERVALOS DE CLASE Se utilizan si la variable es continua o si es discreta con un gran nmero de datos. Son cada uno de los intervalos en los que pueden agruparse los datos que se obtienen en un estudio estadstico. Son de gran ayuda para simplificar la informacin. Intervalos o clases son las divisiones en intervalos del recorrido. Conviene que sus extremos sean nmeros "redondos". Extremos de las clases son los extremos de los intervalos. Marca de clase es un valor representativo de la clase, generalmente el punto medio. Ejemplo: Queremos estudiar la altura de los alumnos de 4 ESO del Instituto. Como es una variable continua definimos los intervalos de clase: El alumno ms bajo mide 143cm. y el ms alto 187cm. Por lo tanto tomaremos intervalos de clase de longitud 10 cm. desde la altura 140cm. hasta 190cm.: [140, 150) cuya marca de clase es 145 [150, 160) cuya marca de clase es 155 [160, 170) cuya marca de clase es 165

Introduccin a la Estadstica.

09/11/11

pg: 3

[170, 180) cuya marca de clase es 175 [180, 190) cuya marca de clase es 185

FRECUENCIA ABSOLUTA Y RELATIVA (f) Frecuencia absoluta de un determinado valor de una variable estadstica es el nmero de veces que se repite dicho valor. (fr) Frecuencia relativa de un determinado valor de una variable estadstica es el cociente que resulta de dividir su frecuencia absoluta por el nmero total de experiencias. (%) Si multiplicamos por 100 cada una de las frecuencias relativas se obtienen los porcentajes. Frecuencias acumuladas de un valor es la suma de todas las frecuencias de los valores menores o iguales que el considerado. La frecuencia absoluta acumulada se denota por F; La frecuencia relativa acumulada se denota por Fr. Ejemplo: Realiza la tabla de frecuencias de las notas de 25 alumnos de una clase: 2,4,6,8,5,7,4,6,8,4,6,10,3,5,6,9,1,2,4,3,5,7,5,8,4. FRECUENCIAS Nota xi
1 2 3 4 5 6 7 8 9 10 SUMA: f. absoluta f.relativa porcentaje

FRECUENCIAS ACUMULADAS %
F. absoluta acumulada Fi F. relativa acumulada Fri

fi

fri

5/25

20

25

100

PRESENTACION DE LOS DATOS: TABLAS Y GRAFICOS Los resultados de un trabajo estadstico pueden presentarse con la ayuda de tablas y grficos. Los grficos permiten ver de un modo rpido y global dicho resultado; las tablas de datos proporcionan el detalle. Las tablas son anlogas a la vista anteriormente. Unicamente cuando los datos estn agrupados por clases en la primera columna se consignarn los intervalos y en la segunda las

Introduccin a la Estadstica.

09/11/11

pg: 4

marcas de clase. Los grficos ms frecuentes son los siguientes: * Diagrama de barras: Son grficos que asignan a cada valor de la variable (eje de abscisas) una barra proporcional a su frecuencia (eje de ordenadas. * Polgono de frecuencias: Es la lnea quebrada que une las frecuencias de cada uno de los valores de la variable. * Histogramas: Son grficos especficos para variables agrupadas por intervalos. Los histogramas asocian a cada intervalo un rectngulo de superficie proporcional a la frecuencia correspondiente. * Poligonal de frecuencias: Es la lnea que une los puntos correspondientes a las frecuencias de cada valor. Si los datos vienen dados en intervalos, unir los puntos correspondientes a las marcas de clase. * Diagrama de sectores: Estos grficos tienen forma circular. En el crculo, cada valor viene representado por un sector circular de una amplitud proporcional a su frecuencia. El ngulo que representa cada valor es proporcional a su frecuencia (i=fri*360)
fi 1 DIAGRAMA DE BARRAS 1 2 2 36 2 5 4 5 4 5 4 3 62 4 71 2 80 3 9 1 2 13 4 5 6 7 8 10 1
N de alumnos

POLGONO DE FRECUENCIAS
6 5 4 3 2 1 0

DIAGRAMA DE SECTORES
9 8 10 1 2 3

7 4 6

9 10

10
5

Variable cuantitativa CONTINUA: Peso Representacin grfica: HISTOGRAMA Peso [40,45) [45,50) [50,55) [55,60) [60,65) [65,70) [70,75) N alumns 1 3 10 9 4 2 1

HISTOGRAMA del peso


10
N de alumnos

0
40 45 50 55 60 65 70 75

Introduccin a la Estadstica.

09/11/11

pg: 5

Ejercicios: 1) Solo para los que conocen los intervalos de confianza (anterior) Se ha aplicado un test de capacidad espacial compuesto de 80 preguntas a un grupo de 100 alumnos, obtenindose los siguientes resultados: a) Forma la tabla de frecuencias: absolutas, relativas y porcentajes. b) Representa el histograma de frecuencias
N respuestas correctas N de alumnos

[0,15) [15,38) [30,45) [45,60) [60,75)

10 30 35 15 10

2) A 1000 alumnos de 4 de ESO se les ha aplicado un test sobre satisfaccin en el colegio y se han obtenido los siguientes resultados: a) Forma la tabla estadstica en la que figuren las frecuencias absoluta, relativa y porcentajes. b) Representa el diagrama de barras y el polgono de frecuencias.

Satisfaccin Gusta mucho Gusta No gusta No gusta nada

N de alumns. 80 440 330 150

3) En una clase de 25 alumnos se ha preguntado por el nmero de hermanos, obtenindose: 0,0,0,0,1,1,1,1,1,1,2,2,2,2,2,2,3,3,3,3,4,4,4,4,5 a) Forma la tabla estadstica en la que figuren las frecuencias absoluta, relativa y porcentajes. b) Representa el diagrama de barras y el de sectores.

Introduccin a la Estadstica.

09/11/11

pg: 6

Parmetros estadsticos
Los parmetros estadsticos son nmeros que describen, de manera concisa (breve y precisa), el comportamiento y las caractersticas generales de un conjunto de datos. Hay dos tipos de parmetros: - Parmetros de centralizacin: Son los que miden la tendencia central de los datos. - Parmetros de dispersin: son los que miden la variacin de los datos.

MEDIDAS DE CENTRALIZACIN
Supongamos que Juan a tenido 4, 8, 6 y 5 en las notas de una evaluacin. Cul es el parmetro que nos describir de forma concisa las notas? Es la llamada media aritmtica: 4 8 6 5 23 x 5,75 4 4

La media aritmtica
Se calcula dividiendo la suma de los valores de todos los datos entre el nmero de ellos. Su frmula es:

x x 2 ... x n x 1 n

abreviadamente: x

x
i 1

Supongamos que tenemos las notas de los 30 alumnos de una clase y queremos calcular la media aritmtica de la clase. Evidentemente no sumaremos los 30 datos, sino que aprovecharemos que estn agrupados por valores:

Si los n datos se agrupan en m valores diferentes, con frecuencia fi cada uno:


x f 1 x1 f 2 x 2 ... f m x m n

abreviadamente: x

f x
i 1 i

n
fi 1 2 2 5 4 4 2 3 1 1 25 xifi 1 4 6 20 20 24 14 24 9 10 132

Ej.: Calcula la nota media de una clase con 25 alumnos que han tenido las xi siguientes notas: 2,4,6,8,5,7,4,6,8,4,6,10,3,5,6,9,1,2,4,3,5,7,5,8,4. 1 2 3 4 11 22 32 45 54 64 72 83 91 101 132 5 5,28 x 6 25 25 7 8 9 10 SUM

Introduccin a la Estadstica.

09/11/11

pg: 7

Si los datos estn agrupados en intervalos, todos los valores de cada intervalo se considera que toman el valor de la marca de clase (valor central del intervalo)

Ej.: Calcula el peso medio de los alumnos cuyos datos aparecen agrupados en la pgina 2. El nmero de alumnos en cada intervalo es el dado a continuacin: 5080 x 169,3 30

Int [140,150) [150,160) [160,170) [170,180) [180,190)

Marca (xi ) 145 155 165 175 185 TOTAL:

fi 2 3 10 10 5 30

xi fi 290 465 1650 1750 925 5080

La moda Es el valor que ms se repite en un conjunto de datos. Si hay dos valores que se repiten con igual frecuencia, la distribucin se dice bimodal.

Ej.: Da un valor de centralizacin para la satisfaccin que muestran los alumnos de 4ESO del ejercicio 2 de la pgina 5. Evidentemente en las variables cualitativas no tiene sentido calcular la media, por lo tanto se da la moda que en este caso es Gusta
xi 1 2 3 4 5 6 7 8 9 10 fi 1 2 2 5 4 4 2 3 1 1 Fi 1 3 5 10 14 18 20 23 24 25

La mediana Es el valor del dato que queda en medio cuando todos los datos se han ordenado de menor a mayor. Si en el conjunto estudiado hay un nmero par de datos, la mediana es la media de los dos valores centrales. Ej.: En las notas de clase anteriores, si ordenamos de menor a mayor las notas, la que queda en medio (la 13) es 4 (basta con ver la fila de Fi , frec. Acumulada)

You might also like