You are on page 1of 21

Roy Jonny Sida Lpez

Universidad Autnoma de Durango


Campus Culiacn
Probabilidad y Estadstica
1










Materia: Anlisis de Datos en la Administracin
(Modulo 1)
Maestra: Informtica Administrativa




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
2
ESTADISTICA
INTRODUCCIN
La mayora de los lectores no estn interesa en ser expertos en el rea de estadstica.Pero cabe preguntarnos entoncespor que
hay que estudiarla. La respuestaes simple y es en base a que los conceptos y las tcnicas de la estadstica se utilizan actualmente
en gran un nmero de ocupaciones. Las ideas estadsticas constituyen una parte integral de las actividades de investigacin, de las
encuestas para recopilar datos y de los anlisis de los datos que se originan en las actividades que desarrollan las instituciones y
organizaciones.

Es posible que una persona no necesite conocer la estadstica sino solo aquello que lo faculte para:
- Saber cuanto se requieren los servicios de un experto.
- Para poderse comunicar eficazmente con lcuando trabajen juntos en la Implementacin, direccin, e interpretacin de los
resultados de una actividad que requiera la metodologa de la estadstica.

El profesional que entienda la estadstica podr leer con mayor inteligencia la literatura que, bajo su campo de accin, va da a da
apareciendo.

La estadstica como rea de las matemticas que se encarga de la recopilacin, organizacin, resumen, anlisis, interpretacin y
comunicacin de informacin numrica, es aplicada en diferentes reas del conocimiento.

Es importante que una vez captada toda la informacin para realizar el estudio se deba efectuar la valoracin (comprobacin)
estadstica. En muchos de los casos el volumen de la informacin es grande o el anlisis a realizar es complejo, en estos casos
conviene que dicha informacin sea procesada y analizada mediante el manejo de computadoras, para lo cual es necesaria la
presencia de paquetes estadsticos.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
3
ESTADSTICA
QUE ES LA ESTADSTICA?
La estadstica se ocupa de los mtodos y procedimientos para recoger, clasificar, resumir, encontrar regularidades y analizar los
datos; as como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular
predicciones.

La estadstica se clasifica en:

ESTADSTICA DESCRIPTIVA.
Parte de la estadstica que se encarga de describir, analizar y representar un grupo de datos utilizando mtodos numricos y
grficos.

ESTADSTICA INFERENCIAL.
Para de la estadstica que se encarga de efectuar estimaciones, decisiones, predicciones u otras generalizaciones sobre un
conjunto mayor de datos apartir de datos muestralesapoyndose en el clculo de probabilidades,

ESTADSTICA
ESTADSTICA DESCRIPTIVA ESTADSTICA INFERENCIAL



Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
4
CONCEPTOS BSICOS
Al igual que en todos los campos del aprendizaje, la estadstica tiene su propio vocabulario. Algunas expresiones frecuentes en el
estudio de la estadstica son nuevas para quienes no han tenido relacin previa con el tema. Otros trminos, aunque parecen
familiares, probablemente tienen significados especializados que difieren del significado asociado por costumbre a dichos
trminos. A continuacin haremos mencin de algunos trminos mayormente utilizados durante el desarrollo del presente.

DATOS.
Los datos son la materia prima de la estadstica. Para este propsito se pueden definir a los datos como nmeros. Las dos clases
de nmeros que se utilizan en estadstica son nmeros que resultan de la toma de medidas, y aquellos que resultan del proceso de
conteo.
Por ejemplo, cuando una enfermera pesa al paciente o le toma la temperatura, se obtiene la medida que consiste en una cantidad,
por ejemplo 50 Kg. o 100 Fahrenheit. Un tipo bastante diferente de nmeros se obtiene cuando el administrador de un hospital
cuenta el nmero de pacientes dados de alta en un da.

VARIABLE.
Una caracterstica se clasifica como variable, tal como se observa, se encuentra que sta toma diferentes valores en diferentes
personas, lugares o cosas. Esto se hace por la simple razn de que la caracterstica no es la misma cuando se observa en
diferentes sujetos.

VARIABLE ALEATORIA.
Cuando los valores que toma la caracterstica se originan como resultado de factores (al azar), es decir, que no pueden predecirse
con exactitud y anticipacin, la variable se llama variable aleatoria.Por ejemplo: Determinar la estatura, el peso o la edad de un
individuo.

VARIABLE CUANTITATIVA.
Es aquella caracterstica que puede medirse en la forma usual. Las mediciones hechas sobre estas variables conllevan informacin
respecto a cantidad.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
5
VARIABLE CUALITATIVA.
Son caractersticas no pueden ser medidas. nicamente se les puede asignar un valor o un orden.

INDIVIDUOS O ELEMENTOS.
Personas u objetos que contienen cierta informacin que se desea estudiar.

POBLACIN.
Conjunto de individuos o elementos que cumplen ciertas propiedades comunes.

MUESTRA.
Subconjunto representativo de una poblacin.

PARMETRO.
Funcin definida sobre los valores numricos de caractersticas, medibles de una poblacin.

ESTADSTICO.
Funcin definida sobre los valores numricos de una muestra.

En relacin al tamao de la poblacin esta puede ser:
Finita:Como es el caso del nmero de personas que llegan al servicio de urgencias de un hospital en un da.
Infinita:Por ejemplo estudiamos el mecanismo aleatorio que describe la secuencia de caras y cruces obtenida en el lanzamiento
repetido de una moneda al aire.

EJEMPLO. Consideremos la poblacin formada por todos los estudiantes de la Universidad Autnoma de Sinaloa (Finita). La altura
media de todos los estudiantes es el parmetro. El conjunto formado por los alumnos de la Facultad de Medicina es una muestra de
dicha poblacin y la altura media de esta muestra, es un estadstico.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
6
DATOS ESTADSTICOS
Los datos estadsticos se obtienen mediante la observacin o medicin de las caractersticas de las unidades elementales de una
muestra. Para seleccionar el procedimiento estadstico a utilizar es necesario conocer que tipo de datos tenemos, estos pueden
ser: continuos, discretos, ordinales (jerarquizados) y nominales (categricos).

Los datos se clasificacin de la siguiente manera.


DATOS NOMINALES.
Los datos nominales comprenden categoras: sexo, color de cabello, etc. Generalmente son representados por una frase o un
enunciado.
DATOS ORDINALES.
Por ultimo los datos ordinales comprenden categoras referentes a evaluaciones subjetivas segn preferencia o logro. Algunos
ejemplos serian: Estado de salud, Nivel socio-econmico, Nivel de Preparacin escolar.
DATOS DISCRETOS.
Una variable discreta es la que puede asumir solo ciertos valores, por lo general enteros. Los datos discretos surgen al contar l
nmero de conceptos que poseen cierta caracterstica.
DATOS CONTINUOS.
Los datos continuos son los que se obtienen al medir con algn instrumento. Son los que provienen de variables continuas tales
como: Estatura, Peso, etc.

DATOS
CUALITATIVOS
NOMINALES ORDINALES
CUANTITATIVOS
DISCRETOS CONTINUOS



Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
7
TRATAMIENTOS DE DATOS.
El tratamiento de datos se realizarse de diversas maneras, dependiendo del tipo y de la cantidad de datos.

DATOS CUALITATIVOS.
Si los datos son cualitativos simplemente se agrupan segn la frecuencia y la proporcin ( porcentaje) de cada categora y se
representan grficamente mediante diagramas circulares y diagramas de barras.

DATOS CUANTITATIVOS.
Si los datos son cuantitativos, dependiendo del tamao de la muestra se tratara en forma agrupada o no.
Si se tienen muchos datos diferentes su distribucin, su frecuencia y graficas resultan muy complicadas y hasta confusas por lo
cual es conveniente agruparlos en clases o intervalos, sin embargo, debe tomarse en cuenta que el agrupamiento siempre significa
perdida de informacin y en consecuencia perdida de exactitud en las medidas obtenidas de las distribuciones o graficas.

Dos importantes caractersticas de los datos son:

El valor central o tpico de conjunto (Es l ms representativo de un conjunto de datos,tambin se le llama promedio). Hay muchos
promedios cada uno de los cuales posee propiedades particulares. A los promedios se les llama MEDIDAS DE TENDENCIA
CENTRAL y los ms frecuentemente encontrados son la Media Aritmtica, la Mediana, y la Moda.

Adems de la tendencia de los valores a agruparse en la cercana de un valor promedio, es necesario saber cuanto se dispersan es
decir si estn uno cerca del otro o alejado; las medidas de este acercamiento o alejamiento se conoce como MEDIDAS DE
VARIABILIDAD O DE DISPERSIN y las mas usadas son: El Rango, laDesviacin Estndar, la Varianza, y el Coeficiente de Variacin.



Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
8
MEDIDAS DE TENDENCIA CENTRAL
(Datos no agrupados)

Una medida de tendencia central es un valor numrico que representa el centrode un conjunto de datos.
Entre las medidas de tendencia central ms utilizadas tenemos:
- La Media Aritmtica
- La Mediana
- La Moda

MEDIA ARITMTICA.
Es la medida de tendencia central mas utilizada en estadstica y es la que se conoce como promedio de las observaciones, sin
embargo, debido a la confusin que hay con l termino promedio los estadsticos la llaman media aritmtica o simplemente
media y es representada por x .La media aritmtica de un conjunto de n observaciones
1 2
, , ,
n
x x x es igual a la suma de las
observaciones divididas entre n. En forma simblica, la media muestral es:
n
x
x
n
i
i
=
=
1


PROPIEDADES DE LA MEDIA.
La media aritmtica tiene ciertas propiedades. Algunas deseables y otras no tanto. Algunas de estas propiedades son las
siguientes:
- Es nica. Para un conjunto de datos existe una y slo una media aritmtica.
- Simplicidad. El clculo y comprensin de la media aritmtica son sencillos.
- Puesto que todos y cada uno de los valores en el conjunto de datos entran en el clculo de la media, sta es afectada por
cada valor. Por lo tanto, es afectada por los valores extremos.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
9
MEDIANA.

La mediana representada por Mees el valor central de un conjunto de datos cuando los valores se encuentran en orden ascendente
y es aquel que divide al conjunto de tal forma que 50% de los valores son menores o iguales que l, y el 50% de los valores son
mayores o iguales que l.Dado que le mediana es un valor posicional (En comparacin con la naturaleza aritmtica de la media) se
ve menos afectadas por valores extremos dentro del grupo, que la media. Esta propiedad de la mediana la convierten en algunos
casos, en una til medida de tendencia central.

Ejemplo:
La mediana de 2, 3, 6, 8, 9, 9, 12 es 8. Si los valores extremos cambian de manera que la serie resulte: 2, 3, 6, 8, 9, 9,26 la mediana
seguir siendo 8 pero la media habr aumentado de 7 a 9.

PROPIEDADES DE LA MEDIANA.
Entre las propiedades de la mediana se encuentran las siguientes:
- Es nica. Al igual que en el caso de la media, existe solamente una mediana para un conjunto de datos.
- Simplicidad. Es muy sencillo calcularla.
- Los valores extremos no tienen efectos importantes sobre la mediana, lo que s ocurre con la media.
- Otra caracterstica til de la mediana es que puede usarse con observaciones ordinales.

MODA.
La moda se denota por Mo y es el valor que con ms frecuencia se presenta en un conjunto de datos. Es muy fcil de determinar,
basta con observar detenidamente el conjunto de datos y ver cual es l mas repetido; sin embargo no es muy til por que puede
ocurrir que una distribucin tenga dos o ms valores que se repitan con la misma frecuencia, en tal caso se obtienen dos o ms
modas. Tambin puede ocurrir que no exista ningn valor que se repita y entonces no habr moda. Por otra parte puede ser un
valor extremo el de mayor frecuencia y difcilmente podr ser considerado una medida de tendencia central.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
10
USO DE LAS MEDIDAS DE TENDENCIA CENTRAL.
Dado un conjunto de observaciones, un investigador puede preguntarse naturalmente que medida de tendencia central es mejor
para utilizar con los datos.
Para la toma de decisin se requieren dos factores: la escala de medicin (ordinal o numrica) y el tipo de distribucin de las
observaciones.
Si hay observaciones distantes slo en una direccin (ya sean unos cuantos valores pequeos o unos cuantos grandes) se dice que
es una distribucin sesgada.
Si los valores distantes son pequeos, la distribucin se sesga a la izquierda o tiene sesgo negativo; si los valores son grandes, la
distribucin se sesga a la derecha o presenta sesgo positivo.
Una distribucin simtrica tiene la misma forma a los dos lados de la media.

Las siguientes reglas ayudan al investigador a decidir la medida de tendencia central que conviene aplicar a determinado conjunto
de datos.

1. La media se usa para datos numricos y distribuciones simtricas (no sesgadas)
2. La mediana se emplea para datos ordinales o numricos con distribucin sesgada.
3. De manera bsica, la moda se usa para distribuciones binomiales

Los puntos siguientes ayudan a conocer la forma de una distribucin sin observarla en realidad.

1. Si la media y la mediana son iguales, la distribucin es simtrica.
2. Si la media es mayor que la mediana, la distribucin est sesgada a la derecha.
3. Si la media es menor que la mediana, la distribucin est sesgada a la izquierda.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
11
MEDIDAS DE VARIABILIDAD
(Datos no agrupados)

Una medida de variabilidad (o dispersin) es un valor numrico que indica la extensin (magnitud) de la separacin entre los
elementos de una muestra o poblacin.

Hay al menos dos razones para medir variabilidad.
1. Para tener una idea de que tan bien un valor centralrepresenta a los datos.
2. Para conocer la magnitud de la variabilidad y as poder tomar medidas para su control.

Comnmente, la variabilidad se expresa como una desviacin promedio de los datos con respecto al centro. Tambin puede
expresarse como la posicin de un dato con respecto a los dems.

Las medidas de dispersin ms utilizadas son:
- El Rango.
- La Varianza.
- La Desviacin Estndar.
- Coeficiente de Variacin.

RANGO (AMPLITUD O RECORRIDO).
El rango es la medida de la distancia total en la escala numrica a lo largo de la cual varan las observaciones y se define como la
diferencia entre la observacin mxima y la mnima ms la unidad de medicin.
max min
R X X U = +

Con el rango no se obtiene una idea clara de la dispersin puesto que varias distribuciones diferentes pueden tener la misma
amplitud o rango.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
12
VARIANZA Y DESVIACIN TPICA (ESTNDAR).
Cuando los valores de un conjunto de observaciones se encuentran ubicados cerca de su media, la dispersin es menor que cuando
estn esparcidos. En consecuencia, se puede pensar intuitivamente que es posibl e medir la dispersin en funcin del esparcimiento
de los valores alrededor de su media. Esta medicin se efecta mediante lo que se conoce como varianza.

VARIANZA.
Para calcular la varianza de una muestra de valores, se resta la media de cada uno de los valores individuales, las diferencias se
elevan al cuadrado y despus se suman entre s. Esta suma se divide entre el tamao de la muestra, menos 1, se denota por S
2
y su
formula de definicin es:
( )

=
n
i
i
x x
n
s
1
2
2
1
1

DESVIACIN ESTNDAR.
La varianza representa unidades al cuadrado, por lo que no es una medida adecuada de dispersin si se pretende expresar este
concepto en trminos de las unidades originales. Para obtener la medida de dispersin en medidas originales, siempre se obtiene la
raz cuadrada de la varianza. El resultado se llama desviacin estndar de una muestra se obtiene mediante la siguiente formula:
( )

= =
n
i
i
x x
n
s s
1
2
2
1
1

La Desviacin estndar de una poblacin finita se obtiene con la raz cuadrada de la cantidad resultante de la ecuacin de la
varianza se denota por S y presenta varias ventajas sobre la varianza, pues sus unidades son las mismas que las observaciones,
mientras que la varianza son unidades fsicas cuadradas. Por otra parte la desviacin estndar es la ms usada en anli sis
estadsticos.
Si la distribucin es aproximadamente normal el intervalo para la media muestral es dado por:
- S X , contiene aproximadamente 68% de las observaciones.
- S X 2 , contiene aproximadamente 95% de las observaciones.
- S X 3 , contiene aproximadamente casi todas las observaciones (99.7%)




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
13
COEFICIENTE DE VARIACIN.
Es una medida de dispersin relativa, pues esta exenta de unidades y se expresa en porcentaje. Se usa para comparar
distribuciones con diferentes unidades o para comparar la dispersin de dos distribuciones diferentes. Su formula es:
100 =
X
S
CV

USO DE LAS MEDIDAS DE DISPERSIN.
Las indicaciones siguientes ayudan a los investigadores a decidir cul medida de dispersin deben usar para un conjunto
determinado de datos.
- La desviacin estndar se emplea cuando tambin es apropiado el uso de la media; es decir con distribuciones simtricas
(no sesgadas) de datos numricos.
- El rango es una medida apropiada para datos numricos cuando el propsito es enfatizar valores extremos.
- El coeficiente de variacin es til cuando la intencin es comparar dos distribuciones numricas medidas en escalas
diferentes.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
14
DATOS AGRUPADOS
Aunque un conjunto de observaciones puede hacerse ms comprensible y ms significativo por medio de un arreglo ordenado, es
ms til el resumen que se obtiene mediante la agrupacin de datos. Antes de la era de las computadoras, uno de los principal es
objetivos de agrupar grandes conjuntos de datos era el de facilitar el clculo de las medidas descriptivas. Debido a que las
computadoras pueden ejecutar esos clculos a partir de grandes conjuntos sin agrupacin previa, actualmente el propsito
principal de agrupar los datos es el de resumir la informacin.

Para agrupar un conjunto de observaciones se debe seleccionar un conjunto de intervalos contiguos que no se traslapen, para que
cada valor en el conjunto de observaciones pueda ser puesto en uno y slo uno de los intervalos. Estos intervalos normalmente se
identifican como intervalos de clase. Una de las consideraciones cuando se agrupan datos es la de cuntos intervalos se deben
incluir. Resulta inadecuado incluir pocos intervalos, porque se perdera informacin. Por otro lado, si se utilizan muchos
intervalos, el objetivo de resumir no se consigue. Una regla emprica que habitualmente se sigue establece que deben ser entre 6 y
15 intervalos.

Quienes deseen guas ms especficas para decidir cuntos intervalos de clase son necesarios, pueden utilizar la frmula
propuesta por Sturges. Esta frmula se enuncia como: k = 1+3.322 (log
10
n), donde k es el nmero de intervalos de clase y n es el
nmero de valores en el conjunto de datos en observacin. La respuesta que se obtiene no es definitiva, nicamente se considera
como gua.
Otra pregunta que se debe responder se refiere a la amplitud del intervalo de clase. Los intervalos de clase generalmente deben
ser de la misma amplitud, aunque algunas veces esto es imposible. La amplitud se determina dividiendo el rango entre k, que es el
nmero de intervalos de clase. Simblicamente, la amplitud de los intervalos de clase est dada por:
k
R
C =

Por lo general, con este procedimiento se obtiene una amplitud que no es conveniente usar, y de nuevo se debe utilizar el sentido
comn para elegir la amplitud.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
15
TABLAS DE FRECUENCIAS
Para construir tablas de frecuencias adems de los principios generales expuestos anteriormente debemos seguir las siguientes
reglas:

1. El primer intervalo o clase debe contener la observacin mnima y el ltimo la mxima.

2. Los intervalos deben ser mutuamente exclusivos; es decir, cada observacin debe quedar exactamente en una sola clase,
no en dos al mismo tiempo.

3. Los intervalos debern ser exhaustivos en cuanto a los datos; es decir, cada observacin deber quedar en alguna clase
(no deben quedar datos por fuera).

4. Todos los intervalos debern tener la misma longitud o amplitud, de ser posibles.

5. Los intervalos se escogern de manera que los centros de clase o marcas de clase correspondan a nmeros con pocos
dgitos decimales diferentes de cero.

6. Mientras menos clases escojamos ser ms fcil el trabajo, pero se perder ms informacin.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
16
Ejemplo:Para el siguiente conjunto de datos,Construir una tabla de frecuencia con 8 clases que contenga: lmites, centro de clase
(marca de clase), frecuencias, frecuencias acumuladas y % de frecuencias acumuladas o porcentaje acumulado.

12.8 10.8 14.0 14.1 11.1 13.7 14.0 11.7 14.0 12.8
16.3 14.0 13.2 13.7 13.6 14.3 13.7 14.0 10.1 13.7
11.2 11.5 13.4 13.9 11.4 10.1 12.0 12.0 12.9 14.2
Primero buscamos la amplitud o rango, restando la observacin mnima de la mxima:
16.3 10.1 0.1 6.3 R = + =
Como se nos indican 8 clases, dividimos el rango 6.3por 8 para conocer la amplitud de cada clase:
6.3
0.7875 8
8
C = = ~

Como la primera clase debe contener la menor de las observaciones, comenzamos con: (10.0, 10.8] y adems como todas deben
tener la misma amplitud y ser mutuamente exclusivas, la segunda clase ser (10.8, 11.6], para garantizar que 10.8 estar en la
primera clase pero no en la segunda. As continuamos construyendo las clases hasta que la ltima (octava) contenga la mayor de
las observaciones, 16.3. As tenemos que:
Lmite
de clase
Marca
de clase
Frec.
f
Frec. Acum.
F
% F
(10.0, 10.8]
(10.8, 11.6]
(11.6, 12.4]
(12.4, 13.2]
(13.2, 14.0]
(14.0, 14.8]
(14.8, 15.6]
(15.6, 16.4]
10.4
11.2
12.0
12.8
13.6
14.4
15.2
16.0
3
4
3
4
11
4
0
1
3
7
10
14
25
29
29
30
10.00
23.33
33.33
46.67
83.33
96.67
96.67
100.00
C = 0.8 30





Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
17
MEDIDAS DE TENDENCIA CENTRAL
(Datos agrupados)
MEDIA ARITMTICA.
Debido a que los valores individuales de la muestra se pierden al agruparse, para calcular las medidas de tendencia central y las
de dispersiones se utilizan las marcas de clase o centros de clase como representantes de clase. En consecuencia, si m
i
es el
centro de clase y f
i
es la frecuencia de clase para la clase i-esima, la media aritmtica puede definirse como:
n
m f
x
k
i
i i
=
=
1

Donde k es el nmero de clases.

Ejemplo: La media aritmtica para el ejemplo anterior es:
Marcade clase m
i
Frec.f
i
f
i
m
i

10.4
11.2
12.0
12.8
13.6
14.4
15.2
16.0
3
4
3
4
11
4
0
1
31.20
44.80
36.00
51.20
149.60
57.60
0.00
16.00
n = 30 386.40

88 12
30
40 386
.
.
x = =





Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
18
MEDIANA.
Para determinar la mediana Mdprimero se determina la clase mediana(Clase que contiene al dato central) y para determinarla
utilizamos la frmula:
2 n F
Md LRI c
f
| |
= +
|
\ .

Donde: LRI=Limite real inferior
= Limite Inferior (Unidad de Medicin)
n = Tamao de la muestra
F = Frecuencia acumulada de la clase anterior a la clase mediana.
f = Frecuencia de la clase mediana.
C =Amplitud de la clase.
Ejemplo: Para nuestro ejemplo
( )
30 2 14
13.2 0.8 13.27
11
Md

| |
= + =
|
\ .

MODA.
Para determinar la moda primero se determina la clase modal (clase con mayor frecuencia absoluta) y para determinarla
utilizamos la frmula:
c LRI M
(

A + A
A
+ =
2 1
1

Donde: LRI = Limite real inferior
= Limite Inferior (Unidad de Medicin)
1
A = Diferencia entre la frecuencia de la clase modal y la anterior.
2
A = Diferencia entre la frecuencia de la clase modal y la posterior.
C = Amplitud de la clase.
Para nuestro ejemplo:
60 . 13 8 . 0
7 7
7
2 . 13 =
(

+
+ = M





Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
19
MEDIDAS DE DISPERSIN
(Datos agrupados)
VARIANZA Y DESVIACIN ESTNDAR.
La varianza muestral para datos agrupados se define mediante la frmula.
( )
1
2
1
2
2

=

=
n
x n m f
S
k
i
i i

Donde k es el nmero de clases.

Ejemplo: Para nuestro ejemplo:
Marcade clase m
i
Frec.f
i
f
i
m
i
2

10.4
11.2
12.0
12.8
13.6
14.4
15.2
16.0
3
4
3
4
11
4
0
1
324.48
501.76
432.00
655.36
2034.56
829.44
0
256.00
n = 30 5033.60

La varianza es:
( )( )
96 1
29
88 12 30 60 5033
2
2
.
. .
S =

=

Y la desviacin estndar es:
40 1 96 1 . . S = =





Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
20
ORGANIZACIN Y REPORTE DE DATOS
(TABLAS Y GRAFICAS)

Los datos tal como se obtienen de una investigacin estn en forma desordenada por lo que es difcil su interpretacin en un
anlisis. Debido a esto se deben organizar en forma de tablas y graficas para permitir una visualizacin clara y rpida de todo el
conjunto.

1. PRINCIPIOS GENERALES SOBRE LA CONSTRUCCIN DE TABLAS
2. Las tablas se explicaran por si mismas, se ha de dar suficiente informacin en l titulo y en los encabezados de las
columnas para permitir que el lector identifique claramente su contenido.
3. Cada variable numrica debe contener sus unidades.
4. La funcin del rayado debe ser: Dar claridad de interpretacin, debe evitarse el rayado excesivo e innecesario.
5. No se debe incluir demasiada informacin en una sola tabla.
6. Las anotaciones numricas de cero se deben escribir explcitamente en vez de usar un guin; ya que este se usara para
indicar datos que faltan o que no se han observado.
7. Una anotacin numrica no debe de iniciar con punto decimal.
8. Los numero que indican valores de una misma caracterstica se han de dar con el mismos nmeros de cifras decimales.

PRINCIPIOS GENERALES SOBRE LA CONSTRUCCIN DE GRAFICAS
1. Han de explicarse enteramente por s mismas.
2. Las escalas vertical (ordenadas) y horizontal (abscisas) estarn rotuladas con claridad dando las unidades y con los
mismos intervalos para las ordenadas y abscisas respectivamente.
3. No se debe abarcar demasiada informacin en un solo grafico. Es mejor hacer varios grficos que comprimir demasiada
informacin en uno solo
4. La finalidad de las graficas es dar una visin general y no una imagen detallada de un conjunto de datos.
5. Debe evitarse la inclusin de nmeros dentro del cuerpo de la grafica.




Roy Jonny Sida Lpez


Universidad Autnoma de Durango
Campus Culiacn
Probabilidad y Estadstica
21
USO DE LOS GRFICOS
Para variables categricas, como sexo, estado civil, profesin, etc., se quiere conocer la frecuencia el porcentaje del total de
casos que "caen" en cada categora. Una forma muy sencilla de representar grficamente estos resultados es mediante diagramas
de barras o diagramas de sectores. En los grficos de sectores, tambin conocidos como diagramas de pastel, se divide un crculo
en tantas porciones como clases tenga la variable, de modo que a cada clase le corresponde un arco de crculo proporcional a su
frecuencia absoluta o relativa.

Si el nmero de categoras es excesivamente grande, la imagen proporcionada por el grfico de sectores no es lo suficientemente
clara y por lo tanto la situacin ideal es cuando hay pocas categoras. En este caso se pueden apreciar con claridad dichos
subgrupos.

Los diagramas de barras son similares a los grficos de sectores. Se representan tantas barras como categoras tiene la variable,
de modo que la altura de cada una de ellas sea proporcional a la frecuencia porcentaje de casos en cada clase, estos grficos
pueden utilizarse tambin para describir variables numricas discretas que toman pocos valores (nmero de hijos, nmero de
recibidos, etc.).

Para variables numricas continuas, tales como la edad, la tensin arterial o el ndice de masa corporal, el tipo de grfico ms
utilizado es el histograma. Para construir un grfico de este tipo, se divide el rango de valores de la variable en intervalos de i gual
amplitud, representando sobre cada intervalo un rectngulo que tiene a este segmento como base. El criterio para calcular la
altura de cada rectngulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de los datos en cada
intervalo y el rea de los rectngulos. Uniendo los puntos medios del extremo superior de las barras del histograma, se obtiene
una imagen que se llama polgono de frecuencias. Dicha figura pretende mostrar, de la forma ms simple, en qu rangos se
encuentra la mayor parte de los datos.

Los grficos de lneas pueden resultar tambin especialmente interesantes, sobre todo cuando interesa estudiar tendencias a lo
largo del tiempo. No son ms que una serie de puntos conectados entre s mediante rectas, donde cada punto puede representar
distintas cosas segn lo que nos interese en cada momento (el valor medio de una variable, porcentaje de casos en una categora,
el valor mximo en cada grupo, etc.).

You might also like