You are on page 1of 8

ESTADSTICA DESCRIPTIVA

Estadstica Descriptiva se refiere a la recoleccin, presentacin, descripcin,


anlisis e interpretacin de una coleccin de datos, esencialmente consiste en
resumir stos con uno o dos elementos de informacin (medidas descriptivas) que
caracterizan la totalidad de los mismos. La estadstica Descriptiva es el mtodo de
obtener de un conjunto de datos conclusiones sobre si mismos y no sobrepasan el
conocimiento proporcionado por stos. Puede utilizarse para resumir o describir
cualquier conjunto ya sea que se trate de una poblacin o de una muestra, cuando
en la etapa preliminar de la Inferencia Estadstica se conocen los elementos de
una muestra.
CONCEPTOS BSICOS DE ESTADSTICA:
o ESTADSTICA: Es el conjunto de procedimientos y tcnicas
empleadas para recolectar, organizar y analizar datos, los cuales
sirven de base para tomar decisiones en las situaciones de
incertidumbre que plantean las ciencias sociales o naturales.

o TEORA DE DECISIN: La estadstica trata de las tcnicas para
recolectar, organizar, presentar, analizar un conjunto de datos
Numricos y a partir de ellos y de un marco terico, hacer las
indiferencias de lugar. Es una herramienta Fundamental para la
investigacin cientfica y emprica en los campos de la
administracin, educacin, Sociologa, psicologa, medicina,
gentica, informtica, ingeniera, contabilidad, economa, agricultura,
etc. Se consagra en forma directa al gran problema universal de
como tomar las decisiones inteligentes y acertadas en condiciones
de incertidumbre. Sirve como fuente de instruccin para los niveles
introductorias de Estadstica descriptiva y por consiguiente, los
conceptos manejados y las tcnicas empleadas han sido
presentadas de la forma mas simple, claramente posibles.

o POBLACIN: Una poblacin se precisa como un conjunto finito o
infinito de personas u objetos que presentan caractersticas
comunes.
"Una poblacin es un conjunto de todos los elementos que estamos
estudiando, acerca de los cuales intentamos sacar conclusiones".
Levin & Rubin (1996).
"Una poblacin es un conjunto de elementos que presentan una
caracterstica comn". Cadenas (1974).
o MUESTRA ALEATORIA: Es muestra elegida independientemente de
todas las dems, con la misma probabilidad que cualquier otra y
cuyos elementos estn elegidos independientemente unos de otros y
con la misma probabilidad.

o PARMETROS ALEATORIOS: Se denominan variables aleatorias a
las caractersticas o atributos de seres u objetos que observamos y
medimos. El sexo de los animales, la altura de los rboles, el tiempo
que est en actividad cada da un determinado insecto o el peso de
los huevos de estornino, son variables que podemos cuantificar. Se
denominan variables porque cambian de valor y aleatorias porque su
valor depende del azar, es impredecible. Las variables aleatorias
pueden ser discretas y continuas.
Las variables aleatorias que corresponde a una poblacin se
denominan Parmetros.

DESCRIPCIONES DE DATOS
o DATOS AGRUPADOS Y NO AGRUPADOS
Datos Agrupados:
Medidas de dispersin: Se llaman medidas de
dispersin aquellas que permiten retratar la distancia
de los valores de la variable a un cierto valor central, o
que permiten identificar la concentracin de los datos
en un cierto sector del recorrido de la variable. Se trata
de coeficiente para variables cuantitativas.
Medidas de tendencia central: La estadstica busca
entre otras cosas, describir las caractersticas tpicas
de conjuntos de datos y, como hay varias formas de
hacerlo, existen y se utilizan varios tipos de promedios.
Se les llama medidas de tendencia central porque
general mente la acumulacin ms alta de datos se
encuentra en los valores intermedios.
Datos no Agrupados:
Tendencia central: la tendencia central se refiere al
punto medio de una distribucin. Las medidas de
tendencia central se conocen como medidas de
posicin.
Dispersin: se refiere a la extensin de los datos en
una distribucin, es decir, al grado en que las
observaciones se distribuyen.
o FRECUENCIA DE CLASE: La frecuencia de clase se le denomina
frecuencia absoluta y se le designa con las letras fi. Es el nmero
total de valores de las variables que se encuentran presente en una
clase determinada, de una distribucin de frecuencia de clase. La
suma de las frecuencias absolutas es igual al nmero total de datos,
que se representa por N.

o FRECUENCIA RELATIVA: La frecuencia relativa es el cociente entre
la frecuencia absoluta de un determinado valor y el nmero total de
datos. La frecuencia relativa se puede expresar en tantos por ciento
y se representa por ni.

o PUNTO MEDIO: Marca de Clase es el punto medio del intervalo de
clase, se recomienda observar que los puntos medios coincidan con
los datos observados para minimizar el error.

o LMITES: Son los valores extremos que tiene el intervalo de clase,
inferior y superior, entre los cuales van a estar los valores de los
datos agrupados en ese intervalo de clase.


















MEDIDAS DE TENDENCIA CENTRAL
o MEDIA ARITMTICA, GEOMTRICA Y PONDERADA:
Media Aritmtica: de un conjunto finito de nmeros es igual a la
suma de todos sus valores dividida entre el nmero de sumandos.
Cuando el conjunto es una muestra aleatoria recibe el nombre
de media muestral siendo uno de los principales estadsticos
muestrales.
Dados los n nmeros , la media aritmtica se
define simplemente como:

Media Geomtrica: es la raz n-sima del producto de todos
los nmeros.

Media Ponderada: resultado de multiplicar cada uno de los
nmeros por un valor particular para cada uno de ellos,
llamado su peso, y obteniendo a continuacin la media
aritmtica del conjunto formado por los productos anteriores.
Se utiliza la media ponderada cuando no todos los elementos
componentes de los que se pretende obtener la media tienen
la misma importancia.
Para una serie de datos

a la que corresponden los pesos

la media ponderada se calcula como:



o MEDIANA: es el valor de la variable que deja el mismo nmero de
datos antes y despus que l, una vez ordenados estos. De acuerdo
con esta definicin el conjunto de datos menores o iguales que la
mediana representarn el 50% de los datos, y los que sean mayores
que la mediana representarn el otro 50% del total de datos de la
muestra. La mediana coincide con el percentil 50, con el
segundo cuartil y con el quinto decil.

o MODA: es el valor con una mayor frecuencia en una distribucin de
datos.


o MEDIDAS DE DISPERSIN: Muestran la variabilidad de una
distribucin, indicando por medio de un nmero, si las diferentes
puntuaciones de una variable estn muy alejadas de la
mediana media. Cuanto mayor sea ese valor, mayor ser la
variabilidad, cuanto menor sea, ms homognea ser a la
mediana media. As se sabe si todos los casos son parecidos o
varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su
media, se calcula la media de las desviaciones de las puntuaciones
respecto a la media aritmtica. Pero la suma de las desviaciones es
siempre cero, as que se adoptan dos clases de estrategias para
salvar este problema. Una es tomando las desviaciones en valor
absoluto (Desviacin media) y otra es tomando las desviaciones al
cuadrado (Varianza).

o VARIANZA: Es l a medi a ari tmti ca del cuadrado de l as desvi aci ones
respecto a l a medi a de una di stri buci n estad sti ca. La vari anza se
representa por .



o DESVIACIN ESTNDAR: Es una medida de centralizacin o
dispersin para variables de razn (ratio o cociente) y de intervalo,
de gran utilidad en la estadstica descriptiva.
Se define como la raz cuadrada de la varianza. Junto con este valor,
la desviacin tpica es una medida (cuadrtica) que informa de la
media de distancias que tienen los datos respecto de su media
aritmtica, expresada en las mismas unidades que la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer
las medidas de tendencia central, sino que necesitamos conocer
tambin la desviacin que representan los datos en su distribucin
respecto de la media aritmtica de dicha distribucin, con objeto de
tener una visin de los mismos ms acorde con la realidad al
momento de describirlos e interpretarlos para la toma de decisiones.
o DESVIACIN MEDIA: Es la media de las diferencias en valor
absoluto de los valores a la media.

o DESVIACIN MEDIANA: Radica en el uso de diferencias de cada
dato respecto a la mediana muestral m.
Si estas diferencias son muy grandes, entonces estamos ante un
caso de gran variabilidad, y si son pequeas se espera que la
variabilidad sea pequea.
Dado un conjunto de datos, x
1
, ..., x
n
su desviacin mediana d.m.,
est definida por :

o RANGO: al intervalo de menor tamao que contiene a los datos; es
calculable mediante la resta del valor mnimo al valor mximo; por
ello, comparte unidades con los datos. Permite obtener una idea de
la dispersin de los datos.

PARMETROS PARA DATOS AGRUPADOS:
En el estudio de las distribuciones de datos, la estadstica selecciona un
conjunto de los mismos de forma que sean representativos de todos los de
la distribucin.
Estos datos seleccionados se denominan caractersticas de la distribucin o
parmetros estadsticos.
Pasos para agrupar datos:

a. Determinar el rango o recorrido de los datos.

Rango = Valor mayor Valor menor

b. Establecer el nmero de clases (k) en que se van a agrupar los datos
c. Determinar la amplitud de clase para agrupar (C).



d. Formar clases y agrupar datos.
Para formar la primera clase, se pone como lmite inferior de la
primera clase un valor un poco menor que el dato menor encontrado
en la muestra y posteriormente se suma a este valor C, obteniendo
de esta manera el lmite superior de la primera clase, luego se
procede a obtener los lmites de la clase siguiente y as
sucesivamente.







k
Rango
C
DISTRIBUCIN DE FRECUANCIAS
o DISTRIBUCIN DE FRECUENCIA PARA DATOS NO AGRUPADOS
Es aquella distribucin que indica las frecuencias con que aparecen
los datos estadsticos, desde el menor de ellos hasta el mayor de ese
conjunto sin que se haya hecho ninguna modificacin al tamao de
las unidades originales. En estas distribuciones cada dato mantiene
su propia identidad despus que la distribucin de frecuencia se ha
elaborado. En estas distribuciones los valores de cada variable han
sido solamente reagrupados, siguiendo un orden lgico con sus
respectivas frecuencias.
o DISTRIBUCIN DE FRECUENCIA DE DATOS AGRUPADOS:
Es aquella distribucin en la que la disposicin tabular de los datos
estadsticos se encuentran ordenados en clases y con la frecuencia
de cada clase; es decir, los datos originales de varios valores
adyacentes del conjunto se combinan para formar un intervalo de
clase. No existen normas establecidas para determinar cundo es
apropiado utilizar datos agrupados o datos no agrupados; sin
embargo, se sugiere que cuando el nmero total de datos (N) es
igual o superior 50 y adems el rango o recorrido de la serie de datos
es mayor de 20, entonces, se utilizar la distribucin de frecuencia
para datos agrupados, tambin se utilizar este tipo de distribucin
cuando se requiera elaborar grficos lineales como el histograma, el
polgono de frecuencia o la ojiva.
La razn fundamental para utilizar la distribucin de frecuencia de
clases es proporcionar mejor comunicacin acerca del patrn
establecido en los datos y facilitar la manipulacin de los mismos.
Los datos se agrupan en clases con el fin de sintetizar, resumir,
condensar o hacer que la informacin obtenida de una investigacin
sea manejable con mayor facilidad.

You might also like