Estadstica Descriptiva se refiere a la recoleccin, presentacin, descripcin,
anlisis e interpretacin de una coleccin de datos, esencialmente consiste en resumir stos con uno o dos elementos de informacin (medidas descriptivas) que caracterizan la totalidad de los mismos. La estadstica Descriptiva es el mtodo de obtener de un conjunto de datos conclusiones sobre si mismos y no sobrepasan el conocimiento proporcionado por stos. Puede utilizarse para resumir o describir cualquier conjunto ya sea que se trate de una poblacin o de una muestra, cuando en la etapa preliminar de la Inferencia Estadstica se conocen los elementos de una muestra. CONCEPTOS BSICOS DE ESTADSTICA: o ESTADSTICA: Es el conjunto de procedimientos y tcnicas empleadas para recolectar, organizar y analizar datos, los cuales sirven de base para tomar decisiones en las situaciones de incertidumbre que plantean las ciencias sociales o naturales.
o TEORA DE DECISIN: La estadstica trata de las tcnicas para recolectar, organizar, presentar, analizar un conjunto de datos Numricos y a partir de ellos y de un marco terico, hacer las indiferencias de lugar. Es una herramienta Fundamental para la investigacin cientfica y emprica en los campos de la administracin, educacin, Sociologa, psicologa, medicina, gentica, informtica, ingeniera, contabilidad, economa, agricultura, etc. Se consagra en forma directa al gran problema universal de como tomar las decisiones inteligentes y acertadas en condiciones de incertidumbre. Sirve como fuente de instruccin para los niveles introductorias de Estadstica descriptiva y por consiguiente, los conceptos manejados y las tcnicas empleadas han sido presentadas de la forma mas simple, claramente posibles.
o POBLACIN: Una poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan caractersticas comunes. "Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levin & Rubin (1996). "Una poblacin es un conjunto de elementos que presentan una caracterstica comn". Cadenas (1974). o MUESTRA ALEATORIA: Es muestra elegida independientemente de todas las dems, con la misma probabilidad que cualquier otra y cuyos elementos estn elegidos independientemente unos de otros y con la misma probabilidad.
o PARMETROS ALEATORIOS: Se denominan variables aleatorias a las caractersticas o atributos de seres u objetos que observamos y medimos. El sexo de los animales, la altura de los rboles, el tiempo que est en actividad cada da un determinado insecto o el peso de los huevos de estornino, son variables que podemos cuantificar. Se denominan variables porque cambian de valor y aleatorias porque su valor depende del azar, es impredecible. Las variables aleatorias pueden ser discretas y continuas. Las variables aleatorias que corresponde a una poblacin se denominan Parmetros.
DESCRIPCIONES DE DATOS o DATOS AGRUPADOS Y NO AGRUPADOS Datos Agrupados: Medidas de dispersin: Se llaman medidas de dispersin aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentracin de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. Medidas de tendencia central: La estadstica busca entre otras cosas, describir las caractersticas tpicas de conjuntos de datos y, como hay varias formas de hacerlo, existen y se utilizan varios tipos de promedios. Se les llama medidas de tendencia central porque general mente la acumulacin ms alta de datos se encuentra en los valores intermedios. Datos no Agrupados: Tendencia central: la tendencia central se refiere al punto medio de una distribucin. Las medidas de tendencia central se conocen como medidas de posicin. Dispersin: se refiere a la extensin de los datos en una distribucin, es decir, al grado en que las observaciones se distribuyen. o FRECUENCIA DE CLASE: La frecuencia de clase se le denomina frecuencia absoluta y se le designa con las letras fi. Es el nmero total de valores de las variables que se encuentran presente en una clase determinada, de una distribucin de frecuencia de clase. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.
o FRECUENCIA RELATIVA: La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. La frecuencia relativa se puede expresar en tantos por ciento y se representa por ni.
o PUNTO MEDIO: Marca de Clase es el punto medio del intervalo de clase, se recomienda observar que los puntos medios coincidan con los datos observados para minimizar el error.
o LMITES: Son los valores extremos que tiene el intervalo de clase, inferior y superior, entre los cuales van a estar los valores de los datos agrupados en ese intervalo de clase.
MEDIDAS DE TENDENCIA CENTRAL o MEDIA ARITMTICA, GEOMTRICA Y PONDERADA: Media Aritmtica: de un conjunto finito de nmeros es igual a la suma de todos sus valores dividida entre el nmero de sumandos. Cuando el conjunto es una muestra aleatoria recibe el nombre de media muestral siendo uno de los principales estadsticos muestrales. Dados los n nmeros , la media aritmtica se define simplemente como:
Media Geomtrica: es la raz n-sima del producto de todos los nmeros.
Media Ponderada: resultado de multiplicar cada uno de los nmeros por un valor particular para cada uno de ellos, llamado su peso, y obteniendo a continuacin la media aritmtica del conjunto formado por los productos anteriores. Se utiliza la media ponderada cuando no todos los elementos componentes de los que se pretende obtener la media tienen la misma importancia. Para una serie de datos
a la que corresponden los pesos
la media ponderada se calcula como:
o MEDIANA: es el valor de la variable que deja el mismo nmero de datos antes y despus que l, una vez ordenados estos. De acuerdo con esta definicin el conjunto de datos menores o iguales que la mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil.
o MODA: es el valor con una mayor frecuencia en una distribucin de datos.
o MEDIDAS DE DISPERSIN: Muestran la variabilidad de una distribucin, indicando por medio de un nmero, si las diferentes puntuaciones de una variable estn muy alejadas de la mediana media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea, ms homognea ser a la mediana media. As se sabe si todos los casos son parecidos o varan mucho entre ellos. Para calcular la variabilidad que una distribucin tiene respecto de su media, se calcula la media de las desviaciones de las puntuaciones respecto a la media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan dos clases de estrategias para salvar este problema. Una es tomando las desviaciones en valor absoluto (Desviacin media) y otra es tomando las desviaciones al cuadrado (Varianza).
o VARIANZA: Es l a medi a ari tmti ca del cuadrado de l as desvi aci ones respecto a l a medi a de una di stri buci n estad sti ca. La vari anza se representa por .
o DESVIACIN ESTNDAR: Es una medida de centralizacin o dispersin para variables de razn (ratio o cociente) y de intervalo, de gran utilidad en la estadstica descriptiva. Se define como la raz cuadrada de la varianza. Junto con este valor, la desviacin tpica es una medida (cuadrtica) que informa de la media de distancias que tienen los datos respecto de su media aritmtica, expresada en las mismas unidades que la variable. Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de tendencia central, sino que necesitamos conocer tambin la desviacin que representan los datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto de tener una visin de los mismos ms acorde con la realidad al momento de describirlos e interpretarlos para la toma de decisiones. o DESVIACIN MEDIA: Es la media de las diferencias en valor absoluto de los valores a la media.
o DESVIACIN MEDIANA: Radica en el uso de diferencias de cada dato respecto a la mediana muestral m. Si estas diferencias son muy grandes, entonces estamos ante un caso de gran variabilidad, y si son pequeas se espera que la variabilidad sea pequea. Dado un conjunto de datos, x 1 , ..., x n su desviacin mediana d.m., est definida por :
o RANGO: al intervalo de menor tamao que contiene a los datos; es calculable mediante la resta del valor mnimo al valor mximo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersin de los datos.
PARMETROS PARA DATOS AGRUPADOS: En el estudio de las distribuciones de datos, la estadstica selecciona un conjunto de los mismos de forma que sean representativos de todos los de la distribucin. Estos datos seleccionados se denominan caractersticas de la distribucin o parmetros estadsticos. Pasos para agrupar datos:
a. Determinar el rango o recorrido de los datos.
Rango = Valor mayor Valor menor
b. Establecer el nmero de clases (k) en que se van a agrupar los datos c. Determinar la amplitud de clase para agrupar (C).
d. Formar clases y agrupar datos. Para formar la primera clase, se pone como lmite inferior de la primera clase un valor un poco menor que el dato menor encontrado en la muestra y posteriormente se suma a este valor C, obteniendo de esta manera el lmite superior de la primera clase, luego se procede a obtener los lmites de la clase siguiente y as sucesivamente.
k Rango C DISTRIBUCIN DE FRECUANCIAS o DISTRIBUCIN DE FRECUENCIA PARA DATOS NO AGRUPADOS Es aquella distribucin que indica las frecuencias con que aparecen los datos estadsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificacin al tamao de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad despus que la distribucin de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lgico con sus respectivas frecuencias. o DISTRIBUCIN DE FRECUENCIA DE DATOS AGRUPADOS: Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se encuentran ordenados en clases y con la frecuencia de cada clase; es decir, los datos originales de varios valores adyacentes del conjunto se combinan para formar un intervalo de clase. No existen normas establecidas para determinar cundo es apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que cuando el nmero total de datos (N) es igual o superior 50 y adems el rango o recorrido de la serie de datos es mayor de 20, entonces, se utilizar la distribucin de frecuencia para datos agrupados, tambin se utilizar este tipo de distribucin cuando se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o la ojiva. La razn fundamental para utilizar la distribucin de frecuencia de clases es proporcionar mejor comunicacin acerca del patrn establecido en los datos y facilitar la manipulacin de los mismos. Los datos se agrupan en clases con el fin de sintetizar, resumir, condensar o hacer que la informacin obtenida de una investigacin sea manejable con mayor facilidad.