You are on page 1of 8

2 MARCO TEORICO 2.

1Concepto de estadstica
La estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadstica es ms que eso, en otras palabras es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica. Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las ciencias sociales, desde las ciencias de la saludhasta el control de calidad. Se usa para la toma de decisiones en reas de negocios o instituciones gubernamentales. La estadstica se divide en dos grandes reas:

La estadstica descriptiva, se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio. Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de parmetros estadsticos son: lamedia y la desviacin estndar. Algunos ejemplos grficos son: histograma, pirmide poblacional, clsters, entre otros.

La estadstica inferencial, se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas a preguntas si/no (prueba de hiptesis), estimaciones de unas caractersticas numricas (estimacin), pronsticos de futuras observaciones, descripciones de asociacin (correlacin) o modelamiento de relaciones entre variables (anlisis de regresin). Otras tcnicas de modelamiento incluyen anova, series de tiempo y minera de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. Hay tambin una disciplina llamada estadstica matemtica, la que se refiere a las bases tericas de la materia. La palabra estadsticas tambin se refiere al resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en estadsticas econmicas, estadsticas criminales, entre otros.

La palabra "estadstica" suele utilizarse bajo dos significados distintos, a saber: 1 Como coleccin de datos numricos.- Esto es el significado ms vulgar de la palabra estadstica. Se sobrentiende que dichos datos numricos han de estar presentados de manera ordenada y sistemtica. Una informacin numrica cualquiera puede no constituir una estadstica, para merecer este apelativo, los datos han de constituir un conjunto coherente, establecido de forma sistemtica y siguiendo un criterio de ordenacin.

Tenemos muchos ejemplos de este tipo de estadsticas. El Anuario Estadstico publicado por el Instituto Nacional de Estadstica, El Anuario de Estadsticas del Trabajo, 2 Como ciencia.- En este significado, La Estadstica estudia el comportamiento de los fenmenos de masas. Como todas las ciencias, busca las caractersticas generales de un colectivo y prescinde de las particulares de cada elemento. As por ejemplo al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de nacimientos y obtener despus la proporcin de varones. Es muy frecuente enfrentarnos con fenmenos en los que es muy difcil predecir el resultado; as, no podemos dar una lista ,con las personas que van a morir con una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo, Por tanto, el objetivo de la estadstica es hallar las regularidades que se encuentran en los fenmenos de masa. Poblacin, elementos y caracteres Es obvio que todo estudio estadstico ha de estar referido a un conjunto o coleccin de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos poblacin. Las personas o cosas que forman parte de la poblacin se denominan elementos. En sentido estadstico un elemento puede ser algo con existencia real, como un automvil o una casa, o algo ms abstracto como la temperatura, un voto, o un intervalo de tiempo. A su vez, cada elemento de la poblacin tiene una serie de caractersticas que pueden ser objeto del estudio estadstico. As por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesin, Peso, Altura, Color de pelo,Etc. Luego por tanto de cada elemento de la poblacin podremos estudiar uno o ms aspectos cualidades o caracteres. La poblacin puede ser segn su tamao de dos tipos: Poblacin finita: cuando el nmero de elementos que la forman es finito, por ejemplo el nmero de alumnos de un centro de enseanza, o grupo clase. Poblacin infinita: cuando el nmero de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre los productos que hay en el mercado. Hay tantos y de tantas calidades que esta poblacin podra considerarse infinita. Ahora bien, normalmente en un estudio estadstico, no se puede trabajar con todos los elementos de la poblacin sino que se realiza sobre un subconjunto de la misma. Este subconjunto puede ser una muestra, cuando se toman un determinado nmero de elementos de la poblacin, sin que en principio tengan nada en comn; o una subpoblacin, que es el subconjunto de la poblacin formado por los elementos de la

poblacin que comparten una determinada caracterstica, por ejemplo de los alumnos del centro la subpoblacin formada por los alumnos de 3 ESO, o la subpoblacin de los varones.

Variables y atributos.
Como hemos visto, los caracteres de un elemento pueden ser de muy diversos tipos, por lo que los podemos clasificar en: dos grandes clases: Variables Cuantitativas. Variables Cualitativas o Atributos. Las variables cuantitativas son las que se describen por medio de nmeros, como por ejemplo el peso, Altura, Edad, Nmero de Suspensos A su vez este tipo de variables se puede dividir en dos subclases: Cuantitativas discretas. Aquellas a las que se les puede asociar un nmero entero, es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo nmero de hermanos, pginas de un libro, etc. Cuantitativas continuas: Aquellas que no se pueden expresar mediante un nmero entero, es decir, aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo. etc.

No obstante en muchos casos el tratamiento estadstico hace que a variables discretas las trabajemos como si fuesen continuas y viceversa. Los atributos son aquellos caracteres que para su definicin precisan de palabras, es decir, no le podemos asignar un nmero. Por ejemplo Sexo Profesin, Estado Civil, etc. A su vez las podemos clasificar en: Ordenables: Aquellas que sugieren una ordenacin, por ejemplo la graduacin militar, El nivel de estudios, etc. No ordenables: Aquellas que slo admiten una mera ordenacin alfabtica, pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.

TIPOS DE MEDIDA: 1. Medidas de Centralizacin: o Que sirven para determinar los valores centrales o medios de la dsitribucin 2. Medidas de Dispersin: o Nos van a dar una idea sobre la representatividad de las medidas centrales, a mayor dispersin menor representatividad. 3. Medidas de Localizacin: o tiles para encontrar determinados valores importantes, para una "clasificacin" de los elementos de la muestra o poblacin. 4. Medidas de la Simetra: o Sirven para ver si la distribucin tiene el mismo comportamiento por encima y por debajo de los valores centrales.

Media aritmtica:
La media aritmtica de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por y se calcula mediante la expresin:

xi representa el valor de la variable o en su caso la marca de clase.

Propiedades:
1. 2. 3. Si multiplicamos o dividimos todas las observaciones por un mismo nmero, la media queda multiplicada o dividida por dicho numero. Si le sumamos a todas las observaciones un mismo nmero, la media aumentar en dicha cantidad. Adems de la media aritmtica existen otros conceptos de media, como son la media geomtrica y la media armnica.

Media geomtrica:
La media geomtrica de N observaciones es la raz de ndice N del producto de todas las observaciones. La representaremos por G. Solo se puede calcular si no hay observaciones negativas. Es una medida estadstica poco o nada usual.

Media armnica:
La media armnica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos por H

Mediana:
La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el valor que divide en dos partes la muestra. Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua.

MODA:
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que ms se repite, es la nica medida de centralizacin que tiene sentido estudiar en una variable cualitativa, pues no precisa la realizacin de ningn clculo. Por su propia definicin, la moda no es nica, pues puede haber dos o ms valores de la variable que tengan la misma frecuencia siendo esta mxima. En cuyo caso tendremos una distribucin bimodal o polimodal segn el caso.

Medidas de dispersin
Rango: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el menor de la distribucin,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayora de los casos, pero indudablemente es muy fcil de calcular. Hemos estudiado varias medidas de centralizacin, por lo que podemos hablar de desviacin con respecto a cualquiera de ellas, sin embargo, la mas utilizada es con respecto a la media. Desviacin: Es la diferencia que se observa entre el valor de la variable y la media aritmtica. La denotaremos por di . No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviacin, por lo que precisaremos una medida que resuma dicha informacin. La primera solucin puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de todas las desviaciones y calculamos su media. Pero esta solucin es mala pues como veremos siempre va a ser 0. Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas. Para resolver este problema, tenemos dos caminos: Tomar el valor absoluto de las desviaciones. Desviacin media Elevar al cuadrado las desviaciones. Varianza.

Desviacin media: Es la media de los valores absolutos de las desviaciones, y la denotaremos por d m. Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en cm. La varianza vendr en cm2. Desviacin tpica: Este estadstico se mide en la misma unidad que la variable por lo que se puede interpretar mejor. Otros dos estadsticos importantes son la cuasivarianza y la cuasidesviacin tpica, que como veremos cuando estudiemos el tema de estimacin estadstica, son los estimadores de la varianza y desviacin tpica poblacionales respectivamente. Cuasidesviacin tpica: Todas estas medidas de dispersin vienen influidas por la unidad en la que se mide la variable, esto implica que si cambiamos de unidad de medida, los valores de estos estadsticos se vean a su vez modificados. Adems, no permite comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas dispersin. Pues no es posible comparar unidades de distinto tipo. Precisamos por lo tanto, una medida " escalar", es decir, que no lleve asociado ninguna unidad de medida. Coeficiente de Variacin:

Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitir decir entre dos muestras, cual es la que presenta mayor dispersin. La denotaremos por C.V.

Medidas de Localizacin: Cuartiles, deciles y percentiles.


Las medidas de localizacin dividen la distribucin en partes iguales, sirven para clasificar a un individuo o elemento dentro de una determinada poblacin o muestra. As en psicologa los resultados de los test o pruebas que realizan a un determinado individuo, sirve para clasificar a dicho sujeto en una determinada categoria en funcin de la 53-1-u-puntuaciMn obtenida. 1. 2. 3. 4. 5. Cuartiles. Deciles. Percentiles. Ejemplos de clculo. Algunas medidas de dispersin asociadas

Cuartiles
Medida de localizacin que divide la poblacin o muestra en cuatro partes iguales. Q1= Valor de la variable que deja a la izquierda el 25% de la distribucin. Q2= Valor de la variable que deja a la izquierda el 50% de la distribucin = mediana. Q3= Valor de la variable que deja a la izquierda el 75% de la distribucin.

Al igual que ocurre con el clculo de la mediana, el clculo de estos estadsticos, depende del tipo de variable. Caso I: Variable cuantitativa discreta: En este caso tendremos que observar el tamao de la muestra: N y para calcular Q1 o Q3 procederemos como si tuvisemos que calcular la mediana de la correspondiente mitad de la muestra. Caso II: Variable cuantitativa continua: En este caso el clculo es ms simple:, sea la distribucin que sigue:

Deciles
Medida de localizacin que divide la poblacin o muestra en 10 partes iguales No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para las variables continuas. dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k10 % de la distribucin.

Percentiles:
Medida de localizacin que divide la poblacin o muestra en 100 partes iguales No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver slo para las variables continuas.

pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribucin.

Medidas de Simetra:
Las medidas de la asimetra, al igual que la curtosis, van a ser medidas de la forma de la distribucin, es frecuente que los valores de una distribucin tiendan a ser similares a ambos lados de las medidas de centralizacin. La simetra es importante para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable.

As<0 Asimetra Negativa a la Izquierda

As=0 Simtrica

As>0 Asimetra Positiva a la

Derecha.

Para medir la asimetra se puede realizar atendiendo bsicamente a dos criterios: Comparando la Media y la Moda. Comparando los valores de la variable con la media.

Comparando la Media y la Moda:

Si la diferencia es positiva, diremos que hay asimetra positiva o a la derecha, en el caso de que sea negativa diremos que hay asimetra negativa o a la izquierda. No obstante, esta medida es poco operativa al no ser una medida relativa, ya que esta influida por la unidad en que se mida la variable, por lo que se define el coeficiente de Asimetra como:

Esta medida es muy fcil de calcular, pero menos precisa que el coeficiente de asimetra de Pearson. El coeficiente de asimetra de Pearson, se basa en la comparacin con la media de todos los valores de la variable, as que es una medida que se basar en las diferencias , como vimos en el caso de la dispersin si medimos la media de esas desviaciones sera nulas, si las elevamos al cuadrado, seran siempre positivas por lo que tampoco serviran, por lo tanto precisamos elevar esas diferencias al cubo. Para evitar el problema de la unidad, y hacer que sea una medida escalar y por lo tanto relativa, dividimos por el cubo de su desviacin tpica. Con lo que resulta la siguiente expresin:

You might also like