You are on page 1of 22

Colegio de Bachilleres de Oaxaca

Centro de Enseanza Abierta 08 Pueblo Nuevo

Estadstica I. Antologa.

Junio, 2012

ndice de contenido
Introduccin...............................................................................................................................................1 La estadstica descriptiva e inferencial y sus aplicaciones en diversos contextos.....................................1 Estadstica..............................................................................................................................................1 La estadstica descriptiva.......................................................................................................................1 La estadstica inferencial.......................................................................................................................1 Aplicaciones..........................................................................................................................................1 Las tcnicas de recoleccin de datos como herramienta en el anlisis de una poblacin.....................2 Definiciones......................................................................................................................................2 Poblacin......................................................................................................................................2 Muestra........................................................................................................................................3 Variable........................................................................................................................................3 Variable Aleatoria.........................................................................................................................3 Tipos de variables........................................................................................................................3 Variables Numricas o Cuantitativas.......................................................................................3 Variables Numricas Discretas...........................................................................................3 Variables Numricas Continuas..........................................................................................4 Variables Categricas o Cualitativas.......................................................................................4 Variables Categricas Nominales.......................................................................................4 Variables Categricas Ordinales.........................................................................................4 Datos............................................................................................................................................4 Datos Internos.........................................................................................................................4 Datos Externos........................................................................................................................4 Experimento ................................................................................................................................4 Experimento Determinista.......................................................................................................4 Experimento Aleatorio, Probabilista, casual o de azar............................................................4 Mtodos de muestreo.............................................................................................................................5 Censo................................................................................................................................................5 Poblacin finita.................................................................................................................................5 Poblacin infinita..............................................................................................................................5 Muestreo probabilista o aleatorio.....................................................................................................5 Muestreo no probabilista..................................................................................................................5 Muestreo aleatorio simple.................................................................................................................5 Muestreo sistemtico........................................................................................................................5 Muestreo estratificado......................................................................................................................6 Asignacin proporcional..............................................................................................................6 Asignacin ptima.......................................................................................................................6 Muestreo conglomerado...................................................................................................................6 La nocin de variabilidad, los tipos de variables y su significatividad en el comportamiento de un conjunto de datos...................................................................................................................................6 Variabilidad.......................................................................................................................................6 Tipos de variabilidad........................................................................................................................7 Variabilidad sistemtica y planificada. .......................................................................................7 Variabilidad tpica de la naturaleza del problema y del experimento. ........................................8 Variabilidad sistemtica y no planificada. ..................................................................................8 Significatividad.....................................................................................................................................8 -1-

Descripcin y representacin de datos de forma tabular y grfica............................................................8 Reglas para determinar el numero de clases y la amplitud del intervalo en una serie de datos............8 Lmite de los intervalos de clase para variables numricas discretas...............................................8 Representacin tabular de los datos......................................................................................................9 Distribucin de frecuencias..............................................................................................................9 Representacin grfica de los datos: histogramas, polgonos de frecuencias y polgonos de frecuencias acumuladas...................................................................................................................................10 Componentes de un grfico............................................................................................................10 Histogramas....................................................................................................................................10 Polgono de frecuencia....................................................................................................................11 Polgono de frecuencias acumuladas..............................................................................................12 Otras representaciones grficas...........................................................................................................12 De circulo o pastel..........................................................................................................................12 Pictograma......................................................................................................................................13 Cartogramas...............................................................................................................................13 Estadstica descriptiva..............................................................................................................................14 Medidas de tendencia central y variabilidad para datos agrupados y sin agrupar...............................14 Promedio o media aritmtica..........................................................................................................14 Moda...............................................................................................................................................14 Mediana..........................................................................................................................................14 En datos agrupados..............................................................................................................................15 En datos agrupados por intervalos.......................................................................................................15 Media..............................................................................................................................................15 Moda...............................................................................................................................................15 Mediana..........................................................................................................................................15 Medidas de dispersin.........................................................................................................................16 Rango..............................................................................................................................................16 Varianza..........................................................................................................................................16 Desviacin estndar........................................................................................................................17 Coeficiente de variacin.................................................................................................................17 Conclusiones............................................................................................................................................18 Bibliografa..............................................................................................................................................18

-2-

Introduccin
Toca el turno de estudiar la estadstica, que es una herramienta indispensable para la toma de decisiones en el rea de administracin de empresas, sin embargo, su aplicacin abarca prcticamente todas las reas del quehacer humano. Se le utiliza para describir que se est haciendo y tambin para hacer predicciones de forma cientfica. An en la ciencia ficcin ocupa un papel interesante, como se aprecia en la serie de novelas conocida como saga de las fundaciones de Issac Asimov, en la que sirve como base de una ciencia llamada psicohistoria. Comencemos entonces ...

La estadstica descriptiva e inferencial y sus aplicaciones en diversos contextos.


Estadstica.
Se le llama Estadstica a la rama de las matemticas que se sirve de un conjunto de mtodos, normas, reglas y principios para la observacin, toma, organizacin, descripcin, presentacin y anlisis del comportamiento de un grupo de datos para la conclusin sobre un experimento o fenmeno, es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica. La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. La estadstica se divide en dos grandes reas:

La estadstica descriptiva
Es la parte de la Estadstica que estudia las tcnicas y mtodos que sirven para la observacin, toma, organiza cin, descripcin, presentacin y anlisis de datos. Se dedica a la descripcin, visualizacin y resumen de datos originados a partir de los fenmenos de estudio.

La estadstica inferencial.
Es el conjunto de tcnicas que se utiliza para obtener conclusiones que sobrepasan los lmites del conocimiento aportado por los datos, busca obtener informacin de un colectivo mediante un metdico procedimiento del ma nejo de datos de la muestra. En sus particularidades la Inferencia distingue la estimacin de parmetros y las pruebas de hiptesis con respecto a caractersticas estadsticas de una poblacin. Intenta dar explicacin, concluir o inferenciar sobre los experimentos y fenmenos observados, mediante el auxilio de la probabilidad, estadstica descriptiva y distribucin de probabilidad, por lo que resulta una herramienta de suma utilidad para la toma de decisiones. Se dedica a la generacin de los modelos, inferencias y predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar patrones en los datos y extraer inferencias acerca de la poblacin bajo estudio.

Aplicaciones.
La estadstica se utiliza prcticamente en todas las ciencias y profesiones, entre algunas: programas guberna mentales, ingeniera, agronoma, economa, medicina, biologa, psicologa, sociologa, fsica, etc. Una lista de ejemplos de aplicacin: En dependencias gubernamentales se utiliza para realizar planes y programas.

-1-

En la ingeniera se aplica entre otras actividades a: La planeacin de la produccin, control de calidad, ventas, almacn. En la sociologa se aplica para comparar el comportamiento de grupos socio-econmicos y culturales. En la economa se utiliza para determinar el desarrollo econmico de una empresa o pas a travs de los ndices econmicos relativos a la produccin, ndices de precios para el consumidor, las tasas de inters, el ndice de inflacin, etc. En el campo demogrfico se aplica en el registro de los hechos cotidianos, como son: Nacimientos, de funciones, divorcios, Matrimonios. En la educacin se utiliza en el perfeccionamiento de los mtodos de enseanza, de evaluacin, mide la efectividad de la tutoras, etc. En la industria se aplica en el control de calidad, para determinar incentivos a la produccin, determinar metas y objetivos cuantitativos, etc.

Poniendo en contexto la aplicacin de la estadsticas a continuacin se listan algunos ejemplos: 1. Sabroso remedio para el cncer de prstata. Se ha encontrado una medicina para combatir el cncer prosttico y es adems sabroso, el jugo de granada. Investigadores estadounidenses midieron en una muestra de enfermos, elegida al azar, la cantidad de concentracin de un antgeno especfico de la prstata (AEP) en la sangre, valor que ayuda a diagnosticar el cncer. Concluyeron que beber un vaso de este jugo diariamente, frenaba en mucho el aumento de dicha concentracin en los enfermos previamente tratados. Se realizarn ms pruebas para confirmarlo pero los primeros estudios estadsticos son prometedores para los miles de hombres que cada ao son diagnosticados con este tipo de mal. Las expectativas de resultados definitivos se estiman tenerlos dentro de dos aos aproximadamente. 2. Una nueva arma contra el asma: Es probable que una nueva terapia ambulatoria de media hora, denominada la termoplasta bronquial, ayude a millones de enfermos de asma. El mdico inserta un broncoscopio por la boca o la nariz, lo lleva hasta los pulmones y, con ondas de radiofrecuencia conducidas por un catter, calienta las vas respiratorias hasta los 65 C, lo cual reduce la cantidad de msculo que hay en ellas sin causar dao ni deja tejido cicatricial. Al terminar las pruebas clnicas, aplicadas a una muestra de pacientes, respiraban mejor, necesitaban menos medicamentos y disfrutaban de ms das sin sntomas, afirm el investigador Gerard Cox. Actualmente se estn realizando estudios ms amplios, se esperan resultados definitivos de 0-2 aos. Cabe mencionar que esta tcnica presenta ciertos riesgos y que slo los mdicos especialistas pueden determinar qu pacientes son factibles de aplicar la tcnica. En ambos casos se aprecia que para verificar los resultados de las dos terapias se utiliz la estadstica al eva luar una poblacin de personas a las que se aplic tanto el alimento, como la terapia contrastando con un grupo de control para medir su efectividad, adems de auxilar a determinar las caractersticas que deben reunir los pacientes para que alguna de estas terapias sean efectivas.

Las tcnicas de recoleccin de datos como herramienta en el anlisis de una poblacin. Definiciones.
Poblacin.
Se le llama poblacin a la totalidad de elementos que se quiere estudiar, analizar o investigar. Existen dos categoras de poblacin, a saber:

-2-

Poblacin fsica: est compuesta por todos los individuos o elementos que proporcionarn la informa cin a travs de la cual se realizar el estudio y el anlisis. Los integrantes de una poblacin fsica pue den ser personas, seres vivos de cualquier especie, objetos, entidades, instituciones; en fin, todo conjunto de elementos que sean posibles de ser medidos . Poblacin estadstica: se integra por la coleccin completa de valores de alguna caracterstica comn en la poblacin fsica, que se toma como variable de estudio al ser medida en todos y cada uno de los elementos.

Por ejemplo: Poblacin fsica: Todas las empresas privadas del sureste de Mxico. Posibles poblaciones estadsticas: El nmero de empleados de cada empresa, el ingreso mensual de cada trabajador, el grado escolar de todos los trabajadores, el puesto que ocupa cada trabajador, la antigedad laboral de todos los empleados, aportaciones voluntarias al sistema de retiro.

Muestra.
A cualquier subconjunto de elementos de la poblacin que tengan una caracterstica comn que se desee analizar se le llama muestra. En todo estudio estadstico es muy importante especificar la poblacin de la cual fue extrada la muestra . Cuando se ha elegido la muestra, se espera lograr que sus propiedades puedan ser com parables a la poblacin, es decir, conserve las caractersticas de la misma. Para que una muestra sea representativa de la poblacin, sta deber contener aproximadamente entre el 5% y el 10% de los datos de la poblacin cuando sta es finita, adems los elementos de la muestra deben ser esco gidos al azar.

Variable.
Es toda aquella caracterstica que poseen todos los elementos de una poblacin fsica y que pueden diferir del valor que pueda tomar, representa una cualidad o cantidad medible de cualquier suceso o accin que presente o experimente un cambio, la podemos representar mediante un smbolo (X, Y, Z, , , , ) y al cual se le puede asignar un valor cualquiera de un conjunto determinado de datos.

Variable Aleatoria
Aquella variable cuyos cambios no pueden ser determinados antes de que estos se presenten; es decir, estn destinados a la suerte. Tambin se le conoce como Variable Probabilista, Cabalstica, de Azar o a la Suerte.

Tipos de variables
Para su estudio, las variables aleatorias se han clasificado segn la naturaleza de los valores que toman en: Variables Numricas y Variables Categricas.

Variables Numricas o Cuantitativas.


Son aquellas que se identifican o se les puede asignar un valor numrico o que corresponden a aspectos que son medibles. Por ejemplo: La suma de puntos al lanzar dos dados, tiempo de uso de un bien o servicio, eda des en un grupo, temperatura alcanzada por un objeto, etc.

Variables Numricas Discretas.


Toman valores enteros con rango finito . Por ejemplo, nmero de hijos por familia, suma de puntos al lanzar los dados, cuantas guilas caen al lanzar una moneda, cuantos alumnos hay por grupo en una escuela.

-3-

Variables Numricas Continuas.


Pueden tomar cualquier valor entre dos valores dados. Es decir, el rango contiene no slo valores enteros sino un intervalo (finito o infinito) de valores reales (esto es, que puede ser fraccionario, decimal o irracional). Teri camente, se cubren todos los posibles valores entre dos valores de variable especficos. Este tipo de variable se obtiene principalmente a travs de mediciones y est sujeta a la precisin de los instrumentos de medicin. Ejemplos: Temperaturas, distancias, velocidades, tiempo.

Variables Categricas o Cualitativas.


Son aquellas cuyos valores son del tipo categrico, es decir, que indican categoras o son etiquetas alfanumricas o "nombres". No se les puede asignar o identificar con un valor numrico, no se pueden medir sino slo observar, ejemplos: Marca de un bien, tipo de sangre, deporte preferido. En las variables categricas, un elemento no puede estar en ms de una categora a la vez, lo cual las hace excluyentes y adems no puede haber elementos de la poblacin que no pertenezcan a alguna categora, lo que las hace exhaustivas.

Variables Categricas Nominales


Son las variables categricas que, adems de que sus posibles valores son mutuamente excluyentes entre s, no tienen alguna forma "natural" de ordenacin, es decir que slo permite clasificacin en categoras por mencin de sta. Ejemplo: La nacionalidad de una persona, idioma, sexo.

Variables Categricas Ordinales


Son aquellas que adems de clasificar a los elementos en distintas categoras les podemos asignar un orden o que podemos ordenar de acuerdo a cierta caracterstica. Por ejemplo: El semestre que cursa un estudiante universitario, el grado escolar de los empleados de un empresa.

Datos
Son agrupaciones de cualquier nmero de observaciones relacionadas. Para que se considere un dato estadstico debe tener dos caractersticas: Que sean comparables entre s. Que tengan alguna relacin.

Datos Internos
No necesitan de observaciones adicionales al experimento; es decir, no es necesario buscar caractersticas que proporcionen informacin adicional acerca del experimento.

Datos Externos
Pueden ser de dos tipos: 1. Datos Bibliogrficos son aquellos ya conocidos y que podemos encontrar fcilmente utilizando bibliografa, registros, actas, etctera, como los datos histricos, censos y otros. 2. Datos Originales son aquellos que podemos obtener mediante mtodos de recoleccin, como las en cuestas, plebiscitos, referndum, y nos proporcionan datos reales y certeros.

Experimento
Toda accin o prueba que se realiza con el fin de observar su resultado.

Experimento Determinista
Se puede predecir con certeza su resultado antes de que ste se presente.

Experimento Aleatorio, Probabilista, casual o de azar.


Ocurre cuando no es posible asegurar el resultado que se va a presentar.

-4-

Mtodos de muestreo. Censo


La informacin se obtiene de estudio de todos los elementos que componen a la poblacin o universo bajo estu dio. Un censo debe cumplir las condiciones de universalidad (censar a todos los elementos de la poblacin) y simultaneidad (realizarse en un momento determinado) .

Poblacin finita.
Contiene una cantidad determinada de elementos por analizar, es decir, la cantidad de elementos es numerable y tiene un fin, ejemplos: Alumnos de una escuela, ciudadanos votantes de un pas, animales en un zoolgico, usuarios de Internet.

Poblacin infinita.
Se presenta cuando se tiene una cantidad indeterminada de elementos por analizar; es decir una cantidad tal que aunque intentemos numerarla nunca se terminara. Ejemplo: todos los puntos de una recta, valores de temperatura durante el da, estrellas en el universo. La toma de muestras puede ser principalmente de dos tipos:

Muestreo probabilista o aleatorio.


Se obtiene mediante sorteo de los elementos que la forman, cada individuo tiene la misma posibilidad de perte necer a la muestra, por lo que es posible calcular el error en la muestra. Se destacan los siguientes: muestreo aleatorio simple, sistemtico, estratificado y el de conglomerado.

Muestreo no probabilista.
No es posible estimar la probabilidad que tiene cada elemento de estar incluido en la muestra, adems, no es posible determinar el posible error de la muestra. Se conocen tres clases: Accidental o incidental, por cuotas, intencional por conveniencia o de juicio.

Muestreo aleatorio simple.


Se eligen los elementos que conformaran la muestra de tal forma que cada elemento de la poblacin tiene la misma posibilidad de pertenecer a ella.

Muestreo sistemtico.
Se utiliza cuando el universo es grande, se elige un individuo al azar y a partir de l, a intervalos constantes, se eligen los dems hasta completar la muestra. Es decir, se hace una seleccin aleatoria inicial de observaciones seguida de otra seleccin de observaciones, obtenida mediante una constante denominada constante de sistematizacin Cs= N/n; donde N es el tamao de la poblacin y n el tamao de la muestra. Esta constante nos sirve para determinar cada cuntos elementos o cada cunto tiempo se debe elegir el siguiente; para ello hay que elegir al azar un nmero entre 1 y Cs; de ah en adelante tomar uno de cada K a intervalos regulares. Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenmeno. Por ejemplo si tenemos una poblacin formada por 100 elementos y queremos extraer una muestra de 25 ele mentos, en primer lugar debemos establecer el intervalo de seleccin que ser igual a 100/25 = 4. A continua cin elegimos el elemento de arranque, tomando aleatoria mente un nmero entre el 1 y el 4, y a partir de l obtenemos los restantes elementos de la muestra.

-5-

El muestreo sistemtico suele ser ms preciso que el aleatorio simple, ya que recorre la poblacin de un modo ms uniforme. Por otro lado, es a menudo ms fcil no cometer errores.

Muestreo estratificado.
En este se divide la poblacin en clases o estratos y se escoge, aleatoriamente, un nmero de individuos de cada estrato proporcional al nmero de componentes de cada estrato. Los elementos de cada estrato son esco gidos mediante muestreo aleatorio simple.

Asignacin proporcional.
El tamao de cada estrato en la muestra es proporcional a su tamao en la poblacin.

Asignacin ptima.
La muestra recoger ms individuos de aquellos estratos que tengan ms variabilidad. Para ello es necesario un conocimiento previo de la poblacin. En una fbrica que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 tra bajadores en la seccin A, 150 en la B, 150 en la C y 100 en la D.

X 20 = 1 600 200 X2 20 = 600 150 X 20 = 3 600 150 X4 20 = 600 100

X 1=6.67

X 2=5 X 3=5 X 4=3.33

Muestreo conglomerado.
Al dividir primero la poblacin en grupos o conglomerados convenientes para el muestreo, seleccionando de cada uno de ellos una porcin, al azar o por un mtodo sistemtico. Bajo este mtodo, aunque no se realizan muestreos a todos los grupos, cada grupo tiene una igual probabilidad de ser seleccionado. Por lo tanto, la muestra es aleatoria. Una muestra por conglomerados, usualmente produce un mayor error muestral que una muestra aleatoria simple del mismo tamao; sin embargo, puede ser obtenida dentro de un corto perodo de tiempo y a bajo costo. Por ejemplo: Si intentamos hacer un estudio sobre los habitantes de una ciudad se eligen aleatoriamente ciertos barrios dentro de la ciudad, para despus elegir calles y edificios. Una vez elegido el edificio, se entrevista a todos los vecinos.

La nocin de variabilidad, los tipos de variables y su significatividad en el comportamiento de un conjunto de datos. Variabilidad.
Los modelos estadsticos clsicos cuyo objetivo es averiguar si unos determinados factores influyen en la varia ble de inters y, si existe influencia de algn factor, cuantificarla.

-6-

Si se repite un experimento los resultados presentan variabilidad que puede ser grande o pequea. Si la experi mentacin se realiza en un laboratorio donde la mayora de las causas de variabilidad estn muy controladas, el error experimental ser pequeo y habr poca variacin en los resultados del experimento. Pero si se experimenta en procesos industriales, administrativos, culturales, etc. la variabilidad es grande en la mayora de los casos. Un experimento se realiza por alguno de los siguientes motivos: Determinar las principales causas de variacin en la respuesta. Encontrar las condiciones experimentales con las que se consigue un valor extremo en la variable de inters o respuesta. Comparar las respuestas en diferentes niveles de observacin de variables controladas. Obtener un modelo estadstico-matemtico que permita hacer predicciones de respuestas futuras.

En el anlisis estadstico de datos histricos se pueden cometer diferentes errores, los ms comunes son los si guientes: Inconsistencia de los datos. Los procesos cambian con el tiempo, se producen cambios en el personal (cambios de personas, mejoras del personal por procesos de aprendizaje, motivacin), cambios en las mquinas (reposiciones, reparaciones, envejecimiento). Estos cambios tienen influencia en los datos recogidos, lo que hace que los datos histricos sean poco fiables, sobre todo si se han recogido en un amplio espacio de tiempo. Variables con fuerte correlacin. Puede ocurrir que en el proceso existan dos o ms variables correlacionadas que pueden llevar a situaciones confusas. Por ejemplo, en el proceso hay dos variables X 1 y X2 fuertemente correlacionadas que influyen en la respuesta, pero si en los datos que se tiene aumenta al mismo tiempo el valor de las dos variables no es posible distinguir si la influencia es debida a una u otra o a ambas variables (confusin de los efectos). Otra situacin problemtica se presenta si solo se dispone de datos de una variable (por ejemplo de X 1 y no de X2), lo que puede llevar a pensar que la variable influyente es la X1 cuando, en realidad, la variable influyente es la X2 (variable oculta). El rango de las variables controladas es limitado. Si el rango de una de las variables importantes e influ yentes en el proceso es pequeo, no se puede saber su influencia fuera de ese rango y puede quedar oculta su relacin con la variable de inters o los cambios que se producen en la relacin fuera del ran go observado. Esto suele ocurrir cuando se utilizan los datos recogidos al trabajar el proceso en condi ciones normales y no se experimenta (cambiando las condiciones de funcionamiento) para observar el comportamiento del proceso en situaciones nuevas.

Tipos de variabilidad.
Uno de los principales objetivos de los modelos estadsticos y, en particular, de los modelos de diseo de expe rimentos, es controlar la variabilidad de un proceso que puede tener diferente origen. Los resultados de cualquier experimento estn sometidos a tres tipos de variabilidad cuyas caractersticas son las siguientes:

Variabilidad sistemtica y planificada.


Esta variabilidad viene originada por la posible dispersin de los resultados debida a diferencias sistemticas entre las distintas condiciones experimentales impuestas en el diseo por expreso deseo del experimentador. Es el tipo de variabilidad que se intenta identificar con el diseo estadstico. Cuando este tipo de variabilidad est presente y tiene un tamao importante, se espera que las respuestas tiendan a agruparse formando grupos (clusters). Es deseable que exista esta variabilidad y que sea identificada y cuantificada por el modelo.

-7-

Variabilidad tpica de la naturaleza del problema y del experimento.


Es la variabilidad debida al ruido aleatorio. Este trmino incluye, entre otros, a la componente de variabilidad no planificada denominada error de medida. Es una variabilidad impredecible e inevitable. Esta variabilidad es la causante de que si se toman medidas repetidas de un mismo objeto ocurra que, en mu chos casos, la segunda medida no sea igual a la primera y, ms an, no se puede predecir sin error el valor de la tercera. Sin embargo, existe un patrn regular de comportamiento en esas medidas: todas ellas tendern a fluctuar en torno a un valor central y siguiendo un modelo de probabilidad que ser importante estimar. Es una variabilidad que va a estar siempre presente pero que es tolerable.

Variabilidad sistemtica y no planificada.


Produce una variacin sistemtica en los resultados y es debida a causas desconocidas y no planificadas. En otras palabras, los resultados estn siendo sesgados sistemticamente por causas desconocidas. La presencia de esta variabilidad supone la principal causa de conclusiones errneas y estudios incorrectos al ajustar un modelo estadstico. Existen dos estrategias bsicas para tratar de evitar la presencia de este tipo de varibilidad: la aleatorizacin y la tcnica de bloques. Este tipo de variabilidad debe de intentar evitarse y su presencia lleva a conclusiones errneas.

Significatividad
La significatividad estadstica se utiliza para determinar si las estadsticas son confiables y si las diferencias que se encuentran sern siempre encontradas. El tipo ms comn de significatividad estadstica es el estadstico T y el p-valor. Diferencias muy pequeas pueden ser significativas cuando el tamao de la muestra es grande. Cuando el mismo es pequeo, entonces se requieren diferencias mucho mayores para alcanzar significatividad estadstica. Para determinar cuntas medidas se necesitan para encontrar significatividad estadstica, el tamao de la muestra se puede estimar antes de realizar el estudio.

Descripcin y representacin de datos de forma tabular y grfica


En toda investigacin o estudio estadstico se requiere medir las caractersticas en los objetos de estudio, es in dispensable disponer con mtodos de organizacin y representacin de datos, las representaciones tabulares y grficas pueden expresar o transmitir de manera sencilla y rpida, las tendencias o regularidades que manifiesten los datos.

Reglas para determinar el numero de clases y la amplitud del intervalo en una serie de datos.
1. Determinar el nmero de intervalos o clases necesaria, la regla ms comn es la de Herbert Sturges, la frmula es K =1+ 3.322 log n se redondea pues el nmero de intervalos debe ser entero. 2. Se calcula en nmero de unidades de variacin en los datos conocido como rango, se simboliza con R y es la diferencia del datos mayor y el menor. R= D max D min 3. Calcular la anchura o amplitud de cada intervalo, se divide el rango entre el nmero de intervalos.

A=

R , la amplitud debe tener el mismo nmero de decimales que los datos, con el fin de que todos K

los datos pertenezcan a un rango. 4. Se construyen los intervalos, el primero inicia con el nmero menor, se le suma la anchura A, y as sucesivamente hasta llegar al ltimo intervalo. Los intervalos se registran en la primera columna de la ta bla, se contabiliza el nmero de datos que corresponden a cada intervalo.

Lmite de los intervalos de clase para variables numricas discretas.


A los valores extremos de un intervalo de clase se les llama lmites. Al extremo izquierdo le denominamos lmite inferior y al extremo derecho del intervalo le denomina lmite superior.

-8-

Existen lmites reales para cada intervalo. El lmite inferior real de un intervalo se obtienen promediando el lmite superior del intervalo anterior con el lmite inferior de su intervalo, de igual forma en el superior real se promedia el lmite superior del intervalo con el inferior del siguiente intervalo. Otro valor representativo es la marca de clase o punto medio, que se calcula promediando el lmite inferior y su perior de cada clase. Simbologia para los lmites Li lmite inferior de cada intervalo. L s lmite superior de cada intervalo.

LR i lmite real inferior de cada intervalo. LR s lmite real superior de cada intervalo. mc Marca de clase de cada intervalo.

Para construir los intervalos reales se utilizan corchetes y parentesis, el corchete indica que que el extremo se incluye en el intervalo y si uno o ms datos coinciden se contabilizaran en el intervalo, el parentesis implica la exclusin del extremo del intervalo y si uno o ms datos coincidieran se contabilizaran en el intervalos sucesor. El ltimo intervalo siempre se considera cerrado, por lo tanto va entre corchetes.

Representacin tabular de los datos.


Las tablas estadsticas permiten resumir la informacin, en la primera columna aparece la variable de estudio y los valores que pueda tomar, en la o las siguientes columnas aparecen las frecuencias absolutas u otras que el estudio requiera. Componentes 1. Titulo. Incluye el objetivo del estudio, y la informacin ms relevante del estudio. 2. Encabezados. Describe el tipo de informacin de cada columna. 3. Cuerpo de la tabla. Agrupa el contenido de la informacin, contiene los valores de las variables, que son excluyentes, adems de la frecuencia asociada a cada uno de stos valores. 4. Final. En el que se presentan los totales. 5. Notas al pie. Explica detalles de la tabla. Ejemplo. Distribucin del uso de agua en nuestro pas Uso del agua Abastecimiento pblico Actividades agrcolas Suministro a Termoelctricas Industria Total Porcentaje 14 % 77 % 5% 4% 100 %
Fuente: CONAGUA Estadsticas del agua en Mxico, edicin 2007.

Distribucin de frecuencias.
Los datos obtenidos de una investigacin estadistica se ordenan, clasificacan y resumen, para lo cual se concentran en tablas de frecuencia que puedes ser de algunos de los siguientes tipos: Absoluta. f a El numro de veces que se repite un dato o valor de variable.

-9-

Relativa. f r Es la proporcin de elementos que pertenecen a una categora o valor de variable; se obtiene dividiendo la frecuencia absoluta entre el total de elementos. Se expresa como fraccin, porcentajes o valores decimales. Acumulada. f ac Se obtiene sumando la frecuencia absoluta, de un valor, con las frecuencas absolutas de los valores anteriores. Relativa acumulada. f rac Se obtiene sumando la frecuencia relativa de un valor con las frecuencias relativas de los valores anteriores.

Ejemplo: La siguiente tabla estadstica contiene los diferentes tipos de distribuciones de frecuencias. Nmero de computadoras por familia en un fraccionamiento perteneciente al municipio de San Luis Ro Colorado. Nmero de Nmero de Frecuencia Frecuencia Frecuencia relativa computadoras familias f a fr f ac acumulada Relativa acumulada 0 5 6.25 % 5 6.25 % 1 25 31.25 % 30 37.50 % 2 32 40.0 % 62 77.50 % 3 12 15.0 % 74 92.50 % 4 4 5.0 % 78 97.50 % Ms de 4 2 2.5 % 80 100.0 % Totales 80 100.0%
Fuente: Encuesta aplicada por un grupo de jovenes en proyectos escolares. Se aplic un muestreo aleatorio proporcional.

Representacin grfica de los datos: histogramas, polgonos de frecuencias y polgonos de frecuencias acumuladas.
La informacin de una tabla de frecuencias se puede presentar en forma de grfica, la cual permite tener una idea clara, precisa, global y rpida acerca de las observaciones de una muestra o poblacin. El tipo de grfica a utilizar depende de la variable en estudio, si es de tipo cualitativo se recomiendan: De barras, ya sea horizontal o vertical. Circulares. De anillo. Pictograma. Cartograma. Si es de tipo cuantitativo, se puede usar: Diagrama de tallo y hojas. Grficos de lnea. Histogramas. Polgonos de frecuencias.

Componentes de un grfico.
1. 2. 3. 4. Identificacin del grfico. Ttulo del grfico. Cuerpo del grfico o grfico. Pie del Grfico.

Histogramas.
Es una representacin grfica de una distribucin de frecuencias, utilizando barras para representar las frecuencias o frecuencias relativas de ocurrencia de cada valor o grupo de valores.

-10-

Generalmente se usa para: resumir un conjunto de datos para una sencilla compresin visual de sus caractersticas generales; sugerir modelos de probabilidad o transformaciones para anlisis; detectar un comportamiento inesperado o valores inusuales en los datos. Los datos estn agrupados en intervalos de la misma anchura, son mutuamente exclusivos, e incluyen todos los posibles datos. Para construir un histograma, se dibujar bsicamente un diagrama de barras, sin espacios en tre stas, colocando en el eje horizontal las marcas de clase o los lmites de cada intervalo en los extremos de las barras y en el eje vertical, una escala en la que se localizan las frecuencias correspondientes de cada inter valo de clase.Las barras se dibujan centradas en la marca de clase y con una altura igual a la frecuencia del intervalo. Ejemplo: La tabla siguente muestra las cuentas por cobrar de 55 clientes de una empresa comercial en febrero 2011 Monto de cuentas por cobrar (miles de pesos) [0.4, 1.2) [1.2, 2.0) [2.0, 2.8) [2.8, 3.6) [3.6, 4.4) [4.4, 5.2) [5.2, 6.0] Total 20 15 10 5 0 0.8 1.6 2.4 3.2 4 4.8 5.6 Nmero de clientes Frecuencia absoluta 4 7 10 17 9 5 3 55 20 15 10 5 0 0.4 1.2 2 2.8 3.6 4.8 5.2 6

Polgono de frecuencia.
20 15 10 5 0 0.2 0.8 1.6 2.4 3.2 4 4.8 5.6 5.4 Es un grfico de lneas en el cual el eje horizontal representa los datos a travs de sus marcas de clase, y el eje vertical las frecuencias de cada uno de los intervalos.

-11-

La forma de un histograma puede sugerir un comportamiento esto a aproximar la curva que suavemente los describe, sta es la campana de Gauss o curva normal:

Polgono de frecuencias acumuladas.


A los polgonos de frecuencias acumuladas se les llama ojivas y a los polgonos de frecuencias relativas acumu ladas se les llama ojivas porcentuales. Se construyen de forma similar a los polgonos de frecuencias, la dife rencia es que los polgonos de frecuencia acumulada ya no descienden. Para el ejemplo anterior:

60 50 40 30 20 10 0 0 0.8 1.6 2.4 3.2 4 4.8 5.6

Otras representaciones grficas. De circulo o pastel


7.69% 13.46% 19.23% 32.69% 9.62% 17.31% 0.8 1.6 2.4 3.2 4 4.8

Para distribuir las clase se aplica una regla de tres relacionando el total de la muestra o poblacin con 360. Ejemplo: Considerando la primera clase del ejercicio anterior se tiene que la frecuencia es 4 que representa el 7 del total de la muestra entonces,

-12-

x= Arco del sector

x=

3607 =25.2 100

Esta operacin se repite para cada clase de la muestra o poblacin.

Pictograma
Es un grfico con dibujos alusivos a la caracterstica que se est estudiando y cuyo tamao es proporcional a la frecuencia que representan; dicha frecuencia se suele indicar en el grfico.

Cartogramas
son grficos realizados sobre mapas, en los que aparecen indicados sobre las distintas zonas cantidades o co lores de acuerdo con el carcter que representan.

Urbanizacin en el mundo atendiendo a la industrializacin

-13-

Estadstica descriptiva.
Medidas de tendencia central y variabilidad para datos agrupados y sin agrupar.
Es necesario resumir los datos en unos pocos representativos, que se conocen como las medidas de tendencia central, a saber: la media o promedio, la moda y la mediana. La moda y la mediana slo se pueden obtener en variables cuantitativas, mientras que la moda se puede obtener en variables cuantitativas o cualitativas. Se dice que los datos estadsticos no estn de forma agrupada cuando no se encuentran resumidos en tablas de distribucin de frecuencias.

Promedio o media aritmtica.


Son una medida de posicin que dan una descripcin compacta de cmo estn centrados los datos y una visualizacin ms clara del nivel que alcanza la variable, pueden servir de base para medir o evaluar valores extre mos o raros y brinda mayor facilidad para efectuar comparaciones. En forma prctica se dice que es la suma de todas las cantidades dividida entre el nmero de ellas. Se representa con el smbolo que se lee x testada. x La representacin matemtica es:

x =

x 1 + x 2 + x 3 +. . . .+ x n i =1 = n n

xi

Caractersticas de la media: En su clculo se consideran todos los valores del conjunto de datos. La suma de las desviaciones de los valores individuales respecto a la media es 0 Es afectada por los valores extremos, por lo que si la distribucin es sesgada no constituye un valor representativo.

Moda
Es el valor que mayor frecuencia absoluta tiene en un estudio estadstico, o sea el que se repite ms. Puede ocurrir que la moda no sea nica, es decir, que haya ms de un valor con la frecuencia mxima. Se habla entonces de distribuciones bimodales, trimodales, etc. Se puede simbolizar con x . Se considera el valor ms tpico de una serie de datos. Caractersticas de la moda: Representa ms elementos que cualquier otro valor. No permite conocer la mayor parte de los datos. Puede usarse en variables cuantitativas y cualitativas. Vara mucho de un muestra a otra. Al obtener ms de una moda se dificulta su interpretacin.

Mediana
En datos numricos es el que ocupa el valor central. Para calcularla, ordenamos las cantidades de menor a mayor y elegimos la del medio. Si hay un nmero par de datos, la mediana es el promedio de los dos valores cen trales. No se ve afectada por los valores extremos. Se le representa como x o M e .

-14-

En datos agrupados.
Media Cuando se tiene una muestra con muchos valores es tedioso obtener el promedio con la frmula anterior, se pueden sumar el producto de las frecuencias por su valor correspondiente y dividir el resultado entre la sumatoria de las frecuencias absolutas.

x i=1 = k

f i xi fi
i=1

En donde la k representa el nmero de valores diferentes que toma la variable de estudio, y las frecuencias.

f i cada una de

La moda se obtiene por inspeccin visual. Localizando el intervalo donde se encuentra la frecuencia mayor. La mediana se obtiene dividiendo la cantidad de elementos de la muestra o poblacin entre dos se decide si es la cantidad es par se toman los dos centrales, se es non slo el central . Se suman las frecuencias absolutas hasta localizar el o los valores centrales.

En datos agrupados por intervalos.


En estos casos las tres medidas de tendencia central requieren de expresiones algebraicas para su clculo.

Media.
De cada intervalo se calcula su marca de clase que se tomara como valor representativo de su intervalo, se aplica la siguiente frmula:
k

x i=1 =

f i x i mci fi
i=1 k

Donde: f es la frecuencia de cada intervalo, mc es la marca de clase de cada intervalo, k representa el nmero de intervalos.

Moda.
En el caso de variables continuas es correcto referirse a intervalos modales, como aquellos que tienen mayor frecuencia con respecto al intervalo anterior y al posterior.

x =E i +(

da + dp) A da

Donde: E i es el Extremo inferior o lmite real del intervalo modal, da Diferencia de la frecuencia del intervalo modal y la frecuencia del intervalo anterior, dp es la diferencia del intervalo modal y el intervalo posterior, A es la amplitud del intervalo modal.

Mediana.
n f anteriores 2 x =E i +( )A f mediana

-15-

En donde: E i es el extremo inferior o lmite real del intervalo mediana, f anteriores es la sumatoria de las frecuencias anteriores al intervalo mediana, f mediana frecuencia del intervalo mediana, A Amplitud del intervalo mediana.

Medidas de dispersin.
Los estadsticos de tendencia central indican dnde se sita un grupo de datos; los de variabilidad o dispersin indican si esas puntuaciones o valores estn prximas entre s, o al contrario, estn muy dispersas. Entre las medidas de dispersin o variacin se tiene: el rango, la varianza, la desviacin tpica, la desviacin media y el coeficiente de variacin.

Rango.
Se obtiene de restar el dato menor del dato mayor, se simboliza con R y su frmula es:

R=dato mayordato menor

Varianza.
Permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media ). Dependiendo del tipo de muestreo se puede utilizar alguna de las siguientes:

Poblacin no agrupada

Muestra de datos no agrupada

(x i )2
i =1

x Donde: media poblacional, es la media muestral, N es el tamao de la muestra, cualquier dato de la muestra.
Distribuciones de frecuencias poblacional agrupadas sin intervalos

s = i =1

x (x i )2 n1
n

es el tamao de la poblacin,

Distribuciones de frecuencias muestrales agrupadas sin intervalos

2= i =1
Donde dio.

f i (x i) fi
i=1 k

s 2= i =1

x f i (x i )2

f i1
i=1

es el nmero de agrupaciones o valores diferentes que puede tomar una variable de estuDistribuciones de frecuencias muestrales agrupadas con intervalos.

Distribuciones de frecuencias poblacional agrupadas con intervalos

f i (mci )
i =1

s 2= i =1

x f i (mci )2

fi
i=1

i =1

f i1

Representa el nmero de intervalos de clase.

-16-

Desviacin estndar.
Permite determinar el promedio aritmtico de fluctuacin de los datos respecto a su punto central o media. La desviacin estndar nos da como resultado un valor numrico que representa el promedio de diferencia que hay entre los datos y la media. La frmula es:

s= s 2
Propiedades de la varianza y de la desviacin estndar Ambas son sensibles a la variacin de cada una de las puntuaciones, es decir, si una puntuacin cam bia, la varianza se modifica. No es recomendable el uso de ellas, cuando tampoco lo sea el de la media como medida de tendencia central,en casos de distribuciones de frecuencias que presentan asimetra.

Coeficiente de variacin
El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media. permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre s.

CV =

Propiedades del coeficiente de variacin. Slo se debe calcular para variables con todos los valores positivos. Todo ndice de variabilidad es esencialmente no negativo. Las observaciones pueden ser positivas o nulas, pero su variabilidad debe ser siempre positiva. De aqu que slo se debe trabajar con variables positivas, para la que se tiene con seguridad que x > 0. Ejemplo: Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 25. Cul de las dos presenta mayor dispersin? coeficiente de variacin

S x

Para una poblacin estadstica

CV = my

CV 1=

28.28 100=20.2 140

coeficiente de variacin

-17-

-18-

Conclusiones
Las aplicaciones de la estadstica son muchas y muy variadas, cualquier actividad que requiera del mtodo cientfico se beneficia de su aplicacin, en la industria es auxiliar de la produccin y de los planes de mantenimiento. La importancia de su estudio es que ayuda a tomar decisiones en las actividades que desarrollemos, desde econmicos, administrativas, de produccin y si somos muy detallistas se puede aplicar en la economa familiar desde el consumo de combustibles, como el gas o gasolina, hasta el control del gasto. Sin embargo se tiene que utilizar con cuidado y en casos en que las observaciones sean mltiples, si se quiere utilizar para el promedio de slo dos valores su resultados no son significativos, lo mismo si el mtodo se aplica con valores tendenciosos. Me parece que se puede enriquecer la experiencia de aprendizaje si en lugar de realizar slo un trabajo de con sulta se dirige al desarrollo de un proyecto utilizando todas las herramientas que se plasman en este documen to.

Bibliografa.
PROBABILIDAD Y ESTADSTICA I Mdulo de Aprendizaje. Copyright , 2008 por Colegio de Bachilleres del Estado de Sonora Probabilidad y Estadstica 1 Mdulo de Aprendizaje. Copyright , 2011 por Colegio de Bachilleres del Estado de Sonora Curso de Probabilidad y Estadstica Dr. Jos Antonio Camarena Ibarrola Universidad Michoacana de San Nicols de Hidalgo Facultad de Ingeniera Elctrica Direcciones electrnicas. http://www.vitutor.com/estadistica/descriptiva/a_1.html http://es.wikipedia.org/wiki/Estadistica http://www.ditutor.com/inferencia_estadistica/muestreo_sistematico.html http://www.udc.es/dep/mate/estadistica2/sec2_2.html http://www.ehowenespanol.com/calcular-tamano-muestra-significativa-estadisticamente-como_20635/ http://www.ceibal.edu.uy/UserFiles/P0001/ODEA/ORIGINAL/090316_estadistica.elp/pictograma.html http://www.spssfree.com/spss/analisis2.html http://www.vitutor.com/estadistica/descriptiva/a_17.html

-19-

You might also like