TECNOLOGA EN GESTIN PBLICA FINANCIERA TECNOLOGA EN GESTIN PBLICA CONTABLE
ORLANDO MOSCOTE FLREZ
ESCUELA SUPERIOR DE ADMINISTRACIN PBLICA
ESCUELA SUPERIOR DE ADMINISTRACIN PBLICA
Director HONORIO MIGUEL HENRIQUEZ PINEDO
Subdirector acadmico CARLOS ROBERTO CUBIDES OLARTE
Decano de pregrado JAIME ANTONIO QUICENO GUERRERO
Coordinador Nacional de A.P.T JOSE PLACIDO SILVA RUIZ
ESCUELA SUPERIOR DE ADMINISTRACIN PBLICA ORLANDO MOSCOTE FLREZ
Bogot D.C., Enero de 2008
CONTENIDO
Del trabajo del tutor 1 INTRODUCCIN A LA ESTADSTICA 1.1 Presentar la Estadstica como ciencia 1.2 Usos de la estadstica 1.3 Trminos frecuentes en estadstica 1.4 El muestreo y el censo 1.5 Clases de variables 1.6 Tipos de datos. 2 DISTRIBUCIONES DE FRECUENCIAS 2.1 Definicin de una distribucin de frecuencias 2.2 Distribucin para datos cualitativos 2.3 Distribucin para variables cuantitativas discretas 2.4 Distribucin para variables cuantitativas continuas 2.5 Datos cronolgicos 3 MEDIDAS DE TENDENCIA CENTRAL 3.1 Introduccin 3.2 Media aritmtica 3.3 Media Geomtrica 3.4 Mediana 3.5 Moda 4 MEDIDAS DE DISPERSIN 4.1 Introduccin 4.2 Rango o Recorrido 4.3 Varianza 4.4 Desviacin estndar 4.5 Coeficiente de variacin 5 ANLISIS DE REGRESIN 5.1 Introduccin 5.2 Diagrama de dispersin 5.3 Estimacin de la ecuacin lineal de mnimos cuadrados 5.4 Error estndar de estimacin 5.5 Coeficiente de determinacin 5.6 Coeficiente de correlacin 6 SERIES DE TIEMPO 6.1 Introduccin 6.2 Definicin de una serie de tiempo 6.3 Componentes de una serie de tiempo 6.4 Anlisis de tendencia 6.5 Pronsticos con las series de tiempo 7 NMEROS NDICES 7.1 Introduccin 7.2 Definicin de un nmero ndice 7.2.1 ndices para un solo bien 7.2.2 ndices de base fija 7.2.3 ndices de base variable 7.3 ndices compuestos 7.3.1 ndices de agregativos simple 7.3.2 ndices de promedios de relativos 7.4 ndices ponderados 7.4.1 ndice de Laspeyres 7.4.2 ndice de Paasche. 7.4.3 ndice de Fisher 7.5 Cambio de base 7.5.1 De una base fija a otra base fija 7.5.2 De una base variable a una base fija o a la inversa 7.6 Uso de los nmeros ndices 7.7 Definicin de un nmero ndice
DEL TRABAJO DEL TUTOR
El tutor tendr libertad de ctedra en cuanto a su posicin terica o ideolgica frente a los contenidos del mdulo, pero el desarrollo de los contenidos de los mdulos son de obligatorio cumplimiento por parte de los tutores. Los Tutores podrn complementarlos los mdulos con lecturas adicionales, pero lo obligatorio para el estudiante frente a la evaluacin del aprendizaje son los contenidos de los mdulos; es decir, la evaluacin del aprendizaje deber contemplar nicamente los contenidos de los mdulos. As mismo, la evaluacin del Tutor deber disearse para dar cuenta del cubrimiento de los contenidos del mdulo. El Tutor debe disear, planear y programar con suficiente anticipacin las actividades de aprendizaje y los contenidos a desarrollar en cada sesin de tutora (incluyendo la primera). Tambin debe disear las estrategias de evaluacin del trabajo del estudiante que le permita hacer seguimiento del proceso de autoaprendizaje del estudiante. Por cada crdito, 16 horas son de tutora presencial o de encuentro presencial y 32 horas son de autoaprendizaje (y este tiempo de trabajo del estudiante debe ser objeto de seguimiento y evaluacin por parte del tutor). Las asignaturas (mdulos) de APT son de 2, 3 y 4 crditos.
ESTADSTICA
UNIDAD I INTRODUCCIN A LA ESTADSTICA
OBJ ETIVOS
1. PRESENTAR LA ESTDSTICA COMO CIENCIA 2. DAR A CONOCER ALGUNOS USOS DE LA ESTADSTICA 3. PRESENTAR ALGUNOS TRMINOS FRECUENTES EN ESTADSTICA. 4. DEFINIR LOS CONCEPTOS DE MUESTREO Y CENSO 5. CLASIFICAR LOS TIPOS DE VARIABLES 6. DEFINIR LOS TIPOS DE DATOS.
1.1 ORIGEN Y DESARROLLO DE LA ESTADSTICA
La palabra Estadstica es ampliamente utilizada a diario, generalmente refirindose a hechos numricos. En sus inicios, efectivamente la estadstica se utiliz en trminos de contar hechos o fenmenos que ocurran en una poblacin. Para los gobernantes era necesario disponer de informacin acerca de las actividades que ocurran en sus Estados, como por ejemplo, conocer el nmero de habitantes que lo conformaban, el nmero de hombres disponibles para la guerra, el nmero de personas que moran de una determinada enfermedad.
Si bien, estos fueron los inicios rudimentarios de la Estadstica, aun hoy ese uso sigue dndose como una simple recopilacin de datos numricos para analizar un fenmeno, como puede ser una recopilacin de datos acerca de la produccin de bienes y servicios, las cuentas nacionales de un pas, recuentos demogrficos o de salubridad que pueden implicar un proceso laborioso y de alta tcnica que incluyen principios tericos de microeconoma, macroeconoma o bioestadstica, tambin pueden referirse a recuentos ms sencillos o cotidianos como las estadsticas que se relacionan con un partido de football o de baseball.
Sin embargo, durante el siglo XVII, Blas Pascale y Pierre de Feermat, a partir de algunas inquietudes relacionadas con los juegos de azar sentaron las bases de lo que posteriormente se conocera como Clculo de Probabilidades, pero solamente hasta finales del siglo XIX y principalmente a principios del siglo XX, Francis Galton, William Gosset, Karl Pearson y sobre todo Ronald Fisher, crearon lo que hoy es la Estadstica Moderna: ms que una simple recopilacin de datos, es un proceso sistemtico de principios cientficos que pueden ser aplicados en muchas otras ciencias para contribuir a la toma de decisiones en condiciones de riesgo o incertidumbre.
1.2 USO DE LA ESTADSTICA
Algunos ejemplos del uso de la Estadstica en diferentes campos son : establecer cul de varios procedimientos o tratamientos es el mejor ; probarse una droga es ms efectiva que otra en el tratamiento de una enfermedad ; elaborar modelos acerca del comportamiento del inventario de una materia prima, para determinar el tamao ptimo del lote que se requiere pedir, y lapsos de reaprovisionamiento ; realizar estudios de colas en un banco o en un supermercado con el propsito de establecer el nmero de cajas que se requieren para atender a los clientes.
Los anteriores son algunos ejemplos que pueden ser aplicados en campos tan diversos como la Ingeniera, la Medicina, la Administracin. Pero todos tienen en comn un hecho: se acude al estudio de algunos casos, una muestra, con el fin de realizar generalizaciones para ayudar en la toma de decisiones, y justamente, el Administrador de Empresas es el Profesional que frecuentemente se enfrenta a la toma de decisiones, pues tiene diferentes alternativas entre las cuales debe elegir con el propsito de maximizar la administracin Empresarial. En el estudio de Administracin de Salarios, el la Investigacin de Operaciones, en el Control de Calidad, en la Investigacin de Mercados, en Comercializacin son campos en los cuales el Administrador de Empresas se suele mover frecuentemente y en los cuales ser necesario que deba acudir a sus conocimientos de Estadstica.
Adems de las anteriores consideraciones, la Estadstica como ciencia de origen Matemtico le ayudar en la obtencin de un proceso de racionamiento lgico en la organizacin de conjuntos de datos numricos que le permitirn con mayor eficiencia enfrentar decisiones en su vida estudiantil o profesional. Dentro de este contexto, es entonces, que la Estadstica se considera una poderosa herramienta que le permitir utilizar procedimientos y tcnicas necesarias como soporte de la toma de decisiones a nivel empresarial.
1.3 DEFINICIN DE ESTADSTICA
La Estadstica puede definirse como: Ciencia que trata de los procedimientos para recolectar, procesar, interpretar y analizar conjuntos de datos numricos obtenidos de una poblacin o de una muestra con el fin de extraer conclusiones acerca de un fenmeno que se estudia y apoyar la toma de decisiones.
La estadstica se divide en dos ramas: 1. Estadstica descriptiva, que permite describir las caractersticas que presentan los elementos de una poblacin o de una muestra. 2. Estadstica inferencial, que estudia una muestra y a partir de ella trata de obtener conclusiones vlidas para la poblacin de la cual se extrajo la muestra. La muestra debe ser representativa de la poblacin.
ERROR EN LA INFERENCIA.
En los procedimientos de inferencia estadstica se pueden presentar dos tipos de errores: 1. Error no muestral. Este error usualmente se presenta, no por el hecho de estudiar solo una muestra, sino por los procedimientos de recoleccin y procesamiento de los datos. Algunos de estos errores pueden ser: preguntas mal formuladas, malas respuestas, error en los clculos realizados Este error no se puede medir pero se puede controlar a partir de buenos procedimientos de recoleccin de los datos. 2. Error muestral. Es el error que se presenta por el simple hecho de estudiar una poblacin mediante una muestra y no con toda la poblacin. Este error se puede medir y adems se puede controlar mediante un buen diseo del procedimiento muestral, como es el de seleccionar adecuadamente el tipo de muestreo a utilizar y un adecuado tamao de muestra.
1.4 FUENTES DE DATOS.
La recoleccin de los datos se puede realizar a partir de tres fuentes: 1. Datos internos de las empresas o de entidades pblicas o privadas. Las empresas como parte de sus actividades rutinarias generan y conservan datos que un investigador puede utilizar. Por ejemplo las empresas tienen datos de sus empleados, de las ventas, del origen de sus materias primas de sus fuentes de financiacin. Estos datos pueden ser utilizados para realizar estudios sobre la administracin, mercadeo u otras funciones de las empresas. Igualmente las entidades pblicas llevan tambin datos sobre sus actividades. Adems, existen entidades pblicas encargadas de llevar datos sobre diferentes actividades del pas y que son materia prima de muchos estudios e investigaciones. En Colombia la entidad encargada de llevar datos sobre muchas caractersticas es el DANE (Departamento Administrativo Nacional de Estadstica). All se encuentran muchos datos sobre estudios demogrficos, precios, comercio exterior, etc. Otras entidades que tienen datos tiles son el DNP (Departamento Nacional de Planeacin), el Banco de la Repblica, Cmaras de Comercio, Asociaciones o Agremiaciones que tienen datos disponibles sobre las actividades de sus asociados y a las cuales es posible acceder para realizar algunos estudios. 2. Los experimentos diseados. Estos datos surgen de la manipulacin deliberada de algunas variables por parte de un investigador .Es decir, el investigador realiza una serie de actividades sobre sujetos experimentales con el fin de medir la respuesta que surge de la manipulacin de ciertas variables, llamadas variables independientes. Tales experimentos son muy frecuentes en la agricultura o en, donde se pueden utilizar diferentes tipos de abonos (variables independientes) y luego medir la magnitud de la cosecha obtenida (variable respuesta o variable dependiente); en medicina, y en la industria es muy comn realizar este tipo de experimentos. 3. La tercera fuente de datos son las encuestas. En este caso el investigador no puede realizar manipulacin de variables sino que se enfrenta a situaciones que ya son dadas. En las encuestas se obtienen datos directamente de los individuos. Son muy utilizadas en estudios de mercados, estudios de preferencias electorales, estudios sociales y econmicos.
Las encuestas se pueden realizar bsicamente a partir de tres formas: 3.1 Por correo. 3.2 Telfono. 3.3 Mediante entrevistas personales.
1.5 MTODOS RECOLECCIN.
1. Censo. 2. Muestreo.
TIPOS DE MUESTREO. 1. MUESTREO NO PROBABILSTICO. 2. MUESTREO PROBABILSTICO.
En el censo se requiere estudiar todos los elementos que conforman una poblacin. Sin embargo, en la mayora de los estudios no es posible estudiar todos los elementos de la poblacin, pues estas tienden a ser muy grandes lo que implica mucha demora en la recoleccin de los datos y sobre todo altos costos.
El estudio por muestreo persigue los siguientes fines: 1. Seleccionar las unidades de la poblacin que se incluirn en el estudio. 2. Interpretar los resultados del estudio con el fin de estimar los parmetros de poblacin a partir de los datos de la muestra y probar hiptesis, generalmente para comparar dos o ms poblaciones o con respecto a ciertos valores esperados para uno o ms parmetros o en una poblacin para establecer si un valor supuesto para un parmetro puede ser validado a partir de la informacin muestral.
El desarrollo de la Estadstica ha hecho que su objetivo sea realizar inferencias acerca de una poblacin con base en la informacin obtenida a partir de una muestra. La inferencia estadstica puede realizarse mediante la estimacin de un parmetro o mediante la prueba de hiptesis acerca del valor de un parmetro poblacional. Los parmetros ms usuales son la media aritmtica ( ) y la proporcin (P).
Cuando se selecciona un elemento de una poblacin, ste elemento contiene cierta cantidad de informacin acerca del parmetro de inters. La seleccin de cada elemento tiene un costo, de tal manera que se debe determinar cuntos elementos se deben seleccionar.
El problema lo centraremos en esta situacin: Cuntos elementos debemos seleccionar en una muestra de tal manera que nuestras estimaciones contengan la menor cantidad de error posible y el costo sea mnimo. Se comprende que estos dos objetivos son contrapuestos.
1.6 SELECCIN DE UNA MUESTRA
El objetivo del muestreo es estimar un parmetro de una poblacin. Al seleccionar una muestra, debemos tener presente que la muestra no nos proporcionar informacin completa sobre una poblacin. La diferencia entre un valor real del parmetro en la poblacin y el valor estimado a partir de la muestra para ese parmetro se llama error de muestreo. Este error siempre estar presente en el muestreo pero puede ser controlado mediante un buen diseo del muestreo: seleccin de un adecuado tamao de muestra y utilizacin del tipo de muestreo que sea ms adecuado para la poblacin bajo estudio. Sin embargo, en cualquier estudio tendremos otro tipo de error que se puede introducir y es llamado error de no muestreo, que principalmente se debe a : a. Imposibilidad de localizar a los informantes. b. Negativa de los informantes a dar las repuestas. c. Malas respuestas intencionales de los informantes. d. Dificultad de los informantes en recordar las respuestas. e. Mal entendimiento de las preguntas debido a una deficiente redaccin de ellas, f. Manipulacin por parte del entrevistador. g. Errores de anotacin por parte del entrevistador. h. Errores en la codificacin o procesamiento de la informacin. Estos errores pueden ser minimizados a travs de un buen diseo del proyecto de investigacin. La utilizacin de una PRUEBA PILOTO puede ser un buen instrumento para corregir algunos de estos errores de no muestreo.
MUESTREO Y CENSO.
Una muestra usualmente comprende el estudio de una parte de los elementos de una poblacin, mientras que el censo consiste en estudiar todos los elementos de sta. En teora puede ser ms conveniente estudiar la poblacin completa, en la prctica ocurre todo lo contrario: es mejor realizar un muestreo que un censo, Las principales razones para realizar un muestreo son: 1. La poblacin tericamente puede ser infinita, en cuyo caso sera imposible realizar un censo. 2. Una muestra puede ser ms oportuna que un censo. Cuando se requiere rpidamente informacin sobre una poblacin, su estudio completo puede requerir tanto tiempo que su utilidad sera poca. Tambin puede darse el caso de que ciertas poblaciones tienden a cambiar rpidamente con el tiempo, por ejemplo la mayora de los estudios de opinin requieren hacerse durante un tiempo muy corto. 3. En algunos casos el estudio de los elementos requieren la utilizacin de ensayos destructivos. 4. El costo de efectuar un censo suele ser muy alto. 5. La exactitud puede verse afectada cuando se realiza un censo de una poblacin grande. Cuando es necesario procesar gran cantidad de datos es posible que se introduzcan errores no deseables. 6. Se puede realizar una mejor planeacin y controlen el diseo de la investigacin. 7. Se puede realizar un estudio ms detallado sobre la poblacin.
Sin embargo, pueden existir algunas circunstancias que hacen ms ventajoso la utilizacin de un censo, por ejemplo: 1. Cuando la poblacin de inters sea tan pequea que un costo y tiempo adicional en el estudio de la poblacin est plenamente justificado. 2. si el tamao de la muestra requerido es relativamente grande comparado con el tamao de la poblacin. 3. Si se requiere una exactitud completa en la informacin, el censo sera la nica va de obtenerla.
DISEO DEL MUESTREO.
El diseo de un estudio por muestro comprende: 1. Establecer detalladamente cul es la poblacin de inters, de tal manera que se pueda establecer si un elemento pertenece o no a ella, esto depender de los objetivos que persiga el estudio. 2. Establecer los parmetros de inters, es decir las medidas de la poblacin que nos interesa estimar o contrastar. 3. Seleccionar el marco de muestreo. El marco de muestreo es una lista o algn procedimiento que permite identificar todos los elementos de la poblacin. Determinar el tipo de muestreo que se utilizar, es decir qu procedimiento aleatorio se utilizar para seleccionar los elementos de la muestra. 4. Establecer el tamao de muestra que ser necesaria. 5. Anlisis de los datos.
1.7 TIPOS DE MUESTREO
Existen dos tipos bsicos de muestreo: El muestreo No probabilstico y el muestreo probabilstico.
El muestreo no probabilstico llamado tambin muestreo circunstancial se caracteriza por que los elementos a ser incluidos en la muestra no tienen especificada una probabilidad o ella no se conoce, si la tienen, de ser incluidos en la muestra y por que el error de muestreo no puede ser medido. Los principales tipos de muestreo no probabilstico son:
1. MUESTREO POR CONVENIENCIA. En el cual se deja la seleccin de los elementos primordialmente a los entrevistadores. En general, los elementos se seleccionaran por su facilidad de acceso o su conveniencia.
2. MUESTREO POR CRITERIO. Implica seleccionar los elementos que a juicio de quien selecciona la muestra sean los ms representativos de la poblacin.
3. MUESTREO POR CUOTA. Un muestreo muy utilizado en investigacin de mercados, cuando se desea tener algn conocimiento sobre la opinin de un grupo de consumidores potenciales sobre un determinado producto. La muestra se estructura de tal manera que incluya nmeros especficos de elementos con caractersticas que se sabe o se cree que afectan el tema de investigacin.
A pesar de las dificultades tericas que presenta el muestreo no probabilstico, principalmente por el hecho de no poder ser utilizado para realizar inferencias, es extensamente utilizado en investigacin de mercados en estudios de tipo exploratorio, prueba de productos, entrevistas por detencin en centros comerciales, discusiones de grupo, panel de consumidores. Pero un cuidadoso diseo de una muestra no probabilstico puede generar resultados satisfactorios.
En el muestro probabilstico los elementos son seleccionados por cualquier procedimiento de azar, teniendo cada muestra posible una probabilidad conocida de ser seleccionada. Sus resultados pueden ser utilizados para realizar inferencias sobre los parmetros poblacionales, y adems, es posible medir el error de muestreo. Los principales tipos de muestreo probabilsticos son:
MUESTREO ALEATORIO SIMPLE. Es el tipo ms sencillo de muestreo probabilstico y base para los otros tipos de muestreo probabilsticos. Se utiliza en poblaciones cuyos elementos son homogneos en las caractersticas de inters. Cuando los elementos son homogneos (presentan una varianza pequea), la muestra tiende a ser representativa de la poblacin. Los elementos son seleccionados mediante cualquier procedimiento de azar.
MUESTREO ALEATORIO ESTRATIFICADO. Se utiliza cuando la poblacin en estudio presenta gran heterogeneidad en sus caractersticas. Los elementos se separan formando subgrupos (llamados estratos), de tal forma que cada uno de los estratos presente homogeneidad interna, pero que presenten gran heterogeneidad con respecto a los dems estratos. En general, en el muestreo estratificado se requiere la utilizacin de una variable auxiliar para realizar la estratificacin. La muestra, entonces, se toma de cada uno de los estratos.
MUESTREO SISTEMATICO. En este muestreo, los elementos se seleccionan de la poblacin dentro de un intervalo uniforme con respecto al tiempo, al orden o al espacio, aunque puede ser inapropiado cuando los elementos presentan un patrn secuencial, presenta una gran sencillez en la forma de seleccin de los elementos.
MUESTREO POR CONGLOMERADOS. En este tipo de muestreo se divide la poblacin en grupos, llamados conglomerados, y luego se toma una muestra aleatoria de conglomerados. En el muestreo por conglomerados, cada uno de los conglomerados se espera que cada conglomerado sea internamente heterogneo, es decir, que los elementos presenten una gran variabilidad en sus caractersticas.
La principal ventaja de los muestreos probabilsticos es su precisin, pues con ellos se logra una muestra que sea representativa de la poblacin en estudio. Debido a ello son ampliamente utilizados.
1.8 VARIABLE. TIPOS DE VARIABLES.
La Estadstica se desarrolla a partir del concepto de variable. Una variable se puede definir como cualquier smbolo(X, Yetc.) que puede tomar diferentes valores de un conjunto dado. Las variables representan las caractersticas que tienen los elementos que se estudian. Cada elemento que se estudia presenta unas caractersticas que interesa conocer. Si los elementos que se estudian son personas, por ejemplo, nos interesara conocer de ellas su gnero, su edad, su ingreso mensual, su estado civil, etc. Si los elementos que nos interesa estudiar son empresas, de ellas nos interesara conocer de ellas, por ejemplo, el sector econmico donde desarrolla su actividad, el tipo de sociedad, el nmero de empleados que tiene, las ventas realizadas por ellas el mes pasado, etc.. Cada una de estas caractersticas son las que nos interesa estudiar y constituyen las variables, pues cambian de persona a persona o de empresa a empresa.
Las variables pueden clasificarse en dos tipos. 1. VARIABLES CUALITATIVAS. Son aquellas que representan caractersticas observables o atributos que presentan los elementos. Por ejemplo, en las personas el gnero, el estado civil, el lugar de nacimiento son variables de tipo cualitativo. 2. VARIABLES CUANTITATIVAS. Son aquellas que expresan la magnitud de una caracterstica, es decir se pueden medir o contar. Por ejemplo en las personas podemos tener inters en estudiar su ingreso mensual, el nmero de personas que tiene a cargo. Esta caractersticas de las personas constituyen variables de tipo cuantitativo, pues son susceptibles de ser expresadas numricamente. Las variables cuantitativas se suelen, a su vez, clasificar en dos tipos: 1. VARIABLES CUANTITATIVAS DISCRETAS. Son aquellas que toman un nmero finito de valores posibles. Estas variables suelen asumir solo valores enteros. Por ejemplo el nmero de hijos de una persona solo admite valores enteros. En general sus valores se obtienen mediante procesos de conteo. 2. VARIABLES CUANTITATIVAS CONTINUAS. Son aquellas que pueden tomar cualquier valor real. En general corresponden a variables que se obtienen a partir de procesos de medicin. Peso, estatura longitud, ingreso, son algunos ejemplos de variables cuantitativas continuas. Esta clasificacin es importante puesto que existen procedimientos diferentes para su tratamiento estadstico segn sea el tipo de variable que se analice.
1.1 TIPO DE DATOS.
Los datos constituyen registro de los valores de las variables en los elementos que se estudian. Los procedimientos estadsticos se aplican a conjuntos de datos que son obtenidos de una poblacin o de una muestra de elementos. Los datos, segn las variables que se estudien, se pueden clasificar en:
1. DATOS CUALITATIVOS. Son un conjunto de registros que se refieren a un conjunto de elementos que en un momento dado se han clasificado segn una cualidad o atributo. Los datos cualitativos o categricos admiten pocos procedimientos estadsticos, tales como procedimientos de conteo o de asociacin. 2. DATOS CUANTITATIVOS. Son un conjunto de registros que se refieren a un conjunto de elementos, que en un momento dado, se han clasificado segn la magnitud de una caracterstica. Los datos cuantitativos permite utilizar con ellos una gran variedad de procedimientos estadsticos, tales como medidas que permiten caracterizar a todo el conjunto de elementos estudiados. 3. DATOS CRONOLOGICOS O DE SERIES DE TIEMPO. Son conjuntos de registros que se refieren a un elemento que se ha medido en diferentes pocas o periodos, generalmente a intervalos iguales de tiempo. Los datos cronolgicos son datos de tipo cuantitativos pero solamente se considera un elemento en diferentes momentos.
El material que sigue trata fundamentalmente de los procedimientos estadsticos utilizados para resumir un conjunto de datos. Supondremos que los datos provienen de una muestra.
El procedimiento ms simple, pero fundamental en el tratamiento de los datos es su resumen mediante tablas o grficos, llamadas distribuciones de frecuencias, que ser el tema del siguiente captulo. En los captulos siguientes se trabajar sobre las medidas ms usuales. Los dos ltimos captulos se dedican a los datos de tipo cronolgicos o series de tiempo.
BIBLIOGRAFA
LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y ECONOMA. Pearson Educcin, 2004.
MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y ECONOMIA. Editorial alfaomega. 2005.
SCHEAFFER,Richard L., MENDENHALL, William, OTT,Lyman. ELEMENTOS DE MUESTREO. Grupo Editorial Iberoamrica. 1992.
UNIDAD II DISTRIBUCIONES DE FRECUENCIAS
OBJ ETIVOS. 1. RESUMIR UN CONJ UNTO DE DATOS. 2. PRESENTAR LOS DATOS MEDIANTE TABLAS DE DISTRIBUCION DE FRECUENCIAS 3. REALIZAR LA PRESENTACIN GRFICA DE LOS DATOS. 4. INTERPRETAR ADECUADAMENTE LOS ELEMENTOS DE LAS TABLAS DE DISTRIBUCIN DE FRECUENCIAS. 5. UTILIZAR LOS DATOS RESUMIDOS EN DISTRIBUCIONES DE FRECUENCIA EN LA TOMA DE DECISIONES.
INTRODUCCIN
Los datos recolectados en cualquier tipo de estudio son datos brutos que requieren de su procesamiento para que transmitan algn sentido. El primer y ms sencillo procedimiento que se realiza con los datos es su ordenamiento y resumen. Este ordenamiento se realiza resumiendo los datos en una tabla de distribucin de frecuencias.
Otra forma diferente de mostrar los datos es mediante su representacin grfica. Un grfico es una representacin pictrica que muestra la misma informacin que una tabla, pero permite ver ms fcilmente algunos detalles que puedan sobresalir en los datos y que no se muestren con tanta claridad en las tablas, adems son visualmente ms atractivas en su presentacin que las tablas.
2.1 DEFINICIN DE UNA DISTRIBUCIN DE FRECUENCIAS Una distribucin de frecuencias es un ordenamiento de un conjunto de datos obtenidos de una poblacin o de una muestra en donde los elementos estudiados son clasificados en grupos o clases mutuamente excluyentes expresando el nmero y/o porcentaje de elementos que pertenecen a cada grupo o categora. El objetivo de una distribucin de frecuencias es resumir en una tabla (llamada tabla de distribucin de frecuencias) los datos recolectados de tal forma que se facilite su interpretacin y anlisis. Las tablas de distribucin de frecuencias tienen distinta forma, segn el tipo de datos de que se disponga. A continuacin se presentan las distintas tablas.
2.2 DISTRIBUCIN DE FRECUENCIAS PARA DATOS CUALITATIVOS. Cuando la variable de anlisis es de tipo cualitativo, cada grupo, clase o categora se forma con cada uno de los diferentes valores que toma la variable, generalmente ordenados en forma alfabtica. EJ EMPLO 1. A una muestra de cuarenta hogares se pregunt la forma de tenencia de la vivienda en donde residan. Las respuestas obtenidas fueron: (A: Arriendo; F: Familiar; P: Propia; NE: No especificada)
P A A P F NE A P F A NE A A F F P A P A F A F NE F A F A A A F F A A A F F A P P P
Los datos recolectados se organizan en una tabla de distribucin de frecuencias que tiene la siguiente forma:
TABLA NMERO 1. DISTRIBUCIN DE LOS HOGARES SEGN TENENCIA DE LA VIVIENDA DISTRIBUCIN DE LOS HOGARES SEGN TENENCIA DE LA VIVIENDA FORMA DE TENENCIA DE LA VIVIENDA NMERO DE HOGARES PORCENTAJ E DE HOGARES ARRIENDO 17 42.5 FAMILIAR 12 30.0 PROPIA 8 20.0 NO ESPECIFICADA 3 7.5 TOTAL 40 100.0 Fuente:
La tabla presenta en forma resumida los 40 datos recolectados de tal manera que facilita analizar cul es el comportamiento de la tenencia de la vivienda en los 40 hogares estudiados. En la primera columna se presentan las cualidades o categoras que tiene la variable, ordenadas alfabticamente, excepto la categora no especificada, que usualmente se coloca al final (en algunas ocasiones aparece como OTRO) En la segunda columna se presenta la cantidad de elementos (hogares) que tienen cada una de las cualidades de la variable (se conocen con el nombre de FRECUENCIAS). En la tercera columna se presenta el porcentaje de elementos (hogares) que toman cada uno de las cualidades de la variable. Se obtienen dividiendo el nmero de hogares con cada cualidad entre el total de hogares, multiplicado por 100(se conocen con el nombre de FRECUENCIAS RELATIVAS). La tabla siempre se presenta con un ttulo que expresa su contenido. Tambin se suele indicar como pie de pgina del grfico la fuente, es decir de donde se obtuvieron los datos.
GRFICOS. Los datos resumidos en una tabla de distribucin de frecuencias, suelen presentarse en forma grfica. Los grficos son representaciones pictricas que permiten, a veces, observar rpidamente de un golpe de vista el comportamiento de la variable que se estudia y sus caractersticas ms sobresalientes. Los grficos apropiados para representar variables cualitativas son los da barra y los de sectores (circular o pastel). GRFICOS DE BARRAS Los grficos de barra pueden ser horizontales o verticales. En los grficos de barras verticales se representa en el eje horizontal la variable y en el eje vertical el nmero de elementos que tiene cada cualidad o categora de la variable (las frecuencias).
GRFICO NMERO 1: GRFICO DE BARRAS VERTICALES El grfico de barras horizontales se construye colocando los ejes en forma inversa, es decir, la variable se representa en el eje vertical y las frecuencias en el eje horizontal. Se utiliza principalmente cuando la variable es de tipo geogrfico.
GRFICO NMERO 2: BARRAS HORIZONTALES.
GRAFICO DE SECTORES. El grfico de sectores (circular o pastel) se utiliza para representar el porcentaje de elementos que pertenecen a cada una de las categoras de la variable. El crculo se divide en cien partes (100%) y se divide segn el porcentaje correspondiente a cada categora.
GRFICO NMERO 3: GRFICO DE SECTORES
EJ EMPLO 2. De los empleados de un municipio se seleccion aleatoriamente una muestra de sesenta de ellos y se les pregunt el nivel educativo que tenan. Las respuestas obtenidas fueron:
PI SI BC BC UI UC PC UI BC PC PC PC SC SI SC UC SC SC SC SC PI PC SC SC PI SC SC SC PC SC SC PI SC PC SC SI PC PC SC SC UI SC SC PC PC SC PC SC SC UC SC SI PC SC UI UC SI SC UC SC (PC: Primaria completa; PI: Primaria incompleta; SC: Secundaria completa; Secundaria Incompleta; UC: Universitaria completa; UI: universitaria incompleta.)
a. Cul es el elemento de estudio? b. Cul es la poblacin? c. Cul es la muestra? d. Cul es la variable y de qu tipo es? e. Ordene los datos en una tabla de distribucin de frecuencias. f. Presente los datos mediante un grfico de sectores. g. Presente los datos mediante un grfico de barras. h. Haga un anlisis de los datos obtenidos.
DISTRIBUCIN CONJ UNTA DE DOS VARIABLES CUALITATIVAS En muchas ocasiones se desea representar en una misma tabla los datos obtenidos para dos variables (o incluso ms de dos). Este tipo de ordenamiento permite establecer la forma en que podran estar relacionadas las dos variables. EJ EMPLO 3. En una encuesta se les pidi a las personas que dijeran su gnero y su aficin favorita. Los datos recolectados fueron los siguientes:
Las respuestas dadas por las personas se pueden organizar en una tabla de distribucin de frecuencias conjunta para las dos variables. La tabla se conoce con los nombres de distribucin conjunta o tabla de contingencia o tabla de doble entrada o tabla bidimensional. Este tipo de tablas se dispone por filas y columnas. Se selecciona una cualquiera de las dos variables para representarla por fila (en el ejemplo el GNERO) y la otra por columna (en el ejemplo la AFICIN FAVORITA) y se establece el nmero de elementos( personas) que conjuntamente toman una categora de cada variable.
TABLA NMERO 2 AFICIN FAVORITA GNERO CINE DEPORTES LECTURA MSICA TOTAL FEMENINO 8 3 3 5 19 MASCULINO 2 12 3 4 21 TOTAL 10 15 6 9 40
Los valores internos de la tabla se llaman FRECUENCIAS CONJ UNTAS. Por ejemplo, el primer valor (8) significa que en la muestra se encontraron 8 personas que eran de gnero femenino y que su aficin favorita era el cine. Los totales representan la suma por fila (gnero) o columna (aficin favorita) y se llaman frecuencias marginales. Representan el total de elementos de elementos de cada una de las categoras de una variable (marginan a la otra variable. Por ejemplo, El valor 19 significa que en la encuesta se entrevistaron a 19 personas de gnero femenino (no dice nada sobre la aficin). El valor 10 significa que 10 entrevistados tienen como aficin el cine (no dice nada sobre el gnero). La tabla anterior adems de mostrar en forma aislada el comportamiento de cada variable separadamente, tambin permite establecer entre ellas la existencia de relacin, si existe, en este caso puede observarse que las personas de gnero femenino tienden ms a tener como aficin favorita el cine y los hombres haca el deporte, mientras que las otras aficiones tienden a ser muy semejantes entre los gneros masculino y femenino. Este tipo de tablas tambin se suelen representar en forma porcentual. Se podran representar tres diferentes tipos de porcentajes: con respecto al total de elementos, con respecto al total por filas (con respecto a cada gnero) o con respecto al total por columnas (con respecto a las aficiones favoritas).
Los porcentajes correspondientes aparecen dentro de parntesis en cada una de las casillas de la tabla. Los primeros corresponden al porcentaje con respecto al total de personas; los segundos con respecto al gnero y los terceros con respecto a la aficin favorita. GRFICOS. Este tipo de distribucin se puede representar grficamente mediante alguno de tres tipos de grficos: barras agrupadas, barras compuestas y barras compuestas porcentuales. GRFICO DE BARRAS AGRUPADAS. Para construir un grfico se selecciona una de las dos variables para ser representadas en el eje horizontal, y cada una de las cualidades de esta variable se divide para representar cada una de las cualidades de la otra variable. En el eje vertical se representan las frecuencias absolutas, correspondientes a cada cualidad representada. Este grfico permite comparar como se comportan las dos variables en los elementos.
GRAFICO NMERO 3: BARRAS AGRUPADAS
GRFICO DE BARRAS COMPUESTAS. Este tipo de grficos se construye en forma semejante a la anterior, solo que las barras para las cualidades de una variable no se agrupan una al lado de la otra sino una encima de la otra, adems de permitir comparar las dos variables generan el total de elementos en cada una de las cualidades.
GRAFICO NMERO 4: BARRAS COMPUESTAS
GRFICO DE BARRAS COMPUESTAS PORCENTUALES. Se construye seleccionando una de las dos variables como principal, la cual a su vez se divide segn los porcentajes correspondientes a la otra variable que son los porcentajes que aparecen en la tabla, por filas o columnas)
GRFICO NMERO 5: BARRAS COMPUESTAS PORCENTUALES
DATOS CUANTITATIVOS.
Anteriormente se han clasificado las variables cuantitativas en DISCRETAS y CONTINUAS. Muchas variables discretas toman pocos valores diferentes, mientras que por el contrario, las variables continuas pueden tomar muchos (incuso infinitos) valores diferentes, por esta razn el tratamiento de los datos para los dos tipos de variable suele ser diferente. 2.4 DISTRIBUCION DE FRECUENCIAS PARA VARIABLES DISCRETAS Cada grupo o categora se forma con cada uno de los diferentes valores que toma la variable. La tabla de distribucin de frecuencias para los datos recolectados para este tipo de variable se suele construir utilizando cinco columnas cuyos elementos son los siguientes: 1. Los valores de la variable ordenados en forma ascendente. Los valores de la variable se suelen simbolizar por (i=1, 2,3, ; donde representa la cantidad de valores diferentes que toma la variable). 2. Las frecuencias absolutas (simbolizadas ) que representan el nmero de elementos que toman cada uno de los valores de la variable. Se obtienen por conteo directamente sobre los datos recolectados. 3. Las frecuencias relativas (simbolizadas ) que representan la proporcin o el porcentaje de elementos que toman cada uno de los valores de la 4. Las frecuencias absolutas acumuladas (simbolizadas que representan el nmero de elementos que toman un valor menor o igual al valor de la variable. Se obtienen por sumas sucesivas sobre las frecuencias absolutas. 5. Las frecuencias relativas acumuladas (simbolizadas que representan la proporcin o porcentaje de elementos que toman un valor menor o igual al valor de la variable. Se obtienen por sumas sucesivas sobre las frecuencias relativas. EJ EMPLO 4. En una muestra de cuarenta hogares se pregunt el nmero de personas que lo conformaban y se obtuvieron los siguientes datos:
Los datos resumidos en la anterior tabla pueden ser representados grficamente para cada una de las frecuencias, as: 1. Para las frecuencias absolutas (grfico de lneas). En el eje horizontal se representan los valores observados en los datos para la variable y en el eje vertical se representan las frecuencias absolutas. Para cada valor de la variable se traza una lnea vertical de altura la frecuencia respectiva. (El grfico es un grfico de lneas, justamente para indicar que la variable no toma valores intermedios entre dos valores, por ser una variable discreta)
GRFICO NMERO 6: de lneas
2. Para las frecuencias relativas (grfico de lneas). Se construye de igual forma que el anterior, pero representando en el eje vertical las frecuencias relativas (porcentajes)
GRFICO NMERO 7: DE LINEAS
3. Para las frecuencias absolutas acumuladas (grfico escalonado). En el eje horizontal se representan los diferentes valores que toma la variable y en el eje vertical las frecuencias acumuladas. Para cada valor de la variable se toma altura correspondiente a la frecuencia acumulada.
GRFICO NMERO 8: escalonado
4. Para las frecuencias relativas acumuladas (grfico escalonado)
GRFICO NMERO 9: escalonado
2.5 DISTRIBUCIONES DE FRECUENCIAS PARA VARIABLES CONTINUAS,
Las variables continuas suelen tomar muchos valores diferentes, por lo cual sus valores se ordenan mediante intervalos que contengan un conjunto de valores de la variable. Cada intervalo constituye un grupo o clase de elementos. El procedimiento para construir este tipo de tabla de distribucin de frecuencias es el siguiente: 1. Se establece arbitrariamente el nmero de intervalos, grupos o clases (simbolizado por que se desean construir con los valores de la variable. A pesar de ser arbitrario, el nmero de intervalos debe depender del nmero de datos que se tengan disponibles para ordenar; entre menos datos se dispongan se pueden construir pocos intervalos, por el contrario, cuando se dispone de muchos datos se pueden construir ms intervalos, pero se recomienda que mnimo se construyan 5 intervalos y mximo 20 . 2. Se calcula la amplitud, ancho o tamao que tendrn cada uno de los intervalos (simbolizados por , que se calcula mediante:
La amplitud se debe calcular con la misma precisin que tengan los datos recolectados, aproximando por exceso, cuando sea necesario, desechar cifras significativas. 3. Se construyen los intervalos (Los lmites inferiores de los intervalos se simbolizan por y los lmites superiores por , para ). El lmite inferior del primer intervalo se hace igual al menor de los datos recolectados. El lmite superior del primer intervalo se obtiene sumndole la amplitud al lmite inferior. El lmite inferior del segundo intervalo se hace igual al lmite superior del primer intervalo; y as sucesivamente hasta completar los intervalos. 4. Se obtienen los puntos medios o marcas de clase de cada uno de los intervalos (se simbolizan por ), sumando los lmites inferior y superior de cada intervalo, y dividiendo por dos. 5. Se obtienen las frecuencias absolutas de cada intervalo, contando el nmero de elementos que pertenecen a cada uno de ellos. La forma de construccin de los intervalos anteriormente explicada, lleva a que el valor del lmite superior de un intervalo coincida con el valor del lmite inferior del intervalo siguiente por lo cual se considera que los intervalos son abiertos en su lmite superior, excepto en el ltimo si es necesario. 6. Se obtienen las dems frecuencias: las frecuencias relativas , las frecuencias absolutas acumuladas y frecuencias relativas acumuladas ( , de la misma forma explicada para las variables cuantitativas discretas. EJ EMPLO 6. En un estudio realizado para establecer el nmero de empleados necesarios para la atencin de los usuarios de un servicio se midi el tiempo, en minutos, que se requera para su atencin cuarenta clientes. Se recolectaron los siguientes datos:
Queremos ordenar estos datos en una tabla de distribucin de frecuencias que tenga seis intervalos. Una vez definido el nmero de intervalos o grupos que se desean construir se determina la amplitud o tamao que tendrn cada uno d los intervalos: = Ahora se construye la distribucin de frecuencias
TABLA NMERO 7. DISTRIBUCIN DE LOS USUARIOS SEGN EL TIEMPO DE ATENCIN.
GRFICOS Los datos resumidos en la anterior tabla pueden ser representados grficamente de la siguiente forma: 1. Las frecuencias absolutas se representan mediante el grfico llamado HISTOGRAMA DE FRECUENCIAS. Se construye tomando en el eje horizontal los lmites de los intervalos y en el eje vertical las frecuencias. Est formado por rectngulos que tienen por base la amplitud del intervalo y por altura la frecuencia absoluta respectiva.
GRFICO NMERO 10.HISTOGRAMA DE FRECUENCIAS
2. Para las frecuencias relativas, el grfico correspondiente se llama HISTOGRAMA DE FRECUENCIAS RELATIVAS. Se construye de forma similar al histograma de frecuencias, pero en el eje vertical se representan las respectivas frecuencias relativas.
GRFICO NMERO 10
3. Las frecuencias absolutas se pueden tambin representar mediante un grfico conocido como POLIGONO DE FRECUENCIAS. Se construye tomando en el eje horizontal las MARCAS DE CLASE de cada intervalo, y en el eje vertical las frecuencias absolutas de cada intervalo. .
GRAFICO NMERO 11: POLIGONO DE FRECUENCIAS
4. Para las frecuencias relativas, tambin se puede utilizar el POLIGONO DE FRECUENCIAS RELATIVAS, que se construye de igual forma que el anterior per tomando en el eje vertical las frecuencias relativas.
GRFICO NMERO 12: POLIGONO DE FRECUENCIAS RELATIVAS.
5. Las frecuencias absolutas acumuladas se representan mediante un grfico llamado OJ IVA en donde en el eje horizontal se representan los lmites de los intervalos y el vertical las frecuencias absolutas acumuladas.
GRFICO NMERO 13: OJ IVA
6. Las frecuencias relativas acumuladas se representan en un grfico llamado OJ IVA PORCENTUAL, en la cual se representan en el eje horizontal los lmites de los intervalos y en el eje vertical las frecuencias relativas acumuladas.
GRFICA NMERO 13: OJ IVA PORCENTUAL
EJ EMPLO NMERO 8.
En 50 viviendas de un sector se midi el consumo de energa (Kw) que tuvieron el mes pasado, obteniendo los siguientes datos: 125 134 215 187 225 172 80 95 115 212 196 145 160 87 147 270 200 189 163 157 143 108 182 275 201 194 98 101 112 158 162 174 245 182 215 224 234 191 114 138 164 177 180 160 120 173 118 237 241 166 a. Cul es la poblacin? Cul es la muestra? Cul es la variable? De qu tipo es la variable? b. Organizar los datos en una tabla de distribucin de frecuencias que tenga siete intervalos de igual amplitud. c. A partir de la distribucin, interpretar: Segunda frecuencia absoluta. Tercera frecuencia relativa. Cuarta frecuencia acumulada. Quinta frecuencia relativa acumulada.
d. A partir de la distribucin de frecuencias establecer el porcentaje de viviendas que el mes pasado tuvieron consumo: Menor a 136 Kw Al menos de 192 Kw Entre 108 y 220 Kw e. Representar los datos mediante: Histograma de frecuencias relativas. Polgono de frecuencias absolutas.
2.4 DATOS CRONOLGICOS.
Los datos cronolgicos son registros de una variable que, en un elemento, se han medido en diferentes pocas o periodos. Para la recoleccin de los datos cronolgicos debe seleccionarse la frecuencia con la cual se registra la variable (das, mese, trimestres, aos, etc.) y el nmero de periodos que se desean analizar. Por ejemplo, deseamos estudiar el comportamiento de las exportaciones colombianas en el periodo 1994-2006, para ello se registra su valor en cada uno de estos aos, en la siguiente forma:
TOTAL EXPORTACIONES COLOMBIANAS, 1994-2006 (En millones de dlares FOB) AOS TOTAL EXPORTACIONES 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 8.538 10201 10648 11549 10866 11617 13158 12330 11975 13129 16788 21190 24391 Fuente: DANE GRFICOS.
Los datos cronolgicos se suelen representar en una de las siguientes formas: GRFICO DE BARRAS. Los diferentes periodos se representan en el eje horizontal y la magnitud de la variable en el eje vertical.
GRFICO NMERO 14: GRFICO DE BARRAS.
GRFICO LINEAL. Es el ms comn de los grficos utilizados para representar datos cronolgicos. Se representan en el eje horizontal y en el eje vertical los valores de la variable en cada periodo, mediante un punto. Los puntos obtenidos se unen por trazos rectos.
GRFICO NMERO 15: GRFICO LINEAL
GLOSARIO.
DATOS: Registros de las observaciones de una o ms variables en los elementos estudiados.
DATOS BRUTOS O SIN PROCESAR: Los datos tal como se recolectan antes de ser organizados mediante algn procedimiento.
DISTRBUCIN DE FRECUENCIAS: Forma de presentar los datos en una forma organizada donde se muestra el nmero de observaciones del conjunto de datos que pertenecen a cada una de las clases definidas.
HISTOGRAMA: Grfico formado por un conjunto de rectngulos con base, el ancho de cada intervalo o clase y altura, la frecuencia del intervalo o clase.
OJ IVA: Grfico en el cual se representan las frecuencias acumuladas.
POLIGONO DE FRECUENCIAS: Grfico que se construye uniendo los puntos medios del histograma de frecuencias en sus techos.
TABLA DE CONTINGENCIA o bidimensional o de doble entrada: Tabla de distribucin de frecuencias en la cual se representan simultneamente dos variables.
BIBLIOGRAFA
LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y ECONOMA. Pearson Educcin,2004.
MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y ECONOMIA. Editorial alfaomega. 2005.
1. En una encuesta se pregunt en 40 viviendas de estrato II el nmero de dormitorios que tenan y se obtuvieron las siguientes respuestas. 2 1 1 4 3 2 2 2 3 4 1 3 2 5 3 4 2 3 2 5 3 7 5 3 2 4 4 3 2 1 1 2 3 2 3 4 1 2 2 2 a. Organizar estos datos en una distribucin de frecuencias. b. De la anterior distribucin, interpretar: 1. tercera frecuencia. 2. segunda frecuencia relativa. 3. cuarta frecuencia acumulada. c. En un slo grfico representar frecuencias y frecuencias relativas. 2. A una muestra de pequeas empresas dedicadas a la produccin de calzado en Bogot se les observ el nmero de trabajadores que tenan contratados. Se obtuvo: 3 4 2 5 3 1 4 2 4 3 4 2 4 5 3 1 4 2 5 5 2 5 1 4 6 3 4 4 5 3 3 2 3 4 2 1 4 3 2 5 a. Ordenar los datos en una tabla de distribucin de frecuencias. b. Construir un grfico para representar las frecuencias relativas acumuladas. c. Construir un grfico para representar las frecuencias absolutas.
3. El costo variable unitario($) de producir un artculo en 30 fbricas es el siguiente 29.2 27.0 32.1 31.6 31.4 33.2 32.4 25.8 34.7 30.1 36.4 30.8 24.8 34.6 31.1 29.5 32.0 28.4 31.2 30.6 35.1 33.6 28.1 29.4 37.2 26.6 31.7 37.9 29.9 33.6 a. Ordenar los datos en una tabla de distribucin de frecuencias que tenga 6 intervalos de igual amplitud b. Interpretar n 3 ,h 2 ,N 4 ,H 3 c. en cuntas fbricas se tienen costos variables unitarios de i. por lo menos $29.2 ii. menores a $35.8 iii. por lo menos $27.0 pero menos de $33.6
4. En 40 entidades financieras se pregunt la tasa anual efectiva de colocacin a corto plazo, que tena cada una de ellas. Se obtuvieron los siguientes datos 0.35 0.39 0.32 0.35 0.44 0.28 0.24 0.40 0.45 0.48 0.37 0.26 0.31 0.36 0.37 0.41 0.52 0.42 0.39 0.40 0.42 0.41 0.40 0.38 0.41 0.50 0.28 0.36 0.37 0.42 0.44 0.36 0.30 0.27 0.26 0.31 0.38 0.41 0.40 0.45 a. Ordenar los datos en una tabla de distribucin de frecuencias que tenga 6 intervalos. b. A partir de la distribucin anterior interpretar n 2 , h 3 , N 4 y H 5 c. A partir de la distribucin establecer el nmero de entidades que tienen tasa de colocacin i. menor al 44% ii. entre 34% y 49% iii. por lo menos del 39% iv. construir en un solo grfico la ojiva y la ojiva porcentual
5. El auditor de una empresa selecciona una muestra de 40 cuentas que han sido declaradas como incobrables y encuentra que el valor de esas cuentas ( en miles$ ) son : 40.2 52.8 90.8 120.2 24.8 100.0 90.1 72.6 64.8 47.9 36.6 123.4 88.4 75.1 58.4 107.3 87.6 65.1 48.3 28.0 31.2 99.0 66.1 101.0 110.0 104.8 115.9 49.6 57.8 60.1 84.2 56.1 54.2 60.2 75.3 84.2 79.6 74.1 63.6 56.4 a. Ordenar estos datos en una distribucin de frecuencias que tenga seis intervalos de igual amplitud. b. Interpretar n 3 , h 2 ,H 4 N 3 . c. A partir de la distribucin establecer el porcentaje de cuentas incobrables que tienen un valor : 1. por lo menos de 90.8 miles$; 2. menor a 74.3 miles$; 3. comprendido entre 57.8 y 107.3 miles$. d. Representar en un slo grfico las frecuencias acumuladas y las frecuencias relativas acumuladas. 6. Una encuesta realizada entre 30 personas poseedoras de automvil mostr las siguientes respuestas acerca de la marca del auto que posean. F S CH S R R R M R M F F R M O R M CH O S R M CH R CH CH M R CH M
a. La poblacin es ... b. La muestra es ...
c. La variable es .... d. La variable es de tipo ... e. Ordenar las respuestas en una tabla de distribucin de frecuencias. f. Representar la informacin de la tabla anterior en un grfico apropiado. 7. El ndice de rotacin durante el ao pasado de 25 artculos que se disponen en el inventario del almacn de materias primas de una fbrica fue : 6.1 5.8 7.2 9.0 8.6 7.6 5.3 6.7 7.0 7.6 6.0 8.1 6.2 6.8 6.3 6.9 7.8 6.1 6.6 6.2 6.9 7.4 7.9 8.5 6.4 a. Organizar los datos en una distribucin de frecuencias que tenga cinco intervalos b. De la anterior distribucin de frecuencias interpretar una frecuencia de cada tipo. c. En un solo grfico representar las frecuencias acumuladas y las relativas acumuladas 8. Durante la rueda de ayer en la Bolsa de Valores de Colombia se negociaron los siguientes papeles
PAPEL VALOR TRANSADO ( millones$) C.D.T. 14000 ACCIONES 2500 ACEPTACIONES 4000 OTROS 2000 Representar esta informacin mediante dos grficos diferentes que sean apropiados.
9. En un estudio en medianas empresas industriales, se seleccion una muestra de 400 de ellas, y se observ el valor del inventario a 31 de diciembre del ao pasado, obteniendo la siguiente informacin : El mnimo inventario encontrado fue de 8 millones$ y el mximo fue de 62 millones$; El 8% de las empresas encuestadas tena inventario inferior a 17 millones$; El 15% tena inventario comprendido entre 17 y 26 millones$; el 50% tena inventario menor a 35 millones$; el 25% tena inventario entre 35 y 44 millones$; el 95% tena inventario por menos de 53 millones$. a. Ordenar esta informacin en una tabla de distribucin de frecuencias. b. Representar en un solo grfico las frecuencias acumuladas y las relativas acumuladas.
UNIDAD III MEDIDAS DE TENDENCIA CENTRAL
OBJ ETIVOS: 1. Resumir los datos en una medida nica 2. Identificar cuando es ms apropiado un promedio que otro.
3.1 INTRODUCCIN
Las medidas de tendencia central, tambin conocidas con la denominacin de promedios, son medidas que tratan de caracterizar a todos los elementos estudiados, en un solo valor. Existen diferentes promedios, de los cuales solo consideraremos cuatro. La media aritmtica es el promedio ms utilizado de ellos, por su facilidad de clculo, sin embargo deben considerarse los otros, pues no siempre la media aritmtica es un promedio adecuado.
3.2 MEDIA ARITMTICA
La media aritmtica de un conjunto de valores se define como la sumatoria de todos los valores dividida por la cantidad de valores, generalmente se simboliza por
EJ EMPLO 3.1 El ingreso mensual, en millones$, de 10 personas es: 2.5 1.8 1.4 15.0 1.5 1.2 2.2 2.0 2.4 1.6 La media aritmtica del ingreso mensual de estas personas es:
La media aritmtica se interpreta como: El ingreso medio (promedio) de estas diez personas es de 3.16 millones de $. A partir de este valor se puede realizar un anlisis respecto de la magnitud de este valor, dependiendo del grupo de referencia. En los datos anteriores se puede observar que una persona (la cuarta) tiene un ingreso mensual muy superior a las dems personas (este valor se conoce como un valor atpico o extremo), lo cual hace que el promedio del grupo sea muy alto y por lo tanto no represente adecuadamente a todo el grupo, por lo tanto puede ser ms adecuado utilizar otro promedio para representar el ingreso de todas las personas. Cuando los datos ya se encuentren tabulados en una distribucin de frecuencias, para el clculo de la media aritmtica es necesario tener en cuenta la frecuencia que tiene cada valor o intervalo de valores, por ello la media aritmtica para este caso se define como:
Donde: : representa los valores de la variable, si ella es discreta o las marcas de clase o puntos medios de los intervalos, si la variable es de tipo continuo. : representa las frecuencias que tiene cada valor o intervalo.
EJ EMPLO 3.2
Para una muestra de ochenta viviendas de un sector, se obtuvieron los siguientes datos sobre el nmero de personas que residen en cada una: TABLA 1. NMERO DE RESIDENTES ( ) NMERO DE VIVIENDAS ( ) 2 3 4 5 6 7 8 15 20 17 14 6
TOTAL 80
Los datos se pueden organizar en la misma tabla, agregando una columna para el producto de los valores de la variable por su frecuencia,
NMERO DE RESIDENTES ( ) NMERO DE VIVIENDAS ( )
2 3 4 5 6 7 8 15 20 17 14 6
16 45 80 85 84 42 TOTAL 80 352
La media aritmtica ser: = Es decir, el nmero medio de personas por vivienda es de 4.4 EJ EMPLO 3.3 El consumo de agua, en metros cbicos, durante el mes pasado se midi en una muestra de 200 hogares de un sector, obteniendo los siguientes datos:
Observar que a las dos primeras columnas, que son las bsicas de la distribucin de frecuencias, se le han agregado dos columnas: la de las marcas de clase o puntos medios de los intervalos y la del producto de las marcas de clase por las frecuencias, entonces la media aritmtica del consumo es: =
MEDIA ARITMTICA PONDERADA
Cuando a los diferentes valores que toma una variable se le asigna pesos o ponderaciones que indique la importancia que se le asigna a cada valor, se define la media aritmtica ponderada como:
Donde: son los diferentes valores que toma la variable. : son los pesos o ponderaciones que se le asignan a cada uno de los valores de la variable.
EJ EMPLO 3.4 Una empresa llev a cabo la siguiente poltica de aumentos de salarios para este ao: A los trabajadores que devengaban salarios menores a $1000000, se les aument el 8%; a los que tenan salario entre $1000000 y $2000000, el aumento fue del 5%; a los que tenan salarios superiores a $2000000, el aumento fue del 4%. Cul fue el aumento promedio porcentual que realiz la empresa a todos sus trabajadores si el 50% devenga menos de $1000000, el 40% devenga entre $1000000 y 2000000 y el 10% devenga ms de $2000000? Para este caso los pesos o ponderaciones son los porcentajes de trabajadores que se encuentran en cada categora salarial. As que, el aumento porcentual promedio fue:
PROPIEDADES DE LA MEDIA ARITMTICA
1. La media aritmtica es el promedio ms conocido y utilizado, por su facilidad de clculo y de interpretacin. 2. En su clculo intervienen todos los valores que toma la variable. 3. Se ve fuertemente afectada por valores extremos de la variable. Valores muy pequeos o muy grandes influyen fuertemente sobre la media aritmtica, haciendo que no represente adecuadamente a todos los elementos. 4. No se puede utilizar cuando los datos han sido ordenados en una tabla de distribucin de frecuencias que tenga intervalos abiertos. 5. No es recomendable utilizar la media aritmtica cuando los datos se encuentren ordenados en una distribucin de frecuencias que presente intervalos de amplitud variable.
MEDIA GEOMETRICA
La media geomtrica de un conjunto de valores se define como la raz n-sima del producto de los valores, generalmente se simboliza por .
Cuando los datos ya se encuentren ordenados en una tabla de distribucin de frecuencias, la media geomtrica se define como:
EJ EMPLO 3.5 El nmero de empleados que tienen ocho empresas es: 3 6 11 26 50 95 200 y 380 Estos datos se encuentran en forma bruta, por lo cual la media geomtrica sera: = = Empleados.
EJ EMPLO 3.6
PROPIEDADES DE LA MEDIA GEOMTRICA.
1. En su clculo intervienen todos los valores que toma la variable. 2. Es un promedio que se afecta menos que la media aritmtica por valores atpicos o extremos de la variable. 3. No se puede utilizar cuando la variable toma el valor cero o negativos. 4. Es el promedio ms adecuado para promediar cantidades que tienen forma de progresin geomtrica( vase el ejemplo 3.5), por ejemplo, los siguientes valores forman una progresin geomtrica : 2, 6, 18, 54, 162, 486 y 1458 En este caso el promedio ms adecuado es la media geomtrica
No se requiere que los valores constituyan exactamente una progresin geomtrica, slo es necesario que adopten una forma similar. 5. La media geomtrica es el promedio que debe ser utilizado para promediar tasas de crecimiento o variables que presentan variacin a travs del tiempo. Pero debe tenerse en cuenta que no se promedian directamente las tasas de crecimiento sino los factores de crecimiento. Si representa la tasa de crecimiento, entonces representa la tasa de crecimiento.
EJ EMPLO 3.7 Los ingresos operacionales que ha tenido una empresa en el periodo 2001- 2007 han sido: TABLA 4. AOS INGRESOS OPERACIONALES (MILLARDOS) FACTOR DE CRECIMIENTO DEL INGRESO OPERACIONAL 2001 2002 2003 2004 2005 2006 2007 4.5 5.3 5.0 5.6 5.8 6.9 7.8 - 1.229 0.943 1.12 1.036 1.19 1.13
En las dos primeras columnas se presentan los registros histricos de los ingresos operacionales y en la tercera columna se presentan los factores de crecimiento( Se divide el valor de la variable en un periodo entre el valor de la variable en el periodo inmediatamente anterior). El promedio geomtrico de los factores de crecimiento es:
Este es el promedio geomtrico de los factores de crecimiento. La tasa promedio de crecimiento se obtiene restndole 1 al factor de crecimiento
Esto significa que durante el periodo 2001-2007 los ingresos operacionales de la empresa han crecido a una tasa promedio de o del
6. La media geomtrica se utiliza para realizar proyecciones. Si una variable toma un valor al inicio de un periodo y crece a una tasa promedio constante por periodo, despus de periodos el nmero de elementos ser:
EJ EMPLO 3.8 La poblacin colombiana en 2007 es de 44 millones de habitantes. Si la poblacin colombiana crece a una tasa promedio de 0. 014 anual, puede estimarse que la poblacin colombiana dentro de 10 aos ser:
3.3 MEDIANA
La mediana de un conjunto de valores se define como el valor central de la variable. La mediana es un valor tal que divide a los elementos en dos grupos: la mitad (o el 50%) de los elementos tomarn un valor menor o igual a la mediana y la otra mitad (o el 50%) de los elementos tomarn un valor menor o igual a la mediana.
La mediana se suele simbolizar por
CLCULO DE LA MEDIANA.
Para el clculo de la mediana consideraremos varias situaciones, de acuerdo con el tipo de datos. 1. Para los datos brutos o no tabulados, se consideran dos situaciones. EL NMERO DE DATOS ES IMPAR. Los datos se ordenan en forma creciente o decreciente de magnitud y la mediana ser el valor visualmente central.
EJ EMPLO 3.9 El salario mensual (miles de $) de una muestra de trabajadores de una empresa es: 770 580 950 600 700 650 900 680 1000 650 550 Los valore se ordenan en forma creciente: 550 580 600 650 650 680 700 770 900 950 1000 Se observa que el valor que ocupa la posicin central es 680, luego este valor es la mediana
Esto significa que la mitad de los operarios tiene salario mensual de $680000 o menos y la otra mitad tiene salario mensual de $680000 o ms. Cuando el NMERO DE DATOS ES PAR, la mediana se toma como la media aritmtica de los dos valores centrales, estando ya los datos ordenados en forma creciente o decreciente. EJ EMPLO 3.10 La rentabilidad de los accionistas el ao pasado, para una muestra de empresas industriales fue( en porcentaje): 5.6 8.2 13.6 14.2 7.5 6.5 6.0 18.8 4.5 9.2 12.4 16.3 8.8 12.0 Los valores se ordenan en forma ascendente: 4.5 5.6 6.0 6.5 7.5 8.2 8.8 9.2 12.0 12.4 13.6 14.2 16.3 18.8 Los dos valores que ocupan la posicin central son 8.8 y 9.2, luego la mediana ser la media aritmtica de estos dos valore.
Esto significa que la mitad de las empresas tuvieron el ao pasado una rentabilidad para los accionistas de 9.0% o menos y la otra mitad tuvo una rentabilidad de 9.0% o ms.
2. Cuando los datos estn tabulados, es decir ya han sido ordenados en una tabla de distribucin de frecuencias, es necesario considerar dos situaciones, cuando la variable es discreta y cuando la variable es continua o los valores se han clasificado por intervalos. Cuando la variable es discreta, el procedimiento para ubicar la mediana es el siguiente: Debe disponerse de la distribucin con sus frecuencias acumuladas. Se calcula el valor de Se ubica la menor frecuencia acumulada que supere a Esta frecuencia se suele simbolizar por donde indica la posicin de esta frecuencia. Se compara la frecuencia acumulada anterior, es decir con . Al realizar esta comparacin pueden ocurrir uno de los dos casos: Que sea menor que En este caso la mediana ser el valor de la variable que ocupe la posicin O que sea igual a En este caso la mediana ser la media aritmtica de los valores de la variable que ocupan las posiciones EJ EMPLO 3.11
Un grupo de personas present una prueba de aptitud. El nmero de respuestas incorrectas que tuvieron se muestra en la siguiente tabla: NMERO DE RESPUESTAS INCORRECTAS ( ) NMERO DE PERSONAS ( ) NMERO ACUMULADO DE PERSONAS
A la tabla se le ha aadido la tercera columna, correspondiente a las frecuencias acumuladas. Primero se calcula Se ubica la menor frecuencia acumulada que supera a . En este caso es la cuarta frecuencia acumula(60) Se compara la frecuencia acumulada anterior co n , o sea, la tercera, que en este caso es 30. Como 30 es menor que 45, la mediana ser el valor de la variable que se encuentra en la cuarta posicin, esto es 3. Luego, Lo cual significa que la mitad (o el 50%) de las personas tuvieron 3 o menos de 3 respuestas incorrectas y la otra mitad(o el 50%) tuvieron 3 o ms respuestas incorrectas.
EJ EMPLO 3.12
El nmero de empleados que tiene una muestra de pequeas empresas, se muestra en la siguiente tabla:
Primero se calcula Se ubica la menor frecuencia acumulada que supera a En este caso es la quinta frecuencia acumulada (90). Se compara la frecuencia acumulada anterior con O sea, la cuarta frecuencia acumulada, que en este caso es 60. Como es igual a o sea tambin 60, la mediana ser la media aritmtica de los valores de la variable que estn en las posiciones cuarta y quinta. Luego, empleados. Lo cual significa que la mitad(o el 50%) de las empresas tienen 6.5 empleados o menos y la otra mitad (o el 50%)tiene 6.5 empleados o ms. Cuando los datos corresponden a una variable continua el procedimiento para obtener la mediana Debe tenerse la distribucin de frecuencias con las frecuencias acumuladas. Se calcula Se ubica la menor frecuencia acumulada que supere a Esta frecuencia se simboliza por Donde indica la posicin del intervalo en donde se encuentra la frecuencia acumulada que supera a . La mediana puede ser ubicada mediante la siguiente expresin:
Donde: Es el lmite inferior del intervalo . Es el ancho o amplitud del intervalo . Es la frecuencia acumulada anterior a la que supera a Es la frecuencia del intervalo
EJ EMPLO 3.13
La siguiente tabla muestra gasto (miles $) efectuado el mes pasado en mantenimiento por una muestra de los buses de una empresa transportadora:
A la tabla bsica se le ha agregado la tercera columna, correspondiente a las frecuencias acumuladas. El procedimiento para el clculo de la mediana es el siguiente: Se calcula Se ubica la menor de las frecuencias acumuladas que supere a 25. En este caso es la tercera frecuencia acumulada(28), es decir Se calcula la mediana utilizando la frmula anterior. El lmite inferior del tercer intervalo es 300( ; la amplitud del tercer intervalo es 100 ( ; La frecuencia acumulada del intervalo anterior es 10( ; la frecuencia del tercer intervalo es 18( . Entonces, la mediana ser:
Este valor significa que la mitad( o el 50%) de los buses gastaron en mantenimiento 383.3 mil$ o menos y la otra mitad ( o el otro 50%) gast 383.3 mil$ o ms.
PROPIEDADES DE LA MEDIANA.
1. No es un promedio matemtico, pues no est definida por una frmula algebraica sino por un procedimiento para su localizacin. 2. En su clculo no intervienen todos los valores que toma la variable, nicamente intervienen los valores centrales. 3. No se ve afectada por valores extremos o atpicos de la variable. 4. Es el promedio ms adecuado cuando se dispone de una distribucin de frecuencias con intervalos de amplitud variable. 5. Tambin es adecuado como promedio cuando se tienen los datos ordenados en una distribucin de frecuencias con intervalos de amplitud variable.
3.3 MODA
La Moda de un conjunto de valores se define como el valor que se presenta con mayor frecuencia. La moda representa el valor que es tpico o representativo de los elementos estudiados. Se simboliza por .
CLCULO DE LA MODA.
1. Cuando los datos se encuentran en forma bruta o no tabulados, la moda ser el valor de la variable que ms veces se repite. EJ EMPLO 3.14 A una muestra de hogares se les midi el consumo de gas que haban tenido el mes pasado ( en metros cbicos): 22 32 34 25 18 25 24 42 7 45 25 34 23 25 27 30 25 28 25 27 25 33 31 25 Una inspeccin visual muestra que el valor que ms veces se repite es 25, luego este valor es la moda.
Este valor significa que el consumo ms frecuente en los hogares es de 25 metros cbicos o que el hogar tpico es aquel que tiene un consumo mensual de gas de 25 metros cbicos.
EJ EMPLO 3.15
La edad de un grupo de personas es : 18 27 20 22 34 25 22 28 20 33 19 20 27 22 19 37 22 17 55 Como puede observarse, los valores 20 y 22 son los que ms se repiten. Por lo tanto estos dos valores son la moda. Se dice, en este caso que los datos son bimodales.
2. Cuando los datos se encuentran tabulados en una tabla de distribucin de frecuencias, hay que considerar dos situaciones, si la variable es discreta o es continua. Si la variable es discreta, la moda ser el valor de la variable que presenta la mayor frecuencia.
EJ EMPLO 3.16
El nmero de das que fallaron a su trabajo, por diversas causas, los empleados de una empresa durante el ao pasado se presenta en la siguiente tabla: NMERO DE DAS QUE FALLARON
NMERO DE EMPLEADOS
0 1 2 3 4 5 6 7 6 25 19 8 7 5 3 2 TOTAL 75
Como se observa en la tabla la mayor frecuencia (25) la tiene el valor 1. Luego, este valor es la moda. 1 da.
Cuando la variable es continua, es decir, sus valores se han agrupado por intervalos, la moda puede obtenerse utilizando la siguiente frmula de interpolacin:
Donde: Es el lmite inferior del intervalo que tiene la mayor frecuencia. Es la amplitud del intervalo que tiene la mayor frecuencia. Es la mayor frecuencia (frecuencia modal) Es frecuencia ubicada inmediatamente antes de la mayor frecuencia (frecuencia premodal). Es la frecuencia ubicada inmediatamente despus de la mayor frecuencia (frecuencia postmodal).
EJ EMPLO 3.17
Para una muestra de viviendas de un sector residencial, se obtuvieron los siguientes datos sobre el valor pagado por impuesto predial, en miles de pesos, este ao: IMPUESTO PAGADO
La mayor frecuencia se encuentra en el tercer intervalo (21: ); la frecuencia inmediatamente anterior a esta es 15( ; la inmediatamente posterior es 17( ; la amplitud del tercer intervalo es 50( ; el lmite inferior del tercer intervalo es 170( . Entonces la moda ser:
Lo cual significa que el valor ms frecuente pagado por las viviendas fue de 200 mil $.
PROPIEDADES DE LA MODA.
1. La moda es un promedio de posicin, pues no est definida por una frmula algebraica. 2. En el clculo de la moda no intervienen todos los valores que toma la variable, pues solo intervienen los valores ms frecuentes. 3. No se afecta por la presencia de valores atpicos. 4. No es recomendable utilizarla en distribuciones de frecuencias que tengan intervalos de amplitud variable. 5. Es til cuando se desea determinar el valor que es tpico o caracterstico de un grupo. 6. Es el promedio ms adecuado cuando se encuentre que un valor presenta una frecuencia grande comparada con las dems.
CUL PROMEDIO UTILIZAR? Cada uno de los promedios vistos tienen una caracterstica especial de tal manera que cada uno de ellos se debe utilizar de acuerdo con el tipo de datos de que se dispongan. En las propiedades enunciadas de cada uno de los promedios se puede encontrar una gua de cuando utilizarse y cuando no utilizarse. Sin embargo, la media aritmtica es el promedio que ms se utiliza.
GLOSARIO
MEDIA ARITMTICA: Medida de tendencia central, definida como la suma de todos los valores dividida por el nmero de valores. Es el promedio ms utilizado.
MEDIA ARITMTICA PONDERADA: Es un promedio aritmtico de un conjunto de valores teniendo en cuenta la importancia que se le asigne a cada valor.
MEDIA GEOMTRICA: Promedio que se utiliza frecuentemente para estudiar la tasa de crecimiento. Se define como la raz n del producto de los n valores.
MEDIANA: Valor central de los datos. Divide a los datos en dos partes iguales.
MODA: El valor que se presenta con mayor frecuencia.
MEDIDA DE TENDENCIA CENTRAL: Medidas que representan a un conjunto de valores y que se ubican en la parte central de los datos.
BIBLIOGRAFA
LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y ECONOMA. Pearson Educcin,2004.
MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y ECONOMIA. Editorial alfaomega. 2005.
EJ ERCICIOS
1. A una muestra de amas de casa se le pregunt el nmero de veces que en la semana acudan al supermercado ms cercano. Las respuestas se ordenaron en la siguiente distribucin: NUMERO DE VECES 1 2 3 4 5 NUMERO DE AMAS DE CASA 15 25 40 18 12 Obtener e interpretar media aritmtica, mediana y moda.
2. La utilidad de una empresa ha presentado el siguiente registro : AOS 1999 2000 2001 2002 2003 2004 2005 2006 2007 UTILIDAD (MILLON$) 400 480 600 680 720 850 970 1050 1120 a. A qu tasa media anual han crecido las utilidades de la empresa en es periodo? b. Si la anterior tasa promedio se mantiene haca el futuro qu utilidad esperara tener la empresa en 2008? en 2009?
3. La siguiente distribucin se refiere al tiempo ( minutos ) necesarios para que una muestra de clientes de un banco lleven a cabo una transaccin TIEMPO (MINUTOS) 1.5 - 3.5 3.5 - 5.5 5.5 - 7.5 7.5 - 9.5 9.5 - 11.5 11.5 - 13.5 NUMERO CLIENTES 6 13 25 11 9 5 Obtener e interpretar media aritmtica, mediana y moda 4. Obtener la media, mediana , moda y media geomtrica de los siguientes datos : 3 6 10 18 30 58 100 Establecer cul de las anteriores medidas es la ms conveniente. Porqu?
5. La distribucin de los salarios mensuales ( miles$ ) de los empleados de dos empresas se da a continuacin : EMPRESA A EMPRESA B SALARIOS NUMERO DE SALARIOS NUMERO DE (MILES$) EMPLEADOS (MILES$) EMPLEADOS 700 - 900 10 300 - 500 15 900 - 1100 20 500 - 700 25 1100 - 1300 25 700 - 900 35 1300 - 1500 10 900-1100 10 1500- 1700 5 1100 - 1500 5 a. Obtener el salario medio de los trabajadores de cada empresa. b. Obtener el salario medio para los trabajadores de las dos empresas en conjunto. c. Obtener la media geomtrica de los salarios de los trabajadores de la empresa A. d. Obtener la mediana de los salarios de los trabajadores de la empresa B.
6. Se deseaba medir la eficiencia de unos operarios. Para ello se registr el tiempo que cada operario tardaba en realizar una tarea, obtenindose la siguiente informacin: El 12% de los operarios tardaban 12 minutos en realizar la tarea; el 13% tardaba 14 minutos en realizarla; el 9% tardaba 14.5 minutos; el 20% tardaba 16 minutos; el 19% tardaba 18 minutos; y el 27% tardaba 19 minutos. Cul es el tiempo medio de ejecucin de la tarea por parte de los trabajadores ?.
UNIDAD IV MEDIDAS DE DISPERSIN
OBJ ETIVOS
1. ESCRIBIR UNA VARIABLE MEDIANTE LA VARIACIN DE SUS VALORES. 2. EXAMINAR EL GRADO DE HOMOGENEIDAD QUE PRESENTA UN GRUPO DE ELEMENTOS.
4.1 INTRODUCCIN.
Observar los siguientes conjuntos de datos: I II III 200 210 200 200 190 100 200 180 300 200 220 50 200 200 350 Una ligera inspeccin visual de los tres conjuntos de datos nos revelan que en los tres conjuntos los valores se encuentran alrededor de 200(es la media aritmtica para cada uno de los tres grupos), pero en el primer conjunto los valores estn justamente concentrados en este valor; en el segundo conjunto los valores se encuentran cercanos a 200 mientras que en el tercer conjunto los valores tienden a estar bastante alejados de 200. Las medidas de dispersin cuantifican el grado de dispersin o variacin que presenta un conjunto de valores entre s o con respecto a un promedio, generalmente la media aritmtica, que es el promedio ms utilizado. Por lo tanto las medidas de dispersin pueden utilizarse para establecer la uniformidad u homogeneidad de un grupo con respecto a una variable. A continuacin se describen las medidas de dispersin ms utilizadas.
4.2 RANGO o RECORRIDO. (
Se define como la diferencia entre el mayor y menor valor que toma la variable.
El rango es una medida de dispersin muy simple, pues mide la amplitud que presentan las observaciones. Como medida tiene el inconveniente de que no tiene en cuenta todos los valores que toma la variable, pues solo toma en cuenta el mayor y el menor valor de la variable.}
EJ EMPLO 4.1 El costo de produccin de un artculo en 10 fbricas es ($): 2400 2450 2380 2520 2700 2470 2670 2550 2390 2510 El rango del costo de produccin del artculo en las diez fbricas es:
Esto simplemente indica que la diferencia entre la fbrica que tiene mayor costo de produccin y la que tiene menos costo de produccin es de $320
Las medidas de dispersin ms utilizadas son la varianza y la desviacin estndar. J unto con la media aritmtica constituyen las medidas que representan mejor el comportamiento de una variable en un conjunto de elementos.
4.3 VARIANZA (
La varianza de un conjunto de datos se define como el promedio de las diferencias al cuadrado entre los valores que toma la variable y su media aritmtica.
Donde: : son los diferentes valores que toma la variable, y la media aritmtica de la variable. La varianza expresa, en promedio, qu tanto se alejan los valores de la media aritmtica, pero las distancias las expresa al cuadrado, por lo tanto la varianza queda expresada en unidades de la variable al cuadrado ( , lo cual puede que no tenga un sentido muy lgico, pero como se expres anteriormente es la medida de dispersin que ms se utiliza. Cuando los datos ya se encuentran tabulados en una tabla de distribucin de frecuencias, la varianza se obtiene como:
Donde son los diferentes valores que toma la variable, si es discreta, o los puntos medios o marcas de clase, si la variable es continua y son las frecuencias que tiene cada valor o cada intervalo. Esta frmula por manipulacin algebraica se puede transformar en:
EJ EMPLO 4.2
La experiencia (aos) en su oficio de una muestra de operarios de una fbrica es: 12 8 10 5 7 25 14 1 4 20 Estos datos se encuentran en forma bruta o no tabulada. Observar que la experiencia vara entre los operarios, qu tanto es esa variacin puede medirse con una medida de dispersin, tal como la varianza. Primero se debe calcular la media aritmtica, pues la varianza mide la dispersin que presentan los valores respecto de ella.
La varianza puede obtenerse mediante:
Esto significa: En promedio, la experiencia que tienen los operarios se dispersa o vara alrededor de la experiencia media en . Observar que este valor es bastante grande, por lo cual se puede decir que la experiencia que tienen los operarios es muy variable entre ellos o de otra forma, que los operarios no son uniformes en la experiencia que tienen.
EJ EMPLO 4.3
En la siguiente tabla se muestra el valor, en millones$, de los crditos para vehculo que concedi durante el mes pasado una entidad financiera:
TABLA 4.1: CRDITOS PARA VEHCULO VALOR DE LOS CRDITOS (MILLONES$) ) NMERO DE CRDITOS
Las dos primeras columnas corresponden a los datos disponibles, que ya se encuentran tabulados en una distribucin de frecuencias. La tercera columna corresponde a los puntos medios o marcas de clase de cada intervalo . En la tercera columna se encuentran los productos de cada marca de clase por su frecuencia , necesarios para calcular la media aritmtica
El valor medio (promedio) por el cual se concedieron los crditos fue de 23.06 millones $. Qu tanto varan los valores de los crditos alrededor de la media? Esto se puede medir con la varianza. En la quinta columna se encuentran los clculos necesarios para obtener la varianza.
Esto significa que el valor de los crditos varan (se dispersan, se alejan) alrededor de la media en 67.01 .
OTRA FRMULA PARA CALCULAR LA VARIANZA.
El numerador de la definicin de la varianza se puede operar algebraicamente, operando el cuadrado de la diferencia, para obtener frmulas que pueden ser ms sencillas, pues tienen involucrados menos clculos,
Para datos no tabulados. Y la correspondiente para datos tabulados,
EJ EMPLO 4.4
Utilizando los datos del ejemplo 2, ya se haba obtenido que
Utilizando ahora para la varianza la frmula derivada, obtenemos
Que es el mismo resultado obtenido anteriormente.
EJ EMPLO 4.5.
Utilizando los datos del ejemplo 4.3 Para este ejemplo, los clculos necesarios se presentan en la columna 6 de la tabla 4.1
4.5 DESVIACIN ESTNDAR.
La desviacin estndar se define como la raz cuadrado positiva de la varianza.
La desviacin estndar se expresa en las mismas unidades de medida en que est expresada la variable, por lo cual resulta ms fcil y comprensible su interpretacin que la varianza.
EJ EMPLO 4.6
Si tomamos la varianza calculada en el ejemplo 2, tenemos que la desviacin estndar se puede obtener como:
Lo cual significa que: En promedio, la experiencia que tienen los operarios se dispersa o vara alrededor de la experiencia promedio en 7.43 aos. Observar que este valor tiende a ser grande, lo cual indica que la experiencia es muy variable entre los operarios, es decir, no son uniformes en esta caracterstica.
4.6 COEFICIENTE DE VARIACIN
El coeficiente de variacin de un conjunto de datos se define como el cociente entre la desviacin estndar y la media aritmtica de un conjunto de datos.
El coeficiente de variacin tambin se suele expresar en porcentaje (multiplicar por 100%)
El coeficiente de variacin es una medida de dispersin relativa que se utiliza para establecer el grado de variacin que presenta un conjunto de valores alrededor de su media aritmtica. La varianza y la desviacin estndar son las medidas ms extensamente utilizadas para medir la dispersin o variacin de los valores alrededor de su media , sin embargo, a veces puede resultar difcil establecer si su magnitud es grande o pequea. El coeficiente de variacin puede en este sentido facilitar su interpretacin. Se considera que si el coeficiente de variacin es menor a 0.15 (o 15%) los valores tienen muy poca dispersin, es decir los elementos tienden a ser homogneos. Si el coeficiente de variacin est entre 0.15 y 0.30 ( o entre el 15% y 30%), se considera que los valores presentan una dispersin moderada, o sea, los elementos tienden a ser ligeramente homogneos. Si el coeficiente de variacin es mayor a 0.30 ( o el 30%), los valores tienen una alta dispersin y los elementos tienden a ser heterogneos.
EJ EMPLO 4.7
Para un grupo de empleados de una empresa se ha encontrado que su salario mensual tiene una media de $1200000 y una desviacin estndar de $500000.Es uniforme el salario de estos empleados?. Al observar la magnitud de la desviacin estndar parece que es grande, esto se puede confirmar con el coeficiente de variacin:
Que est bastante por encima de 0.30, por lo cual podemos decir que el salario de los trabajadores es bastante disperso, es decir el grupo de empleados es bastante heterogneo con respecto a su salario mensual.
GLOSARIO
COEFICIENTE DE VARIACIN: Medida de dispersin relativa que se utiliza para comparar diferentes distribuciones y se expresa la relacin entre la desviacin estndar y la media.
DESVIACIN ESTNDAR: definida como la raz cuadrada positiva de la varianza; es una medida de dispersin que se expresa en las mismas unidades de medida que la variable estudiada.
DISPERSIN: Variabilidad que presenta un conjunto de datos.
MEDIDA DE DISPERSIN: medida que expresa la magnitud en la variacin que presenta un conjunto de datos.
RANGO: Diferencia entre el mayor y menor valor de un conjunto de datos.
VARIANZA: Medida que expresa el promedio de las distancias al cuadrado entre los valores y su media aritmtica.
BIBLIOGRAFA
LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y ECONOMA. Pearson Educcin,2004.
MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y ECONOMIA. Editorial alfaomega. 2005.
EJ ERCICIOS
1. Durante nueve das se observ el nmero de unidades que produjeron dos trabajadores de una fbrica que elaboraban el mismo artculo, obteniendo OPERARIO 1 : 22 25 28 29 35 27 26 20 30 OPERARIO 2 : 21 24 26 28 28 27 29 24 26 Cul de los dos operarios es : a. Ms eficiente en su produccin diaria ? Porqu ? b. Ms uniforme en su produccin diaria ? Porqu ?
2. El consejo de Administracin de una corporacin est estudiando la posibilidad de adquirir una de dos compaas y para ello analiza la administracin de cada una en relacin con su inclinacin a correr riesgos. En los ltimos cinco aos , la primera compaa alcanz un promedio de rendimiento sobre las inversiones del 28% con una desviacin estndar de 5.3%. La segunda tuvo un rendimiento medio de 37.8% con una desviacin estndar de 6.29%. Cul de estas dos empresas ha aplicado una estrategia ms riesgosa en sus inversiones ? Porqu?. Cul de las dos empresas recomendara comprar? Porqu?.
3. En dos empresas, A y B, dedicadas a la produccin de un mismo artculo, se tomaron muestras de 10 trabajadores de la empresa A y 15 de la empresa B y se cont el nmero de unidades semanales, X, que elaboraba cada uno de ellos, obteniendo : A : X i = 191 X i 2 =3721 B : X i = 274 X i 2 =5148 Comparar la produccin semanal de los trabajadores de cada empresa en cuanto a la produccin media, variacin absoluta de la produccin semanal, y variacin relativa de la produccin semanal.
4. Un inversionista est interesado en hacerse socio en una de dos empresas de inversiones. El deseara ser socio de aquella empresa de la cual considere que obtiene mayor rentabilidad con menor riesgo. Para decidir observa que las ltimas inversiones realizadas por las empresas han tenido las siguientes rentabilidades ( %) : EMPRESA A : 27 32 31 28 25 22 24 EMPRESA B : 25 29 24 26 24 30 35 23 En cul de las dos empresas le recomendara invertir ? Porqu?.
5. Se pregunt el precio ( X ,en $ ) de un artculo en 20 tiendas y los datos obtenidos se resumieron as : X i =4000 , X i 2 =928000. Obtener e interpretar el coeficiente de variacin del precio del artculo.
6. Da a da durante el mes de J ulio pasado y lo mismo durante el mes de Agosto se tom el precio (libra) de venta mayorista para un producto agrcola . En J ulio se encontr que el precio tuvo una media de $180 y desviacin estndar de $36; en Agosto el precio tuvo una media de $240 y desviacin estndar de $44. En cul de los dos meses fue ms estable el precio del producto ?
7. Cul de las siguientes es una medida de dispersin relativa? A. La desviacin estndar B. El coeficiente de variacin C. La varianza D. La mediana E. El rango
8. La varianza se mide en A. Unidades al cuadrado de la variable. B Unidades de la variable. C porcentaje. D. diferentes unidades de la variable.
9. La raz cuadrada de la varianza se llama A. Coeficiente de variacin B. desviacin media C. desviacin estndar D. Amplitud
10. El Rango o Recorrido de un conjunto de datos es : A. La diferencia entre el tercer cuartel y el primer cuartel. B. La diferencia entre el mayor valor y el menor valor C. El mayor valor D. El menor valor
11. Cual de las siguientes medidas es una medida de dispersin absoluta? A. El tercer cuartil B. La variable estandarizada C. La desviacin estndar D. El coeficiente de variacin.
12. En una empresa A los salarios mensuales de los trabajadores tienen una media de $1500000 y desviacin estndar de $400000; en otra empresa B los salarios mensuales de los trabajadores tienen media de $ 1300000 y desviacin estndar de $450000. A partir de esta informacin podemos afirmar que los salarios en la empresa A A. Tienen forma sesgada a la derecha B. Son absolutamente ms variables que los de la empresa B. C. Tienen una menor dispersin relativa que los de la empresa B. D. Son menos asimtricos que los de la empresa B.
UNIDAD V ANLISIS DE REGRESIN
OBJ ETIVOS: 1. Establecer la relacin entre dos variables. 2. Utilizar el diagrama de dispersin para observar la forma de la relacin entre dos variables. 3. Estimar un modelo lineal para expresar la relacin entre dos variables. 4. Utilizar la ecuacin lineal estimada para predecir valores de la variable dependiente con base en la variable independiente.
5.1 INTRODUCCIN
Muchas decisiones en Administracin, Negocios y Economa se basan en predicciones sobre el comportamiento de una o ms variables con base en relaciones conocidas o supuestas entre variables. En el anlisis de regresin se considera el caso de la relacin entre dos variables que conduce a la estimacin de una ecuacin, es decir una frmula matemtica o modelo.
Establecido este modelo, se puede utilizar con propsitos de pronstico o prediccin, que son ampliamente utilizadas con fines de planeacin.
En el anlisis de regresin se considera: 1. La existencia de relacin entre las variables. Esta relacin debe ser establecida desde el propio contexto de las variables, es decir, bajo un sustento terico. Hay que tener en cuenta que aqu no se considera una relacin causal. 2. La definicin de una variable dependiente o explicada y una variable independiente o explicatoria. 3. Suponer un modelo o ecuacin que permita relacionar las variables.
En este captulo solo consideramos el caso de la relacin entre dos variables y slo se considera el caso de la relacin lineal entre ellas.
5.2 DIAGRAMA DE DISPERSIN
El diagrama de dispersin es un grfico que se suele utilizar para representar el comportamiento conjunto de dos variables. En el eje horizontal se representa la variable independiente y en el vertical, la variable dependiente.
EJ EMPLO 5.1
Suponer que a un grupo de personas se les ha medido su ingreso mensual ( en millones de $) y su gasto mensual de consumo( en millones de $) y que se han obtenido los siguientes datos:
Es relativamente fcil suponer que entre las dos variables, ingreso mensual y gastos mensuales de consumo, existe relacin y que el ingreso mensual es la variable dependiente o explicatoria, pues puede explicarse a partir de ella las variaciones en el gasto mensual de consumo de las personas, que sera la variable dependiente. Una forma de representar grficamente las dos variables es mediante el siguiente grfico, que representa en el eje horizontal los valores de la variable independiente y en el eje vertical los valores de la variable dependiente.
GRFICO 5.1
El grfico anterior se conoce con el nombre de diagrama de dispersin o nube de puntos. Este grfico nos muestra que evidentemente existe relacin entre las dos variables y adems que esta relacin es directa: en la medida en que el ingreso mensual en que el ingreso mensual aumenta, los gastos mensuales de consumo tambin aumentan o a la inversa, cuando el ingreso mensual disminuye, los gastos mensuales de consumo tambin disminuyen.
Otro hecho que tambin muestra el grfico es que los puntos tienden a alinearse alrededor de una lnea recta, entonces puede utilizarse este hecho para suponer que entre las dos variables existe una relacin lineal y por lo tanto un modelo lineal sera apropiado para relacionar las dos variables.
No necesariamente la relacin entre dos variables puede ser lineal. Consideremos el siguiente ejemplo.
EJ EMPLO 5.2
Se mide a 8 operarios la experiencia (en meses) que tienen en realizar un trabajo y el tiempo (minutos) que tardan en realizar ese trabajo.
En este caso la variable independiente es la experiencia del operario (representada en el eje horizontal)y la variable dependiente es el tiempo en que se realiza el trabajo(representado en el eje vertical).
GRFICO 5.2: Diagrama de dispersin de la experiencia y tiempo para realizar un trabajo por 8 operarios.
En el grfico puede observarse que existe relacin inversa entre las dos variables, entre mayor sea la experiencia el tiempo en que se realiza el trabajo es menor, y a la inversa, entre menor sea la experiencia menor es el tiempo que se tarda en realizar el trabajo.
Tambin puede observarse que los puntos no tienden a alinearse alrededor de una recta sino de una curva. Sin embargo, tambin pueden presentarse casos en los cuales las dos variables no muestran ningn tipo de relacin como puede verse en el siguiente grfico.
GRFICO 5.3: No relacin entre dos variables.
5.3 Estimacin de la ecuacin lineal de mnimos cuadrados. Partimos del supuesto de que entre las dos variables existe una relacin lineal (el diagrama de dispersin puede sugerirlo). La ecuacin lineal tiene la siguiente forma:
se llaman los parmetros de la ecuacin lineal.
Como usualmente solo se dispone de los datos provenientes de una muestra, estos solo permiten realizar una estimacin de la verdadera relacin entre las dos variables. Entonces se dice que la ecuacin lineal se ESTIMA a partir de los datos muestrales, y se expresa de la siguiente forma:
son los estimadores de los parmetros. En la ecuacin, se llama el intercepto de la recta, y representa el valor que se estima toma la variable dependiente cuando la variable independiente toma el valor de cero ( no siempre tiene un sentido lgico). El valor de se llama la pendiente de la recta y representa el valor en que se estima vara la variable dependiente cuando la variable independiente vara en una unidad.
MTODO DE MNIMOS CUADRADOS.
A partir del diagrama de dispersin se puede observar que no existe ninguna recta que pase justo por encima de todos los puntos. Se trata de obtener la recta que pueda pasar lo ms cercana posible a todos los puntos del diagrama de dispersin.
Cuando se ajusta una recta a los puntos del diagrama de dispersin para cada valor observado en la muestra para la variable independiente habr dos valores diferentes para la variable dependiente, el observado en la muestra ( y) y el estimado por la ecuacin lineal( ). La diferencia que hay entre los dos es un error, es decir,
El mtodo de mnimos cuadrados establece que la ecuacin que mejor se ajusta a los datos muestrales es aquella que minimiza la suma de los errores al cuadrado.
Este mtodo conduce a obtener los estimadores de los parmetros de la ecuacin lineal a partir de las siguientes ecuaciones:
EJ EMPLO 5.3
Se desea disponer de un modelo que exprese como cambian los costos totales de produccin (millones $) de acuerdo con la cantidad de unidades producidas, para un determinado artculo. Se obtuvieron datos de cinco fbricas que elaboran el mismo artculo, que se muestran en la siguiente tabla.
La variable dependiente es el costo total de produccin y la variable independiente es la cantidad de unidades producidas. Puede suponerse que las dos variables se relacionan en forma lineal como lo muestra el siguiente diagrama de dispersin
GRFICO 5.4: Diagrama de dispersin de unidades producidas y costos totales de produccin.
Para obtener la ecuacin lineal que relaciona las dos variables se deben inicialmente realizar los clculos que se muestran en la siguiente tabla
TABLA 5.4
FBRICA CANTIDAD DE UNIDADES PRODUCIDAS ( COSTOS TOTALES DE PRODUCCIN
A partir de los datos anteriores se obtienen las medias de las dos variables:
Utilizando las ecuaciones (5.1) y (5.2) se obtienen los estimadores de los parmetros,
Entonces, la ecuacin estimada ser:
El valor del intercepto, 5.6 significa que si una fbrica no produjera, se esperara que tuviera unos costos de 5.6 millones $. Notar que este valor representa los costos fijos estimados promedios para las empresas. El valor de la pendiente, 0.16 significa que si una fbrica aumenta(disminuye) su produccin en una unidad se espera o se estima que sus costos totales de produccin se aumenten(disminuyan) en 0.16 millones $. Notar que este valor representa los costos variables de estas empresas.
PREDICCIN.
Una vez obtenida la ecuacin, que representa un modelo, para relacionar las dos variables, este modelo puede utilizarse con fines de pronstico o prediccin.
EJ EMPLO 5.4
Si una fbrica deseara producir 70 unidades del artculo, qu costos de produccin se estimara que debera tener? Para responder la anterior pregunta solamente se requiere reemplazar el valor supuesto de la variable independiente, en este caso 70, en la ecuacin estimada,
Millones $ As que se estimara que la fbrica tendra costos de produccin por 16.8 millones $.
5.4 ERROR ESTNDAR DE ESTIMACIN
Al obtener una ecuacin lineal para estimar la relacin entre dos variables hemos vistos que siempre habr un error. El error estndar de estimacin es una medida de la confiabilidad del modelo estimado. Puede interpretarse como la cantidad promedio en que los valores observados de la variable dependiente se dispersan o varan alrededor de la recta. Otra forma de interpretarlo es como la cantidad promedio de error que se comete al utilizar la ecuacin lineal para estimar la variable dependiente con base en valores conocidos o supuestos para la variable dependiente. El error estndar de estimacin se define como:
: representa los valores estimados con la ecuacin lineal para todos los valores observados de la variable independiente.
EJ EMPLO 5.5
Para el ejemplo 5.3 vamos a obtener el error estndar de estimacin. Inicialmente se reemplazan en la ecuacin estimada los diferentes valores de la variable independiente, con lo cual se obtienen los valores estimados para la variable dependiente. Los clculos se muestran en la siguiente tabla.
TABLA 5.5
FBRICA CANTIDAD DE UNIDADES PRODUCIDAS ( COSTOS TOTALES DE PRODUCCIN
Este valor se puede interpretar como el error promedio que se comete al utilizar la ecuacin lineal ajustada para estimar el costo total de produccin de una fbrica con base en la cantidad de unidades producidas.
OTRA FRMULA. Otra frmula que puede utilizarse para el clculo del error estndar de estimacin, se obtiene por manipulacin algebraica, y resulta mucho ms fcil de calcular manualmente, es:
EJ EMPLO 5.6
Obtener el error estndar de estimacin para el ejemplo 5.3 utilizando la frmula 5.4.
Los clculos se disponen como en la siguiente tabla:
TABLA 5.6 FBRICA CANTIDAD DE UNIDADES PRODUCIDAS ( COSTOS TOTALES DE PRODUCCIN
millones $. Que es igual al obtenido anteriormente.
5.5 COEFICIENTE DE DETERMINACIN.
El coeficiente de determinacin se define como:
Es decir, el coeficiente de determinacin es el cociente entre las variaciones de los valores estimados por la ecuacin lineal d regresin y las variaciones de la variable dependiente, ambos con respecto de la media. El coeficiente de determinacin es una medida que siempre se encuentra comprendido entre 0 y 1. El coeficiente de determinacin puede interpretarse de dos formas: Una, como la proporcin de las variaciones de la variable dependiente que son explicadas por las variaciones de la variable independiente; la otra como una medida de la bondad del ajuste de la ecuacin lineal a los datos muestrales. Cuando el coeficiente de determinacin tienda a 0 es porque la ecuacin lineal no se ajusta a los datos muestrales, por el contrario, si el coeficiente de determinacin tiende a 1 es porque la ecuacin lineal explica bien la relacin entre las dos variables.
EJ EMPLO 5.7
Obtener el coeficiente de determinacin para el ejemplo 5.3
Los datos se disponen como en la siguiente tabla:
TABLA 5.7
FBRICA CANTIDAD DE UNIDADES PRODUCIDAS ( COSTOS TOTALES DE PRODUCCIN
Esto significa que el 0.9846(o el 98.46%) de las variaciones que se producen en el costo total de produccin son explicadas por las variaciones que se producen en la cantidad de unidades producidas. De otra parte, como el coeficiente de determinacin es bastante alto, cercano a 1, se puede decir que la ecuacin lineal es un buen modelo para representar la relacin entre las dos variables.
OTRA FRMULA.
Mediante manipulacin algebraica la frmula del coeficiente de determinacin se puede transformar en otra que es ms sencilla para trabajo manual:
EJ EMPLO 5.8
Para el ejemplo 5.3, obtener el coeficiente de determinacin utilizando la frmula 5.6
Los datos se disponen como en la siguiente tabla:
TABLA 5.8
FBRICA CANTIDAD DE UNIDADES PRODUCIDAS ( COSTOS TOTALES DE PRODUCCIN
El coeficiente de correlacin se define como la raz cuadrada del coeficiente de determinacin:
El coeficiente de correlacin siempre tiene el mismo signo de en la ecuacin lineal de regresin. Siempre vara entre -1 y 1.
El coeficiente de correlacin es una medida del la asociacin lineal que existe entre las dos variables. Un coeficiente de correlacin cercano a 0 indica que no existe relacin lineal entre las dos variables. Si es cercano a -1 indica que existe una muy buena relacin lineal inversa entre las dos variables. Si es cercano a 1, indica que existe una muy buena relacin lineal directa entre las dos variables.
EJ EMPLO 5.9
Para los datos del ejemplo 5.3, el coeficiente de correlacin sera:
Este valor indica que existe una correlacin de 0.992 entre la cantidad de unidades producidas y los costos totales de produccin. Como este valor es prximo a 1 se puede decir que existe una buena relacin lineal directa entre las dos variables.
EJ EMPLO 5.10.
Durante diez meses se observ la tasa de inters efectiva anual ( %) de colocacin que tena una institucin financiera y el nmero de crditos solicitados por los clientes. Se obtuvieron los datos que se muestran en la tabla 5.9: En la tabla tambin se muestran las columnas con los clculos necesarios.
a. Cul es la variable dependiente y cul la independiente? RESPUESTA: La cantidad de crditos solicitados en un mes depende de la tasa de inters que cobre la institucin financiera. Luego, la variable independiente es la tasa de inters cobrada por el banco y la variable dependiente es la cantidad de crditos solicitados por los clientes. b. Representar los datos en un diagrama de dispersin. Analizar. RESPUESTA. El diagrama de dispersin se muestra a continuacin. En el diagrama de dispersin se confirma la existencia de relacin entre las dos variables. Adems, se observa, como cabra esperarse que las dos variables muestran una relacin inversa. Entre ms alta sea la tasa de inters menor es la cantidad de crditos solicitados por los clientes, y al contrario, entre ms baja sea la tasa de inters cobrada, mayor es la cantidad de crditos solicitados por los clientes. Tambin se observa que los puntos tienden a concentrarse alrededor de una recta, por lo cual el modelo lineal sera apropiado para relacionar las dos variables.
c. Obtener la recta de regresin de mnimos cuadrados que relaciona las dos variables. RESPUESTA. Los parmetros de la ecuacin lineal se estiman mediante:
Entonces, la ecuacin lineal de regresin que relaciona las dos variables es:
d. Interpretar los parmetros de la ecuacin lineal estimada. El valor de , significa que si la entidad financiera cobrara una tasa de inters efectiva anual del 0% estimara que el nmero de crditos que solicitarn los clientes seran 9409.07 El valor de , significara que si la entidad aumentara (disminuyera) la tasa de inters efectiva anual en un 1%, se esperara que el nmero de crditos se disminuir(aumentar) en 220.287. e. Obtener e interpretar el error estndar de estimacin. Crditos. Este valor significa que si la ecuacin lineal ajustada se utiliza para estimar el nmero de crditos solicitados en un mes con base en la tasa de inters anual efectiva cobrada, en promedio se cometer un error de 211.957 crditos. f. Obtener e interpretar el coeficiente de determinacin.
El 0.931(el 93.1%) de las variaciones que se producen en la cantidad de crditos solicitados mensualmente se producen por las variaciones producidas en la tasa de inters efectiva anual cobrada. Como el valor del coeficiente de determinacin es alto, se aproxima a 1, se puede decir que la ecuacin lineal explica muy bien el comportamiento de las dos variables. g. Obtener e interpretar el coeficiente de correlacin. = Significa que existe una correlacin de -0.965 entre el nmero de crditos solicitados mensualmente y la tasa de inters cobrada. Como este valor se aproxima a -1 se puede decir que la ecuacin lineal establece una buena relacin inversa entre las variables.
GLOSARIO
COEFICIENTE DE CORRELACIN: Medida de asociacin lineal entre dos variables.
COEFICIENTE DE DETERMINACIN: Medida que expresa la proporcin de la variacin en la variable dependiente que se explica por las variaciones en la variable independiente..
DIAGRAMA DE DISPERSIN: Grfica en el cual se representan mediante puntos en el plano, los valores para dos variables en cada elemento de la muestra; presenta como se relacionan dos variables-
ERROR ESTNDAR DE ESTIMACIN. Mide el error promedio que se comete al utilizar la ecuacin lineal para predecir el valor de la variable dependiente, utilizando la ecuacin estimada.
MTODO DE MNIMOS CUADRADOS: Procedimiento estadstica que se utiliza para ajustar una ecuacin lineal a un conjunto de datos muestrales de tal manera que minimiza la distancia al cuadrado entre los puntos muestrales y la recta ajustada.
REGRESIN: Mtodo estadstico que permite predecir el valor de una variable a partir del conocimiento de otra variable con la cual se encuentra relacionada.
RELACIN LINEAL: Una forma de asociacin entre dos variables que se describe estadsticamente mediante la ecuacin de la lnea recta.
BIBLIOGRAFA
LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y ECONOMA. Pearson Educcin,2004.
MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y ECONOMIA. Editorial alfaomega. 2005.
1. Indicar si es FALSO O VERDADERO cada una de las siguientes afirmaciones:
a. El anlisis de regresin se utiliza para establecer relaciones de causa y efecto. b. La ecuacin de regresin se ajusta a partir de los datos de una poblacin y no de una muestra. c. El coeficiente de correlacin mide el grado de asociacin lineal entre dos variables. d. 1. Para un conjunto de mquinas se obtuvo la siguiente informacin correspondiente a la eficiencia (medida en porcentaje), y al tiempo de uso (en aos) EFICIENCIA(%) 62 54 81 94 80 77 58 51 79 60 97 TIEMPO DE USO (AOS) 7 9 3 2 4 3 8 10 5 6 1 a. Determinar la ecuacin de regresin lineal que relaciona la eficiencia de las mquinas con el tiempo de uso. Interpretar los parmetros. b. Que eficiencia se esperara que tuviera una mquina con 18 meses de uso? c. Calcular e interpretar el coeficiente de determinacin.
2. Para una muestra de municipios se tienen los siguientes datos correspondientes al impuesto predial y al nmero de habitantes. Poblacin 1 2 3 4 5 6 7 8 9 10 Impuestos ( millones$) 850 1180 1640 2280 7000 1100 1610 2611 2000 4440 Habitantes ( miles) 168 240 350 380 150 200 210 490 420 450 Obtener le interpretar todo lo relacionado con la ecuacin lineal de regresin.
3. Los siguientes datos corresponden a una muestra de autos de entidades pblicas correspondientes a la edad del auto( aos) y los costos mensuales de mantenimiento( miles$) AUTOMVIL 1 2 3 4 5 6 7 8 9 10 EDAD DEL AUTO 1 2 2 2 2 3 4 4 5 5 COSTO ME DE MANT. 350 370 420 440 480 510 550 580 620 700 a. Establecer la ecuacin lineal que relaciona las dos variables. b. Interpretar los parmetros de la anterior ecuacin. c. Estimar el costo mensual de mantenimiento de un automvil con 6 aos de uso. d. Interpretar el coeficiente de determinacin. e. interpretar el coeficiente de correlacin. f. Establecer, a un nivel de significancia 0.05, si realmente existe relacin lineal entre las dos variables.
4. Una empresa productora de alimentos est estudiando el efecto de una campaa publicitaria emprendida para promover la venta de un tipo de enlatado. Se seleccionaron al azar a diez personas y se les pregunt el nmero de veces que haban visto los anuncios puestos en la televisin y el nmero de enlatados que haban comprado, en el mes anterior. Las respuestas obtenidas se resumieron as X i =34 X i 2 =160 Y i =88 Xi Y i =368 Y i 2 =885 a. Obtener la ecuacin lineal de regresin que relaciona las dos variables. b. Interpretar los parmetros de la anterior ecuacin c. Si una persona ha visto 4 anuncios en la TV, cuntas cajas del enlatado se esperara hubiera comprado?
UNIDAD VI SERIES DE TIEMPO
OBJ ETIVOS: 1. Conocer los componentes de una serie cronolgica. 2. Utilizar las tcnicas de regresin para modelar las series cronolgicas. 3. Modelar el comportamiento pasado de una serie cronolgica. 4. Utilizar un modelo de serie de tiempo para predecir el comportamiento futuro de una serie de tiempo.
6.1 INTRODUCCIN
Los datos series de tiempo o datos cronolgicos suelen contener informacin subyacente sobre el comportamiento pasado de una variable. El anlisis de las series de tiempo se utiliza para conocer los patrones del comportamiento de una o ms variables. Casos como el manejo de inventario en una empresa , las predicciones del tamao de una poblacin en un futuro, el presupuesto anual o mensual de una empresa, el comportamiento del precio de un producto, etctera, son casos en los cuales el conocimiento del comportamiento a travs de los registros histricos pueden servir de base para proyectar el comportamiento futuro de la variable. Modelando el comportamiento pasado de una serie de tiempo, este modelo se puede utilizar con el fin de realizar pronsticos o predicciones, que son una herramienta ampliamente utilizada en la administracin.
6.2 DEFINICIN
Una serie de tiempo una serie cronolgica corresponde al registro de una variable en un elemento en diferentes tiempos o momentos, usualmente a intervalos regulares de tiempo.
Los datos de series cronolgicas corresponden a registros histricos de los cuales disponen las empresas.
EJ EMPLO 6.1
Los registros de una empresa muestran que las unidades vendidas de un producto han sido como se muestran en la siguiente tabla.
Cuando se desea abordar en conocimiento de una serie de tiempo es necesario definir la unidad de tiempo que se utilizar en el anlisis, tal como aos, meses, trimestres etc. El anlisis de una serie cronolgica consistir en establecer un modelo que trate de reproducir el comportamiento pasado de la variable. Un grfico de los datos es de gran ayuda:
GRFICO 6.1: UNIDADES VENDIDAS POR UNA EMPRESA
6.3 COMPONENTES DE UNA SERIE DE TIEMPO. Toda serie de tiempo se considera que la variable es afectada por cuatro factores o componente que la afectan en cada periodo. Estas componentes son: Tendencia, variaciones estacionales, variaciones cclicas y variaciones aleatorias. TENDENCIA. La tendencia o tendencia secular se concibe como el movimiento a largo plazo de la variable., es decir, la forma en que vara a travs del tiempo la variable. La tendencia generalmente se origina en los aumentos de poblacin, a los cambios tecnolgicos, etc
GRFICO 6.2: TENDENCIA El grfico 6.2 muestra que la variable a travs del tiempo, a pesar de haber periodos en los cuales disminuye, tiende sistemticamente a aumentar. El presupuesto del pas, la poblacin del pas, las ventas de automviles son algunos ejemplos de variables que muestran una tendencia a travs del tiempo. VARIACIONES ESTACIONALES. Son variaciones que presenta una variable dentro de un ao calendario tendiendo a presentar el mismo comportamiento ao tras ao. Las variaciones estacionales generalmente se presentan debido a las temporadas del ao, cambios climticos (estaciones) que hacen que el comportamiento de algunas variables tengan un comportamiento particular en determinadas pocas del ao. Las ventas de juguetes en navidad, las ventas de pasajes areos en pocas de vacaciones, los precios de algunos productos agrcolas en pocas de cosecha, son algunos ejemplos de las variaciones estacionales.
GRFICO 6.3: VARIACIONES ESTACIONALES Observar el grfico 6.3. Los datos representan los registros de ventas de una empresa trimestralmente. Se muestra una tendencia a aumentar a travs de los trimestres. Tambin se observa que las ventas son consistentemente ms alta en el cuarto trimestre y ms baja en el segundo trimestre. Estos son ejemplos de variaciones estacionales. VARIACIN CICLICA. Son variaciones alrededor de la tendencia que ocurren en periodos de al menos cinco aos y hasta veinte aos, generalmente son asociados con los ciclos econmicos donde suelen presentarse pocas de gran crecimiento o de depresiones. Estas fluctuaciones afectan el comportamiento de algunas variables en algunos aos.
GRFICO 6.4: VARIACIONES CICLICAS.
El grfico 6.4 muestra una variacin cclica tpica en donde se muestran fluctuaciones hacia arriba y hacia abajo, alrededor de una tendencia creciente.
VARIACIONES ALEATORIAS.
Son variaciones irregulares completamente impredecibles. Las variaciones aleatorias pueden deberse a fenmenos tales como paros, huelgas, inviernos o veranos prolongados, que hacen que se tenga en un periodo dado una variacin completamente aleatoria.
GRFICO 6.5: VARIACIONES ALEATORIAS.
En el grfico 6.5 se observa el caso de una variacin aleatoria en el periodo nmero siete, donde la variable despus de tener un comportamiento regular, presenta una baja considerable.
El anlisis de una serie de tiempo consiste en estudiar cada uno de estos componentes, medir la magnitud de su influencia sobre el comportamiento de la variable y utilizarlos para predecir su comportamiento futuro. Solamente consideraremos el componente de tendencia, que se presenta a continuacin.
6.4 ANLISIS DE TENDENCIA. El comportamiento de tendencia de una serie de tiempo se estudia mediante el ajuste de una funcin que pueda describir el comportamiento de la variable a travs del tiempo. El mtodo usual es realizar el ajuste mediante el mtodo de mnimos cuadrados.
El estudio de la tendencia permite describir el comportamiento histrico de la serie. Muchas decisiones empresariales se toman a partir del conocimiento que se tenga del comportamiento de la variable. Pero adems este conocimiento permite tomar decisiones haca el futuro. Por ejemplo, tener una estimacin del nmero de habitantes de un pas a 10 o 20 aos permite tomar decisiones sobre planeacin. Si se puede estimar hacia el futuro del nmero de vehculos que habr en una ciudad se podrn tomar decisiones sobre la construccin de vas. Son muchos los ejemplos que se pueden tener sobre el uso de los pronsticos en la toma de decisiones.
AJ USTE DE LA TENDENCIA MEDIANTE EL MTODO DE MNIMOS CUADRADOS.
El modelo correspondiente a una ecuacin lineal estimada a partir de datos muestrales tiene la forma:
Donde , representa a la variable que se estudia y que se supone vara a travs del tiempo. , representa el valor estimado para la variable en algn periodo. , representa la variable independiente, que en este caso es el tiempo. , representan los estimadores de los parmetros de la ecuacin lineal.
Igualmente como en el anlisis de regresin, la estimacin de los parmetros por el mtodo de mnimos cuadrados conduce a resolver las siguientes ecuaciones:
CODIFICIN DEL TIEMPO.
La variable independiente tiempo se mide en meses, trimestres, aos, etc., que no son de por s magnitudes numricas, pero estas medidas de tiempo se pueden transformar en medidas numricas mediante una codificacin. Para la codificacin de los periodos de tiempo se selecciona arbitrariamente un periodo (llamado periodo origen de la serie. Al periodo origen se le asigna el valor de cero. Los dems valores de la variable codificada se obtienen contando el nmero de periodos transcurridos desde el origen (hacia atrs se asignan valores negativos y hacia adelante valores negativos).
EJ EMPLO 6.2
Considerar los datos que se presentan en la tabla 6.2 que muestra el nmero de quejas que se han presentado trimestralmente en una entidad prestadora de servicios.
En la tabla 6.2 se presentan tres formas diferentes de codificacin. En la tercera columna se presenta una forma de codificacin, tal vez la ms utilizada, en la cual se ha tomado como periodo origen el primer trimestre de 2005. En la cuarta columna se presenta otra codificacin en la cual se ha tomado como origen segundo trimestre de 2006 y en la quinta columna se presenta otra codificacin en la cual el origen se ha tomado como el cuarto trimestre de 2004(a pesar de no contarse con registro de este periodo).
Con los valores asignados a la variable independiente por codificacin se puede realizar la estimacin de la ecuacin lineal de tendencia.
Las dems medidas utilizadas en el anlisis de regresin tambin pueden ser utilizadas de la misma forma ( error estndar de estimacin, coeficiente de determinacin, coeficiente de correlacin).
EJ EMPLO 6.3
En la tabla siguiente se muestra el nmero de pasajeros que ha transportado una aerolnea en el periodo 1999-2007.
TABLA 6.4: PASAJ EROS TRANSPORTADOS POR UNA AEROLINEA.
AOS NMERO DE PASAJ EROS 1999 2000 2001 2002 2003 2004 2005 2006 2007 12500 13200 14100 15800 15600 16200 18100 19000 21300
En la siguiente tabla se muestra la codificacin realizada para la variable independiente tomando arbitrariamente como periodo origen el ao 1999. Los datos se disponen de la misma forma que para el anlisis de regresin.
TABLA 6.5: PASAJ EROS TRANSPORTADOS POR UNA AEROLINEA.
La ecuacin lineal de regresin que expresa la tendencia del nmero de pasajeros transportados por la aerolnea se obtiene:
Entonces la ecuacin que expresa la tendencia anual del nmero de pasajeros transportados por la aerolnea es:
En esta ecuacin el valor de no tiene sentido, pero el valor de , significa que el nmero de pasajeros transportados por la aerolnea, en promedio, se aumenta anualmente en 1016.67. El error estndar de estimacin: =
Que significa que si la ecuacin lineal de regresin se utiliza para estimar el nmero de pasajeros que transportar la empresa en un ao, en promedio se cometer un error de 661.3 pasajeros. El coeficiente de determinacin:
El 95.29% de las variaciones que se producen en la cantidad de pasajeros transportados por la aerolnea son explicados por la tendencia.
PREDICCIN.
La ecuacin lineal ajustada se puede utilizar para predecir el comportamiento futuro de la variable, as si deseamos predecir el nmero de pasajeros que transportara la aerolnea en 2008 y 2009, solo se requiere reemplazar en la ecuacin el valor de X por nueve y diez respectivamente. Pronstico para el ao 2008:
Pronstico para el 2009:
GLOSARIO
SERIE DE TIEMPO: Conjunto de datos registrados a intervalos de tiempo regulares para una variable.
TENDENCIA: variacin a largo plazo de una serie cronolgica.
VARIACIN ESTACIONAL: Variaciones que tiene una serie de tiempo dentro de un ao repitindose todos los aos en la misma poca.
VARIACIN CICLICA: Variacin de una serie de tiempo alrededor de la ecuacin de tendencia.
VARIACIN ALEATORIA: Variacin no predecible que se produce en una serie de tiempo.
BIBLIOGRAFA
LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y ECONOMA. Pearson Educcin,2004.
MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y ECONOMIA. Editorial alfaomega. 2005.
1. Indicar si cada una de las siguientes afirmaciones es VERDADERA o FALSA a. Las variaciones estacionales solo pueden ocurrir en periodos mensuales. b. El conocimiento del comportamiento histrico de una variable permite predecir su comportamiento futuro. c. Puede haber variables que no presentan variaciones estacionales. d. La ecuacin para modelar la tendencia de una serie cronolgica debe se siempre la ecuacin lineal. e. Las variaciones irregulares siempre se pueden predecir. f. Una serie de tiempo se puede obtener por muestreo.
2. 1. Las captaciones (millones$) que ha tenido una entidad financiera en los ltimos diez aos han sido: AOS 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 CAPTACIONES 800 850 900 1200 1800 2000 2400 2780 3600 3800 Ajustar la ecuacin lineal a la tendencia de las captaciones y utilizarla para estimar las captaciones que realizara la empresa en 2008 y 2009
2. Los ingresos no operacionales (en millones de $) que ha tenido una empresa presentan el siguiente registro para el periodo para el periodo 2000-2007
AOS 2000 2001 2002 2003 2004 2005 2006 2007 INGRESOS NO OPERACIN. 45 60 58 74 95 80 120 135 Obtener la ecuacin lineal que expresa la tendencia de los ingresos no operacionales de la empresa y utilizarla para estimar los ingresos no operacionales que tendra la empresa en 2009, 2010 y 2011.
3. El nmero de unidades vendidas, por una compaa en el periodo 2001-2007 ha sido:
AOS 2001 2002 2003 2004 2005 2006 2007 #DE UNIDADES VEND. 2200 2500 2400 3000 3100 3500 4200 Establecer la ecuacin lineal que expresa la tendencia de las ventas y utilizarla para estimar el nmero de unidades que esperara vender la compaa en 2008 y 2009
4. El presupuesto que ha tenido un municipio presenta el siguiente registro histrico: AO 2002 2003 2004 2005 2006 2007 PRESUP ( MILES MILLONES $) 340 400 440 680 710 900 a. Ajustar la ecuacin lineal que exprese la tendencia anual del presupuesto. b. Interpretar de la anterior ecuacin. c. Utilizar la anterior ecuacin para estimar el presupuesto que tendra el municipio en 2008, 2009 y 2010.
5. Las captaciones en CDT que ha tenido una entidad financiera tiene el siguiente registro:
Suponer que las captaciones en CDT siguen una tendencia lineal. Ajustar esta ecuacin e interpretar . Obtener e interpretar el coeficiente de determinacin. Comentar Utilizar la ecuacin lineal de tendencia para estimar las captaciones en cada uno de los trimestres de 2008 y2009.
UNIDAD VII NMEROS NDICES
OBJ ETIVOS: 1. Comprender el sentido de los nmeros ndices como medida de la variacin experimentada por una variable entre dos periodos. 2. Conocer los principales tipos de nmeros ndice. 3. Poder calcular diferentes ndices. 4. Utilizar los nmeros ndices.
7.1 INTRODUCCIN.
Los nmeros ndices forman parte de un conjunto de indicadores referidos a variaciones que experimenta una variable a travs del tiempo. Los ndices son ampliamente utilizados en Economa y Finanzas. Tal vez los ndices ms utilizados son los que se utilizan para calcular el ndice de Precios al Consumidor, que es un indicador de cmo varan los precios de una canasta de bienes y servicios. Otro ndice muy conocido es el ndice que diariamente publican las Bolsas de Valores referidos a la variacin de los precios de las acciones que se negocian en ellas.
Vamos a tratar de en este captulo sobre los principales tipo de ndices y sus aplicaciones.
7.2 DEFINICIN DE UN NMERO NDICE.
Los nmeros ndices son cantidades relativas, generalmente expresadas en porcentaje, que miden la variacin en los precios, cantidades o valores de uno o ms bienes en un periodo llamado de estudio o de inters con respecto a otro periodo llamado base. Segn lo anterior, los ndices pueden ser de precios, de cantidades o valores. Los nmeros ndices se pueden referir a un solo bien (ndices simples) o referirse a ms de un bien (una canasta de bienes). Con respecto a los periodos involucrados en el ndice, se tienen dos periodos: el periodo en el cual interesa establecer la variacin (periodo de inters) con respecto a otro periodo (periodo base o de referencia). El periodo base se establece arbitrariamente pero se prefiere que sea muy estable en cuanto a los precios o cantidades (consumidas, vendidas, exportadas, etc.). Con respecto de la base, los ndices pueden ser de base fija o de base variable.
7.3 NDICES PARA UN SOLO BIEN. (NDICES SIMPLE)
Expresan la variacin en el precio, cantidad o valor de un nico bien en un periodo con respecto a un periodo base. Estos ndices pueden ser de base fija o de base variable.
7.3.1 NDICE SIMPLE DE BASE FIJ A
Un ndice se dice que es de base fija si dados diferentes periodos, el periodo de comparacin es el mismo para toda la serie. Los ndices de base fija se definen como:
NDICE DE PRECIOS. Indica la variacin en el precio de un bien en uno o ms periodos con respecto a un mismo periodo.
Donde: : Indica el ndice de precios en el periodo con respecto al periodo base ( .
: Precio del bien en el periodo de estudio . : Precio del bien en el periodo base,
NDICE DE CANTIDAD. Expresa la variacin en la cantidad de un bien en uno o ms periodos con respecto a otro periodo fijo de referencia.
Donde: : Cantidad utilizada (vendida, comprada, exportada, etc. ) en el periodo de inters . : Cantidad utilizada (vendida, comprada, exportada, etc. ) en el periodo base : ndice de cantidad en el periodo de inters con respecto al periodo base
NDICE DE VALOR. Expresa la variacin en el valor de un bien en uno o ms periodos con respecto a un mismo periodo base.
Donde: : Es el ndice de valor de un bien en el periodo de inters con respecto al periodo base Valor del bien en el periodo de inters Valor del bien en el periodo base
Observar que los ndices se expresan en porcentaje pero no se les suele agregar el smbolo %.
EJ EMPLO 7.1 El registro histrico del precio que ha tenido un bien se muestra en la siguiente tabla:
Generalmente no interesa cul ha sido el precio del bien sino la evolucin en la variacin porcentual que ha tenido a travs del tiempo. Para el caso de ndices con base fija se selecciona un periodo base que sirve de comparacin para todos los dems periodos. Para el ejemplo seleccionamos como periodo base el ao 2001. Los ndices de precios para el producto se obtienen de la siguiente forma:
Los ndices de precios para el producto quedarn de la siguiente forma:
Cuando se disponen de ndices con base fija de especificarse cul es el periodo 2. representa el precio del producto en un 3. do (aumentado o disminuido) el Tomemos como ejemplo el prim cio que tuvo 2. l precio del producto fue 0.88 veces el precio que tuvo 3. l precio del producto fue un 12% menor que en el ao
.3 NDICES CON BASE VARIABLE. do de comparacin es periodo que se est utilizando como periodo base, como aparece en la tabla 7.2: 2001=100, pues siempre en la base el ndice valdr cien. Un ndice se puede interpretar de alguna de las siguientes formas: 1. Como el porcentaje que representa el precio del producto en un con respecto al periodo base. Como el nmero de veces que periodo con respecto al periodo base. Como el porcentaje en que ha varia precio del producto en un periodo con respecto al periodo base. er ndice (88.0) de la tabla 7.2: 1. En el ao 2000 el precio del producto fue el 88.0% del pre en el ao 2001. En el ao 2000 e en el ao 2001. En el ao 2000 e 2001. 7
Un ndice se dice que es de base variable si el perio el periodo inmediatamente anterior. Los ndices de base variable se expresan de la siguiente forma: NDICE DE PRECIOS.
Donde: Es ndice de precio de un bien en el periodo de inters con respecto al periodo inmediatamente anterior . : Precio del bien en el periodo de r inte s Precio del bien en el periodo inmediatamente anterior
DICE DE CANTIDAD: N
Donde: : ndice de cantidad en el periodo de inters con respecto al periodo inmediatamente anterior . Cantidad utilizada del n e bie n el periodo de inters Cantidad utilizada del bien en el periodo inmediatamente anterior
DICE DE VALOR. N
onde: D ndice de valor en el periodo de inters con respecto al periodo inmediatamente anterior Valor del bien en el pe o riod de inters Valor del bien en el periodo inmediatamente anterior .
J EMPLO 7.2 n la tabla siguiente se muestra el nmero de unidades vendidas de un ABLA 7.3: Unidades vendidas. ES UNIDADES E
E artculo en los meses del primer semestre del ao 2007:
T
M VENDIDAS ENERO O FEBRER MARZO ABRIL MAYO J UNIO 400 450 420 460 500 600
Nos interesa conocer como ha sido la variacin en el nmero de unidades vendidas, utilizando ndices de base fija, con lo cual obtendremos la variacin porcentual en la cantidad de unidades vendidas en cada mes con respecto al mes inmediatamente anterior:
Observar que el ndice para el mes de Enero no se puede calcular puesto que se requiere de la cantidad de unidades vendidas en Diciembre de 2006, que no est disponible en la tabla 7.3.
Los anteriores ndices se resumen en la siguiente tabla:
TABLA 7.4
MESES NDICE ENERO FEBRERO MARZO ABRIL MAYO J UNIO
1112.5 93.3 109.5 108.7 120.0
7.4 INDICES COMPUESTOS.
En los ndices compuestos se dispone de una canasta de bienes de los cuales interesa establecer la variacin promedio que ha habido en los precios, cantidades o valores de los bienes que posee la canasta, en un periodo de inters o de estudio con respecto a un periodo base. En los ndices compuestos bsicamente se tienen dos situaciones: ndices no ponderados e ndices ponderados.
7.4.1 NDICE AGREGATIVO SIMPLE.
En este ndice se considera que la importancia que tienen todos los bienes incluidos en la canasta es la misma. Para el caso del ndice de precios, se definen como la suma de todos los precios de todos los bienes de la canasta en el periodo de inters dividido por la suma de todos los precios de todos los bienes de la canasta en el periodo base, multiplicado por cien.
EJ EMPLO 7.3
Para la produccin de un bien se utilizan cuatro insumos. La cantidad consumida de cada uno de los insumos y los precios ($) a los cuales se han comprado en los aos 2006 y 2007 se muestran en la siguiente tabla:
Para obtener el ndice de precios para el ao 2007 con respecto al 2006, para los cuatro insumos, se requiere solamente sumar los precios en cada uno de los aos, como se muestra en la siguiente tabla:
Segn esto, los precios de los insumos, en el ao 2007 tuvieron un aumento del 20.3%. Observar que en este ndice no se han tenido en cuenta la cantidad consumida de cada una.
7.4.2 NDICE DE PROMEDIO DE RELATIVOS.
Para este ndice, se promedian, bien con la media aritmtica, o preferiblemente con la media geomtrica, los ndices individuales de cada uno de los bienes. Si se utiliza la media aritmtica, el ndice se definira:
Donde m representa el nmero de bienes que tiene la canasta. Si se utiliza la media geomtrica, se tendra:
EJ EMPLO 7.4
Considerando los datos del ejemplo 7.3, se muestran en la sexta columna los ndices de cada uno de los insumos:
Como en el anterior ndice en estos tampoco se tienen en cuenta las cantidades consumidas de cada insumo. Tambin se observa que los dos ndices anteriores dan resultados diferentes. En general con los nmeros ndices es preferible utilizar la media geomtrica, pues suelen aparecer variaciones atpicas.
7.5 NDICES PONDERADOS.
Es usual que no todos los bienes que se incluyen en la canasta tengan la misma importancia. Los ndices ponderados requieren que se asigne un peso o ponderacin que exprese la importancia de cada uno de los bienes. Un ndice ponderado se define como:
Donde es ponderacin que se asigna a cada uno de los bienes (i=1,2,3,,m; donde m es el nmero de bienes que se incluyen en la canasta) De acuerdo con la forma en que se asignen las ponderaciones a los bienes se tienen diferentes tipos de ndices. Los ndices ponderados ms usuales son los de Laspeyres, Paasche y Fisher. Los tres llevan el apellido de quienes lo propusieron.
7.5.1 NDICE DE LASPEYRES. Laspeyres, para el ndice de precios, asigna como ponderacin las cantidades que de cada bien se hayan utilizado en el periodo base, es decir, . Entonces, el ndice de Laspeyres se puede expresar como:
Laspeyres parte del supuesto de que las cantidades utilizadas en el periodo base permanecen constantes a travs del tiempo; la critica que se le hace al supuesto de Laspeyres es que las cantidades no deben permanecer constantes, sino que deben ser menores, pues los precios tienden a ser mayores. Si lo anterior fuera cierto, entonces, el ndice de Laspeyres tendera sistemticamente a sobrestimar el verdadero valor del ndice de precios.
EJ EMPLO 7.5 Consideremos los datos del ejemplo 7.3 TABLA 7.7 Precios y cantidades consumidas.
A(Kilos) 700 12000 750 12500 8750000 8400000 B((Litros) 5200 30000 500 40000 208000000 156000000 C(Unidades) 2500 2000 2100 2500 6250000 5000000 D(Kilos) 800 15000 900 16000 12800000 12000000 235800000 181400000 El ndice de precios de Laspeyres para el ao 2007 con respecto al 2006 sera:
7.5.2 NDICE DE PAASCHE. Paasche, para el ndice de precios, propone como ponderacin las cantidades que de cada uno de los bienes de la canasta se hayan utilizado en el periodo de inters , es decir, Entonces, el ndice de Paasche se expresa como:
Paasche parte del supuesto de que las cantidades que se utilizan actualmente seran las mismas que se han estado utilizando desde el periodo base. La crtica que se hace al supuesto de Paasche es que las cantidades que se utilizan en los periodos anteriores al actual deberan ser mayores puesto que los precios deban ser menores. Si esto fuera as, el ndice de Paasche subestimara el verdadero valor del ndice.
EJ EMPLO 7.6.
Consideremos los datos del ejemplo 7.3, Los clculos necesarios se muestran en la tabla 7.8
TABLA 7.8 Precios y cantidades consumidas. 2006 2007 INSUMOS CANTIDAD PRECIO($) CANTIDAD PRECIO($)
El ndice de precios de Paasche para el ao 2007 con respecto al ao 2006 sera:
7.5.3 NDICE DE FISCHER
Ante la situacin de los dos ndices anteriores, Laspeyres sobreestima y Paasche subestima, surgieron diferentes propuestas para construir ndices ponderados. El ndice de Fisher, llamado tambin ndice ideal es simplemente la media geomtrica entre los ndices de Laspeyres y Paasche:
EJ EMPLO 7.8 Para el ejemplo que hemos venido trabajando, =123.6
Como se observa todos los ndices compuestos dan resultados diferentes, por lo cual debe utilizarse aquel ndice que se crea cumple ms apropiadamente con los respectivos supuestos.
7.6 CAMBIO DE BASE EN LOS NMEROS NDICES. Es frecuente que los usuarios de ndices encuentren que los ndices no estn expresados en la forma en que se requieren. Por ejemplo, los ndices pueden estar expresados con base variable y se requieren con base fija o a la inversa. A continuacin se trata de efectuar estos cambios.
7.6.1 CAMBIO DE UNA BASE FIJ A A OTRA BASE FIJ A. Se dispone de una serie de ndices expresados con base fija, pero por razones prcticas se desea expresarlos con base en otro periodo. Para pasar una serie de ndices que estn expresados en una base fija a otra base fija solo se requiere dividir cada uno de los ndices de la serie por el ndice que tiene el periodo que se desea tener como nueva base, multiplicado por cien.
EJ EMPLO 7.9.
Se dispone de una serie de ndices de precios, como se muestra en la siguiente tabla:
Deseamos expresar estos mismos ndices con otra base, por ejemplo en el ao 2003. Entonces todos los ndices de la serie se dividen por el ndice que tiene el periodo que se va a utilizar como nueva base (200), quedando la serie de ndices de la siguiente forma.
7.6.2 CAMBIO DE UNA BASE FIJ A A UNA BASE VARIABLE Y A LA INVERSA. 7.6.3 Cuando se dispone de una serie de ndices expresados con base fija y se desea expresarlos con base variable, se utiliza la siguiente relacin:
Si los ndices estn expresados con base variable y se desean expresar con base fija en cualquier periodo, de la expresin anterior se obtienen
Para los periodos posteriores a aquel que se ha seleccionado como periodo base, o
EJ EMPLO 7.10
Sea la serie de ndices expresados con base fija dados en la tabla siguiente.
TABLA 7.11: NDICES CON BASE EN2000 AOS NDICES 2000=100 2001 2002 2003 2004 2005 2006 2007 112.0 124.0 138.0 145.0 160.0 170.0 185.0
Si deseamos expresar los ndices con base variable, utilizamos la ecuacin 7.14, y se obtiene:
TABLA 7.12: NDICES CON BASE VARIABLE. AOS NDICES 2000=100 2001 2002 2003 2004 2005 2006 2007 112.0 110.7 111.3 105.1 110.3 106.3 108.8
EJ EMPLO 7.11.
Dada una serie de ndices con base variable,
TABLA 7.13: NDICES CON BASE VARIABLE. AOS NDICES 2000 2001 2002 2003 2004 2005 2006 2007 108.0 111.0 113.0 107.0 112.0 109.5 108.5 106.8
Queremos expresar los anteriores ndices con base fija, por ejemplo en el ao 2002, entonces, este ao tendr como ndice 100.0, y utilizando las ecuaciones 7.15 y 7.16, obtenemos:
TABLA 7.14: NDICES CON BASE FIJ A EN 2002 AOS NDICES 2000 2001 2002 2003 2004 2005 2006 2007 79.7 88.5 100.0 107.0 119.8 131.2 142.4 152.1
7.7 USO DE LOS NDICES.
De los ndices que ms se utilizan en las aplicaciones generales es el ndice de Precios al Consumidor (IPC), sin embargo en aplicaciones particulares se deben utilizar los ndices correspondientes a los fenmenos que se estudian.
Las aplicaciones ms usuales de los ndices son: 1. Para obtener el porcentaje de inflacin que ha ocurrido en un periodo cualquiera:
EJ EMPLO 7.12
Suponer que el IPC para el ao 2000 era de 180 y para el ao 2005 era de 250, el porcentaje de inflacin que ha ocurrido entre el ao 2000 y 2005 ser:
2. Para deflactar. Deflactar es expresar valores nominales o corrientes como valores reales o a precios constantes de un determinado periodo.
EJ EMPLO 7.13
En el ao 2000 el IPC era de 100 y en el ao 2005 era de 140, Si una persona en 2000 tena ingreso mensual de $500000 y en 2005 era de $1800000, Cul es el ingreso real de la persona en 2005 a precios constantes de 2000?
3. Para actualizar el precio de activos.
EJ EMPLO 7.14 Se compr en el ao 2001 una maquinaria por un precio de $4000000, cuando el IPC tena un valor de 120. Cul ser el precio de la mquina en el ao 2007 en el cual el IPC tiene un valor de 174?
GLOSARIO
NDICE DE CANTIDAD: Medida que indica la variacin en la cantidad de uno o ms bienes en un periodo con respecto a otro.
NDICE DE PRECIO: Medida que indica la variacin sufrida en el precio de uno o ms bienes en un periodo con respecto a otro.
NDICE DE VALOR: Medida de la variacin del valor de uno o ms bienes en un periodo con respecto a otro.
NDICE DE LASPEYRES. ndice ponderado en el cual para el ndice de precios se utiliza como ponderacin las cantidades utilizadas en el periodo base y para el ndice de cantidad se utiliza como ponderacin los precios del ao base.
NDICE DE PAASCHE: ndice ponderado en el cual se utiliza como ponderacin para el ndice de precios las cantidades utilizadas en el actual o de inters y para el ndice de cantidades los precios de los bienes en el periodo de inters.
NDICE DE PROMEDIO DE RELATIVOS: es un ndice promedio de los ndices individuales de cada uno de los bienes.
BIBLIOGRAFA
LEVIN I., Richard, RUBIN S. David. ESTADSTICA PARA ADMINISTRACIN Y ECONOMA. Pearson Educcin,2004.
MASON, Robert D.,LIND, Douglas A. ESTADSTICA PARA ADMINISTRACIN Y ECONOMIA. Editorial alfaomega. 2005.
1. Indicar si cada una de las siguientes AFIRMACIONES ES verdadera o falsa a. El ndice de precios para el periodo base siempre es cero. b. El ndice de precios al consumidor ( IPC) que lleva el DANE utiliza el ndice de Fisher. c. El ndice de promedio de relativos utiliza el promedio de los ndices de cada bien incluido en el ndice. d. El ndice de Paasche solo se utiliza para establecer el ndice de precios. e. Un ndice de valor mide la variacin combinada en precios y cantidades. f. El ndice de Laspeyres no se puede utilizar para medir la inflacin. g. Un ndice de precios de 100 indica que el o los bienes aumentaron su precio en un 100%. h. El ndice de agregativos simples no tiene en cuenta la importancia de cada bien. i. El ndice de Laspeyres tiende siempre a sobreestimar el verdadero valor del ndice.
2. Una fbrica elabora un producto para el cual utiliza cuatro materias primas. La cantidad de materia prima utilizada y los precios de compra de ellas tienen el siguiente registro para los aos 2007 y 2008 2007 2008 MATERIA PRIMA CANTIDAD PRECIO ($) CANTIDAD PRECIO($) ---------------------------------------------------------------------------------------------------------- A (KG) 800 200 850 300 B (KG) 1500 700 900 1100 C (UNIDAD) 2000 800 2500 1000 D (UNIDAD) 1000 1500 1500 1800 Obtener e interpretar el ndice de precios de para el ao 2008 con base en el ao 2007 a. Agregativos simples. b. Promedio de relativos. c. Laspeyres. d. Paasche. e. Fisher. f. Obtener el ndice de valor.
3. En la produccin de un tipo de ponqu se utilizan como insumos harina, huevos, crema de leche, azcar y uvas. La cantidad utilizada de estos insumos y el precio al cual se compran es: CANTIDAD PRECIO DE COMPRA ($) INSUMOS POR KILO 2005 2006 2007 2008 Harina (kg) 0.7 700 850 950 1000 Huevos (unidad) 4 60 70 90 100 Crema (kg) 0.3 2000 2400 2500 2800 Azcar 0.2 450 500 540 620 Uvas 0.1 2800 2950 3000 3200 a. Obtener un ndice ponderado para obtener el ndice de precio de los insumos en cada uno de los aos con base en 2005 b. Si en el ao 2005 el Kilo de ponqu se venda en $4500, cul deba ser el precio de venta en cada uno de los dems aos ?
4. La siguiente tabla presenta los ingresos anuales ( en millones $ ) de una persona durante el perodo 1999-2006, lo mismo que la variacin porcentual en el ndice de precios al consumidor durante el mismo perodo. AOS 1999 2000 2001 2002 2003 2004 2005 2006 INGRESOS 6.7 7.5 9.6 11.5 13.9 16.3 19.1 20.5 I.P.C. 9.23 8.75 7.65 6.99 6.49 5.5 4.85 4.48 (variacin porcentual a. Expresar los ndices con base fija en 2001 b. Establecer cul es el ingreso real de la persona en cada uno de los aos 1999 -2006 a precios constantes de 2000. c. Cul fue el porcentaje de inflacin que tuvo Colombia entre 2000 y 2005? d. Si la persona compr en 2001 un apartamento por 60 millones$, cul ser su precio en 2005? 5. La cantidad de materia prima utilizada por unidad de producto elaborado en una fbrica y el precio de compra de esas materias primas para el perodo 2003- 2007 se da en la siguiente tabla. MATERIA PRIMA CANTIDAD POR PRECIO DE COMPRA ( $ ) UNIDAD 2003 2004 2005 2006 2007 A (KG) 50 400 480 550 620 750 B (KG) 78 1500 1900 2100 2400 2700 C (MT) 10 120 150 170 250 280 D (UNIDAD) 2 2000 2450 2600 2800 2900 a. Obtener un ndice ponderado de precios para cada uno de los aos con base variable. Interpretarlos. b. Si en 2003 el precio de venta del artculo se estableci en $ 180000, utilizar los anteriores ndices para establecer el precio que debera haber tenido el artculo en los dems aos de la anterior serie.
6. En la pgina del DANE (www.dane.gov.co) puede encontrar los registros del IPC. Obtenga el IPC de por lo menos cuatro aos, mes a mes, graficarlos y comentar su comportamiento.
7. En la pgina del DANE (www.dane.gov.co) puede encontrar la Metodologa del ndice de Precios al consumidor. Utilizarla para responder lo siguiente: a. Cuntos productos se incluyen en la canasta? b. En cuntos grupos se dividen los productos de la canasta? c. Cul es la ponderacin correspondiente a cada uno de los grupos de bienes? Comentar. d. Para qu ciudades se obtiene el IPC?. e. Qu ponderacin corresponde a cada ciudad? f. Para cuntos estratos socioeconmicos se obtiene el IPC? g. Qu ponderacin corresponde en el IPC a cada estrato socioeconmico?
ORLANDO ANTONIO MOSCOTE FLOREZ Profesor de ctedra ESAP- Estadstico Especialista en Docencia Universitaria Especialista en Gestin de Riesgos Financieros oamoscote@hotmail.com