You are on page 1of 50

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

1. INTRODUCCION AL SPSS 15.0 EL software estadstico SPSS (Statistical Package for Social Sciences) es un conjunto de programas orientados a la realizacin de anlisis Estadsticos y gestin de datos. Nos permite realizar anlisis y grficos estadsticos sin tener que conocer la mecnica de los clculos ni la sintaxis de los comandos del sistema.

1.1. Ingreso a SPSS Para ingresar a SPSS debemos seguir las siguientes opciones: a) Inicio Todos los programas SPSS para Windows SPSS 15 para Windows

b) La segunda forma de ingresar es directamente usando el icono de acceso directo que se encuentra en el Escritorio; y para ejecutar el SPSS, simplemente hacer doble clic con el botn izquierdo del ratn.

c) Una tercera forma sera haciendo doble clic sobre el icono correspondiente a cualquier archivo de tipo SPSS ya creado. Los distintos tipos de archivo son: Los archivos de datos propios de SPSS: tienen extensin .sav Los archivos de grficos y resultados de SPSS: tienen extensin .spo Los archivos de sintaxis de SPSS: tienen extensin .sps 1.2. Ventanas de SPSS Ventana inicial del SPSS Al ingresar al SPSS, podremos observar automticamente el Asistente de inicio, mostrado en la Figura; a travs de este asistente podemos comenzar a trabajar con SPSS de seis diferentes maneras: Vicente Pocomucha Poma

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Ejecutar el tutorial Introducir datos Ejecutar una consulta creada anteriormente Crear una nueva consulta mediante el asistente de base de datos Abrir una fuente de datos existente Abrir otro tipo de archivo

Ventana editor de datos Al ingresar al programa, se observa la ventana principal del SPSS, en esta se encuentra la mayora de los procedimientos que utilizan en el programa y como en cualquier otra aplicacin Windows, puede modificarse en cuanto al tamao y la disposicin de sus elementos. Adems, esta ventana, esta conformado por los elementos principales como: Vista de datos y vista de variables; en ambas vistas, se puede aadir, modificar y eliminar la informacin contenida en el archivo de datos.

1.3. Componentes del SPSS El SPSS se compone de 3 ventanas principales

Vicente Pocomucha Poma

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Opcin datos, donde definiremos las variables a procesar e ingresaremos la informacin recopilada. Opcin Sintaxis, SPSS permite al usuario programar el anlisis de la informacin que se desea.

Opcin Resultados, en donde se van almacenando los reportes o salidas del procesamiento que se est realizando. 1.4. Men principal

Como la mayora de los programas basados en el sistema operativo Windows, el Editor de datos de SPSS cuenta con las siguientes barras del men: Barra de ttulos. Muestra el icono de SPSS que sirve como botn de control, sigue con el nombre del archivo que estamos utilizando y el nombre de la ventana activa y termina con los botones de minimizar, maximizar y cerrar la ventana.

Barra de mens.
Como muestra la Figura, recoge las denominaciones de los mens de SPSS, a travs de los cuales se pueden ejecutar todos los posibles comandos que proporciona el paquete, que tambin pueden ser seleccionadas con el Mouse o [LT] y la letra subrayada para cada opcin. En SPSS se cuenta con diez diferentes mens desplegables; que son mostrados en la siguiente Figura.

A continuacin se indican las funciones de cada men: Archivo: Mediante este men se pueden abrir, crear o grabar los diferentes archivos que SPSS emplea, ya sean de datos, instrucciones, resultados o procesos. Igualmente, es posible controlar las tareas de impresin. Vicente Pocomucha Poma

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Edicin: Permite realizar las tareas habituales de edicin: modificar, borrar, copiar, pegar, seleccionar, etc. Ver: Permite controlar diversos parmetros de visualizacin en pantalla. Datos: Este men permite insertar variables, as como efectuar modificaciones en los archivos de datos: seleccionar, aadir, ponderar, etc. Transformar: Aqu se encuentran todas las opciones relativas a la modificacin y generacin de nuevas variables. Analizar: Mediante este men se accede a los diferentes anlisis estadsticos que se pueden realizar con los datos. Grficos: Permite la creacin y edicin de diversos tipos de grficos de alta resolucin. Algunos de ellos son tambin accesibles a travs de determinadas tcnicas estadsticas. Utilidades: Entre otras, posibilita mostrar informacin sobre los ficheros de SPSS, las variables o el tratamiento de conjuntos de variables. Ventana: Dispone de las funciones habituales para controlar las ventanas. ?: Proporciona ayuda al usuario en el formato tpico de Windows. Para salir del programa se selecciona la opcin Archivo Salir o se pulsa el botn cerrar de la esquina superior derecha de la ventana.

Barra de herramientas. En esta barra de herramientas se encuentran los botones de acceso rpido y fcil a las tareas ms comunes de cada ventana de SPSS. Los procedimientos de esta barra pueden ser modificados por el usuario de acuerdo a su criterio y necesidades; permitindole personalizar su contenido; por defecto el programa incluye los procedimientos:

Barra de estado o posicin. Situada en la base de la pantalla y suministra la informacin en forma rpida y sencilla sobre el estado que se encuentra el SPSS.

1.5. Generacin de datos y variables Para trabajar con la informacin recopilada a travs del SPPS, seguimos la siguiente secuencia: a) Definicin de variables Vista de variables Vicente Pocomucha Poma

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

En la ventana <<Vista de Variables>> definiremos cada una de las variables con las que trabajaremos, como se muestra en la siguiente Figura:

Nombre: Nombre de la variable que vamos a evaluar Tipo: Tipo de variable que deseamos ingresar en la hoja de datos, para lo cual seleccionaremos una de las diferentes opciones del SPSS, como observa en la Figura siguiente y luego pulsamos OK:

Anchura: para el caso de las variables de tipo numrico se indican la cantidad de dgitos que desea que contenga la variable, considerando el nmero de decimales que contendr ese valor, pudiendo ser 0 diferente de cero, el cual se indica en la opcin Cifras Decimales. Decimales: indica el numero de decimales que contiene cada valor numrico Si queremos definir una variable de tipo Carcter, debemos seleccionar la opcin Cadena como se muestra en la Figura siguiente:

Caracteres: permite definir el nmero de caracteres que contendr como mximo la variable en estudio. Etiqueta: con esta opcin especificaremos la etiqueta de la variable, es decir, podemos describir al detalle la variable en estudio. Valores: si la variable en estudio tiene diversas categoras, es recomendable asignarles un cdigo a cada una de ellas. Por ejemplo, para la variable Sexo, podemos definir las siguientes categoras: 1 = Masculino y 2 = Femenino, e ingresarlas de la siguiente manera: Vicente Pocomucha Poma

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Perdidos: permite definir qu valores se encontraran fuera del rango de valores permitido para la variable analizada. Por ejemplo, para la variable sexo solo es permitido dos categoras (1 y 2); los dems valores no sern tomados en cuenta por el SPSS para el anlisis.

Alineacin: permite alinear los caracteres hacia la izquierda, derecha y centrado. Medida: tipo de datos evaluados que pueden ser Escala, ordinal y nominal Definidas las variables, con todos sus atributos, obtendremos la siguiente ventana de la hoja <<Vista de Variables>>

b) Definicin de datos Vista de datos En la hoja <<Vista de Datos>> ingresaremos la informacin recopilada, como se muestra en la siguiente Figura:

Vicente Pocomucha Poma

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

c) Aplicacin practica basado a una encuesta. PRCTICA ALUMNOS 1.6. Manejo de archivos de datos Grabar un archivo Para guardar un archivo trabajado, se sigue la siguiente secuencia: Archivo Guardar o guardar como

Especificaremos el lugar donde vamos a guardar el archivo (C:\, D:\, E:\), escribimos el nombre del archivo y pulsamos Guardar.
Seleccionar la unidad, en este men

Escribir el titulo del archivo

Pulsar guardar para terminar la operacin

Vicente Pocomucha Poma

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Abrir un archivo Para acceder a un archivo trabajado, en este caso Archivo Ejemplo, se sigue la siguiente secuencia: Archivo Abrir

Especificaremos el lugar donde vamos a Abrir el archivo (C:\, D:\, E:\), escribimos el nombre del archivo Ejemplo y pulsamos Abrir

Una vez completada esta operacin aparecen los datos en el editor de datos.

Vicente Pocomucha Poma

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

2. ESTADISTICA DESCRIPTIVA 2. 1. Distribucin de frecuencias a) Tablas de frecuencias Para generar las tablas de frecuencias de variables cualitativas y cuantitativas, seguimos la siguiente secuencia: Men Analizar Estadsticos descriptivos Frecuencias... Luego se acceder al cuadro de dilogo Frecuencias.

Tipos de datos de las variables Hay diferentes medidas de resumen, adecuadas a diferentes tipos de datos dependiendo del nivel de medida: Categricas. Datos con un nmero limitado de valores o categoras distintas (por ejemplo, sexo o estado civil). Tambin se hace referencia a estos datos como datos cualitativos. Las variables categricas pueden ser variables de cadena (alfanumricas) o variables numricas que utilizan cdigos numricos para representar a las categoras (por ejemplo, 0 = Soltero (a) y 1 = Casado (a). Hay dos tipos bsicos de datos categricos: Nominal. Datos categricos en los que las categoras no tienen un orden inherente. Por ejemplo, una categora laboral de ventas no es mayor o menor que una categora laboral de marketing o investigacin. Ordinal. Datos categricos en los que las categoras tienen un orden significativo, pero sin una distancia medible entre las categoras. Por ejemplo, hay un orden para los valores alto, medio y bajo pero no se puede calcular la distancia entre los valores. Escala. Datos medidos en una escala de intervalo o de razn en los que los valores de los datos indican el orden de los valores y la distancia entre ellos. Por ejemplo, un salario de 72.195 soles es superior a un salario de 52.398 soles y la diferencia entre ambos valores es 19.797 soles. Tambin se hace referencia a estos datos como datos cuantitativos o continuos.

Vicente Pocomucha Poma

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Un icono junto a cada variable proporciona informacin acerca del tipo de datos y el nivel de medida.

Pulse en la variable Sexo. Pulse en la flecha hacia abajo de la lista desplegable Etiquetas de valor.

Seleccione Nhijos y mover hacia la lista Variables. Pulsar Aceptar para ejecutar el procedimiento con las opciones por defecto. Visualizacin de los resultados

Vicente Pocomucha Poma

10

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Se abrir la ventana de resultados para mostrarnos la tabla de frecuencia, mostrado en la siguiente Figura.

Puede dirigirse rpidamente a cualquier elemento del Visor seleccionndolo en el panel de titulares. Pulse en Nhijos

Aparecer la tabla de frecuencias del nmero de hijos. Esta tabla de frecuencias muestra el nmero y el porcentaje de personas para cada categora de Nhijos. b) Histogramas y grficos de barras Aunque algunos procedimientos estadsticos pueden crear grficos de gran resolucin, tambin puede utilizar el men Grficos para crear grficos. Desactive la casilla de verificacin Mostrar tablas de frecuencias. Pulse en Grficos para abrir el cuadro de dilogo Frecuencias: Grficos.

Vicente Pocomucha Poma

11

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Se obtiene el Grfico de barras en la ventana Visor, de la variable Cultivo

Elegir finalmente la variable Ventas, luego seleccione Histogramas y con curva normal, y a continuacin Pulse en Continuar. Luego, se obtiene el Grfico de barras en la ventana Visor, de la variable Ventas.

c) Medidas de tendencia central y de dispersin. Medidas para datos categricos Vicente Pocomucha Poma

12

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Para los datos categricos, la medida de resumen ms habitual es el nmero o el porcentaje de casos de cada categora. La moda es la categora que contiene el mayor nmero de casos. Para los datos ordinales, la mediana (el valor por debajo y por encima del cual se encuentran la mitad de los casos) tambin puede ser una medida de resumen til si hay un gran nmero de categoras. Medidas para datos de escala Hay muchas medidas de resumen disponibles para variables de escala, incluyendo: Medidas de tendencia central. Las medidas de tendencia central ms comunes son la media (media aritmtica) y la mediana (valor por debajo y por encima del cual se encuentran la mitad de los casos). Medidas de dispersin. Los estadsticos que miden la dispersin o variacin en los datos incluyen la desviacin tpica, mnimo y mximo (rango). La opcin Frecuencias, adems, nos permite calcular algunos estadsticos bsicos de tendencia central y de dispersin de una variable numrica. Para seleccionar estadsticos de resumen, pulse en Estadsticos en el cuadro de dilogo Frecuencias para acceder al cuadro de dilogo Frecuencias: Estadsticos.

Seleccione Media, Mediana, Moda, Desviacin tpica, Variancia, Mnimo y Mximo y a continuacin pulse en Continuar. En el cuadro de dilogo Frecuencias, Pulse en Aceptar para ejecutar el procedimiento. La ventana Visor muestra los estadsticos solicitados, mostrados en la siguiente Figura.

Vicente Pocomucha Poma

13

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

2.2 Anlisis descriptivos La opcin Descriptivos del men analizar, nos permite calcular, al igual que la opcin Frecuencias, algunos estadsticos de tendencia central y de dispersin; para lo cual seguimos la siguiente secuencia: Men Analizar Estadsticos descriptivos Descriptivos Luego se acceder al cuadro de dilogo Descriptivos; mostrado en la siguiente Figura.

La ventana Visor muestra los estadsticos solicitados, mostrados en la siguiente Figura.

2.3 Anlisis exploratorio El procedimiento Explorar de SPSS nos ofrece una serie de opciones para representar grficamente los datos, examinar visualmente las distribuciones de valores para varios grupos de datos, y realizar pruebas de normalidad y homogeneidad de los datos.

Vicente Pocomucha Poma

14

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Adems el anlisis exploratorio es til para: Detectar errores Observar la distribucin de los datos Preparar las pruebas de contraste de hiptesis Para el anlisis Explorar se realiza los siguientes pasos: Men Analizar Estadsticos descriptivos Explorar Se abrir el cuadro de dilogo Explorar.

Trasladar aqu la variable cuantitativa, de las que se desea obtener un anlisis descriptivo

Pulsar aqu para solicitar un diagrama de tallo y hojas

Pulsar el botn Grficos. Seleccionar las opciones Tallo y hoja del cuadro explorar; luego pulsar Continuar y Aceptar para ejecutar el procedimiento.

Grficos de tallo y hojas Es una representacin similar al histograma, pero que nos da mayor informacin sobre los valores dentro de cada intervalo que el histograma. Al igual que el histograma, la longitud de cada fila corresponde al nmero de casos que hay dentro del intervalo. Sin embargo, este tipo de grficos nos proporciona informacin adicional que no podemos obtener con un simple histograma. Los resultados obtenidos para la variable Venta son los siguientes:

Vicente Pocomucha Poma

15

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Otro caso:

Diagramas de caja Este tipo de grfico es otro modo de resumir las distribuciones de los valores de una variable. En vez de visualizar los valores individuales, se representan estadsticos bsicos de la distribucin: la mediana, el centil 25, el centil 75 y los valores extremos de la distribucin. En la siguiente Figura se muestra cmo se representan los estadsticos en un Grafico de caja.

Los resultados obtenidos para la variable Venta son los siguientes:

Vicente Pocomucha Poma

16

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Estadsticos El anlisis estadstico completo que se pueden realizar en el procedimiento Explorar, es mediante la opcin presentada en la Figura.

Los resultados obtenidos para la variable Venta son los siguientes:

3. PRUEBA DE HIPOTESIS: COMPARACION DE MEDIAS En esta parte trabajaremos con el archivo BENEFICI.SAV; pero, antes de proceder a los diversos anlisis vamos a generar en el archivo dos nuevas variables que van a hacer Vicente Pocomucha Poma

17

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

referencia al porcentaje (%) de beneficios que sobre las ventas ha obtenido la muestra de 83 empresas en los periodos 1994 y 1995. Se sabe que las variables son: BAI94: beneficios antes de impuestos del ao 1994 en millones de pesetas. VENTAS94: ventas del ao 1994 en millones de pesetas. BAI95: beneficios antes de impuestos del ao 1995 en millones de pesetas. VENTAS95: ventas del ao 1994 en millones de pesetas. Las dos nuevas variables generadas se denominarn PBAI94 y PBAI95 referidas al porcentaje de beneficios sobre las ventas de los aos 1994 y 1995; para lo cual seguimos la siguiente secuencia: Ingresar al archivo BENEFICI.SAV, luego acceder a: Men Transformar Calcular variable Luego se abrir el cuadro de dilogo Calcular variable; mostrado en la siguiente Figura.

En Variable de destino ponemos el nombre de la nueva variable PBAI94 En Expresin numrica colocamos [(bai94 / ventas)*100], luego pulsar Aceptar. Seguir los mismos pasos para la variable PBAI95 Luego se acceder a la siguiente Figura.

Al terminar la sesin Guardar el archivo con nuevo nombre, en este caso como BENEFICI PRACTICA.SAV para grabar el archivo con las dos nuevas variables generadas. 3.1. MEDIAS Vicente Pocomucha Poma

18

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Este procedimiento tiene como finalidad calcular una serie de estadsticos (media, desviacin estndar y nmero de observaciones) en una o ms variables Dependientes, para los distintos valores, niveles o categoras de una o ms variables Independientes, para lo cual realizamos la siguiente secuencia:

Men Analizar Comparar medias Medias Luego se acceder al cuadro de dilogo Medias; mostrado en la siguiente Figura:

Seleccione Pbai95 y mover a la lista de Dependientes. Seleccione Sector y mover a la lista de Independientes Pulse Aceptar para ejecutar el procedimiento.

Los resultados obtenidos para la variable Pbai95 son los siguientes:

3.2. UNA MUESTRA En esta prueba se trata comprobar la hiptesis nula de la no existencia de diferencias significativas entre la media de una muestra y la media de una poblacin. Suponemos, que queremos comparar el % de beneficios promedio de una muestra de 83 empresas analizadas en el archivo, con el % de beneficios promedio de todas las empresas del pas sea cual sea el tamao de estas, el volumen de ventas y el sector. Vicente Pocomucha Poma

19

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Nota: Se recomienda, antes de realizar la prueba es necesario realizar algunas precisiones respecto a la base de datos a fin de poder depurar o conservar los datos. Caso 1: Ordenar los datos a fin de poder observar los datos extremos que pueden desvirtuar los resultados del anlisis; para realizar este procedimiento se realiza las siguientes secuencias: Ingresar al archivo BENEFICI PRACTICA.SAV, luego acceder a: Men Datos Ordenar casos Ascendente Luego se acceder al cuadro de Ordenar casos; mostrado en la siguiente Figura:

Pulse Aceptar para ejecutar el procedimiento. En el archivo BENEFICI PRACTICA.SAV, se encontrar dos empresas con valores extremos como son Prima Inmobiliaria con perdida de 1355,03 por 100 y C. Finan. reunida con beneficio de 2498,51 por 100. Caso 2: Filtrar datos de las dos empresas a fin de realizar un anlisis adecuado, siguiendo los pasos: Men Datos Seleccionar casos

Seleccionar Si se satisface la condicin Vicente Pocomucha Poma

20

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Luego Pulsar Si y En el cuadro de texto ingresar la expresin condicional de que Pbai95 es mayor que menos 100 y menor que 100 (Pbai95 >-100 & Pbai95 < 100), lo cual nos permitir dejar de lado los dos valores extremos. Con los datos filtrados podemos calcular los estadsticos de la variable Pbai95, donde n=81. PRUEBAS T DE STUDENT La prueba t de Student es utilizada para la estimacin de medias en variables cuantitativas y para la comparacin de medias en distintas poblaciones. El procedimiento Comparar medias ofrece varias opciones en funcin de la procedencia de los datos que queremos comparar. Para contrastar la hiptesis si el porcentaje promedio de beneficios de 83 empresas el ao 1995 difiere del porcentaje promedio de beneficios de todas las empresas del pas cifrado el citado ao en el 12.55 %, para lo cual seguimos la siguiente secuencia:

Men Analizar Comparar medias Prueba T para una muestra Luego se acceder al cuadro de dilogo Prueba T para una muestra; mostrado en la siguiente Figura:

Seleccione Pbai95 y mover a la lista de Contrastar variables. En Valor de prueba colocar la media de la hiptesis a contrastar (12.55) Pulse en Aceptar para ejecutar el procedimiento.

Los resultados obtenidos para la variable Pbai95 son los siguientes:

Vicente Pocomucha Poma

21

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Los resultados nos muestran el numero de casos, la media, la desviacin estndar y el error estndar; la diferencia entre el estadstico y el parmetro; y los limites de confianza de la diferencias al 95 %; el resultado de la prueba, los grados de libertad y el nivel de significacin. Como el nivel de significacin (0.180) es mayor a 0.05 no podemos rechazar la hiptesis nula de que no existe diferencia significativa en el porcentaje de beneficios promedio de la muestra de 81 empresas y la poblacin de todas del pas. 3.3. DOS MUESTRAS CON DATOS INDEPENDIENTES Esta prueba trata de comprobar la hiptesis de que las medias de dos poblaciones independientes son iguales y que no existen diferencias significativas entre las medias. En el archivo BENEFICI PRACTICA.SAV solo se tiene una muestra de empresas, pero bien podramos hacer dos submuestras en base a un criterio determinado, como podra ser empresas con perdidas y empresas con ganancias o beneficios. Las dos submuestras de empresas se formarn en base al sector de actividad al que pertenecen (variable Sector) y agrupando las mismas segn el criterio al que pertenecen, en dos categoras, una en Servicios (Categora 1) y dos en Industriales (Categora 2). Para obtener las dos nuevas variables realizamos las siguientes secuencias: Men Transformar Recodificar en distintas variables. Aparecer el siguiente cuadro de dialogo

Primero se sita en este cuadro la variable que se quiere recodificar

Nombre de la nueva variable. Se pulsa CAMBIAR

Vicente Pocomucha Poma

22

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Introducir el nombre de la variable que se quiere recodificar en Var. de entrada -> Var. de resultado, luego seleccionar Valores antiguos y nuevos y se especifica cmo se van a recodificar la(s) variable(s). En el recuadro Recodificar en distintas variables: Valor antiguo y nuevo se marca la opcin que convenga, dependiendo de la re-codificacin. Si es un valor puntual se elige Valor, si es un grupo de valores se elige alguna opcin de Rango. En Valor nuevo se escribe el nuevo valor. Se pulsa AADIR para colocar la especificacin en el cuadro Antiguo->Nuevo. El cuadro de dilogo correspondiente es el siguiente:

Remodificacin de la variable Sector:

VALOR ANTIGUO (sector) 1 2 3 4 5 6 7 8 9 10 11 12

ETIQUETA Alimentacin Automviles Cementos y construccin Comercio y varios Constructoras Elctricas Inmobiliarias Maq. electrnica e ingeniera Qumicas Servicios pblicos Siderurgia y metalurgia Textil y papeleras

VALOR NUEVO (Sectorb) 1 2 2 1 2 1 1 2 2 1 2 2

Podemos etiquetar la nueva variable como: 1: Servicios 2: Industriales PRUEBAS T PARA MUESTRAS INDEPENDIENTES Una vez terminada la recodificacin, vamos a contrastar la hiptesis, si los beneficios promedio de las empresas de Servicios de la muestra del ao 1995 difieren significativamente del porcentaje promedio de los beneficios de las empresas Industriales ese mismo ao. Para realizar el anlisis correspondiente seguimos la siguiente secuencia: Men Analizar Comparar medias Prueba T para muestras independientes. Aparecer el siguiente cuadro de dialogo Vicente Pocomucha Poma

23

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Seleccionar la variable PBAI95 y mover a Contrastar variables. En Variable de agrupacin ingresar Sectorb que aparece dos signos de interrogacin pidiendo cuales son las dos categoras de esta variable. Pulsar en Definir grupos, en esta ingresamos 1 de Servicios como grupo 1 y un 2 de Industriales como grupo. Pulse Continuar.

Finalmente pulse Aceptar para ejecutar el procedimiento; y obtener los siguientes resultados.

Vicente Pocomucha Poma

24

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Interpretacin de los resultados Los resultados nos indican el nmero de cada empresas de cada sector, la media, desviacin estndar y error estndar; la Prueba de Levene1 que nos indica que existe una diferencia significativa en la variabilidad de los Beneficios de las empresas de los dos sectores. Finalmente tenemos los resultados de la prueba de T propiamente dicho y que tanto para variancias iguales como diferentes nos permiten concluir (p=0.293 y p=0.328) no existen diferencias significativas en los beneficios promedio de las empresas de ambos grandes sectores. 3.4. DOS MUESTRAS CON DATOS APAREADOS Esta prueba trata de comprobar la hiptesis de que las medias de dos muestras con datos apareados son iguales y que no existen diferencias significativas entre las medias. Esta situacin se da en los mismos individuos o sujetos (en este caso EMPRESAS) en dos situaciones diferentes o si son observados antes y despus (por ejemplo PBAI94 y PBAI95). Nota: el tamao de muestra deben ser iguales para ambas muestras. El procedimiento es Analizar Comparar medias T para muestras relacionadas, obteniendo el cuadro de dialogo siguiente

Seleccionar las variables PBAI94 y PBAI95 y introducir a Variables relacionadas. En Selecciones actuales se observan el orden de la seleccin de las variables.

Esta prueba trata de conocer si las varianzas entre dos grupos son iguales o distintas.

Vicente Pocomucha Poma

25

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Pulsar Opciones para definir el nivel de confianza de la prueba, como se muestra la figura Pulsar Continuar y luego Aceptar para ejecutar el procedimiento; y obtener los resultados siguientes:

Interpretacin de los resultados Los resultados nos indican los estadsticos, la correlacin y la prueba de hiptesis de las muestras relacionadas. Se observa la media -0.29027, la desviacin estndar 15,69075 y el error estndar 1,74342 de la variable Diferencia entre los beneficios del ao 1994 y 1995. Si el resultado de la media es negativo, como en este caso, nos indica que los beneficios promedio del ao 1995 ha sido superior al ao 1994, pero con una T de 0,166 y una p= 0,868 (> 0,05), el cual nos demuestra que no existe diferencias significativas entre las muestras.

Vicente Pocomucha Poma

26

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

CORRELACION Cuando se analizan un conjunto de datos, uno de los objetivos es conocer las relaciones que existen entre las variables. Los sujetos ms frustrados son tambin ms agresivos Cuanto mayor es el nivel educativo, mayor es el nivel de renta Los niveles altos de colesterol en la sangre van acompaados de dietas alimenticias ricas en grasas. Los sujetos muestran ms inters por una labor cuanto mayor es la renumeracin que reciben. En los ejemplos mencionados se habla de la relacin entre dos variables; entonces es importante obtener una medida de la dependencia o medida de la relacin entre esas variables. En esta unidad vamos a estudiar algunos ndices estadsticos que nos permitan cuantificar el grado de asociacin existente entre dos variables. CORRELACION BIVARIADA El procedimiento Correlaciones bivariada calcula el coeficiente de correlacin de Pearson, la rho de Spearman y la Tau-b de Kendall con sus niveles de significacin Para medir la correlacin, el primer paso consistir en recoger los datos y representarlas despus mediante un diagrama de dispersin Vamos a trabajar en este tema con el archivo CCAA.SAV Diagrama de dispersin Men Grficos Cuadros de dilogo antiguos dispersin/puntos, obtenindose la siguiente figura.

Pulsar DISPERSION SIMPLE, luego DEFINIR y se obtiene el cuadro de dialogo siguiente:

Vicente Pocomucha Poma

27

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Ingresar PIB.PC en el Eje Y (variable dependiente) Ingresar O.IND en el Eje X (variable independiente) Ingresar COMUNIDA en ETIQUETAR LOS CASOS MEDIANTE Luego pulsar OPCIONES y marcar MOSTRAR EL GRAFICO CON LAS ETIQUETAS DEL CASO, presionar CONTINUAR, finalmente ACEPTAR para acceder al grafico siguiente:

Interpretacin El grafico nos muestra una relacin lineal bastante alta entre el porcentaje de trabajadores ocupados en la industria (O.IND) y el PIB per cpita de las 17 comunidades de la muestra (PIB.PC) El grafico nos sirve para precisar si existe o no una relacin entre las dos variables y que en el supuesto de que exista sta puede ser lineal positiva o negativa, exponencial, en forma de U, etc. Cuantificacin de la correlacin Vicente Pocomucha Poma

28

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Para cuantificar el grado de la relacin lineal entre las variables se utiliza el coeficiente de correlacin de PEARSON (r).

Los valores de r oscilan entre -1 y 1 Donde: 0 = Relacin nula o independencia entre las dos variables 1 = Relacin perfecta y positiva -1 = Relacin perfecta y negativa Para obtener coeficientes de correlacin se siguen los pasos: Men Analizar Correlaciones Bivariadas... y obtenemos el cuadro de dialogo siguiente.

Ingresar todos los datos del archivo en VARIABLES Luego pulsar ACEPTAR y se obtiene la matriz de correlaciones siguiente:

Vicente Pocomucha Poma

29

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Interpretacin de los resultados La matriz es simtrica y los valores de la diagonal igual a 1, puesto que corresponden a la correlacin de cada variable consigo mismo. El primer valor de cada celda nos indica el coeficiente de correlacin de PEARSON (r) entre cada par de variables (pueden oscilar entre -1 y 1). El segundo valor indica la significacin de cada coeficiente de correlacin y trata de probar la hiptesis de que el coeficiente sea nulo (r=0), esto es, que no exista relacin alguna entre las variables cuyo coeficiente de correlacin estamos cuantificando. La prueba de hiptesis utiliza como estadstico de contrate la siguiente ecuacin:

La prueba sigue una distribucin t de Student con V=N-2 grados de libertad. El coeficiente de correlacin entre O.SER y PIB92 es r=0.4117 y p=0.101 (>0.05), este resultado permite aceptar la hiptesis nula y nos indica que no existe correlacin entre las dos variables analizadas. El coeficiente de correlacin entre POB92 y PIB92 es r=0.9292 y p=0.0000, este resultado permite rechazar la hiptesis nula y nos indica que existe alta correlacin entre las dos variables. CORRELACION PARCIAL Permiten estudiar la relacin existente entre dos variables cuantitativas controlando el posible efecto de una o ms variables cuantitativas extraas. Un coeficiente de correlacin parcial es una tcnica de control estadstico que expresa el grado de relacin lineal entre dos variables tras eliminar de ambas el efecto atribuible a terceras variables. Ejemplo: Se sabe que la correlacin entre las variables INTELIGENCIA y RENDIMIENTO ACADEMICO es alta y positiva. Sin embargo, cuando se controla el efecto de terceras variables como el NUMERO DE HORAS DE ESTUDIO o EL NIVEL EDUCATIVO DE LOS PADRES, la correlacin entre INTELIGENCIA y RENDIMIENTO desciende sensiblemente, lo cual indica que la relacin entre inteligencia y rendimiento est condicionada, depende o est modulada por las dos variables sometidas a control estadstico. Para obtener coeficientes de correlacin parcial se siguen los pasos: Men Analizar Correlaciones Parciales... y obtenemos el cuadro de dialogo siguiente.

Vicente Pocomucha Poma

30

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Trasladar a VARIABLES los caracteres a correlacionarse en este caso P-OCUP-IND y POCUP-SERV. Trasladar a CONTROLANDO PARA las variables cuyo efecto se desea controlar, en este caso P-OCUP-AGR. Luego pulsar ACEPTAR y se obtiene la matriz de correlaciones siguiente:

Estos resultados se pueden comparar con el anlisis de correlacin bivariada realizadas con mis mismo variable del caso anterior:

Interpretacin de resultados Puesto que el coeficiente de correlacin parcial entre P-OCUP-IND y P-OCUP-SERV ha cambiado de -0.380 a -1.000 a respecto a la correlacin bivariada; as mismo pasando de no significativos (p=0.133) a significativo, podemos concluir que la variable P-OCUP-AGR determina que entre P-OCUP-IND y P-OCUP-SERV exista una relacin significativa. ANALISIS DE REGRESION El anlisis de regresin es una tcnica estadstica que estudia las variaciones de una variable cuantitativa continua en funcin de una o ms variables cuantitativas continuas. La variable cuya variabilidad queremos estudiar es la VARIABLE DEPENDIENTE o RESPUESTA, y las variables en funcin de las cuales vara son las VARIABLES INDEPENDIENTES, tambin llamadas VARIABLES PREDICTORAS El objetivo del anlisis de regresin es predecir los valores de la VARIABLE RESPUESTA, en funcin de los valores de las VARIABLES INDEPENDIENTES.) Vicente Pocomucha Poma

31

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

TIPOS DE ANLISIS DE REGRESIN Los anlisis de regresin pueden ser de varios tipos, segn el nmero de variables independientes y de la funcin: Regresin lineal simple cuando el nmero de variables independientes es una. Regresin lineal mltiple cuando el nmero de variables independientes es ms de uno REGRESION LINEAL SIMPLE Mtodo estadstico que analiza la relacin entre una nica VARIABLE DEPENDIENTE (variable respuesta) y una VARIABLE INDEPENDIENTE (variables predictora, estimadora), para predecir cambios en la variable dependiente en respuesta a cambios en la variable independiente. Sirve para estudiar la naturaleza y forma de la relacin entre dos variables cuantitativas, una variable dependiente (VD) y otra variable independiente (VI), donde dicha relacin puede ser expresada matemticamente por la ecuacin de la lnea recta. La ecuacin general de la recta de regresin lineal es la siguiente:

Donde: Y X Bo B1 = Variable dependiente (v. respuesta, v. estimada,) = Variable independiente (v. predictora, v. estimadora, v. explicativa) = Valor de la variable dependiente si X=0, llamado tambin INTERCEPTO. = es la pendiente de la lnea, llamada tambin COEFICIENTE DE REGRESIN

Sin embargo, la ecuacin indicada no se va a cumplir exactamente, porque existir un error () que representa la variacin de Y en todos los datos con un mismo valor de la variable independiente. Por lo tanto, la expresin terica del modelo matemtico ser:

= Es la diferencia entre un valor observado y el valor estimado de la variable dependiente y se denomina residuos o error. Vicente Pocomucha Poma

32

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Finalidad Averiguar en que medida la VD puede estar explicada por la VI Obtener predicciones en la VD a partir de la VI

Estimacin de parmetros: Se puede realiza por varios mtodos; el ms utilizado es el de MNIMOS CUADRADOS, que consiste en calcular una recta tal que la suma de todas las diferencias entre los valores observados y la recta sean los mnimos posibles. Estimacin de coeficiente de regresin Bo y B1 mediante:

Pasos para la realizacin de un anlisis de la regresin lineal en SPSS utilizando el archivo CORONAR: Men Analizar Regresin Lineal... y obtenemos el cuadro de dialogo siguiente.

Seleccionar la variable PESO y trasladar al cuadro DEPENDIENTE:


Seleccionar la variable TALLA y trasladar a INDEPENDIENTES

Pulsamos ACEPTAR, se obtiene los RESULTADOS que se muestran. Variables en anlisis

Vicente Pocomucha Poma

33

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Bondad de ajuste

El cuadro nos muestra el coeficiente de correlacin mltiple R = 0.443 y no es otra cosa que el valor absoluto del coeficiente de correlacin de Pearson. El R2 = 0.196 (R cuadrado) es el coeficiente de determinacin y expresa la proporcin de varianza de la VD que est explicada por la VI; y nos indica que el 19.6% de la variabilidad del PESO esta explicada por, depende de, o esta asociada a la TALLA. El R2 corregida = 0.184 es una correccin de R2 que se basa en el numero de casos y de variables independientes, y nos indica que el 18.4 % de las variaciones observadas en la VD (PESO) pueden ser explicadas linealmente por la VI (TALLA) Error tipo de la estimacin = 10.894 es la desviacin tpica de los residuos, se obtiene sacando la raz cuadrada de la media cuadrtica residual del ANOVA. Representa una medida de la parte de variabilidad de la VD que no est explicada por la recta de regresin. En general, cuanto mejor es el ajuste, ms pequeo es este error tpico.

El ANOVA nos muestra los resultados obtenidos en el anlisis de regresin. Y nos indica si existe o no relacin significativa entre la VD y la VI. El estadstico F = 16.073 permite contrastar la hiptesis nula, si en la poblacin B1 es cero. Como el nivel critico (Sig) p =0,000 es menor que 0.05 rechazamos la hiptesis nula y concluimos que B1 es significativamente distinto de cero y, consiguientemente existe regresin lineal entre las variables PESO y TALLA. Ecuacin de regresin

Vicente Pocomucha Poma

34

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

El cuadro nos indican los coeficientes de la recta de regresin. Donde los coeficientes no estandarizados contiene los coeficientes de regresin parcial que define la ecuacin de regresin. En la columna B, se muestran los coeficientes B1 = 0.646 y Bo = -37.015, quedando la ecuacin de regresin lineal simple estimada como: Y = Bo + B1 X Y = -37.015 + 0.646 X

Bo = -37.015 es origen de la recta de regresin y recibe el nombre de constante. B1 = 0.646 es la pendiente de la recta de regresin, nos indica el cambio medio que corresponde a la VD (PESO) por cada unidad de cambio de la VI (TALLA); quedando finalmente la ecuacin de regresin como:

PESO = -37.015 + 0.646 TALLA


Coeficiente de regresin estandarizados Los coeficientes Beta (coeficientes de regresin parcial estandarizados) son los coeficientes que definen la ecuacin de regresin cuando sta se obtiene tras estandarizar las variables originales. En el anlisis el coeficiente Beta corresponde a la nica variable independiente presente en la ecuacin y coincide exactamente con el coeficiente de correlacin de Pearson r= 0.443. En regresin mltiple tiene mayor relevancia estos coeficientes. Prueba de significacin Los estadsticos t y sus niveles crticos (Sig.) permiten contrastar la hiptesis nulas, donde los coeficientes de regresin valen cero en la poblacin (Ho: B1 = 0) REGRESION LINEAL MULTIPLE El anlisis estadstico permite utilizar ms de una VI y, por tanto, permite ajustar modelos de regresin lineal mltiple (mltiple = ms de una VI). Pero un anlisis de regresin mltiple la ecuacin de regresin ya no define una recta en un plano, sino un hiperplano en un espacio multidimensional.

Vicente Pocomucha Poma

35

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

El modelo matemtico, en este caso, es el siguiente:

Pasos para la realizacin de un anlisis de la regresin mltiple en SPSS utilizando el archivo CORONAR: Men Analizar Regresin Lineal... y obtenemos el cuadro de dialogo siguiente.

Seleccionar la variable CB (colesterol) y trasladar al cuadro DEPENDIENTE:


Seleccionar las variables EDAD Y PESO y trasladar a INDEPENDIENTES

Pulsamos ACEPTAR, se obtiene los RESULTADOS que se muestran. Variables en anlisis

El mtodo de elaboracin utilizado es INTRODUCIR, indicado mediante el subcomando METODO con la opcin INTRODUCIR; Esta opcin incluye en el modelo todas las variables listadas, aunque sus coeficientes no sean significativos Vicente Pocomucha Poma

36

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Bondad de ajuste

El coeficiente de determinacin R2 = 0.381 nos indica la calidad del modelo de regresin, cuando se toman a las dos VI para el anlisis y explican que el 38.1 % de la varianza de la VD CB. El R2 corregida = 0.362 nos indica que el 36.2 % de las variaciones observadas en la VD (COLESTEROL) se explican por las variables EDAD y PESO. Error tipo de la estimacin = 27.079 se obtiene sacando la raz cuadrada de la media cuadrtica residual del ANOVA.

El ANOVA muestra la F observada = 20.015 y la (Sig) p=0.000 (<0.05) esto indica que existe significacin estadstica entre la VD y el conjunto de VI juntas; por tanto podemos mencionar que al menos uno de los coeficientes de regresin mltiple es distinto de cero. Y que el hiperplano definido por la ecuacin de regresin ofrece un buen ajuste a la nube repuntos. Para ver cul o cules son significativos, tenemos que consultar la tabla siguiente, en la que se listan los coeficientes de regresin, con sus errores estndar y valores de la T de Student asociadas. Ecuacin de regresin

El cuadro contiene en la columna encabezada coeficientes no estandarizados se encuentran los coeficientes (Bk) que forman parte de la ecuacin de regresin lineal mltiple:

Vicente Pocomucha Poma

37

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Y = Bo + B1 X1 + b2 X2 Donde: Bo = 73.657 es el valor del termino independiente. B1 = 1.010 es el coeficiente de regresin mltiple correspondiente a la variable EDAD B2 = 1.518 es el coeficiente de regresin mltiple correspondiente a la variable PESO Los coeficientes de regresin mltiple (B1 y B2) se denominan COEFIECIENTES DE REGRESION PARCIAL y son distintos de cero, y contribuyen a la ecuacin de regresin significativamente. La prueba T muestran diferencias estadsticas debido a que los valores crticos (Sig) p=0.000 y p=0.038 son <0.05 para B1 y B2. La ecuacin estimada de regresin mltiple es: COLESTEROL (CB) = 73.657 + 1.010 EDAD + 1.518 PESO El coeficiente correspondiente a la variable EDAD es 1.010, esto indica, un aumento en ao en EDAD, le corresponde un aumento de 1.010 mg en COLESTEROL, cuando el resto de trminos de la ecuacin se mantienen constantes, Coeficiente de regresin estandarizada (Beta) Los coeficientes Beta indican la cantidad de cambio que se producir en la variable dependiente por cada cambio de una unidad en la correspondiente variable independiente (manteniendo constante el resto de variables independientes) Estos coeficientes proporcionan informacin til sobre la importancia relativa de cada variable independiente en la ecuacin de regresin. En general, una variable tiene tanto ms peso (importancia) en la ecuacin de regresin cuanto mayor (en valor absoluto) es su coeficiente de regresin estandarizado. Observando los coeficientes Beta podemos comprobar que la variable PESO es la ms importante, presenta ms peso (0.540) en la ecuacin, seguido de la EDAD que presenta 0.211. Prueba de significacin Los estadsticos t y los niveles crticos (Sig.) sirven para contrastar la hiptesis nulas de que los coeficientes de regresin valen cero en la poblacin (Ho: B1 = B2 = .= Bk =0). Si los niveles crticos (Sig.) son muy pequeos (generalmente < 0.05) se deben rechazar la hiptesis nula. Un coeficiente cero indica ausencia de relacin lineal, de modo que los coeficientes significativamente distintos de cero informan qu variables son relevantes en la ecuacin de regresin. Observando el nivel critico asociado a cada prueba de T, puede verse que las dos VI utilizadas poseen coeficientes significativamente distintos de cero (en todos ellos, Sig, =0.000 y 0.038 son < 0.05). Los dos variables, por tanto, contribuyen de forma significativa al ajuste del modelo, o si se prefiere, a explicar lo que ocurre con la variable dependiente.

Vicente Pocomucha Poma

38

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

3.5. ANALISIS DE VARIANCIA: UN SOLO FACTOR El anlisis de la varianza (ANOVA) es una tcnica estadstica que nos permite, entre otras cosas, comparar tres o ms medias con datos independientes de forma simultnea. El ANOVA plantea el problema como un modelo matemtico, donde la variable dependiente es la variable cuantitativa, y la variable independiente es la variable cualitativa, tambin llamada factor. Donde: V.A. cuantitativa Variable Dependiente = Variable de respuesta V.A. cualitativa/categrica/ordinal V. Independiente = Factor Nota 1: En el modelo de un solo FACTOR slo existe una variable independiente. Son requisitos indispensables para aplicar el ANOVA que la distribucin de las muestras sean normal y que todas tengan la misma varianza. Para llevar a cabo un ANOVA de un factor se utilizar el archivo TTERRENO.SAV, realizando la siguiente secuencia: Analizar Comparar Medias ANOVA de un factor, obteniendo la ventana siguiente:

Seleccionar la variable DEPENDIENTES.

CONSURB

(consumo

urbano)

trasladarla

la

lista

Seleccionar la variable CILINDRO (numero de cilindros) y trasladarla al cuadro FACTOR, y se obtiene la figura siguiente.

Pulsar ACEPTAR para ejecutar el procedimiento; y obtener los resultados siguientes:

Vicente Pocomucha Poma

39

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Interpretacin de los resultados Los resultados nos indican la suma de cuadrados, los grados de libertad, las medias cuadrticas entre grupos, dentro de grupos y el total; as como la prueba de F y la significacin estadstica. Como la prueba de F = 44,037 y el valor critico p = 0.000 (<0.05), podemos indicar que existe una alta significacin estadstica en el CONSUMO URBANO promedio en funcin al NUMERO de cilindros utilizados. OPCIONES Las opciones del procedimiento ANOVA de un factor nos permiten determinar: Estadsticos descriptivos como numero de observaciones, media, desviacin estndar, error tpico de la media, intervalos de confianza para la media y valores mnimos y mximas. Homogeneidad de variancia que incluye la normalidad y homocedasticidad. Para ingresar y modificar las opciones, realizar los siguientes pasos: Pulsar el botn OPCIONES.. del cuadro de dialogo ANOVA de un factor para acceder al subcuadro de dialogo siguiente:

Pulsar CONTINUAR y ACEPTAR para ejecutar el procedimiento; y obtener los resultados siguientes:

Vicente Pocomucha Poma

40

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

COMPARACIONES POST HOC O A POSTERIORI La prueba de F del ANOVA nicamente nos permite contrastar la hiptesis general de que todos promedios comparados son iguales. Al rechazar esa hiptesis, sabemos que las medias poblacionales comparadas no son iguales, pero no sabemos dnde en concreto se encuentran las diferencias son diferentes entre s todas las medias?, hay slo una media que difiere de las dems?, etc. Para saber qu media difiere unas de otras medias, debemos utilizar los contrastes denominadas comparaciones mltiples POST HOC o comparaciones a POSTERIORI, que son comparaciones entre pares de grupos. Para efectuar comparaciones POST HOC: Pulsar el botn POST HOC.. del cuadro de dialogo ANOVA de un factor para acceder al subcuadro de dialogo siguiente:

Marcar la opcin SCHEFFE del cuadro de dialogo, asumiendo variancias iguales y la opcin GAMES HOWELL no asumiendo varianzas iguales. Luego pulsar CONTINUAR y ACEPTAR para ejecutar el procedimiento; y obtener los resultados siguientes:

Vicente Pocomucha Poma

41

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Interpretacin de los resultados Los resultados nos indican que hemos seleccionado dos mtodos POST HOC: las pruebas de SCHEFFE y GAMES HOWELL. Se observan todas las posibles combinaciones dos a dos entre los niveles o categoras de la variable Factor (CILINDROS); y nos indican las diferencias entre los consumos promedios de cada dos grupos, el error tpico de esas diferencias y el nivel crtico asociado a cada diferencia (significacin). Los grupos cuyas medias difieren significativamente al nivel de significacin establecido (0.05 por defecto) estn marcados con un asterisco. Podemos indicar que los resultados obtenidos van depender de los mtodos utilizados. CONTRASTES A PRIORI O PLANEADAS Estas comparaciones permiten conocer si los valores promedio de la variable dependiente para cada nivel del factor, siguen o no alguna tendencia lineal, cuadrtica, cbica o de grado 4 5 (contraste polinmicas), el acceso es mediante la opcin POLINOMICO. As tambin permite realizar contrastes personalizados entre medias, el acceso es mediante la asignacin de COEFICIENTES. Nota: Antes de realizar los contrastes polinmicos, se deben realizar una representacin grafica, a fin de averiguar que tendencia presenta los datos utilizando la opcin BARRAS DE ERROR del men Grficos, mediante los siguientes pasos: Men Grficos Cuadros de dilogo antiguos Barras de error, obtenindose la ventana siguiente: Vicente Pocomucha Poma

42

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Pulsar los botones SIMPLE, RESUMENES PARA GRUPOS DE CASOS y DEFINIR para acceder al subcuadro de dialogo siguiente:

Ingresar en la variable CONSURB y como Eje de categoras CILINDRO Pulsar ACEPTAR para acceder a la siguiente Figura:

Interpretacin del grafico Se observa como el consumo urbano (CONSURB) promedio se encuentra se en funcin del nmero de cilindros (CILINDROS) sigue una tendencia lineal que se comprobar mediante el contraste polinomial, tratada en la siguiente secuencia. Contrastes polinomicos Para efectuar comparaciones CONTRASTES:

Vicente Pocomucha Poma

43

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Pulsar el botn CONTRASTES del cuadro de dialogo ANOVA de un factor para acceder al subcuadro de dialogo siguiente:

Seleccionar la opcin POLINOMICO, En la lista despegable ORDEN seleccionar un tipo de ajuste de los 5 niveles que presenta la variable independiente (aunque podemos indicar ms all de la tendencia cbica no resulta fcil interpretar la relacin) Pulsar ACEPTAR para acceder a la siguiente Figura

Interpretacin de los resultados El resultado ofrece tanto la solucin NO PONDERDA como la PONDERDA, cada tendencias aparece con su correspondiente suma de cuadrados, grados de libertad, media cuadrtica, la prueba de F y el nivel critico de significacin. En el ejemplo la tendencia lineal para la solucin PONDERADA y NO PONDERADA, tiene un nivel critico de significacin 0.000, y como este valor es menor que 0.05 podemos concluir que la variable independiente CILINDRO y la variable dependiente CONSURB presentan una relacin lineal significativa. Contrastes personalizados Un contraste es una comparacin en la que interviene dos o ms medias. En el ejemplo de CONSURB y CILINDRO podramos plantear:

x x x

----

x x

etc.

Vicente Pocomucha Poma

44

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Los pesos o coeficientes de cada componente pueden tomar diferentes valores y da lugar a contrastes ortogonales o no ortogonales. En los contrastes anteriores estos coeficientes bien podran ser para cada uno de los tres niveles de la variable CILINDRO 1 -1 0 1 0 -1 0 1 -1 etc. Estos valores se deben ingresar en el siguiente cuadro de dialogo:

Ingresar cada uno de los valores definidos del contraste, en el cuadro de texto COEFICIENTES y llevando a la lista inferior con el botn AADIR y pulsando SIGUIENTE. Para el primer contraste asignado (1 -1 0) ingresar los valores respetando los signos en forma secuencial, continuar este procedimiento hasta el ultimo contraste (0 1 -1). Al terminar de ingresar todos los valores, pulsar CONTINUAR luego presionar ACEPTAR, y obtenemos los resultados que se muestran en la figura siguiente:

Interpretacin de los resultados La tabla inicial nos muestra los coeficientes de los contrastes planteados; esta informacin sirve para comprobar si los contrastes definidos han sido ingresados correctamente. La siguiente tabla nos muestra dos bloques de informacin que debemos utilizar en forma alternativa: en el primero los contrastes propuestos estn evaluados asumiendo que las Vicente Pocomucha Poma

45

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

variancias poblacionales son iguales; el segundo, estn evaluados no asumiendo igualdad de variancias. As mismo, muestra para cada contrastes definidos, el valor del contraste, su error tpico, el estadstico de contraste t, sus grados de libertad y el nivel critico asociado a t (significacin bilateral) La hiptesis nula que se pone a prueba en cada contraste, es que los promedios comparados son iguales: observando los niveles crticos de los tres contrastes vemos que debemos rechazar la hiptesis nula referido a los tres contrastes, debido a que la menor significacin es 0.012 (<0.05) nos indica que existe significacin estadstica entre los contrastes planteados. Podemos concluir, que el consumo urbano (CONSURB) promedio en los tres grupos de CILINDRO son diferentes. 3.6. ANALISIS DE VARIANCIA MULTIFACTORIAL (MAS DE UN FACTOR) En el anlisis de la varianza (ANOVA) de una va, se utiliza cuando se tiene una variable dependiente cuantitativa y una sola variable independiente cualitativa. Ejm. 1.- Tenemos el inters de estudiar si la variable dependiente (VD) SALARIO de los varones y de las mujeres es diferente (efecto del primer factor) y, al mismo tiempo, si varios GRUPOS DE EDAD tienen distinto salario (efecto del segundo factor). Adems, deseamos conocer si las diferencias entre varones y mujeres se repiten o no en cada grupo de edad, es decir, permite determinar si la INTERACCIN entre los factores SEXO y GRUPOS DE EDAD afectan a la VD SALARIO. Ejm 2. Queremos estudiar simultneamente la influencia en la TENSIN ARTERIAL SISTLICA (variable dependiente) de la CLASE SOCIAL y del SEXO (variables independientes) en un mismo experimento. El ANOVA con ms de un factor, llamado ANOVA factorial o anlisis multifactorial de varianza; se estudia la influencia de dos variables independientes (cualitativas) sobre una variable dependiente (cuantitativa); entonces el anlisis de la varianza de dos vas. En algunos casos, podemos estar interesados en analizar la influencia de tres o ms variables independientes (factores) sobre una variable dependiente, si los factores son tres, hablaremos de anlisis de la varianza de tres vas, etc. Ventajas Utilizar ms de un factor en un mismo diseo posee ventajas de poder estudiar el efecto de la interaccin entre los factores. En modelo de dos factores, los efectos de inters son tres: los dos efectos principales (uno por cada factor) y el efecto de la interaccin entre ambos factores. En modelo de tres factores, los efectos de inters son siete: los tres efectos principales, los tres efectos de las interacciones dobles (uno por cada interaccin entre cada dos factores) y el efecto de la interaccin triple (entre los tres factores).

Para llevar a cabo el anlisis de varianza factorial se utilizar el archivo CORONAR.SAV. Men Analizar Modelo lineal general Univariante, para acceder al cuadro de dialgo Univariante siguiente: Vicente Pocomucha Poma

46

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Seleccionar una variable cuantitativa TAS trasladarla al cuadro DEPENDIENTE. Seleccionar dos variables cualitativas SEXO y CLSO y trasladarla al cuadro FACTORES FIJOS. Luego pulsar ACEPTAR para acceder a los resultados siguientes:

Este resultado nos indican el nombre de las variables independientes (factores), sus niveles, incluidas las etiquetas de los valores, y el nmero de casos que existe en cada grupo.

Interpretacin de los resultados

El cuadro del ANOVA contiene fuentes de variacin, las sumas de cuadrados, los grados de libertad (gl), las medias cuadrticas, los estadsticos F y los niveles crticos (Sig.), correspondientes. Vicente Pocomucha Poma

47

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Adems el ANOVA nos muestra el modelo corregido, los efectos principales (factores SEXO y CLSO), los efectos de la interaccin (SEXO*CLSO), el error experimental y el total corregido; cada uno con su significacin estadstica. Se observa que no existe significacin estadstica en ninguno de las efectos principales, ni en la interaccin, debido a que el valor critico Significacin es >0.05. Los efectos principales para sexo CLSO no se encontraron diferencias significativas, esto indica que los valores de TAS son los mismos para HOMBRES y MUJERES; as como para CLSO (clase social). La interaccin entre SEXO*CLSO tampoco mostr significacin estadstica. Comparaciones post hoc o a priori Si alguno de los estadsticos F asociados a los efectos principales resulta significativo, se debe realizar comparaciones POS HOC, siempre y cuando factores presentes mayores a dos niveles. Los estadsticos F del ANOVA slo permiten contrastar la hiptesis general, que los promedios comparados son iguales; al rechazar esa hiptesis se sabe que existen diferencias, pero no se sabe quien tiene mayor promedio estadsticamente. Para saber que media en concreto difiere de otra media, es necesario utilizar un tipo particular de contrastes denominados comparaciones mltiples POST HOC o comparaciones a posteriori. Para efectuar comparaciones POST HOC: Pulsar el botn POST HOC del cuadro de dialogo UNIVARIANTE para acceder al subcuadro de dialogo univariante: comparaciones mltiples post hoc para las medias observadas.

Seleccionar las variables SEXO y CLSO en la lista FACTORES y trasladarla a la lista CONTRASTES POST HOC PARA. Marcar la opcin TUKEY del recuadro Asumiendo varianzas iguales y la opcin GAMES HOWELL No asumiendo varianzas iguales. Pulsar CONTINUAR y finalmente ACEPTAR, y se obtiene lo siguiente resultados:

Vicente Pocomucha Poma

48

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Los resultados en los dos mtodos utilizados TUKEY y GAMES HOWELL no muestran diferencias estadsticas significativas entre las tres CLASES SOCIALES.(CLSO).

El resultado obtenido de las comparaciones mltiples basado a la prueba de Tukey nos indica que la medias no difieren entre si y se encuentran agrupados en el mismo subconjunto. Grficos de interaccin Las comparaciones mltiples post hoc proporcionan toda informacin necesaria para interpretar correctamente un efecto principal significativo. Pero no ocurre lo mismo con los efectos de las interacciones. La interpretacin correcta de una interaccin suele requerir adems del anlisis de efectos simples la ayuda de un grafico de lneas o grafico de perfil. Para obtener los GRFICOS DE PERFIL presentando el efecto de las interacciones:

Vicente Pocomucha Poma

49

ANALISIS Y PROCESAMIENTO ESTADISTICO DE DATOS

MANUAL SPSS 15.0

Pulsar el botn GRAFICOS del cuadro de dialogo UNIVARIANTE para acceder al subcuadro de dialogo univariante: Grficos de perfil.

Seleccionar la variable SEXO al cuadro EJE HORIZONTAL y la variable CLSO al cuadro LINEAS DISTINTAS. Pulsar el botn AADIR para hacer efectiva la seleccin de variables Pulsar CONTINUAR y finalmente ACEPTAR para obtener los siguientes grficos.

Promedio

En los cuadros se observan las medias de la TAS calculada en cada subgrupo resultante de combinar cada nivel de la variable SEXO con cada nivel de la variable CLSO y viceversa. En el primer grafico se observa que el promedio de los niveles de la variable CLSO presentan diferente comportamiento dependiendo de los niveles del SEXO. En el segundo grafico se observa que el promedio de los niveles de la variable SEXO presentan diferente comportamiento dependiendo de los niveles de CLSO.

Vicente Pocomucha Poma

50

You might also like