ESTADISTICA BASICA Maestria Finanza Laguna Rodriguez Stabilito Salazar Stabilito 2016

UNIVERSIDAD DE ORIENTE
NCLEO ANZOTEGUI
EXTENSIN CANTAURA
COORDINACION DEL POSTGRADO EN CIENCIAS ADMINITRATIVAS
MAESTRIA EN CIENCIAS ADMINISTRATIVAS MENCIN: FINANZAS
Estadstica Bsica
Presentado por:
Hogla Rodrguez G. C.I: 12.969.576 Edith J. Laguna M. C.I: 16.160.679
ngel M. Stabilito C. C.I: 9.817.598 Eliana C. Stabilito C C.I: 12.816.163
Ins M. Salazar G. C.I: 16.613.588
Prof. MSc. Hamlet Mata Mata
Cantaura, diciembre de 2016

NDICE GENERAL
Contenido
NDICE GENERAL.................................................................................................I
NDICE DE TABLAS.........................................................................................XIV
NDICE DE GRFICOS.....................................................................................XV
INTRODUCCIN.............................................................................................XVII
UNIDAD I EL PROGRAMA INFORMTICO SPSS Y EL ANLISIS

ESTADSTICO.......................................................................................................I
1. El Programa Informtico SPSS..................................................................1
1.2 Definicin de SPSS..................................................................................1
2. Caractersticas del SPSS...........................................................................1
3. Instalar el Programa SPSS.........................................................................3
3.1 Requisitos del sistema para el programa spss para ser instalado en
ambiente Windows............................................................................................3
3.1.1 Sistemas operativos..........................................................................4
3.1.2 Software................................................................................................4
3.1.2.1 Para sistemas Microsoft XP...........................................................4
3.1.2.2 Para sistemas Microsoft Vista o 7..................................................4
3.1.3 Hardware...............................................................................................4
3.1.4 Cdigo de licencia.................................................................................5
4. Instrucciones...........................................................................................5
5. Estructura del SPSS...................................................................................9
5.1 Archivo de datos del SPSS..................................................................9
5.2 Editor de datos del SPSS..................................................................10
1
5.3 Transformar Datos mediante el SPSS...............................................13
5.3.1 Recodificacin de una Variable...................................................15
5.3.2 Filtrado de datos..........................................................................15
5.4 Modificar archivos de datos en el SPSS............................................16
5.4.1 Trasponer archivos..........................................................................16
5.4.2 Fundir Archivos................................................................................17
5.4.3 Agregar Datos..................................................................................17
5.4.4 Seleccionar archivos........................................................................18
5.4.5 Ponderar casos................................................................................18
5.5 El visor del SPSS...................................................................................18
5.5 Archivo de sntesis del SPSS............................................................20
6. Anlisis Estadstico con el SPSS..........................................................20
7. Aplicacin del SPSS en estadstica inferencial........................................22
8. Solucin de problemas estadsticos con el spss......................................23
Ejercicios con el SPSS.......................................................................................23
UNIDAD II INTRODUCCIN A LA ESTADSTICA DESCRIPTIVA....................25
9. Estadstica....................................................................................................26
9.1 Concepto...................................................................................................26
10. Importancia de la estadstica........................................................................26
11. Estadstica Descriptiva..............................................................................27
11.1 Conceptos Bsicos..................................................................................27
11.1.1 Poblacin...........................................................................................27
11.1.2 Variable..........................................................................................28
11.1.2.1 Tipos de variables.......................................................................28
2
11.1.2.2 Cualitativas o Categricas..........................................................28
11.1.2.3 Cuantitativas:..............................................................................28
12. Recoleccin, organizacin y presentacin de los datos...........................29
13. Datos agrupados y no agrupados:...............................................................30
14. Distribucin de frecuencia............................................................................31
14.1 Tipos de frecuencias.......................................................................32
14.1.1 Frecuencia absoluta.................................................................32
14.1.2 Frecuencia relativa...................................................................32
14.1.3 Frecuencia acumulada..................................................................33
14.1.4 Frecuencia relativa acumulada......................................................33
14.1.5 Distribucin de frecuencias agrupadas.........................................33
14.1.6 Construccin de tablas de frecuencia...........................................34
14.1.7 Histogramas...................................................................................35
14.1.7.1 Crear un histograma con el SPSS.............................................36
14.1.8 Polgonos simples y acumulativos................................................38
15. Grficos.........................................................................................................39
15.1 Definicin....................................................................................................39
15.1.1 Tipos de datos...................................................................................40
15.1.2 Cualitativos....................................................................................40
15.1.3 Cuantitativos..................................................................................40
15.2 Tipos de Grficos....................................................................................40
15.2.1 Grfico de barras..................................................................................40
15.2.2 Grfico de lneas......................................................................................41
15.2.3 Grfico de Pareto.....................................................................................41
3
15.2.4 Grfico de sectores..................................................................................41
15.2.5 Grfica de pastel......................................................................................41
15.2.6 Grfico de dispersin...............................................................................42
15.2.7 Cartograma..............................................................................................42
15.3.8 Grfico de sectores..................................................................................42
15.3.10 Barras mltiples.....................................................................................43
15.3.11 Grficos circulares.................................................................................43
15.3.12 Grficos de reas..................................................................................43
15.3.13 Grficos Mixtos......................................................................................43
17. La Media Aritmtica......................................................................................44
18. Mediana........................................................................................................44
19. Moda.............................................................................................................45
20. Cuartiles........................................................................................................46
21. Percentil........................................................................................................46
22. Medidas de dispersin..................................................................................47
24.1 Caractersticas..................................................................................48
25. Varianza..............................................................................................49
28. Solucin de problemas aplicando el Spss:...................................................51
Resolucin de Ejercicio.......................................................................................51
Grficos P-P........................................................................................................58
Grficos Q-Q.......................................................................................................62
UNIDAD III INTRODUCCIN A LA ESTADSTICA INFERENCIAL.................64
29. Estadstica Inferencial...................................................................................65
30. Probabilidad..................................................................................................67
4
30.1 Definicin.................................................................................................67
31. Tipos de Probabilidad...................................................................................68
31.3 Probabilidad subjetiva.............................................................................69
31.4 Probabilidad Axiomtica..........................................................................69
32. Propiedades de la probabilidad....................................................................69
33. Teorema de Bayes y su aplicacin...............................................................70
34. Distribuciones de probabilidad......................................................................71
34.1 Definicin.................................................................................................71
35. Variables Aleatorias Discretas y Distribucin de Probabilidades Discretas. 73
35.1 Definicin.................................................................................................73
35.2 Variables aleatorias discretas..................................................................73
35.3 Variables aleatorias continuas................................................................73
35.5 Distribucin Binomial...............................................................................74
35.5.1 Uso del proceso de Bernoulli............................................................75
35.5.2 Parmetros de la distribucin binomial.............................................76
36. Distribucin de Poisson................................................................................77
36.1 Caractersticas de los procesos que producen una distribucin de

probabilidad de Poisson..................................................................................77
37. Variables Aleatorias Continuas y Distribucin de Probabilidades Continuas

............................................................................................................................80
37.1 Variables aleatorias continuas................................................................80
37.2 Distribucin de probabilidades continas...............................................80
38. La Distribucin Normal.................................................................................81
38.1 Manejo de tablas de distribucin normal....................................................82
38.2 Tabla de la distribucin normal................................................................83
5
38.3 Uso de la tabla de Z...................................................................................84
UNIDAD IV TEORA DE MUESTREO..............................................................85
39. Muestreo probabilstica y no probabilstica..................................................86
39.1 Muestreo probabilstica...........................................................................86
39.2 Muestreo no probabilstica......................................................................86
39.2.1 Definicin.................................................................................................87
39.1.1 Muestreo probabilstico............................................................................87
39.2 Las ventajas del mtodo de muestreo........................................................87
40. Tipos de muestreo........................................................................................87
40.1 Muestreo probabilstico........................................................................88
40.1.1 El muestreo aleatorio simple............................................................88
40.1.2 Muestreo aleatorio sistemtico......................................................88
40.1.3 Muestreo estratificado...................................................................88
40.1.4 Muestreo errtico...........................................................................88
40.1.5 Muestreo doble..............................................................................88
40.1.6 El muestreo aleatorio por conglomerados.....................................89
40.1.7 Muestreo aleatorio mixto/por etapas mltiples..............................89
40.2 Muestreo no probabilstico......................................................................89
40.2.1 Muestreo por cuotas......................................................................89
40.2.2 Muestreo intencional o de conveniencia.......................................90
40.2.3 Bola de nieve.................................................................................90
40.2.4 Muestreo Discrecional...................................................................90
A criterio del investigador los elementos son elegidos sobre lo que l cree
que pueden aportar al estudio..................................................................90
6
40.2.5 El muestreo por cuotas..................................................................90
40.3 Error Muestral..........................................................................................91
40.4 Tamao De La Muestral..........................................................................91
UNIDAD V ESTIMACIN DE PARMETROS Y PRUEBAS DE HIPTESIS. .93
41. Estimacin de la Media Poblacional.............................................................94
41.1 Definicin.................................................................................................94
41.1.1 Medida Poblacional.......................................................................94
42. Caractersticas de la estimacin puntual y por intervalo..............................95
42.1 Caractersticas de Estimacin puntual...................................................95
42.2 Caractersticas de Estimacin por intervalos.........................................96
42.2.1 Un estimador puntual T.................................................................97
44. Estimacin de la media por intervalo usando muestras grandes con

varianza poblacional conocida............................................................................99

varianza poblacional desconocida....................................................................102
45.1 Muestras grandes..............................................................................103
46. Determinacin del tamao de muestra.......................................................104
47. Estimacin de la Proporcin Poblacional...................................................108
47.1 Concepto de Estimacin.......................................................................108
47.2 Estimacin puntual de la proporcin poblacional.................................108
47.2.1 Propiedades deseables de un estimador........................................112
47.2.1.1 Insesgadez................................................................................112
47.2.1.2 Eficiencia...................................................................................112
47.2.1.3 Suficiencia.................................................................................112
47.2.1.4 Consistencia.............................................................................112
7
47.3 Mtodos para obtener estimadores.......................................................113
47.3.1 Mtodo de los momentos................................................................113
47.3.2 Mtodo de mnimos cuadrados.......................................................113
47.3.3 Mtodo de mxima verosimilitud....................................................113
47.4 Estimacin por intervalos de confianza.................................................113
47.4.1 Variabilidad del parmetro...........................................................114
47.4.2 Error de la estimacin..................................................................114
47.4.3 Nivel de confianza........................................................................114
47.4.4 Valor ..........................................................................................114
47.4.5 Valor crtico..................................................................................114
47.5 Estimacin por intervalo de la proporcin poblacional..........................115
47.5.1 Error mximo con una confianza de 1-......................................116
47.5.2 Determinacin del tamao de muestra para estimar una

proporcin poblacional............................................................................116
47.5.2.1 Tamao de la muestra..............................................................116
48. Determinacin del tamao de muestra para estimar una proporcin

poblacional........................................................................................................117
49. Pruebas de Hiptesis..................................................................................118
49.1 Contraste de hiptesis...........................................................................120
49.1.2 Una hiptesis estadstica.............................................................121
49.1.3 Regin de Rechazo o Regin Crtica..........................................122
49.1.4 Regin de Aceptacin o Regin de No Rechazo........................122
50. Planteamiento de la hiptesis estadstica........................................122
50.1 Supuestos..............................................................................................122
50.2 Estadstico de Contraste.......................................................................123
8
50.3 Reglas de decisin................................................................................123
50.4 Clculo del estadstico y toma de decisin...........................................125
50.5 Errores en los contrates de hiptesis....................................................125
50.6 Potencia de un contrate........................................................................126
50.6.1 Curvas de potencia de un contrate.................................................127
50.7 Efecto del tamao de la muestra en la potencia...................................127
50.8 Violacin de los supuestos en los contrastes de hiptesis...................127
50.8.1 Utilizacin de la distribucin T-Student, en el contraste de .........127
50.8.2 Utilizacin de la distribucin T-Student, en el contraste de 1 - 2

................................................................................................................128
50.8.3 Utilizacin de la distribucin Chi-Cuadrado (x), en el contraste

...................................................................................................................128
50.8.4Utilizacin de la distribucin F-Snedecor en el contraste de 1/

2..............................................................................................................128
50.9 Propiedades deseables en los contrastes de hiptesis....................128
50.9.1 Carencia de Sesgo.........................................................................128
50.9.2 Consistencia....................................................................................129
50.10 El concepto de p-valor........................................................................129
51. Formulacin de las hiptesis estadsticas..................................................129
50.1 Algunas Caractersticas para la Formulacin de Hiptesis..................131
51. Hiptesis nula y alternativa.........................................................................133
51.1 Hiptesis Nula....................................................................................133
51.2 Hiptesis Alternativa..........................................................................133
52. Hiptesis simples y compuestos................................................................134
52.1 Contrastes De Hiptesis Simple........................................................135
9
53. Errores tipo I y II..........................................................................................135
53.1. El error de tipo I................................................................................135
53.2 El error de tipo II................................................................................135
53.1 Nivel De Significancia........................................................................137
54. Matriz De Decisin......................................................................................138
55. Seleccin de las pruebas estadsticas.......................................................138
56. El nivel de significacin y el tamao de la muestra....................................139
56.1 Prueba de Uno y Dos Extremos........................................................139
56.1.1 Curva Caracterstica Operativa y Curva de Potencia.....................140
56.1.2 Grados de Libertad......................................................................141
57. Zonas de aceptacin y de rechazo de la hiptesis....................................141
57.1Decisin..............................................................................................141
57.1.1 Mantener.........................................................................................142
57.1.2 Rechazar H0...................................................................................142
58. Pruebas de hiptesis en el caso de una sola muestra...............................142
59. Pruebas no paramtricas............................................................................143
59.1 Limitaciones de las pruebas no paramtricas.......................................144
59.2 Pruebas paramtricas alternativas........................................................144
60. Pruebas paramtricas.................................................................................145
60.1 Caracterstica de las pruebas paramtricas.........................................145
UNIDAD VI REGRESIN, CORRELACIN, ANOVA, LA CONFIABILIDAD Y

SERIES DE TIEMPO........................................................................................146
61. Regresin Lineal.........................................................................................147
62. Representacin grfica de la nube de puntos o Diagrama De Dispersin 147
10
63. Clculo de los coeficientes de regresin................................................148
64. El coeficiente de determinacin y su interpretacin...................................149
65. Ecuacin de regresin lineal.......................................................................150
66. La ecuacin de regresin y su ajuste por el mtodo de mnimos cuadrados

..........................................................................................................................150
66.1 Mtodo De Cuadrados Mnimos...........................................................151
66.2 El mtodo de los mnimos cuadrados para la estimacin de los

coeficientes de regresin..................................................................................153
67. Supuestos bsicos para la aplicacin del mtodo de regresin: Linealidad,

Homocedasticidad............................................................................................156
68. Concepto y tipos de Correlacin................................................................157
68.1 Propiedades..........................................................................................157
68.2 Tipos de correlacin...........................................................................158
68.2.1 Correlacin directa..........................................................................158
68.2.2 Correlacin inversa.........................................................................159
68.2.3 Correlacin nula..............................................................................159
68.3 Grado de correlacin.........................................................................160
68.3.1 Correlacin fuerte........................................................................160
68.3.2 Correlacin dbil..........................................................................160
69. Coeficiente de correlacin de r Pearson..................................................161
70. Matrices de decisiones estadsticas...........................................................163
71. El anlisis de Varianza................................................................................164
72. Anlisis de varianza factorial y multifactorial..............................................165
73. La prueba F de Fisher..............................................................................167
74. Calculo de la Confiabilidad.........................................................................168
11
74.1 Medida de estabilidad (confiabilidad por test-retest)........................168
74.2 Mtodo de formas alternativas o paralelas........................................168
74.3 Mtodo de mitades partidas (split-halves).........................................169
74.4 Coeficiente alfa de Cronbach............................................................169
74.5 Coeficiente KR-20. Kuder y Richardson............................................170
75. Series de Tiempo........................................................................................171
75.1 Componentes de la serie de tiempo.....................................................171
75.1.1 La tendencia o tendencia secular......................................................172
75.1.2 La variacin cclica.............................................................................172
75.1.3 La variacin estacional.......................................................................172
76. Tendencia de una serie...............................................................................173
76.1 Tendencia lineal.....................................................................................173
76.2 Tendencia no lineal................................................................................173
77. Mtodos de Suavizamiento de la Serie......................................................173
77.1 Promedio mvil......................................................................................173
77.2 Promedios mviles ponderados............................................................175
78. Pronstico de series de tiempo..................................................................175
78.1 El perodo..............................................................................................175
78.2 El horizonte............................................................................................176
79. Clasificacin descriptiva de las series temporales.....................................176
79.1 Estacionarias.........................................................................................176
79.2 No estacionarias....................................................................................176
80. Procesos Estocsticos................................................................................176
80.1 Proceso estocstico estacionario..........................................................177
12
80.2 Ruido blanco(white noise)..................................................................177
81. Autocorrelacin...........................................................................................177
CONCLUSIONES.............................................................................................178
BIBLIOGRAFA.................................................................................................179
Pginas WEB Visitas:.......................................................................................179
13
NDICE DE TABLAS
Tabla 1 Tabla de Frecuencia...............................................................................34
Tabla 2 Frecuencias Acumulada, Relativa Acumulada......................................35
Tabla 3 Datos Obtenidos....................................................................................51
Tabla 4 Niveles de Confianza Ms Utilizados..................................................106
Tabla 5 Errores y Conclusiones Correctas En Las Pruebas De Hiptesis....136
Tabla 6 Valores crticos de Z.............................................................................140
14
NDICE DE GRFICOS
Grfico 1 Setup del Instalador..............................................................................6
Grfico 2 Sistema operativo de acuerdo a las caractersticas del Pc..................6
Grfico 3 Instalacin.............................................................................................7
Grfico 4 Licencias Monousuario/Usuarios.........................................................7
Grfico 5 Trminos de Licencia............................................................................8
Grfico 6 Fin de La Instalacin.............................................................................8
Grfico 7 Ejecutar el SPSS...................................................................................9
Grfico 8 Transformar Datos mediante el SPSS................................................14
Grfico 9 Venta de Visor.....................................................................................19
Grfico 10 Anlisis Estadstico SPSS.................................................................21
Grfico 11 Frecuencia Cardiaca.........................................................................23
Grfico 12 Analizar con el SPSS........................................................................24
Grfico 13 Seleccin Frecuencias: Estadsticos................................................24
Grfico 14 Solucin de Ejemplo.........................................................................25
Grfico 15 Listado de Variable de inters...........................................................36
Grfico 16 Seleccin de Variable.......................................................................36
Grfico 17 Men de grfico e Histograma..........................................................37
Grfico 18 Polgono Simple................................................................................38
Grfico 19 Polgono de Frecuencia Acumuladas...............................................39
Grfico 20 Introduccin de Variables..................................................................52
Grfico 21 Llenado de Filas................................................................................53
Grfico 22 Ponderar Casos................................................................................53
Grfico 23 Escoger como Variable de frecuencia la variable ponderaciones. 54
15
Grfico 24 Estadsticos descriptivos...................................................................54
Grfico 25 seleccin de Variable Concentracin................................................55
Grfico 26 Estadsticos.......................................................................................55
Grfico 27 Seleccionar Tipo de Grfico..............................................................56
Grfico 28 Resultados Estadsticos 1.................................................................56
Grfico 29 Resultados Estadsticos 2.................................................................57
Grfico 30 Grfico P-P........................................................................................58
Grfico 31 Elegir Variable...................................................................................59
Grfico 32 Descripcin del Modelo.....................................................................59
Grfico 33 Resumen del Procesamiento de los Casos y Parmetros de

distribucin Estimados........................................................................................60
Grfico 34 Grfico P-P Normal...........................................................................60
Grfico 35 Grfico P-P Normal Sin tendencia....................................................61
Grfico 36 Seleccin de Variable.......................................................................62
Grfico 37 Grfico Q-Q.......................................................................................62
Grfico 38 Grfico Q-Q 2....................................................................................63
Grfico 39 Error Muestral...................................................................................98
Grfico 40 Error Muestral 2................................................................................99
Grfico 41 Seleccin de los puntos crticos para el clculo del intervalo de

confianza...........................................................................................................100
Grfico 42 Interpretacin del nivel de confianza en el intervalo para la media de

una distribucin normal.....................................................................................101
Grfico 43 Nivel De Confianza........................................................................108
16
INTRODUCCIN
Desde, los aos 80 comenzamos a experimentar una invasin del mundo de

la informtica en el campo de la investigacin educativa a todos los niveles;
bases de datos, bases bibliogrficas, entre otras. Pero muy especialmente en
el anlisis de los datos. Las aplicaciones de la informtica a la investigacin
son importantes, teniendo en cuenta que cada vez ms la cantidad de datos
que se manejan y la variedad de anlisis que se realizan rebasan la capacidad
del clculo manual. A mediados del ao 68, nace el SPSS, como un programa
denominado Statistical Packcage for Social Sciences. Con la era del PC y
Windows evolucion muy rpidamente constituye un programa que ofrece un
conjunto de herramientas de anlisis grfico y cuantitativo, estructurado en
partes independientes e integrables que reciben el nombre de mdulos.
As, partiendo desde un mdulo base que contiene, como su propio nombre
indica, el conjunto bsico de utilidades, es posible aadir diferentes partes para
realizar una amplia gama de anlisis. Su xito en el mercado como herramienta
de anlisis fue rpido debido a su versatilidad, facilidad de uso, buen precio, y
los algoritmos robustos y continuamente mejorados que lo integran. Como
muestra de ello la prctica en casi todas las Universidades de Europa, Amrica,
Asia, Latino Amrica y el resto del mundo son usuarios de este producto.
La presente, investigacin presenta el programa informtico spss, el anlisis

estadstico, Introduccin a la estadstica descriptiva, inferencia, teora del
muestreo, estimacin de parmetros y pruebas de hiptesis, regresin,
correlacin y anova. Junto con el respetivo anlisis que este comprende.
Teniendo como objetivo principal describir cada tema para el entendimiento y
practicidad del mismo. Puesto, que es una herramienta que da cobertura a las
distintas etapas del anlisis de datos en funcin de la perspectiva del usuario.
17
UNIDAD I EL PROGRAMA INFORMTICO SPSS Y EL ANLISIS
ESTADSTICO.
1. El Programa Informtico SPSS
1.2 Definicin de SPSS
Parafraseando, a (Castaeda Maria B, 2010), El SPSS es una potente

herramienta de tratamiento de datos, anlisis estadstico amplio, flexible, de
gestin de informacin capaz de trabajar con datos procedentes de distintos
formatos generando, desde sencillos grficos de distribuciones y estadsticos
descriptivos hasta anlisis estadsticos complejos que nos permitirn descubrir
relaciones de dependencia e interdependencia, establecer clasificaciones de
sujetos y variables, predecir comportamientos, entre otros.
SPSS son las siglas de Statistical Package for the Social Sciences, que en
su traduccin al castellano quedara como Paquete Estadstico para las
Ciencias Sociales. Es un sistema de anlisis estadstico y de gestin de datos
en un entorno grfico, utilizando mens descriptivos y cuadros de dilogo
sencillos que realizan la mayor parte del trabajo. (Pg. 15).
2. Caractersticas del SPSS
a) EL software se utiliza para clculos estadsticos.
b) Realizar la correlacin y regresin lineal, Prueba de hiptesis, T de

student, Chi cuadrado.
c) Estadsticos Bivariantes: Medias, Prueba-t, ANOVA, Correlacin,

Bivariante, Parcial, Distancias.
d) Pruebas no paramtricas.
e) Regresin Lineal.
f) Varianza
g) Trabajar con bases de datos de gran tamao.
1
h) Reconoce la recodificacin de las variables y registros segn las
necesidades del usuario.
i) Modelos de Regresin
j) Reduccin de datos: crear variables sintticas a partir de variables

colineales por medio del Anlisis Factorial.
k) Validacin de Datos: Permite al usuario realizar revisiones lgicas de la

informacin contenida en un fichero (.sav.) y obtener reportes de los
valores considerados extraos. Es similar al uso de sintaxis o scripts
para realizar revisiones de los ficheros. De la misma forma que estos
mecanismos es posterior a la digitalizacin de los datos. SPSS
Programmability Extension (SPSS 14 en adelante).
l) Clasificacin: realizar agrupaciones de observaciones o de variables

(cluster analysis) mediante tres algoritmos distintos.
m) Pruebas no paramtricas: Permite realizar distintas pruebas estadsticas

especializadas en distribuciones no normales.
n) Tablas: Admite al usuario dar un formato especial a las salidas de los

datos para su uso posterior. Existe una cierta tendencia dentro de los
usuarios y de los desarrolladores del software por dejar de lado el
sistema original de Tables para hacer uso ms extensivo de las llamadas
Custom Tables.
o) Categoras: analiza multivariados de variables normalmente categoras.

Tambin se pueden usar variables mtricas siempre que se realice el
proceso de recodificacin adecuado de las mismas.
p) Mapas: Accede la representacin geogrfica de la informacin contenida

en un fichero.
q) Pruebas Exactas: pruebas estadsticas en muestras pequeas.
2
r) Anlisis de Valores Perdidos: Regresin simple basada en imputaciones
sobre los valores ausentes.
s) Muestras Complejas: creacin de muestras estratificadas, por

conglomerados u otros tipos de muestras.
t) Sample Power (clculo de tamaos mustrales)
u) rboles de Clasificacin: formular rboles de clasificacin y/o decisin

con lo cual se puede identificar la conformacin de grupos y predecir la
conducta de sus miembros.
v) Maneja el lenguaje de programacin Python para un mejor control de

diversos procesos dentro del programa que hasta ahora eran realizados
principalmente mediante scripts (con el lenguaje SAX Basic). Existe
tambin la posibilidad de usar las tecnologas .NET de Microsoft para
hacer uso de las libreras del SPSS. Aunque algunos usuarios han
cuestionado sobre la necesidad de incluir otros lenguajes, la empresa no
tiene esto entre sus objetivos inmediatos.
Desde el SPSS/PC hay una versin adjunta denomina SPSS Student que es
un programa completo de la versin correspondiente pero limitada en su
capacidad en cuanto al nmero de registros y variables que puede procesar.
Esta versin es para fines de enseanza del manejo del programa
3. Instalar el Programa SPSS
3.1 Requisitos del sistema para el programa spss para ser instalado
en ambiente Windows
Para IBM (2013), Los requisitos mnimos de hardware y software para

SPSS Data Collection Data Entry son los siguientes:
3
3.1.1 Sistemas operativos
Microsoft Windows XP Tablet PC Edition 2005 con Service Pack 2 (x86 de

32 bits).
Microsoft Windows XP Professional (x86 de 32 bits) con Service Pack 3.
Microsoft Windows Vista con Service Pack 2 (x86 de 32 bits o x64 de 64 bits,
todas las ediciones).
Microsoft Windows 7 con Service Pack 1 (x86 de 32 bits o x64 de 64 bits,

todas las ediciones).
Microsoft Windows 8 (x86 de 32 bits o x64 de 64 bits, todas las ediciones).
3.1.2 Software
3.1.2.1 Para sistemas Microsoft XP
Microsoft .NET Framework 4 (disponible en el sitio de descargas de

Microsoft).
3.1.2.2 Para sistemas Microsoft Vista o 7
Microsoft .NET Framework 4
Microsoft Internet Explorer 8 o posterior o Firefox 10 o posterior.
3.1.3 Hardware
Procesador de clase Pentium funcionando a 1 GHz o ms. Se recomienda

2 GHz
512 MB de RAM
Un disco duro con al menos 200 MB de espacio de disco disponible y

espacio adicional para archivos de datos de Data Entry.
Unidad de CD-ROM necesaria para la instalacin.
4
Adaptador de grficos con una resolucin de 1024 x 768 o superior.
Valor para calidad de color de 16 bits como mnimo.
3.1.4 Cdigo de licencia
El cdigo de licencia, que se proporciona con el CD de instalacin de Data

Entry. Le permite instalar el sistema que ha adquirido.
4. Instrucciones
Paso 1
Utilizando una licencia de usuario individual. La licencia de usuario individual

permite instalar SPSS para Windows en un mximo de dos ordenadores
Cdigo de autorizacin. Tambin es necesario un cdigo de autorizacin, que
se proporciona (en una hoja aparte) junto con el software. Permite obtener una
licencia para Base y cualquier otro mdulo adicional de SPSS que haya
adquirido. Si no encuentra el cdigo de autorizacin, pngase en contacto con
el representante de ventas. En algunos casos, puede que tenga varios cdigos.
Todos ellos sern necesarios.
Paso 2
Debe haber iniciado sesin en el ordenador con privilegios de administrador.

Instalacin desde un CD-ROM e introduzca el CD-ROM en la unidad de CD-
ROM. La funcin de reproduccin automtica muestra un men.
Paso 3
Navegar dentro del Cd hasta la carpeta SPSS y seleccionar el sistema

operativo de acuerdo a las caractersticas de su computadora (32bits 64bits).
Ver grfico 1
5
Grfico 1 Setup del Instalador
Fuente Rodrguez, Laguna, Stabilito, Salazar, Stabilito (2016)
Luego de seleccionar su sistema operativo correspondiente, buscar el

archivo setup y darle doble click. Ver grfico 2
. Grfico 2 Sistema operativo de acuerdo a las caractersticas del Pc
Aparecer la ventana inicial de la instalacin Seleccionar Siguiente. Ver

grfico 3
6
Grfico 3 Instalacin
En esta ventana, seleccionar el tipo de instalacin. Para licencias

monousuario/usuarios individuales seleccionar la primera opcin. Seleccionar
Siguiente. Ver grfico 4.
Grfico 4 Licencias Monousuario/Usuarios
7
Aceptar los trminos de la licencia y seleccionar Siguiente
Grfico 5 Trminos de Licencia
Grfico 6 Fin de La Instalacin

Una vez finalizada la instalacin, aparecer esta ventana para iniciar con el
proceso de licenciamiento del producto. Seleccionar Aceptar. Ver grfico 6
Paso 4
Ya en esta instancia se procede a utilizar el programa. Seleccionar Introducir

los datos. Ver grfico 7
Grfico 7 Ejecutar el SPSS
8
5. Estructura del SPSS
5.1 Archivo de datos del SPSS
Permite visualizar los datos y las variables con los que vamos a trabajar.
Recoge todos los mens para trabajar con los datos y realizar los anlisis
estadsticos. Los archivos de datos tienen extensin *.sav y formato SPSS.
Para abrir un archivo de datos de este formato, seleccione en el men principal:
Archivo/Abrir/Datos. Por defecto, SPSS dar una relacin de los archivos en su
directorio con extensin *.sav. Busque y seleccione el archivo que se desee
abrir. Adems de los archivos con este formato, SPSS puede abrir archivos de
EXCEL, LOTUS 1-2-3, dBASE sin necesidad de convertirlos a un formato
intermedio ni de introducir informacin sobre la definicin de los datos.
A partir, de aplicaciones como Microsoft Excel tambin puede leer los

encabezados de las columnas como nombres de variables. Para ello elija en
los mens: Archivo/Abrir/Datos...seleccione Excel 2 (*.xls) de la lista
desplegable Archivos de tipo, aparecer el cuadro de dilogo Apertura de
origen de datos de Excel, que permite especificar si se incluyen los nombres de
las variables en la hoja de clculo, as como las casillas que se desea importar.
En Excel 5 o posterior, tambin se pueden especificar las hojas de clculo que
se desea importar. Si los encabezados de las columnas no cumplen las normas
9
de denominacin de variables de SPSS, se convertirn en nombres de
variables vlidos y los encabezados originales de las columnas se guardarn
como etiquetas de variable.
5.2 Editor de datos del SPSS
Tiene una estructura similar a la de una hoja de clculo y se utiliza para

introducir los datos que se quieren analizar. Los datos se introducen dentro de
variables. Cada variable aparece como una columna en la pantalla. En la fila
superior del editor de datos aparece un men con diferentes opciones. Cada
una de ellas da acceso a un submen. A continuacin se indican las principales
opciones junto con una breve descripcin de la utilidad de cada una de ellas.
Puede observarse que algunas de ellas ( Archivo, Edicin, Ver, Utilidades,
Ventana y?) son comunes a muchos programas basados en Windows, mientras
que Datos , Grficos , Analizar y Transformar son especificas del SPSS.
El contenido genrico de las opciones ms utilizadas es el siguiente:
Archivo Manejo de ficheros. Importacin y exportacin de ficheros de datos.
Edicin Seleccionar, cortar y pegar textos, y otros.
Ver Apariencia de la pantalla Visualizar datos o variables.
Datos Definicin y manejo de variables. Transponer, Ordenar, Seleccionar

datos.
Transformar Operaciones con los datos de las variables, funciones

aplicadas a los datos, generacin de nmeros aleatorios, crear series
temporales.
Analizar Men de mtodos estadsticos para ser aplicados sobre los datos
incluidos en las variables. Estadsticos descriptivos, Regresin, Series
temporales, entre otros.
Grficos Diferentes representaciones graficas (diagramas de barras, de

sectores, histogramas, diagramas de caja, y otros) de los datos.
10
Utilidades Para obtener informacin sobre variables y archivos, definir
conjuntos de variables y utilizar slo las variables seleccionadas en esos
conjuntos.
Es la ventana que se abre automticamente cuando se inicia una sesin de

SPSS. Muestra el contenido del archivo de datos actual. Con l, se pueden
crear nuevos archivos o modificar los ya existentes. El editor de datos
proporciona dos vistas:
a) Vista de los datos: Muestra los valores de datos reales o las etiquetas de
valor definidas. Las funciones de la vista de datos son similares a las que se
encuentran en aplicaciones de hojas de clculo, sin embargo, existen
algunas diferencias:
Cada fila representa un caso u observacin (atencin en ejercicio 1).
Las columnas son variables.
Las casillas contienen valores numricos o de cadena. A diferencia de

una hoja de clculo, las casillas del editor de datos no pueden contener
frmulas.
b) Vista de variables: Contiene descripciones de los atributos de cada variable

del archivo de datos. Aqu:
Las filas son variables.
Las columnas son caractersticas de las variables.
Una vez que nos encontramos en la ventana de edicin de datos de SPSS

podemos abrir un archivo de datos creado con anterioridad o crear un nuevo
archivo. En el caso en que queramos crear un archivo de datos nuevo, el
primer paso es el de definir las variables que formarn el archivo.
Para definir una variable se pueden seguir dos procedimientos:
11
1. Haciendo doble clic con el botn izquierdo del ratn cuando el puntero
del mismo se encuentra situado en la palabra var del extremo superior
de la columna (en vista de datos).
2. Pulsando la pestaa de vista de variables.
Para la especificacin del nombre de las variables se debe tener en cuenta:
El nombre debe comenzar por una letra. Los dems caracteres

pueden ser letras, dgitos, puntos o los smbolos @, #, _ o $.
Los nombres de variable no pueden terminar en punto.
Se debe evitar acabar los nombres de variable con subrayado (para

evitar conflictos con las variables creadas automticamente por
algunos procedimientos).
La longitud del nombre no debe exceder los 64 bytes. Normalmente,

64 bytes suelen equivaler a 64 caracteres en idiomas de un solo byte
(por ejemplo, ingls, francs, alemn, espaol, italiano, hebreo, ruso,
griego, rabe, tailands) y a 32 caracteres en los idiomas de dos
bytes (por ejemplo, japons, chino, coreano).
No se pueden utilizar espacios en blanco ni caracteres especiales

(por ejemplo, !, ?, y *).
Cada nombre de variable debe ser nico; no se permiten duplicados.
Cuando es necesario dividir los nombres largos de variable en varias

lneas en los resultados, SPSS intenta dividir las lneas aprovechando
los subrayados, los puntos y los cambios de minsculas a
maysculas.
Las palabras reservadas no se pueden utilizar como nombres de

variable. Las palabras reservadas son: ALL, AND, BY, EQ, GE, GT,
LE, LT, NE, NOT, OR, TO, WITH.
12
Una vez que se haya determinado el nombre de la variable, hay que definir sus
especificaciones:
Tipo Especfica el tipo de datos que contiene la variable. Si se pulsa

el botn tipo y luego los puntos suspensivos que aparecen en la
casilla aparece un cuadro de dialogo. Los tipos ms usuales son
numrico y cadena.
Tipo de variable especifica los tipos de datos de cada variable. Por defecto
se asume que todas las variables nuevas son numricas. Se puede utilizar Tipo
de variable para cambiar el tipo de datos. El contenido del cuadro de dilogo
Tipo de variable depende del tipo de datos seleccionado. Para algunos tipos de
datos, hay cuadros de texto para la anchura y el nmero de decimales.
5.3 Transformar Datos mediante el SPSS
Se puede realizar transformaciones de los datos de todo tipo, desde tareas

sencillas, como la agrupacin de categoras para su anlisis posterior, hasta
otras ms avanzadas, como la creacin de nuevas variables basadas en
ecuaciones complejas e instrucciones condicionales. Una vez elaborado el
archivo de datos, y previamente al anlisis estadstico de los datos es posible
modificar los datos originales presentes en el archivo.
Tales cambios pueden referirse a las variables, a los casos, o al archivo en

su conjunto. Puede interesarnos tanto la recodificacin de los valores de una
variable como la generacin de nuevas mediante transformaciones de las ya
existentes. SPSS permite generar nuevas variables mediante transformaciones
numricas efectuadas sobre las antiguas.
Supongamos que, despus de tener el archivo de datos ya introducido,

hemos detectado un error en la medicin del pH debido a que el aparato
utilizado incrementa en 0,3 unidades todas las mediciones que realiza.
Convendra generar una nueva variable que incorporara esta correccin. Ver
grfico 8.
Para ello elegimos Transformar/ Calcular, y realizamos los siguientes pasos:
13
1. Asignar un nombre y un tipo (por defecto ser numrica) a la nueva
variable en el cuadro de texto de la Variable de destino, en nuestro caso
new_pH
2. definir la Expresin numrica que va a permitir calcular los valores de la

misma. Para ello utilizaremos los nombres de las variables del archivo
(podemos escribirlos o seleccionarlos del listado que aparece),
constantes, operadores y funciones.
Grfico 5 Transformar Datos mediante el SPSS
Tomado: https://hhperez.webs.ull.es/mei_mec/Practicas (2009)
3. pulsa Aceptar.
Para construir estas expresiones pueden usarse operadores aritmticos

como +, -, *, /, ** y funciones como SQRT, EXP, LG10, LN, ARTAN, COS, SIN,
ABS, MOD10, TRUNC, RND, entre otras muchas:
1. MOD10 Resto resultante de dividir entre 10.
2. TRUNC Parte entera de un nmero.
3. RND Redondeo al entero ms cercano.
Existen funciones particulares como UNIFORM y NORMAL, que se utilizan

para la generacin de variables aleatorias. Son de bastante utilidad en estudios
de simulacin. Es importante tener cuidado con el orden de utilizacin de los
14
operadores y no olvidar que los valores antiguos pierden su vigencia al
recodificar una variable sobre el mismo nombre.
El botn SI permite realizar modificaciones similares, pero sujetas a que se

verifique una condicin lgica. Se incluirn aquellos casos que verifiquen la
condicin. Los que no la cumplan pasarn a ser valores ausentes definidos por
el sistema.
5.3.1 Recodificacin de una Variable
A partir de una variable podemos crear otra cuyos valores sean una
recodificacin de los de la primera. Esta recodificacin podemos hacerla tanto
en la misma variable como en variables diferentes. Para ello, seleccionaremos
Transformar/Recodificar/En distintas variables... Se abre una ventana en la que
deberemos asignar un nombre (y una etiqueta si queremos) a la nueva
variable.
5.3.2 Filtrado de datos
El programa SPSS permite seleccionar determinados casos para un prximo

proceso, bien temporalmente o de forma permanente, sobre la base de un
criterio lgico o de una decisin aleatoria. Para ello seleccionaremos el men
Datos/Seleccionar casos.
5.4 Modificar archivos de datos en el SPSS
Este programa dispone de un gran nmero de opciones que permiten

calcular nuevas variables a partir de las existentes, modificar las variables
existentes en el archivo o bien recodificarlas. Estas opciones pueden aplicarse
a todos los casos o slo a algunos casos seleccionados.
Los archivos de datos no siempre estn organizados de forma idnea:

Cambiar el orden de casos transponer las filas y las columnas mezclar en uno
o varios archivos diferentes seleccionar slo unos pocos casos para el anlisis.
15
Ordenar casos Opcin Ordenar Casos permite cambiar el orden de los
casos (Orden de las filas del Editor de datos) utilizando 1 o ms variables.
Sirve para preparar fusin de archivos.
Ordenar por variables trasladadas a la lista de variables. Si utiliza las

de una variable el orden resultante viene determinado por la
secuencia de las variables seleccionadas.
Orden de clasificacin
1) Ordenacin por variable numrica. Opcin Ascendente, ordena los

casos Menor a mayor.
2) Colocacin variable de cadena. Ordena alfabticamente (Maysculas-

Preceden a las Minsculas) Opcin Descendente ordenacin forma
inversa a la opcin Ascendente.
5.4.1 Trasponer archivos
En los archivos SPSS se asume que Filas representan casos / Columnas

variables. Cuando importamos datos de una fuente externa en la que las filas
representan variables y las columnas casos. La opcin Transponer permite
crear un nuevo archivo con los datos transpuestos (Filas convertidas en
Columnas Columnas en filas). Las Variables, solo pasan a formar parte del
nuevo archivo transpuesto, las variables trasladadas a esa lista, serian
Variables de Nombre, las variables (1 por caso) son nombradas Var001,
Var002, y as sucesivamente.
Los nuevos nombres pueden ser valores de alguna de las variables del
archivo (antes de ser transpuesto) y estos deben trasladarse al nuevo cuadro.
Si la variable es numrica, nuevos nombres comienzan con la letra V. Si el
valor excede de 8 caracteres, solo se toman los 8 primeros.
Si los valores de la variable propuesta no son los nicos, a cada valor

repetido se le asigna un nmero secuencial al final. El Visor de resultados
ofrece un listado con los nombres asignados las nuevas variables.
16
5.4.2 Fundir Archivos
El SPSS permite combinaren un solo archivo los datos de archivos

diferentes. Existen 2 posibilidades:
1) Aadir Casos. Combinar archivos que contienen las mismas variables,

pero casos diferentes.
2) Aadir Variables. Combinar archivos que contienen mismos casos, pero

distintas variables.
5.4.3 Agregar Datos
Consiste en agrupar varios casos en uno solo. La opcin Agregar crea un

nuevo archivo de datos en el que cada caso representa a un conjunto de casos
del archivo original. (Menos casos del archivo original)
Agregar variables: Agrupadas niveles de una o ms variables. Agregar

variables: Variables del nuevo archivo se obtienen a partir de variables del
archivo original.
Segmentar archivos:
Consiste en dividirlo en subgrupos.
Analizar todos los casos, no crear grupos.
Comparar los grupos.
Organizar los resultados por grupos. Se activa la Segmentacin y los

anlisis solicitados, a partir de ese momento se repiten para cada
segmento.
Ordenar archivo segn variables de segmentacin. Ordena por

segmentos los casos del archivo de datos
El archivo ya est ordenado. Impide que los casos sean ordenados.
17
5.4.4 Seleccionar archivos
Centrar el anlisis en slo un grupo de casos que cumplan determinada

condicin o muestra aleatoria del total de casos del archivo de datos.
Conjunto de casos utilizando diferentes criterios, valores o rangos de

una variable, nmero de registro, expresiones aritmticas y lgicas.
5.4.5 Ponderar casos
Hacer un registro represente a ms de un caso.
Resultado de la ponderacin, es justamente el inverso de la agregacin.
5.5 El visor del SPSS
Los archivos (ventanas) de resultados se encargan de recoger toda la

informacin (estadsticos, tablas, grficos, texto, y otros.) que el SPSS genera
como consecuencia de las acciones que lleva a cabo.
Al ejecutar un procedimiento SPSS cualquiera, los resultados son

automticamente enva dos a una ventana llamada Visor. Si la ventana del
Visor no se encuentra abierta, se abre automticamente para recoger los
resultados. Desde el Visor es posible efectuar una amplia variedad de acciones
de edicin, moverse fcilmente por los resultados, guardarlos para su uso
posterior, imprimirlos, exportarlos a una aplicacin externa, mostrar u ocultar
tablas y grficos, cambiar el orden de presentacin de los resultados moviendo
los distintos elementos. El Visor del SPSS 2 El Visor de resultados El SPSS
abre automticamente una ventana del Visor la primera vez que se ejecuta un
procedimiento que requiere de la presentacin de resultados. Esta ventana
recibe, por defecto, el nombre Resultado1.
La ventana del Visor se encuentra dividida verticalmente en dos paneles: el

Esquema del Visor y el Contenido del Visor. Ver grfico 9
Grfico 6 Venta de Visor
18

.
El panel izquierdo, al que llamaremos Esquema del Visor, muestra un ndice

con los titulares correspondientes a los resultados generados por el SPSS.
Estos titulares son de dos clases: encabezados y ttulos. Los encabezados van
precedidos de un icono amarillo y sirven para indicar el comienzo de un bloque
de resultados (un bloque de resultados es el conjunto de resultados generados
por un nico procedimiento SPSS). Los encabezados no estn asociados a un
resultado concreto, sino a todo un bloque. Los ttulos cuelgan de los
encabezados y van precedidos de iconos en forma de libro (abierto o cerrado,
segn veremos ms adelante). Cada ttulo se corresponde con un resultado
concreto. Puede cambiarse el tamao de este panel pinchando y arrastrando
su borde derecho.
El panel derecho muestra el Contenido del Visor, es decir, los resultados

generados por el SPSS. Cada bloque de resultados consta de un conjunto de
objetos de resultado (ttulos, no- tas aclaratorias, tablas, grficos, advertencias,
etc.). A cada uno de esos objetos le corresponde un ttulo (una lnea de texto)
en el Esquema del Visor. Los distintos objetos de resultados del Visor adoptan
tres formatos bsicos: texto, tablas y grficos; el SPSS incluye, para cada uno
de estos tres formatos, un editor que permite efectuar todo tipo de
modificaciones. La versin borrador del Visor tiene aspecto de procesador de
texto (la ventana no est partida en dos paneles) y, segn hemos sealado ya,
muestra los resultados en formato texto.
19
Para trabajar con el Visor en formato borrador:
Seleccionar la opcin Opciones del men Edicin.
En el recuadro Tipo de resultados al arrancar, marcar la opcin Visor

de borrador.
5.5 Archivo de sntesis del SPSS
El SPSS tiene implementados un elevadsimo nmero de anlisis

estadsticos, la mayora de ellos bajo el epgrafe Anlisis del men principal. Al
igual que en el apartado relativo a los grficos, un conocimiento profundo de los
datos y una idea clara de las preguntas que se desean responder facilitarn el
correcto uso y el mximo aprovechamiento de los anlisis estadsticos
disponibles. A continuacin se describe brevemente una serie de anlisis
estadsticos bsicos de uso frecuente.
Al contrario que con los procedimientos grficos, es evidente que, en este

caso, la experimentacin con los distintos anlisis est desaconsejada. La
eleccin de un procedimiento u otro depender del tipo de hiptesis que se
desee contrastar.
6. Anlisis Estadstico con el SPSS
El SPSS funciona como un verdadero sistema ya manejando de forma

integrada un sistema de base de datos (DBSM), con el que interacta un
conjunto ordenado de mdulos y comandos, los cuales estn estructurados y
relacionados para efectuar los procedimientos estadsticos, sobre las
entradas o variable y producir las salidas deseadas o reportes, lo que el
SPSS analiza como sistema son los elementos definidos por la variables de
estudio y las relaciones entre ellas. Esta es la estructura imaginaria en la
cual se basa el SPSS, para realizar los anlisis estadsticos que transforman
los insumos (input/datos), en productos (output/hojas de salidas).
20
Grfico 7 Anlisis Estadstico SPSS
Fuente (Pedroza y Discovskyi , 2006)
La idea bsica con que funciona el SPSS como sistema de anlisis es, que
el conjunto de elementos organizados, dado por las variables cualitativas y
cuantitativas, se encuentran en una interaccin o flujo continuo, buscando
como cumplir una meta en comn. Para lograr tal meta, el SPSS acta sobre
los datos organizados en una estructura lgica, dentro de una base de datos,
para producir la informacin de salida, como nuevos hallazgos o
conocimientos, resultado del anlisis estadstico realizado.Como el sistema el
SPSS establece diferentes relaciones entre sus elementos (variables), las que
dentro del SPSS son relaciones sinrgicas fundamentales ya que interactan
con cada uno de los mdulos (subsistema) y entre los comandos (sub-sistemas
dentro de los mdulos), es decir, se refuerzan entre su para obtener los
objetivos comunes; esto hace que el SPSS se comporte como un sistema ideal
con relaciones optimizadas entre variables.
Es importante destacar que en el sistema de anlisis estadstico, con el

SPSS las interrelaciones entre las variables son orientadas al logro del
resultado deseado, con mucha efectividad, de manera que su procedimiento de
anlisis estadstico conduzca al objetivo deseado, todo ello realizado en un
ambiente grfico, en el cual todo el sistema SPSS est inmerso.
21
Tal como se expresa en el sitio web, http:www.spss.la/soluciones/anlisis-
encuesta.htm, el sistema de anlisis estadstico con el SPSS facilita bases de
datos desde internet, incluir datos de cuestionarios, desde hojas electrnicas,
desde otras bases de datos , encuestas telefnicas y/o entrevistas personales
entre otras.
Esta herramienta reduce en gran medida el tiempo empleado en preparar los

datos extrados de las encuestas para realizar el anlisis de la informacin. El
SPSS ofrece a los usuarios una amplia gama de estadsticas y tcnicas para el
procesamiento de datos, siempre que en cuente con la preparacin apropiada
para realizar el anlisis de los datos. Depender del inters del usuario elegir el
procedimiento que considere ms adecuado segn los objetivos y el tipo de
variables en estudio para obtener los reportes de salida desde, (SPSS, 2004).
7. Aplicacin del SPSS en estadstica inferencial
Comprende mtodos y procedimientos para deducir propiedades, es decir,

hacer inferencias, de una poblacin, a partir de una pequea parte de la
misma, o sea, de una muestra. A travs de ella se realizan generalizaciones o
se toman decisiones sobre la base de la informacin obtenida de la muestra.
Dicha muestra es un subconjunto de la poblacin objetivo sobre la cual se
desea inferir o deducir. En la estadstica inferencial suele plantearse un
problema o una incgnita que pueda resolverse en trminos de estadstica,
unas caractersticas a estudiar, de las cuales se derivan las variables y unos
objetivos que permitan que arribar a conclusiones amplias acerca de esas
variables en estudio. La estadstica inferencial nos permite estimar parmetros
poblacionales a partir de la muestra utilizada, as como realizar el contraste de
hiptesis. Los test estadsticos aplicados dependern de la naturaleza de
nuestros datos y tipo de variables.
22
8. Solucin de problemas estadsticos con el spss
Ejercicios con el SPSS
Se est interesado en estudiar si el cambio en frecuencia cardiaca

observado tras la realizacin de una prueba de ejercicio se ve afectado por la
edad de los sujetos sometidos a tal prueba. Para contrastar dicha hiptesis se
plantea una investigacin en la que se seleccionan 10 individuos. Todos los
individuos realizan una prueba de esfuerzo de 12 minutos. Los datos se
presentan en la siguiente tabla. Ver grfico 11
Grfico 8 Frecuencia Cardiaca
Luego vamos para la pestaa de analizar y seleccionamos estadstica

descriptiva, le damos click a frecuencias seleccionamos la variables a estudiar
seguidamente en la barra superior derecha seleccionamos estadsticos. Ver
grfico 12. Y tildamos las opciones que necesitamos (Tendencia central,
Dispersin o distribucin), para este ejemplo tildaremos todos los sub mens.
Ver grfico 13. Y de continuar. Y luego aceptar.
23
Grfico 9 Analizar con el SPSS
Grfico 10 Seleccin Frecuencias: Estadsticos
24
Grfico 11 Solucin de Ejemplo
25
UNIDAD II INTRODUCCIN A LA ESTADSTICA DESCRIPTIVA
9. Estadstica
9.1 Concepto
Para (Ross, 2007), La estadstica es una de las ramas de la ciencia

matemtica que se centra en el trabajo con datos e informaciones que son ya
de por s numricos o que ella misma se encarga de transformar en nmeros.
La estadstica, si bien es una ciencia de extraccin exacta, tiene una injerencia
directa en cuestiones sociales por lo cual su utilidad prctica es mucho ms
comprensible que lo que sucede normalmente con otras ciencias exactas como
la matemtica. Pg. 3
A diferencia de otras ramas de la matemtica que poseen una parte

importante de abstraccin, la estadstica tiene aplicaciones directas y concretas
en la vida real ya que toma los nmeros y cifras de diferentes fenmenos
sociales como por ejemplo la desocupacin, la tasa de mortalidad, la de
natalidad y muchos otros datos incluso ms complejos.
10. Importancia de la estadstica
Podemos decir que la funcin principal de la estadstica es justamente la

recoleccin y agrupamiento de datos de diverso tipo para construir con ellos
informes estadsticos que nos den idea sobre diferentes y muy variados temas,
siempre desde un punto de vista cuantitativo y no cualitativo. Esto es muy
importante de remarcar ya que la estadstica se convierte entonces en una
ciencia que nos habla de cantidades (por ejemplo, cuntas personas viven en
un pas por metro cuadrado) pero no nos da informacin directa sobre la
calidad de vida de esas personas. En este sentido podemos decir que se
presentan varias limitaciones ya que no permite conocer ms que
numricamente aspectos que requieren un trabajo ms complejo y profundo.
Sin embargo, a pesar de lo mencionado en el prrafo anterior, lo interesante

de la estadstica como ciencia es que en muchos casos, la informacin
26
cuantitativa que nos brinda nos permite conocer a ese nivel mucho mejor a una
sociedad, por ejemplo cuntas personas viven en un pas, cul es la tasa de
desempleo, cul es la tasa de indigencia o pobreza, cul es el nivel promedio
de educacin de esa sociedad, entre otros aspectos.
Por lo tanto, todos estos datos numricos son utilizados por los responsables
del Estado a travs de sus distintos organismos y secretaras para luego
realizar proyectos de diferente tipo que tengan que ver con mejorar esa
situacin o mantenerla en el caso de que sea buena. En algunos casos,
aunque no directamente, la estadstica tambin nos permite inferir (no conocer)
la calidad de vida de una poblacin ya que si encontramos altas tasas de
desempleo, pobreza y marginalidad podremos suponer que la calidad de vida
es muy baja.
La estadstica tiene una utilidad no slo en aspectos sociales sino que

tambin sirve para todo tipo de investigacin cientfica si se tiene en cuenta que
los datos estadsticos son el resultado de varios casos de entre los cuales se
toma un promedio. As, una estadstica puede servir para una investigacin
cientfica al demostrar que un porcentaje determinado de los casos observados
represent un resultado particular y no otro. Tambin se utiliza por ejemplo para
conocer el planeta en el que vivimos y darnos datos sobre las proporciones de
recursos renovables, sobre las superficies de los pases, la presencia de
determinados biomas o no.
11. Estadstica Descriptiva
La estadstica descriptiva es la parte de las matemticas que se ocupa de

los mtodos para recoger, organizar, resumir y analizar datos, as como para
sacar conclusiones vlidas y tomar decisiones razonables basadas en tal
anlisis. Es el punto de partida del anlisis de un grupo de datos que involucran
una cierta complejidad, o bien puede ser el todo de un anlisis bsico y limitado
del grupo de datos.
27
11.1 Conceptos Bsicos
11.1.1 Poblacin
Es una coleccin finita o infinita de elementos con caractersticas comunes.

Ejemplo: las personas, libros de una biblioteca, etc. Algunas poblaciones son
finitas y pueden conocerse; otras pueden ser infinitas y abstractas: Ej. el
conjunto de hoteles, establecimientos comerciales de una ciudad o el conjunto
de todas las piezas fabricadas por una mquina.
11.1.2 Variable
Toda caracterstica que puede tomar diferentes valores (Ej. nmero de hijos,
precio de la habitacin) Las variables se suelen denotar por letras maysculas:
(X, Y,...)
11.1.2.1 Tipos de variables
11.1.2.2 Cualitativas o Categricas
Son aquellas que no son medibles, es decir, aquellas cuyas observaciones

no tienen carcter numrico. Expresan cualidades o categoras. Ej. estado civil,
sexo o profesin. (A las variables cualitativas tambin se les llama atributos).
Es el mtodo y tcnicas necesarias para explicar el comportamiento de un

grupo de datos, sobrepasando los lmites de conocimiento inicial que estos
suministran, examinando solo una parte de la poblacin denominada muestra.
11.1.2.3 Cuantitativas:
Son medibles, es decir sus observaciones tienen carcter numrico. Estas

se dividen a su vez en:
Discretas
Toman valores enteros en un conjunto numerable. Ej. Nmero de

habitaciones de un hotel, nmero de hijos de una familia, nmero de obreros de
una fbrica.
28
Continuas
Toman valores en un conjunto no numerable (los nmeros reales o un

intervalo). Ej. peso, estatura.
12. Recoleccin, organizacin y presentacin de los datos.
Los especialistas en estadstica seleccionan sus observaciones de manera

que todos los grupos relevantes estn representados en los datos. Para
determinar el mercado potencial de un nuevo producto, por ejemplo, los
analistas podran estudiar cien consumidores de cierta rea geogrfica. Dichos
analistas deben tener la certeza de que este grupo incluya personas que
representan distintas variables como nivel de ingresos, raza, nivel educativo y
vecindario.
Por lo tanto, los datos pueden provenir de observaciones reales o de

registros elaborados con otros propsitos. Esta informacin puede organizarse
para producir datos que los especialistas en estadstica puedan describir e
interpretar. Tambin, ayudan a los responsables de tomar decisiones a hacer
suposiciones razonadas acerca de las causas y, por tanto, de los efectos
probables de ciertas caractersticas en situaciones dadas.
As mismo, cuando los datos se ordenan de manera compacta y til, los

responsables de tomar decisiones pueden obtener informacin confiable sobre
el entorno y usarla para tomar decisiones inteligentes. Por ende, los datos
pueden organizarse de muchas maneras. Podemos, simplemente recolectarlos
y mantenerlos en orden. O, si las observaciones estn hechas con nmeros,
podemos hacer una lista de los datos puntuales de menor a mayor segn su
valor numrico. Tambin podemos presentar los datos puntuales en orden
alfabtico o mediante algn principio de organizacin.
Una forma, comn de organizar los datos consiste en dividirlos en categoras

o clases parecidas y luego contar El nmero de observaciones que quedan
dentro de cada categora. Este mtodo produce una distribucin de
frecuencias. Para organizar los datos tiene como fin permitirnos ver
29
rpidamente algunas de las caractersticas de los datos recogidos. Buscamos
cosas como el alcance (los valores mayor y menor), patrones evidentes,
alrededor de qu valores tienden a agruparse los datos, qu valores aparecen
con ms frecuencia, etc. Cuanta ms informacin de este tipo podamos
obtener de una muestra, mejor entenderemos la poblacin de la cual proviene,
y mejor ser nuestra toma de decisiones.
Es as, que una ordenacin de datos es una de las formas ms sencillas de

presentarlos: organiza los valores en orden ascendente o descendente.
La ordenacin de datos ofrece varias ventajas con respecto a los datos sin
procesar:
1. Podemos identificar los valores mayor y menor rpidamente.

2. Es fcil dividir los datos en secciones.
3. Podemos ver si algunos valores aparecen ms de una vez en el arreglo.
Los valores iguales quedan juntos.
4. Podemos observar la distancia entre valores sucesivos de los datos.
A pesar de las ventajas, en algunas ocasiones un ordenamiento de datos no

resulta til. Como da una lista de todos los valores, es una forma incmoda de
mostrar grandes cantidades de datos. Suele ser necesario comprimir la
informacin sin que pierda su utilidad para la interpretacin y la toma de
decisiones; y para ello utilizamos lo que se conoce como distribucin de
frecuencia.
13. Datos agrupados y no agrupados:
Los datos agrupados son aquellos que pertenecen a un tamao de muestra

mayor a 20 o ms elementos, por lo que para ser analizados requieren ser
agrupados en clases a partir de ciertas caractersticas.
Su objetivo es resumir informacin

Comnmente, pertenecen a una muestra mayor a 20 elementos, por lo
cual requieren ser agrupados, esto implica: ordenar, clasificar y
expresarlos en una tabla de frecuencias.
30
Se agrupan los datos, esto quiere decir que se pueden clasificar de
forma coherente y lgica mediante una tabla de frecuencias.
La agrupacin de los datos puede ser simple o mediante intervalos de
clase.
Los datos no agrupados son aquellos datos cuya muestra es menor a 20

elementos, por lo que para ser analizados, no requieren ser agrupados.
14. Distribucin de frecuencia
Es una ordenacin en forma de tabla de los datos estadsticos, asignando a

cada dato su frecuencia correspondiente. En estadstica, se le llama
distribucin de frecuencias a la agrupacin de datos en categoras mutuamente
excluyentes que indican el nmero de observaciones en cada categora.1 Esto
proporciona un valor aadido a la agrupacin de datos. La distribucin de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver
el nmero existente en cada clase. Estas agrupaciones de datos suelen estar
agrupadas en forma de tablas.
Una distribucin de frecuencias es un formato tabular en la que se organizan

los datos en clases, es decir, en grupos de valores que describen una
caracterstica de los datos y muestra el nmero de observaciones del conjunto
de datos que caen en cada una de las clases.
La tabla de frecuencias ayuda a agrupar cualquier tipo de dato numrico. En

principio, en la tabla de frecuencias se detalla cada uno de los valores
diferentes en el conjunto de datos junto con el nmero de veces que aparece,
es decir, su Frecuencia. Se puede complementar la frecuencia absoluta con la
denominada frecuencia relativa, que indica la frecuencia en porcentaje sobre el
total de datos. En variables cuantitativas se distinguen por otra parte la
frecuencia simple y la frecuencia acumulada.
La tabla de frecuencias puede representar grficamente en un histograma

(Diagrama De Barras). Normalmente en el eje vertical se coloca las frecuencias
y en el horizontal los intervalos de valores.
31
14.1 Tipos de frecuencias
14.1.1 Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado

valor en un estudio estadstico.
Se representa por f i .
La suma de las frecuencias absolutas es igual al nmero total de datos, que

se representa por N. Para indicar resumidamente estas sumas se utiliza la letra
griega (sigma mayscula) que se lee suma o sumatoria.
Para indicar resumidamente estas sumas se utiliza la letra griega (sigma

mayscula) que se lee suma o sumatoria.
14.1.2 Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un

determinado valor y el nmero total de datos. Se puede expresar en tantos por
ciento y se representa por n i
32
La suma de las frecuencias relativas es igual a 1.
14.1.3 Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos

los valores inferiores o iguales al valor considerado. Se representa por F i .
14.1.4 Frecuencia relativa acumulada
La frecuencia relativa acumulada es el cociente entre la frecuencia

acumulada de un determinado valor y el nmero total de datos. Se puede
expresar en tantos por ciento.
14.1.5 Distribucin de frecuencias agrupadas
La distribucin de frecuencias agrupadas o tabla con datos agrupados se

emplea si las variables toman un nmero grande de valores o la variable es
continua. Se agrupan los valores en intervalos que tengan la misma amplitud
denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Lmites de la clase
Cada clase est delimitada por el lmite inferior de la clase y el lmite superior
de la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el lmite superior e inferior de la

clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que

representa a todo el intervalo para el clculo de algunos parmetros.
14.1.6 Construccin de tablas de frecuencia
Generalmente, las tablas se confeccionan a partir de dos tipos de datos, uno

cualitativo, es decir que determina una caracterstica o cualidad y otro
cuantitativo, que determina un nmero o cantidad. La idea es que se pueda leer
33
un dato que indique una caracterstica y a la vez pueda indicar una cantidad,
confeccionemos una tabla para ver cmo se hace. Para construir la tabla de
frecuencias simplemente se debe ordenar las frecuencias
1. En la primera columna se ordenan de menor a mayor los diferentes

valores que tiene la variable en el conjunto de datos.
2. En las siguientes columnas (segunda y tercera) se ponen las frecuencias
absolutas y las frecuencias absolutas acumuladas.
3. Las columnas cuarta y quinta contienen la las frecuencias relativas y
las frecuencias relativas acumuladas.
4. Adicionalmente (opcional) se pueden incluir dos columnas (sexta y
sptima), representando la frecuencia relativa y la frecuencia relativa
acumulada como tanto por cien. Estos porcentajes se obtienen
multiplicando las dos frecuencias por cien. Ver tabla 1 y 2.
Tabla 1 Tabla de Frecuencia
Fuente escolares.net (2016)
34
Se puede incluir las frecuencias acumuladas (frecuencia acumulada y
frecuencia relativa acumulada). Esto se calcula sumando el dato anterior al
dato del momento, en el caso del ejemplo quedara de la siguiente forma:
Tabla 2 Frecuencias Acumulada, Relativa Acumulada
Fuente escolares.net (2016)
Las tablas resultan tiles para el ordenamiento de la informacin, sobre todo

cuando se requiere presentar la informacin o extraer informacin para graficar.
14.1.7 Histogramas
Uno de los procedimientos grficos ms utilizados en el anlisis de variables

de Escala es el Histograma, a travs de l se puede reunir los valores de una
variable en grupos con un mismo rango o distancia denominados intervalos o
clases, los cuales a su vez incorporan el recuento del nmero de casos dentro
de cada grupo. Este recuento o frecuencia, se puede expresar en forma de
porcentaje, lo que es especialmente til para comparar conjuntos de datos de
diferentes tamaos o unidades de medida.
A travs del histograma se puede detectar parmetros como los valores

atpicos y las desviaciones de la asimetra, quienes nos pueden indicar si la
variable es o no adecuada para ser analizada mediante un procedimiento que
asuma una distribucin normal.
35
14.1.7.1 Crear un histograma con el SPSS
Para el ejemplo que generaremos ser el de un histograma que

describa el comportamiento de los datos de la variable Edad del Alumno.
Ver grfico 15.
Grfico 15 Listado de Variable de inters
Para realizarlo debemos ubicar en el listado la variable de inters e

seleccionar; sucesivamente vamos a la pestaa de grficos y
seleccionamos histogramas. Ver grfico 16
36
Grfico 12 Seleccin de Variable
Y en ella seleccionamos la variable que se quiere representar, luego la

aadimos a seleccin variable, y luego tildamos Curva normal. Para
finalizar hacemos clic en Aceptar y el grfico se crea en el visor de
resultados. Ver grfico 17
Grfico 13 Men de grfico e Histograma
37

14.1.8 Polgonos simples y acumulativos
Para, (Luceo y Gonzlez, 2006), el Polgono Simple ningn costado del

polgono intersecta con otro es una forma de representacin de uso menos
comn, y muy parecida a las grficas de lneas. Es una clase de grfico que se
crea a partir de un histograma de frecuencia. Estos histogramas emplean
38
columnas verticales para reflejar frecuencias): el polgono de frecuencia es
realizado uniendo los puntos de mayor altura de estas columnas. Por lo tanto,
podramos establecer que un polgono de frecuencia es aquel que se forma a
partir de la unin de los distintos puntos medios de las cimas de las columnas
que configuran lo que es un histograma de frecuencia. Pg. 11.
Este se caracteriza porque utiliza siempre lo que son columnas de tipo

vertical y porque nunca debe haber espacios entre lo que son unas y otras. En
las ciencias sociales, en las ciencias naturales y tambin en las econmicas es
donde con ms frecuencia se hace uso de estos mencionados histogramas ya
que se emplean para llevar a cabo lo que es la comparacin de los resultados
de un proceso determinado.
Grfico 14 Polgono Simple
Tomado: http://www.calest.info/CalEst.aspx (2016)
Polgono de frecuencia acumulativa tambin se le conoce como ojiva, se

utiliza para representar la frecuencia acumulada. Similar al Polgono de
frecuencia, se forma o se construye uniendo los puntos ms altos de cada
columna, pero de un Histograma que represente las Frecuencias Acumuladas.
Al estar construido en funcin de las frecuencias acumuladas permite ver
cuntas observaciones se encuentran por encima o debajo de ciertos valores,
39
en lugar de solo exhibir los nmeros asignados a cada intervalo. Si se
representan las frecuencias acumuladas de una tabla de datos agrupados se
obtiene el histograma de frecuencias acumuladas y su correspondiente
polgono de frecuencias acumuladas.
Grfico 19 Polgono de Frecuencia Acumuladas
Tomado http://www.vitutor.net (2016)
15. Grficos
15.1 Definicin
Un grfico estadstico es una representacin visual de una serie de datos

estadsticos. Es una herramienta muy eficaz, ya que un buen grfico debe de
representar la informacin de forma sencilla, clara y precisa. Y facilita la
comparacin de datos y destaca las tendencias y las diferencias.
15.1.1 Tipos de datos
15.1.2 Cualitativos
Se refieren a cualidades o modalidades que no pueden expresarse

numricamente. Pueden ser:
40
Ordinales
Si siguen un orden o secuencia (ej. el abecedario, los meses del ao).
Categricos
Si no siguen ningn orden (ej. el estado civil de las personas: solteros,

casados, viudos, divorciados y separados).
15.1.3 Cuantitativos
Se refieren a cantidades o valores numricos. Pueden ser:
Discretos
Si toman valores enteros (0, 1, 2, 3...). Ej. El nmero de hijos, el nmero de

alumnos de una clase.
Continuos
Pueden tomar cualquier valor dentro de un intervalo (ej. la estatura o el peso

de las personas).
15.2 Tipos de Grficos
15.2.1 Grfico de barras
Un grfico de barras es una representacin grfica en un eje cartesiano de

las frecuencias de una variable cualitativa o discreta. es una grfica para
representar los datos cualitativos de una distribucin de frecuencia, de
frecuencia relativa o de frecuencia porcentual. En uno de los ejes de la grfica
(por lo general en el horizontal), se especifican las etiquetas empleadas para
las clases (categoras).
Para el otro eje de la grfica (el vertical) se usa una escala para frecuencia,
frecuencia relativa o frecuencia porcentual. Despus, empleando un ancho de
barra fijo, se dibuja sobre cada etiqueta de las clases una barra que se
extiende hasta la frecuencia, frecuencia relativa o frecuencia porcentual de la
41
clase. Cuando se tienen datos cualitativos, las barras deben estar separadas
para hacer nfasis en que cada clase est separada.
15.2.2 Grfico de lneas
Un grfico de lneas es una representacin grfica en un eje cartesiano de la

relacin que existe entre dos variables reflejando con claridad los cambios
producidos.
15.2.3 Grfico de Pareto
Es un tipo de grfico de barras vertical ordenado por frecuencias de forma

descendente que identifica y da un orden de prioridad a los datos.
15.2.4 Grfico de sectores
Es una representacin circular de las frecuencias relativas de una variable

cualitativa o discreta que permite, de una manera sencilla y rpida, su
comparacin.
15.2.5 Grfica de pastel
Es una grfica para presentar distribuciones de frecuencia relativa y de

frecuencia porcentual de datos cualitativos. Para elaborar una grfica de pastel,
primero se dibuja un crculo que representa todos los datos. Despus se usa la
frecuencia relativa para subdividir el crculo en sectores, o partes, que
corresponden a la frecuencia relativa de cada clase.
15.2.6 Grfico de dispersin
Un grfico de dispersin muestra en un eje cartesiano la relacin que existe

entre dos variables. Este grfico nos informa del grado de correlacin entre las
dos variables, es decir, nos muestra si el incremento o disminucin de los
valores de una de las variables, denominada variable independiente y que se
suele representar en el eje horizontal, altera de alguna manera los valores de la
42
otra, denominada variable dependiente y que representa generalmente en el
eje vertical. En el ejemplo, el consumo de fertilizantes nitrogenados de cada
pas est representado en el eje horizontal y la produccin agrcola en el
vertical.
15.2.7 Cartograma
Es un mapa en el que se presentan datos estadsticos por regiones bien

poniendo el nmero o coloreando las distintas zonas en funcin del dato que
representan.
15.3.8 Grfico de sectores
Es una representacin circular de las frecuencias relativas de una variable

cualitativa o discreta que permite, de una manera sencilla y rpida, su
comparacin. El crculo representa la totalidad que se quiere observar (en el
ejemplo, total de viajeros hospedados en hoteles) y cada porcin, llamadas
sectores, representan la proporcin de cada categora de la variable (en el
ejemplo, tipo de hotel) respecto el total. Suele expresarse en porcentajes.
15.3.9 Barra simple
Se emplean para graficar hechos nicos .el diagrama de barras proporciona

informacin comparativa principalmente y este es su uso principal, este
diagrama tambin muestra la informacin referente a las frecuencias.
15.3.10 Barras mltiples
Es muy recomendable para comprar una serie estadstica con otra, para ello
emplea barras simples se distinto color o tramado en un mismo plano
cartesiano, una al lado de la otra.
15.3.11 Grficos circulares
Estos grficos nos permiten ver la distribucin interna de los datos que
representan un hecho, en forma de porcentajes sobre un total. Se suele
separar el sector correspondiente al mayor o menor valor, segn lo que se
desee destacar. Se pueden ser: en dos y tres dimensiones.
43
15.3.12 Grficos de reas
En estos tipos de grficos se busca mostrar la tendencia de la informacin

generalmente en un perodo de tiempo. Pueden ser: para representar una
serie, dos o ms series, dos dimensiones, en tres dimensiones.
15.3.13 Grficos Mixtos
En estos tipos de grficos se representan dos o ms series de datos, cada

una con un tipo diferente de grfico. Son grficos ms vistosos y se usan para
resaltar las diferencias entre las series.
15.3.14 Histogramas
Estos tipos de grficos se utilizan para representar distribuciones de

frecuencias. En algunos software especficos para estadstica grafican la curva
de Gauss superpuesta con el histograma.
16. Medidas de Tendencia Central
Las medidas de tendencia central son valores que se ubican al centro de un

conjunto de datos ordenados segn su magnitud. Generalmente se utilizan 4
de estos valores tambin conocidos como estadgrafos, la media aritmtica, la
mediana, la moda y al rango medio.
17. La Media Aritmtica
Es la suma de un conjunto de observaciones dividida por el nmero de las

mismas. Es, probablemente, uno de los parmetros estadsticos ms
extendidos. Se le llama tambin promedio o, simplemente, media.
La media aritmtica, como un solo nmero que representa a un conjunto de

datos completo, tiene importantes ventajas. Primero, se trata de un concepto
familiar para la mayora de las personas y es intuitivamente claro. Segundo,
44
cada conjunto de datos tiene una media; es una medida que puede calcularse y
es nica debido a que cada conjunto de datos posee una y slo una media. Por
ltimo, la media es til para llevar a cabo procedimientos estadsticos como la
comparacin de medias de varios conjuntos de datos. Sin embargo, como
cualquier medida estadstica, la media aritmtica tiene desventajas que
debemos conocer.
18. Mediana
Media estadstica que indica la tendencia central, identificada con un punto

medio. Por regla general, la mitad de los sucesos deben caer por debajo del
punto medio o mediana y la otra mitad por encima.
La mediana algunas veces es llamada media posicional, porque queda

exactamente en la mitad del conjunto de datos despus de que las
observaciones se han colocado en serie ordenada. La mitad de las
observaciones estar por encima de la mediana, la otra mitad estar por
debajo de ella. La mediana tiene varias ventajas respecto a la media. La ms
importante es que los valores extremos no afectan a la mediana de manera tan
grave como a la media. La mediana es fcil de entender y se puede calcular a
partir de cualquier tipo de datos, incluso a partir de datos agrupados con clases
de extremo abierto como la distribucin de frecuencias, a menos que la
mediana entre en una clase de extremo abierto.
Podemos encontrar la mediana incluso cuando nuestros datos son

descripciones cualitativas como color o nitidez, en lugar de nmeros. Suponga,
por ejemplo, que tenemos tres tirajes de una prensa de imprenta. Los
resultados deben clasificarse de acuerdo con la nitidez de la imagen. Podemos
ordenar los resultados desde mejor hasta peor: extremadamente ntida, muy
ntida, ntida, ligeramente borrosa y muy borrosa. La mediana de las cinco
45
clasificaciones es la tercera (ntida).
La mediana tiene tambin algunas desventajas. Ciertos procedimientos

estadsticos que utilizan la mediana son ms complejos que aquellos que
utilizan la media. Tambin, debido a que la mediana es una posicin promedio,
debemos ordenar los datos antes de llevar a cabo cualquier clculo. Esto
implica consumo de tiempo para cualquier conjunto de datos que contenga un
gran nmero de elementos. Por consiguiente, si deseamos utilizar un
estadstico de la muestra para estimar un parmetro de la poblacin, la media
es ms fcil de usar que la mediana.
19. Moda
Medida estadstica de tendencia comn o medida que identifica el valor de la

variable que da el mayor valor en un grfico de distribucin de frecuencias. Su
clculo es extremadamente sencillo, pues solo necesita un recuento. En
variables continuas, expresadas en intervalos, existe el denominado intervalo
modal o, en su defecto, si es necesario obtener un valor concreto de la
variable, se recurre a la interpolacin. La moda, igual que la mediana, se puede
utilizar como una posicin central para datos tanto cualitativos como
cuantitativos.
20. Cuartiles
Los cuartiles son los tres valores que dividen un conjunto de datos
ordenados en cuatro partes porcentualmente iguales. Q1, Q2 y Q3 determinan
los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide
con la mediana. Dada una serie de valores (X1, X2, X3 ...Xn) ordenados en
forma creciente, podemos pensar que su clculo podra efectuarse:
Primer cuartil (Q1) como la mediana de la primera mitad de valores.
Segundo cuartil (Q2) como la propia mediana de la serie.
Tercer cuartil (Q3) como la mediana de la segunda mitad de valores.
46
Pero esto conduce a distintos mtodos de clculo de los cuartiles primero
(as como tercero) segn la propia mediana se incluya o excluya en la serie de
la primera (respecto de la segunda) mitad de valores.
21. Percentil
Los percentiles son los 99 valores que dividen la serie de datos en 100
partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%...
y al 99% de los datos. Se representan con la letra P.
Para el percentil i-simo, donde la i toma valores del 1 al 99. El i % de la

muestra son valores menores que l y el 100-i % restante son mayores.
P50 coincide con la mediana.
P25 = Q1.
P50 = Q2 = mediana.
P75 = Q3.
22. Medidas de dispersin
Las medidas de dispersin, tambin llamadas medidas de variabilidad,

muestran la variabilidad de una distribucin, indicando por medio de un
nmero, si las diferentes puntuaciones de una variable estn muy alejadas de
la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, cuanto menor
47
sea, ms homognea ser a la media. As se sabe si todos los casos son
parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media,

se calcula la media de las desviaciones de las puntuaciones respecto a la
media aritmtica. Pero la suma de las desviaciones es siempre cero, as que se
adoptan dos clases de estrategias para salvar este problema. Una es tomando
las desviaciones en valor absoluto (desviacin media) y otra es tomando las
desviaciones al cuadrado (varianza).
23. Rango
Valor que indica la posicin de un caso entre una escala de posibilidades

ordenadas de mayor a menor. Es la medida de dispersin ms simple, es
simplemente la diferencia entre la observacin ms alta y la ms baja. Su
ventaja es que es fcil de calcular.
Su desventaja es que se considera slo dos de las cientos de

observaciones en un conjunto de datos, el resto de las observaciones se
ignoran. Se le suele simbolizar con R.
Ordenamos los nmeros segn su tamao.
Restamos el valor mnimo del valor mximo.
24. Desviacin
48
Medida de dispersin, calculada como la diferencia entre un valor particular
de una observacin y la media que normalmente es la media aritmtica, o entre
un conjunto de valores u observaciones y su medida. Se halla como la raz
cuadrada positiva de la varianza. La desviacin tpica informa sobre la
dispersin de los datos respecto al valor de la media; cuanto mayor sea su
valor, ms dispersos estarn los datos. Esta medida viene representada en la
mayora de los casos por S, dado que es su inicial de su nominacin en ingls.
24.1 Caractersticas
El valor de la desviacin medio a depender del valor de la variable de cada

unidad de la poblacin o muestra.
Se puede calcular alrededor de la media aritmtica, mediana o cualquier

otra.
Medida de tendencia central.
25. Varianza
Es la media aritmtica del cuadrado de las desviaciones respecto a la media

de una distribucin estadstica. Esto significa que:
1.- Se encuentra la cantidad por la cual cada observacin se desva de la

media.
2.- Se elevan al cuadrado tales desviaciones.
49
3.- Se halla la media de tales desviaciones elevadas al cuadrad.
As, se tiene el promedio de las desviaciones de la medida elevadas al

cuadrado.
26. Coeficiente de variacin
El coeficiente de variacin es la relacin entre la desviacin tpica de una

muestra y su media. El coeficiente de variacin se suele expresar en
porcentajes: permite comparar las dispersiones de dos distribuciones distintas,
siempre que sus medias sean positivas. Puesto que el coeficiente de variacin
no se basa en unidades, se puede utilizar en lugar de la desviacin estndar
para comparar la dispersin de los conjuntos de datos que tienen diferentes
unidades o diferentes medias. Se calcula dividiendo la variacin estndar de
una distribucin por su media y multiplicando por 100.
Tambin se puede ver de tan forma:
50
27. Asimetra o sesgo
El grado de asimetra de la distribucin de frecuencia constituye un de sus

caracteres de mayor importancia. En la prctica se encuentran polgonos de
frecuencia o histogramas completamente simtricos, por lo cual, el grado en el
cual la distribucin es asimtrico constituye su sesgo.
Una distribucin de frecuencia es simtrica, no tiene sesgo, es decir el sesgo

es nulo. Si una o ms observaciones son grandes, la media de la distribucin
se vuelve mayor que la Me o la Mo, en tales casos se dice que la distribucin
tiene sesgo positivo. Si una o ms observaciones son muy pequeas se
encuentran presentes, la media es la menor de los tres promedios y se dice
que la distribucin tiene sesgo negativo.
28. Solucin de problemas aplicando el Spss:
Nota: Los investigadores, tomaron el siguiente ejercicio de la pgina

web: http://wdb.ugr.es/~bioestad/guia-spss, pero modificaron los datos,
con la intensin de no suplantar informacin, y seguir las reglas
establecidas por el Docente. As mismo, se plantea en el ejercicio, toda
la teora desarrollada en la unidad II, con el SPSS 20.
Resolucin de Ejercicio
Para estudiar el efecto de las aguas residuales de las alcantarillas que

afluyen a un lago, se toman 40 muestras distintas en las que se mide la
concentracin de nitrato en el agua. Los datos obtenidos son los siguientes:
51
Tabla 3 Datos Obtenidos
Xi 25 4 30 6 70 13 160 20
0 5 0 0
ni 4 4 5 6 5 7 6 5
Se pide:
1-. Introducir los datos.
2-. Determinar:
Tabla de frecuencias. Nmero de datos.
Percentil 30. Valores mximo y mnimo.
Media. Mediana.
Moda. Desviacin tpica.
Varianza. Histograma de frecuencias.
Paso 1
Introducir la variable. Introducir la variable con las siguientes caractersticas:
Nombre: Concentracin
Tipo: Numrico
Anchura: 8
Decimales: 0
Valores: Ninguno
Perdidos: Ninguno
52
Columnas: 13
Alineacin: Derecha (La que se prefiera)
Medida: Escala
Y as mismo con la variable ponderaciones. Ver grfico 20
Grfico 15 Introduccin de Variables
Luego
Fuente llenar en laLaguna,
Rodrguez, pestaa vistaSalazar,
Stabilito, de datos el mismo
Stabilito (2016)expresados en la tabla 3.en
su respectiva fila, Concentraciones y Ponderaciones respectivamente. Como
se muestra en el grfico 21.
53
Grfico 16 Llenado de Filas
Paso 2
A continuacin hay que ponderar la variable CONCENTRACIN:
1-. Pinchar en Datos -> Ponderar casos
1.1-. Seleccionar la opcin Ponderar casos Mediante. Ver grfico 22
1.2.-. Escoger como 'Variable de frecuencia' la variable ponderaciones.

Y luego aceptar. Ver grfico 23
Grfico 17 Ponderar Casos
53
Grfico 18 Escoger como Variable de frecuencia la variable ponderaciones.
Paso 3
Para determinar todas las medidas que nos piden tenemos que acceder al
men:
Analizar -> Estadsticos Descriptivos -> Frecuencias. Ver grfico 24.
Grfico 19 Estadsticos descriptivos
54
En la ventana 'Frecuencias'. Realizar los siguientes pasos:
1-. Seleccionar la variable CONCENTRACIN haciendo un click sobre ella.

Pulsar el botn de la flecha que seala hacia la derecha para aadirla.
2.-. Mantener marcada la opcin Mostrar tablas de frecuencia. Ver grfico

25.
Grfico 20 seleccin de Variable Concentracin
3.-. Pinchar en el botn Estadsticos. Marcar las siguientes medidas:
Percentiles: Insertar el valor 30, Desviacin tpica, Varianza, Mnimo,

Mximo, Media, Mediana y Moda. Click en aadir Pulsar el botn 'Continuar'
Ver grfico 26.
Grfico 21 Estadsticos
55
Paso 4
Pinchar en el botn Grficos. Seleccionar el tipo de grfico: Histograma.

Marcar la opcin Con curva normal y Pulsar el botn Continuar. Pinchar en
el botn 'Aceptar' para ver los resultados. Ver grfico 27, 28,29
Grfico 22 Seleccionar Tipo de Grfico
Grfico 23 Resultados Estadsticos 1
56
Grfico 24 Resultados Estadsticos 2
57
Veamos ahora el mismo ejercicio y aplicar ms grficos estudiados.
Grficos P-P
Para ello nos vamos a la opcin analizar ir a estadstico descriptivos

seleccionar Grficos P-P. Ver grfico 30
Grfico 25 Grfico P-P
58
Al entrar a la ventana Grficos P-P seleccionamos para este caso la variable

Concentracin del Agua la seleccionamos y la agregamos a variables con la
flechita luego aceptar para ver resultados. Ver grficos 31, 32, 33,34
Grfico 26 Elegir Variable
Grfico 27 Descripcin del Modelo
59
Grfico 28 Resumen del Procesamiento de los Casos y Parmetros de distribucin

Estimados
Grfico 29 Grfico P-P Normal
60
61
Grfico 30 Grfico P-P Normal Sin tendencia
62
Grficos Q-Q
Para ello nos vamos a la opcin analizar ir a estadstico descriptivos

seleccionar Grficos Q-Q. Aceptar para ver resultados. Ver grfico 36,
Grfico 31 Seleccin de Variable
Grfico 32 Grfico Q-Q
63
Grfico 33 Grfico Q-Q 2
64
UNIDAD III INTRODUCCIN A LA ESTADSTICA INFERENCIAL
29. Estadstica Inferencial.
29.1 Definicin
Es rama de la Estadstica que estudia el comportamiento y propiedades de

las muestras y la posibilidad, y lmites, de la generalizacin de los resultados
obtenidos a partir de aquellas a las poblaciones que representan. Esta
generalizacin de tipo inductivo, se basa en la probabilidad. Tambin se le
llama tambin Estadstica Matemtica, por su complejidad matemtica en
relacin a la Estadstica Descriptiva. La Estadstica inferencial o Inferencia
estadstica estudia cmo sacar conclusiones generales para toda la poblacin a
partir del estudio de una muestra, y el grado de fiabilidad o significacin de los
resultados obtenidos. Se dedica a la generacin de los modelos, inferencias y
predicciones asociadas a los fenmenos en cuestin teniendo en cuenta la
aleatoriedad de las observaciones.
Se usa para modelar patrones en los datos y extraer inferencias acerca de la

poblacin bajo estudio. Estas inferencias pueden tomar la forma de respuestas
a preguntas s/no (prueba de hiptesis), estimaciones de unas caractersticas
numricas (estimacin), pronsticos de futuras observaciones, descripciones
de asociacin (correlacin) o modelamiento de relaciones entre variables de
Sam (anlisis de regresin). Otras tcnicas de modelamiento incluyen anlisis
de varianza, series de tiempo y minera de datos.
Los mtodos bsicos de la estadstica inferencial son la estimacin y el

contraste de hiptesis, que juegan un papel fundamental en la investigacin.
Por tanto, algunos de los objetivos que se persiguen en este tema son:
Calcular los parmetros de la distribucin de medias o proporciones mustrales

de tamao n, extradas de una poblacin de media y varianza conocidas.
Estimar la media o la proporcin de una poblacin a partir de la media o

proporcin muestral.
66
Utilizar distintos tamaos mustrales para controlar la confianza y el error
admitido.
Contrastar los resultados obtenidos a partir de muestras.
Visualizar grficamente, mediante las respectivas curvas normales, las

estimaciones realizadas.
En la mayora de las investigaciones resulta imposible estudiar a todos y

cada uno de los individuos de la poblacin ya sea por el coste que supondra, o
por la imposibilidad de acceder a ello. Mediante la tcnica inferencial
obtendremos conclusiones para una poblacin no observada en su totalidad, a
partir de estimaciones o resmenes numricos efectuados sobre la base
informativa extrada de una muestra de dicha poblacin.
Por tanto, el esquema que se sigue es que a partir de una poblacin se

extrae una muestra por algunos de los mtodos existentes, con la que se
generan datos numricos que se van a utilizar para generar estadsticos con
los que realizar estimaciones o contrastes poblacionales. Existen dos formas
de estimar parmetros: la estimacin puntual y la estimacin por intervalo de
confianza.
En la primera se busca, con base en los datos mustrales, un nico valor

estimado para el parmetro. Para la segunda, se determina un intervalo dentro
del cual se encuentra el valor del parmetro, con una probabilidad determinada.
Si el objetivo del tratamiento estadstico inferencial, es efectuar
generalizaciones acerca de la estructura, composicin o comportamiento de las
poblaciones no observadas, a partir de una parte de la poblacin, ser
necesario que la parcela de poblacin examinada sea representativa del total.
Por ello, la seleccin de la muestra requiere unos requisitos que lo

garanticen, debe ser representativa y aleatoria. Adems, la cantidad de
elementos que integran la muestra (el tamao de la muestra) depende de
67
mltiples factores, como el dinero y el tiempo disponibles para el estudio, la
importancia del tema analizado, la confiabilidad que se espera de los
resultados, las caractersticas propias del fenmeno analizado, etctera. As, a
partir de la muestra seleccionada se realizan algunos clculos y se estima el
valor de los parmetros de la poblacin tales como la media, la varianza, la
desviacin estndar, o la forma de la distribucin, entre otros.
30. Probabilidad
30.1 Definicin
La probabilidad constituye parte importante de nuestra vida cotidiana. En la

toma de decisiones personales y administrativas, nos enfrentamos a la
incertidumbre y utilizamos la teora de la probabilidad, admitamos o no el uso
de algo tan complejo. La probabilidad es la posibilidad numrica de que ocurra
un evento. La probabilidad de un evento es medida por valores comprendidos
entre 0 y 1, entre mayor sea la probabilidad de que ocurra un evento, su
probabilidad asignada estar ms prxima a 1. La probabilidad de certeza esa
1. La probabilidad de una imposibilidad es 0. Esto se podra expresar as:
P (evento cierto) = 1
P (evento imposible) = 0
Por tanto, 0 P (E1) 1 en donde E1 es algn evento.
En general, la probabilidad es la posibilidad de que algo pase. Las

probabilidades se expresan como fracciones (1/6, 1/2, 8/9) o como decimales
(0.167, 0.500, 0.889) que estn entre cero y uno. Tener una probabilidad de
cero significa que algo nunca va a suceder; una probabilidad de uno indica que
algo va a suceder siempre. En la teora de la probabilidad, un evento es uno o
ms de los posibles resultados de hacer algo. Al lanzar una moneda al aire, si
cae cruz es un evento, y si cae cara es otro.
De manera anloga, si sacamos una carta de un mazo de naipes, el tomar el
as de espadas es un evento. Un ejemplo de evento que, quiz, est ms
68
cercano a su quehacer diario es ser elegido de entre cien estudiantes para que
responda a una pregunta. Cuando escuchamos las poco gratas predicciones
del ndice de mortalidad en accidentes de trnsito, esperamos no ser uno de
tales eventos.
En la teora de probabilidad, la actividad que origina uno de dichos eventos
se conoce como experimento.
Utilizando un lenguaje formal, podramos hacer la siguiente pregunta: en un
experimento de lanzar una moneda, cul es la probabilidad del evento cara?
Y, desde luego, si la moneda no est cargada y tiene la misma probabilidad de
caer en cualquiera de sus dos lados (sin posibilidades de que caiga parada),
podramos responder, 1/2 o 0.5. Al conjunto de todos los resultados posibles
de un experimento se le llama espacio muestral del experimento. En el de
lanzar una moneda, el espacio muestral es: S ={cara, cruz}.
31. Tipos de Probabilidad
31.1 Probabilidad Clsica o a Priori
Si un suceso puede ocurrir de N maneras mutuamente excluyentes e

igualmente probables, y m de ellas poseen una caracterstica A, es decir el
Nmero de resultados en los que se presenta el evento entre el nmero total de
resultados posibles.
31.2 Probabilidad emprica o frecuencial
La frecuencia relativa observada, de un evento durante un gran nmero de

intentos. La fraccin de veces que un evento se presenta a la larga, cuando las
condiciones es estable. Este mtodo utiliza la frecuencia relativa de las
presentaciones pasadas de un evento como una probabilidad. Determinamos
qu tan frecuente ha sucedido algo en el pasado y usamos esa cifra para
predecir la probabilidad de que suceda de nuevo en el futuro.
69
Cuando utilizamos el planteamiento de frecuencia relativa para establecer
probabilidades, el nmero que obtenemos como probabilidad adquirir mayor
precisin a medida que aumentan las observaciones. En este caso la
probabilidad de ocurrencia de un evento ser:
Nmero de resultados esperados ocurridos en el pasado / nmero total de

experimentos adelantados
31.3 Probabilidad subjetiva
Se refiere a la probabilidad de ocurrencia de un suceso basado en la

experiencia previa, la opinin personal o la intuicin del individuo. En este caso
despus de estudiar la informacin disponible, se asigna un valor de
probabilidad a los sucesos basado en el grado de creencia de que el suceso
pueda ocurrir. Los tomadores de decisiones pueden hacer uso de cualquier
evidencia que tengan a mano y mezclarlas con los sentimientos personales
sobre la situacin.
31.4 Probabilidad Axiomtica
Los axiomas de probabilidad son las condiciones mnimas que deben

verificarse para que una funcin que definimos sobre unos sucesos determine
consistentemente valores de probabilidad sobre dichos sucesos. En la
denicin axiomtica de la probabilidad no se establece la forma explcita de
calcular las probabilidades sino nicamente se proponen las reglas que el
clculo de probabilidades debe satisfacer.
32. Propiedades de la probabilidad
1. La suma de las probabilidades de un suceso y su contrario vale 1, por

tanto la probabilidad del suceso contrario es:
70
2. Probabilidad del suceso imposible es cero.
3. La probabilidad de la unin de dos sucesos es la suma de sus

probabilidades restndole la probabilidad de su interseccin.
4. Si un suceso est incluido en otro, su probabilidad es menor o igual a

la de ste.
5. Si A1, A2, ..., Ak son incompatibles dos a dos entonces:
6 Si el espacio muestral E es finito y un suceso es S = {x 1, x2, ..., xn}

entonces:
33. Teorema de Bayes y su aplicacin
El teorema de Bayes ofrece un potente mtodo estadstico para evaluar

nueva informacin y revisar nuestras anteriores estimaciones (basadas slo en
informacin limitada) de la probabilidad de que las cosas se encuentren en un
estado o en otro. Si es utilizado de manera correcta, se hace innecesario reunir
71
grandes cantidades de datos en un periodo grande con el fin de tomar mejores
decisiones, basadas en probabilidades.
El teorema de Bayes es un procedimiento para obtener probabilidades
condicionales (probabilidades de ocurrencia de acontecimientos condicionadas
a la ocurrencia de otros acontecimientos). As mismo, da respuesta a
cuestiones de tipo causal, predictivas y de diagnstico. En las cuestiones
causales queremos saber cul es la probabilidad de acontecimientos que son
la consecuencia de otros acontecimientos.
En las cuestiones predictivas queremos saber cul es la probabilidad de
acontecimientos dada informacin de la ocurrencia de los acontecimientos
predictores. En las cuestiones de tipo diagnstico queremos saber cul es la
probabilidad del acontecimiento (o acontecimientos) causales o predictivos
dado que tenemos informacin de las consecuencias. Para resumir, en las
situaciones causales o predictivas desconocemos las consecuencias y
tenemos evidencia de las causas. Por el contrario, en las situaciones de
diagnstico desconocemos las causas y tenemos evidencia de las
consecuencias.
34. Distribuciones de probabilidad
34.1 Definicin
Una distribucin de probabilidad es un despliegue de todos los posibles
resultados de un experimento juntos con las probabilidades de cada resultado.
Las distribuciones de probabilidad estn relacionadas con las distribuciones de
frecuencias. De hecho, podemos pensar que una distribucin de probabilidad
72
es una distribucin de frecuencias terica. Esto quiere decir, que una
distribucin de frecuencias terica es una distribucin de probabilidades que
describe la forma en que se espera varen los resultados. Como estas
distribuciones representan expectativas de que algo suceda, resultan modelos
tiles para hacer inferencias y tomar decisiones en condiciones de
incertidumbre.
Por lo tanto, las distribuciones de probabilidad pueden basarse en
consideraciones tericas (los lanzamientos de una moneda) o en una
estimacin subjetiva de la posibilidad de ciertos resultados (la estimacin de la
candidata). Las distribuciones de probabilidad se pueden basar tambin en la
experiencia. Los actuarios de las compaas de seguros, por ejemplo,
determinan las plizas de seguros haciendo uso de los largos aos de
experiencia que las compaas tienen acerca de los ndices de mortalidad para
establecer la probabilidad de muerte entre los diferentes grupos de edad.
Esta divisin se realiza dependiendo del tipo de variable a estudiar, esto

significa que:
1. Si la variable es una variable discreta (valores enteros), corresponder una

distribucin discreta, de las cuales existen:
Distribucin normal (eventos independientes).
Distribucin de poisson (eventos independientes).
Distribucin hipergeomtrica (eventos dependientes).
Si la variable es continua, esto significa que puede tomar cualquier

valor dentro de un intervalo, la distribucin que se generar ser una
distribucin continua, tambin llamada "distribucin normal".
2. Adems, se puede utilizar la "distribucin de poisson como una

aproximacin de la distribucin binomial" cuando la muestra por es estudiar
73
es grande y la probabilidad de xito es pequea. De la combinacin de los
dos tipos de distribuciones anteriores (a y b), surge una conocida
como "distribucin normal como una aproximacin de la distribucin binomial
y de poisson".
35. Variables Aleatorias Discretas y Distribucin de Probabilidades

Discretas
35.1 Definicin
Una variable aleatoria es una descripcin numrica del resultado de un

experimento. Una variable aleatoria proporciona un medio para describir los
resultados experimentales empleando valores numricos. Las variables
aleatorias deben tomar valores numricos. En efecto, una variable aleatoria
asocia un valor numrico a cada uno de los resultados experimentales. El valor
numrico de la variable aleatoria depende del resultado del experimento. Una
variable aleatoria puede ser discreta o continua, depende del tipo de valores
numricos que asuma.
35.2 Variables aleatorias discretas
A una variable aleatoria que asuma ya sea un nmero finito de valores o una
sucesin infinita de valores tales como 0, 1, 2, . . ., se le llama variable aleatoria
discreta. Considere, por ejemplo, el siguiente experimento: un contador
presenta el examen para certificarse como contador pblico. El examen tiene
cuatro partes. Defina una variable aleatoria x como x _ nmero de partes del
examen aprobadas. sta es una variable aleatoria discreta porque puede tomar
el nmero finito de valores 0, 1, 2, 3 o 4.
35.3 Variables aleatorias continuas
A una variable que puede tomar cualquier valor numrico dentro de un

intervalo o coleccin de intervalos se le llama variable aleatoria continua. Los
resultados experimentales basados en escalas de medicin tales como tiempo,
74
peso, distancia y temperatura pueden ser descritos por variables aleatorias
continuas. Considere, por ejemplo, el experimento de observar las llamadas
telefnicas que llegan a la oficina de atencin de una importante empresa de
seguros. La variable aleatoria que interesa es x= tiempo en minutos entre dos
llamadas consecutivas. Esta variable aleatoria puede tomar cualquier valor en
el intervalo x0. En efecto, x puede tomar un nmero infinito de valores, entre
los que se encuentran valores como 1.26 minutos, 2.751 minutos, 4.3333
minutos.
35.4 Distribucin de probabilidades discretas
Se denomina distribucin de variable discreta a aquella cuya funcin de

probabilidad slo toma valores positivos en un conjunto de valores de X
finito o infinito numerable. A dicha funcin se le llama funcin de masa de
probabilidad. En este caso la distribucin de probabilidad es la suma de la
funcin de masa, por lo que tenemos entonces que:
Y, tal como corresponde a la definicin de distribucin de probabilidad, esta

expresin representa la suma de todas las probabilidades desde - hasta el
valor x.
35.5 Distribucin Binomial
La distribucin binomial es una distribucin de probabilidad discreta que cuenta

el nmero de xitos en una secuencia de n ensayos de Bernoulli
independientes entre s, con una probabilidad fija p de ocurrencia del xito
entre los ensayos. Una distribucin de probabilidad de variable aleatoria
discreta utilizada ampliamente es la distribucin binomial. Esta distribucin
describe una variedad de procesos de inters para los administradores. Por
otra parte, describe datos discretos, no continuos, que son resultado de un
75
experimento conocido como proceso de Bernoulli, en honor del matemtico
suizo nacido en el siglo XVII, Jacob Bernoulli.
El lanzamiento de la moneda no alterada un nmero fijo de veces es un

proceso de Bernoulli, y los resultados de tales lanzamientos pueden
representarse mediante la distribucin binomial de probabilidad. El xito o
fracaso de los solicitantes de empleo, entrevistados para prueba de aptitudes,
tambin puede ser descrito como un proceso de Bernoulli. Por otro lado, la
distribucin de frecuencias de la duracin de las luces fluorescentes de una
fbrica se podra medir mediante una escala continua de tiempo y no se podra
clasificar como una distribucin binomial . Una distribucin binomial o de
Bernoulli tiene las siguientes caractersticas:
1. En cada prueba del experimento slo son posibles dos

resultados: xito y fracaso.
2. La probabilidad de xito es constante, es decir, que no vara de una

prueba a otra. Se representa por p.
3. La probabilidad de fracaso tambin es constante, Se representa por q,
q=1p
4. El resultado obtenido en cada prueba es independiente de los

resultados obtenidos anteriormente.
5. La variable aleatoria binomial, X, expresa el nmero de xitos

obtenidos en las n pruebas. Por tanto, los valores que puede
tomar X son: 0, 1, 2, 3, 4, ..., n.
76
35.5.1 Uso del proceso de Bernoulli
Podemos utilizar el resultado del lanzamiento de una moneda no alterada

un cierto nmero de veces como ejemplo de un proceso de Bernoulli. Podemos
describir el proceso de la siguiente manera:
Cada intento (cada lanzamiento, en este caso) tiene solamente dos

resultados posibles: cara o cruz, s o no, xito o fracaso.
La probabilidad del resultado de cualquier intento (lanzamiento) permanece

fijo con respecto al tiempo. Con una moneda no alterada, la probabilidad de
obtener cara siempre es 0.5 para cada lanzamiento, independientemente del
nmero de veces que se lance la moneda.
1. Los intentos son estadsticamente independientes, es decir, el resultado de

un lanzamiento no afecta el resultado de cualquier otro lanzamiento.
Clculo de probabilidades en una distribucin binomial
n es el nmero de pruebas.
k es el nmero de xitos.
p es la probabilidad de xito.
q es la probabilidad de fracaso.
El nmero combinatorio
77
35.5.2 Parmetros de la distribucin binomial
Media
Varianza
Desviacin tpica
36. Distribucin de Poisson
La distribucin de Poisson se utiliza para describir ciertos tipos de procesos,

entre los que se encuentran la distribucin de llamadas telefnicas que llegan a
un conmutador, las solicitudes de pacientes que requieren servicio en una
institucin de salud, las llegadas de camiones y automviles a una caseta de
cobro, y el nmero de accidentes registrados en cierta interseccin. Estos
ejemplos tienen en comn un elemento:
Pueden ser descritos mediante una variable aleatoria discreta que toma
valores enteros (0, 1, 2, 3, 4, 5, etc). El nmero de pacientes que llegan al
consultorio de un mdico en un cierto intervalo ser de 0, 1, 2, 3, 4, 5 o algn
otro nmero entero. De manera parecida, si usted cuenta el nmero de
automviles que llegan a una caseta de cobro de alguna carretera durante un
periodo de 10 minutos, el nmero ser de 0, 1, 2, 3, 4, 5 y as
consecutivamente.
36.1 Caractersticas de los procesos que producen una distribucin de

probabilidad de Poisson
El nmero de vehculos que pasan por una sola caja de una caseta de cobro
en una hora pico sirve para ilustrar las caractersticas de la distribucin de
probabilidad de Poisson:
1. El promedio (la media) del nmero de vehculos que llegan por hora pico
puede estimarse a partir de datos sobre trfico que se tengan disponibles.
78
2. Si dividimos la hora pico en periodos (intervalos) de un segundo cada uno,
encontraremos que las siguientes afirmaciones son verdaderas:
a) La probabilidad de que exactamente un vehculo llegue a una caja por

segundo es muy pequea y es constante para cada intervalo de un segundo.
b) La probabilidad de que dos o ms vehculos lleguen en un intervalo de un

segundo es tan pequea que le podemos asignar un valor de cero.
c) El nmero de vehculos que llegan en un intervalo dado de un segundo es

independiente del momento en que dicho intervalo se presente en la hora pico.
d) El nmero de llegadas en cualquier intervalo de un segundo no depende

del nmero de llegadas en cualquier otro intervalo de un segundo.
Algunos ejemplos de fenmenos que se ajustan a una distribucin de

Poisson son los siguientes:
el nmero de accidentes de trfico en una ciudad durante una semana.
el nmero de emergencias que llegan a un servicio de urgencia

hospitalaria.
el nmero de robos denunciados en un mes en cualquier ciudad.
el nmero de llamadas telefnicas que llegan a la central de una gran

empresa en hora punta.
79
Todos estos casos pueden ser caracterizados como el nmero de sucesos
de un determinado evento en un perodo de tiempo. Cada uno de estos
eventos toma dos posibles valores, xito o fracaso, equivalente a recibir una
llamada o no recibirla, accidentarse o no accidentarse, etctera. Adems, la
probabilidad del xito es muy pequea.
Es decir, la probabilidad de tener un accidente es muy baja, la probabilidad

de que una persona llama a la central de la gran empresa es mnima. Y, no
debemos de olvidar, que n, nmero de personas que hay en una ciudad,
nmero de personas que circulan en coche, es muy grande. Todo esto nos
lleva a que una buena parte de fenmenos de esta naturaleza siguen una
distribucin del tipo Poisson. Es por ello que esta distribucin, tambin
denominada "de los sucesos raros" es particularmente til para resolver
problemas de colas y lneas de espera, temas ambos que se podrn estudiar
en otras asignaturas del rea de mtodos cuantitativos en economa.
Ejemplo:
Veamos un ejemplo de distribucin de Poisson. Un analista de empresas ha

pronosticado que el 3.5% de las pequeas empresas irn a la bancarrota en
2005. Para una muestra de 100 pequeas empresas, estime la probabilidad de
que al menos tres de ellas entren en bancarrota, suponiendo que la prediccin
del experto es correcta.
Resolucin:
Veamos primero de qu tipo de distribucin se trata.
Cumple los requisitos de un Proceso de Bernouilli, puesto que hay dos

resultados posibles (bancarrota o no bancarrota); la probabilidad es constante
(3.5% predicho por el experto); y las pruebas son independientes.
Puede ser considerada una Binomial, puesto que definimos una variable
aleatoria que es el nmero de empresas que entran en bancarrota ("xito").
Pero cumple las condiciones para ser analizada como una distribucin de
Poisson, puesto que n es muy grande (n=100) y p muy pequea (p=0,035), por
lo que la media es muy pequea en relacin a n (n*p = 3,5)
80
Usaremos la distribucin de Poisson con media 3,5 para aproximar nuestra
distribucin. La probabilidad de que al menos 3 de las 100 empresas entren en
bancarrota es igual a la probabilidad de que entren 3 empresas, ms la de que
entren cuatro, ms cinco, y as hasta 100: P(3) + P(4) + P(5) +.........+ P(100) =
1 - P(0) - P(1) - P(2). Para hallar las probabilidades necesarias para resolver el
problema debemos hacer uso de la funcin de cuanta, cuya expresin
genrica es:
Aplicada a nuestro ejemplo, y para el caso

P(0):
Si aplicamos la frmula al resto de casos, la resolucin del problema ser:
1 - 0,302 - 0,1057 - 0,1850 = 0.679.
37. Variables Aleatorias Continuas y Distribucin de Probabilidades

Continuas
37.1 Variables aleatorias continuas
Es una funcin X que asigna a cada resultado posible de un experimento un

nmero real. Si X puede asumir cualquier valor en algn intervalo I (el intervalo
puede ser acotado o desacotado), se llama una variable aleatoria continua. Si
puede asumir solo varios valores distintos, se llama una variable aleatoria
discreta. Una variable continua es aquella que puede tomar un nmero infinito
de valores entre dos valores cualesquiera de una caracterstica.
Ejemplos:
La altura de los alumnos de una clase, las horas de duracin de una pila.
81
37.2 Distribucin de probabilidades continas
Una distribucin continua describe las probabilidades de los posibles valores

de una variable aleatoria continua. Una variable aleatoria continua es una
variable aleatoria con un conjunto de valores posibles (conocido como el rango
o respaldo) que es infinito y no se puede contar. Las probabilidades de
variables aleatorias continuas (X) se definen como el rea por debajo de la
curva de la distribucin. Por lo tanto, solo los rangos de valores pueden tener
una probabilidad diferente de cero. La probabilidad de que una variable
aleatoria continua equivalga a algn valor siempre es cero.
38. La Distribucin Normal
Varios matemticos han contribuido a su desarrollo, entre los que podemos

contar al astrnomo-matemtico del siglo XVIII Karl Gauss. En honor a su
trabajo, la distribucin de probabilidad normal tambin es conocida como
distribucin gaussiana. Existen dos razones fundamentales por las cuales la
distribucin normal ocupa un lugar tan prominente en la estadstica. Primero,
tiene algunas propiedades que la hacen aplicable a un gran nmero de
situaciones en las que es necesario hacer inferencias mediante la toma de
muestras. Segundo, la distribucin normal casi se ajusta a las distribuciones
de frecuencias reales observadas en muchos fenmenos, incluyendo
caractersticas humanas (peso, altura, coeficiente intelectual), resultados de
procesos fsicos (dimensiones y rendimientos), y muchas otras medidas de
inters para los administradores, tanto en el sector pblico como en el privado.
Caractersticas de la distribucin normal de probabilidad
1. La curva tiene un solo pico; por tanto, es unimodal. Tiene la forma de

campana que mencionamos anteriormente.
2. La media de una poblacin distribuida normalmente cae en el centro de su

curva normal.
82
3. Debido a la simetra de la distribucin normal de probabilidad, la mediana
y la moda de la distribucin se encuentran tambin en el centro; en
consecuencia, para una curva normal, la media, la mediana y la moda tienen el
mismo valor.
Una justificacin de la frecuente

aparicin de la distribucin normal es el teorema central del lmite que
establece que cuando los resultados de un experimento sean debidos a un
conjunto muy grande de causas independientes, que actan sumando sus
efectos, siendo cada efecto individual de poca importancia respecto al conjunto,
es esperable que los resultados sigan una distribucin normal.
Cuando su funcin de densidad es de la forma:
En donde R es el conjunto de nmeros reales.

Como se puede ver, la familia de distribuciones normales depende de
parmetros y 2 , que coinciden con la media y la varianza respectivamente.
83
38.1 Manejo de tablas de distribucin normal
La grfica de la distribucin normal tiene la forma de una campana, por este

motivo tambin es conocida como la campana de Gauss. Sus caractersticas
son las siguientes:
Es una distribucin simtrica.
Es asinttica, es decir sus extremos nunca tocan el eje horizontal,

cuyos valores tienden a infinito.
En el centro de la curva se encuentran la media, la mediana y la moda.
El rea total bajo la curva representa el 100% de los casos.
Los elementos centrales del modelo son la media y la varianza.
Esta distribucin es un modelo matemtico que permite determinar

probabilidades de ocurrencia para distintos valores de la variable. As, para
determinar la probabilidad de encontrar un valor de la variable que sea igual o
inferior a un cierto valor xi, conociendo el promedio y la varianza de un conjunto
de datos, se debe reemplazar estos valores (media, varianza y xi) en la frmula
matemtica del modelo. El clculo resulta bastante complejo, pero,
afortunadamente, existen tablas estandarizadas que permiten eludir este
procedimiento.
38.2 Tabla de la distribucin normal
La tabla de la distribucin normal presenta los valores de probabilidad para

una variable estndar Z, con media igual a 0 y varianza igual a 1.
Para usar la tabla, siempre debemos estandarizar la variable por medio de la

expresin:
84
Siendo el valor de inters; la media de nuestra variable y su desviacin
estndar. Recordemos que y corresponden a parmetros, o sea valores en el
universo, que generalmente no conocemos, por lo que debemos calcular Z
usando los datos de nuestra muestra.
En general, el valor de Z se interpreta como el nmero de desviaciones

estndar que estn comprendidas entre el promedio y un cierto valor de
variable x. En otras palabras, se puede decir que es la diferencia entre un valor
de la variable y el promedio, expresada esta diferencia en cantidad de
desviaciones estndar.
Suena abstracto, pero con un ejemplo se podr entender mejor:
Supongamos un conjunto de personas con edad promedio 25 aos y

desviacin estndar 3,86. Nuestro valor de inters (x) es 30 aos. El valor de Z
correspondiente ser:
Este valor de Z nos dice que la edad de 30 aos est a 1,29 desviaciones
estndar sobre el promedio. Ahora bien, la tabla de la distribucin normal,
entrega valores de probabilidad para los distintos valores de Z.
38.3 Uso de la tabla de Z
Lo averiguaremos con un valor concreto: cul es la probabilidad de

encontrar un valor de Z menor o igual a 1,96?
Vamos a la tabla y familiaricmonos con algunas de sus caractersticas.
En la primera columna de la tabla aparece el entero y primer decimal del

valor de Z, vemos que los valores van desde -3,4 a 3,3. En la primera fila
85
(arriba), aparece el segundo decimal del valor de Z y, como es lgico, hay 10
nmeros (0,00 a 0,09).
Entonces, para nuestro valor de Z = 1,96 buscaremos 1,9 en la primera

columna de la tabla y 0,06 en la primera fila de la tabla. Trazaremos lneas
perpendiculares desde esos valores y llegaremos a un nmero en el cuerpo
de la tabla (vase la tabla ms abajo, que tiene marcadas las dos
perpendiculares de las que hablamos. El nmero que encontramos y que
est destacado es: 0,9750.
Por lo tanto, la probabilidad asociada a Z=1,96 es 0,9750, es decir, la

probabilidad de encontrar un valor de Z menor o igual a 1,96 es 0,9750.
86
UNIDAD IV TEORA DE MUESTREO
39. Muestreo probabilstica y no probabilstica
39.1 Muestreo probabilstica
Es una tcnica de muestreo en virtud de la cual las muestras son recogidas

en un proceso que brinda a todos los individuos de la poblacin las mismas
oportunidades de ser seleccionados. En esta tcnica de muestreo, el
investigador debe garantizar que cada individuo tenga las mismas
oportunidades de ser seleccionado y esto se puede lograr si el investigador
utiliza la aleatorizacin.
Los mtodos de muestreo probabilsticos son aquellos que se basan en el

principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos
tienen la misma probabilidad de ser elegidos para formar parte de una muestra
y, consiguientemente, todas las posibles muestras de tamao n tienen la misma
probabilidad de ser seleccionadas. Slo estos mtodos de muestreo
probabilsticos nos aseguran la representatividad de la muestra extrada y son,
por tanto, los ms recomendables.
39.2 Muestreo no probabilstica
A veces, para estudios exploratorios, el muestreo probabilstico resulta

excesivamente costoso y se acude a mtodos no probabilsticos, aun siendo
conscientes de que no sirven para realizar generalizaciones (estimaciones
inferenciales sobre la poblacin), pues no se tiene certeza de que la muestra
extrada sea representativa, ya que no todos los sujetos de la poblacin tienen
la misma probabilidad de ser elegidos.
En general se seleccionan a los sujetos siguiendo determinados criterios

procurando, en la medida de lo posible, que la muestra sea representativa. En
algunas circunstancias los mtodos estadsticos y epidemiolgicos permiten
resolver los problemas de representatividad aun en situaciones de muestreo no
probabilstico, por ejemplo los estudios de caso-control, donde los casos no son
seleccionados aleatoriamente de la poblacin.
88
39.2.1 Definicin
39.1.1 Muestreo probabilstico
El muestreo probabilstico es una tcnica de muestreo en virtud de la cual

las muestras son recogidas en un proceso que brinda a todos los individuos de
la poblacin las mismas oportunidades de ser seleccionados. En esta tcnica
de muestreo, el investigador debe garantizar que cada individuo tenga las
mismas oportunidades de ser seleccionado y esto se puede lograr si el
investigador utiliza la aleatorizacin.
39.2 Las ventajas del mtodo de muestreo
Sencillo y de fcil comprensin.
Clculo rpido de medias y varianzas.
Se basa en la teora estadstica, y por tanto existen paquetes

informticos para analizar los datos.
No siempre es necesario tener un listado de toda la poblacin.
Cuando la poblacin est ordenada siguiendo una tendencia

conocida, asegura una cobertura de unidades de todos los tipos.
Tiende a asegurar que la muestra represente adecuadamente a la

poblacin en funcin de unas variables seleccionadas.
40. Tipos de muestreo
Existen diferentes criterios de clasificacin de los diferentes tipos de

muestreo, aunque en general pueden dividirse en dos grandes grupos:
mtodos de muestreo probabilsticos y mtodos de muestreo no probabilsticos.
40.1 Muestreo probabilstico
40.1.1 El muestreo aleatorio simple
89
Es la forma ms fcil de muestreo probabilstico. Lo nico que el
investigador tiene que hacer es asegurarse de que todos los miembros de la
poblacin sean incluidos en la lista y luego seleccionar al azar el nmero
deseado de sujetos. Existen muchos mtodos para hacer esto. Puede ser tan
mecnico como sacar tiras de papel de un sombrero con nombres escritos
mientras el investigador tiene los ojos vendados o puede ser tan fcil como
usar un software de computadora para hacer la seleccin aleatoria.
40.1.2 Muestreo aleatorio sistemtico
El muestreo aleatorio sistemtico se puede comparar con una progresin

aritmtica en donde la diferencia entre dos nmeros consecutivos es la misma.
Es la eleccin de una muestra a partir de los elementos de una lista segn un
orden determinado, o recorriendo la lista a partir de un nmero aleatorio
determinado.
40.1.3 Muestreo estratificado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases

que se suponen homogneos respecto a caracterstica a estudiar. A cada uno
de estos estratos se le asignara una cuota que determinara el nmero de
miembros del mismo que compondrn la muestra.
40.1.4 Muestreo errtico
Tambin se llama sin norma. La muestra se realiza de cualquier forma,

valorando nicamente la comodidad o la oportunidad en trminos de costes,
tiempo u otro factor no estadstico.
40.1.5 Muestreo doble
Cuando el resultado del estudio de la primera muestra no es decisivo, una

segunda muestra es extrada de la misma poblacin. Las dos muestras son
combinadas para analizar los resultados. Este mtodo permite a
una persona principiar con una muestra relativamente pequea para
90
ahorrar costos y tiempo. Si la primera muestra arroja una resultado definitivo, la
segunda muestra puede no necesitarse.
40.1.6 El muestreo aleatorio por conglomerados
Se realiza cuando es imposible el muestreo aleatorio simple debido al

tamao de la poblacin. Imagnate hacer un muestreo aleatorio simple cuando
la poblacin en cuestin es toda la poblacin de Asia. En el muestreo por
conglomerados, la investigacin identifica primero las fronteras, en el caso de
nuestro ejemplo. Pueden ser los pases de Asia. El investigador selecciona
aleatoriamente un nmero de reas identificadas. Es importante que todas las
reas (pases) dentro de la poblacin tengan las mismas posibilidades de ser
seleccionadas. El investigador puede incluir todos los individuos dentro de las
reas seleccionadas o seleccionar aleatoriamente a los sujetos de las reas
identificadas.
40.1.7 Muestreo aleatorio mixto/por etapas mltiples
Esta tcnica de muestreo probabilstico implica una combinacin de dos o

ms tcnicas de muestreo enumeradas anteriormente. En la mayora de las
investigaciones complejas realizadas en el campo o en el laboratorio, no es
adecuado utilizar un solo tipo de muestreo probabilstico. La mayora de las
investigaciones se realizan en diferentes etapas y en cada etapa se aplica una
tcnica de muestreo aleatorio diferente.
40.2 Muestreo no probabilstico
40.2.1 Muestreo por cuotas
Tambin denominado en ocasiones "accidental". Se asienta generalmente

sobre la base de un buen conocimiento de los estratos de la poblacin y/o de
los individuos ms "representativos" o "adecuados" para los fines de la
investigacin. Mantiene, por tanto, semejanzas con el muestreo aleatorio
estratificado, pero no tiene el carcter de aleatoriedad de aqul.
91
En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero
de individuos que renen unas determinadas condiciones.
40.2.2 Muestreo intencional o de conveniencia
Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener

muestras "representativas" mediante la inclusin en la muestra de grupos
supuestamente tpicos. Es muy frecuente su utilizacin en sondeos
preelectorales de zonas que en anteriores votaciones han marcado tendencias
de voto. Tambin puede ser que el investigador seleccione directa e
intencionadamente los individuos de la poblacin. El caso ms frecuente de
este procedimiento el utilizar como muestra los individuos a los que se tiene
fcil acceso (los profesores de universidad emplean con mucha frecuencia a
sus propios alumnos).
40.2.3 Bola de nieve
Se localiza a algunos individuos, los cuales conducen a otros, y estos a

otros, y as hasta conseguir una muestra suficiente. Este tipo se emplea muy
frecuentemente cuando se hacen estudios con poblaciones "marginales",
delincuentes, sectas, determinados tipos de enfermos.
40.2.4 Muestreo Discrecional
A criterio del investigador los elementos son elegidos sobre lo que l cree
que pueden aportar al estudio.
40.2.5 El muestreo por cuotas
Es una tcnica de muestreo no probabilstico en donde la muestra reunida

tiene la misma proporcin de individuos que toda la poblacin con respecto al
fenmeno enfocado, las caractersticas o los rasgos conocidos.
92
Asimismo, el investigador debe asegurarse de que la composicin de la
muestra final que ser utilizada en el estudio cumpla los criterios de cuota de la
investigacin.
40.3 Error Muestral
Es la desviacin de la muestra seleccionada de las verdaderas

caractersticas, rasgos, comportamientos, cualidades o figuras de toda la
poblacin. El error del proceso de muestreo ocurre cuando los investigadores
toman diferentes sujetos de la misma poblacin, y aun as, los sujetos tienen
diferencias individuales. Debes recordar que cuando tomas una muestra, se
trata de un subconjunto de toda la poblacin y, por lo tanto, puede haber una
diferencia entre la muestra y la poblacin. La causa ms frecuente de dicho
error es un procedimiento de muestreo sesgado. Todo investigador debe tratar
de establecer una muestra que est libre de sesgos y sea representativa de
toda la poblacin. As, el investigador es capaz de minimizar o eliminar el error
de muestreo.
Otra causa posible de este error es la casualidad. Se lleva a cabo el proceso

de aleatorizacin y muestreo de probabilidad para minimizar el error del
proceso de muestreo, pero igualmente es posible que todos los sujetos
asignados al azar no sean representativos de la poblacin. El resultado ms
comn de error de muestreo es el error sistemtico en donde los resultados de
la muestra difieren significativamente de los resultados de toda la poblacin. Se
entiende que si la muestra no es representativa de toda la poblacin, lo ms
probable es que los resultados de la muestra difieran de los resultados de toda
la poblacin.
40.4 Tamao De La Muestral
Es el nmero de observaciones que la componen. El tamao de la muestra

normalmente es representado por "n" y siempre es un nmero entero positivo.
No se puede hablar de ningn tamao exacto de la muestra, ya que puede
variar dependiendo de los diferentes marcos de investigacin. Sin embargo, si
93
todo lo dems es igual, una muestra de tamao grande brinda mayor precisin
en las estimaciones de las diversas propiedades de la poblacin.
94
UNIDAD V ESTIMACIN DE PARMETROS Y PRUEBAS DE HIPTESIS
41. Estimacin de la Media Poblacional
41.1 Definicin
41.1.1 Medida Poblacional
Es el valor esperado o esperanza matemtica aleatoria. Ha media puede ser

considerada como un promedio ya que es una medida de tendencia central: es
decir que los datos se agrupan mayormente en el centro. Tambin puede
definirse como el valor que se espera como resultado de un experimento
aleatorio cuando la probabilidad de cada suceso se mantiene constante y el
experimento se repite un elevado nmero de veces.
Para estimar la media poblacional por medio de intervalos de confianza, ser

necesario recordar que el Teorema Central del Lmite nos daba informacin de
cmo se hallaban distribuidas las medias mustrales: "normalmente" con una
media igual a la de la poblacin original m (que es la que ahora tratamos de
conocer) y desviacin tpica.
Obtenemos que
Supongamos que hemos analizado la muestra ya nombrada de media Km.,

y que sabemos que la desv. Tpica de la poblacin es de s=0,4 km., y que nos
planteamos estimar la media de todo el instituto, con un nivel de confianza del
95% .El proceso para realizar la estimacin es el siguiente:
Sabemos por el T.C.L. que las medias mustrales se distribuyen segn.
96
42. Caractersticas de la estimacin puntual y por intervalo
42.1 Caractersticas de Estimacin puntual
Sesgo Otra propiedad razonable que podemos pedir al estimador de un

parmetro es que, en promedio, sus valores coincidan con . Cuando sucede
esto decimos que el estimador es centrado o insesgado. Un smil coloquial que
suele aplicarse a la estimacin puntual es considerarla como un ejercicio de tiro
a una diana. En este sentido, el centro de la diana sera el parmetro a estimar
(). De manera los disparos de un tirador insesgado estaran centrados
alrededor del centro de la diana. Mientras que los disparos de un tirador
sesgado estaran sistemticamente desviados de la diana (como sucedera si
el can de nuestra arma no estuviese recto).
Carencia de sesgo. Se dice que un estimador es insesgado si el valor

esperado de su distribucin de probabilidad es igual al parmetro. Es decir, si
es igual a la media de los valores calculados en cada una de las muestras
aleatorias posibles del mismo tamao. Si el estadstico es utilizado como
estimador del parmetro , ese estimador carece de sesgo cuando:
E() =
Consistencia. Un estimador es consistente si, adems de carecer de

sesgo, se aproxima cada vez ms al valor del parmetro a medida que
aumenta el tamao de la muestra. Si el tamao n se hace indefinidamente
grande, los valores de se concentran cada vez ms en torno al valor del
parmetro, hasta que con un tamao muestral infinito obtenemos una varianza
del estimador nula. Por tanto, un estimador es consistente si cuando n tiende a
infinito se cumple
E() = ; var() = 0
97
1. Eficiencia. La eficiencia de un estimador est vinculada a su varianza
muestral. As, para un mismo parmetro , se dice que el estimador
1 es ms eficiente que el estimador 2 si se cumple
var(1) < var(2)

Por tanto, si un estadstico es ms eficiente que otro, significa que vara
menos de unas muestras a otras. Se demuestra que la media es un estimador
del parmetro ms eficiente que la mediana. Del mismo modo, la varianza
Sn-12 es un estimador de 2 ms eficiente que Sn2.
Suficiencia. Un estimador es suficiente cuando en su clculo se emplea toda

la informacin de la muestra. Por ejemplo, al calcular el estimador [D]del
correspondiente parmetro poblacional, utilizamos la frmula:
[D]
Para cuyo clculo se tienen en cuenta todas las puntuaciones X i. Otro tanto
ocurre con los estimadores S n-12 y Sn2 de la varianza. Todos ellos pueden ser
considerados estimadores suficientes de los respectivos parmetros.
42.2 Caractersticas de Estimacin por intervalos
La estimacin por intervalos consiste en establecer el intervalo de valores

donde es ms probable se encuentre el parmetro. La obtencin del intervalo
se basa en las siguientes consideraciones:
a) Si conocemos la distribucin muestral del estimador podemos obtener las

probabilidades de ocurrencia de los estadsticos mustrales.
b) Si conociramos el valor del parmetro poblacional, podramos establecer

la probabilidad de que el estimador se halle dentro de los intervalos de la
distribucin muestral.
c) El problema es que el parmetro poblacional es desconocido, y por ello el

intervalo se establece alrededor del estimador. Si repetimos el muestreo un
98
gran nmero de veces y definimos un intervalo alrededor de cada valor del
estadstico muestral, el parmetro se sita dentro de cada intervalo en un
porcentaje conocido de ocasiones. Este intervalo es denominado "intervalo de
confianza".
42.2.1 Un estimador puntual T
Un parmetro es cualquier estadstica que nos permita a partir de los
datos mustrales obtener valores aproximados del parmetro . Para indicar

que T es un estimador del parmetro escribimos = T.
Con esto queremos decir que empleamos la expresin dada mediante T

para obtener valores prximos al valor del parmetro. Es muy probable que
haya error cuando un parmetro es estimado. Es cierto que si el nmero de
observaciones al azar se hace suficientemente grande, stas proporcionaran
un valor que casi sera semejante al parmetro; pero a menudo hay
limitaciones de tiempo y de recursos y se tendr que trabajar con unas cuntas
observaciones. Para poder utilizar la informacin que se tenga de la mejor
forma posible, se necesita identificar las estadsticas que sean buenos
estimadores. Hay cuatro criterios que se suelen aplicar para determinar si una
estadstica es un buen estimador: Insesgamiento, eficiencia, consistencia y
suficiencia.
43. Error muestral
Es el error mximo estadstico de la muestra, vlido para el conjunto de

todas las distintas muestras que se pueden tomar de la misma poblacin. s el
error que surge a causa de observar una muestra de la poblacin completa.1
La estimacin de un valor de inters, como la media o el porcentaje, estar

generalmente sujeta a una variacin entre una muestra y otra. Estas
variaciones en las posibles muestras de una estadstica pueden, tericamente,
ser expresadas como errores muestrales, sin embargo, normalmente, en la
prctica el error exacto es desconocido. El error muestral se refiere en trminos
ms generales al fenmeno de la variacin entre muestras. Cuando este no es
99
mencionado se considera que el margen de error base es el 0.02% (0.2 para
muestreo paralelo y 2 para muestreo directo).
El error muestral deseado, generalmente puede ser controlado tomando

una muestra aleatoria de la poblacin, suficientemente grande, sin embargo, el
costo de esto puede ser limitante. Si las observaciones son tomadas de una
muestra aleatoria, la teora estadstica brinda clculos probabilsticos del
tamao deseado del error muestral para una estadstica en particular o
estimacin. Estos usualmente son expresados en trminos del error estndar.
El error muestral puede ser contrastado con el error no muestral, el cual se

refiere al conjunto de las desviaciones del valor real que no van en funcin de
la muestra escogida, entre los cuales se encuentran varios errores sistemticos
y algunos errores aleatorios. Resultan mucho ms difciles de cuantificar que el
error muestral.2
Grfico 34 Error Muestral
Tomado http://elestadistico.blogspot.com
Las pruebas empricas realizadas muestran que la distribucin de las

medidas de todas la muestra posible del mismo tamao en una poblacin se
ajusta por lo general a la ley normal de probabilidad (campana de Gauss).
100
Grfico 35 Error Muestral 2
Tomado http://elestadistico.blogspot.com

varianza poblacional conocida
Supongamos que disponemos de una poblacin en la que tenemos una v.a.

con distribucin N ( ,) con conocida (de estudios previos, por ejemplo).
Obtenemos una muestra de tamao n y deseamos estimar la media m de la
poblacin. El estimador puntual de la misma es la media muestral cuya
distribucin muestral es conocida.
La cantidad
Tendr distribucin normal estndar.
Sobre la distribucin N (0, 1) podremos seleccionar dos puntos simtricos

zyz, tales que
101
Grfico 41 Seleccin de los puntos crticos para el clculo del intervalo de confianza
Tomado http://biplot.usal.es/problemas/confianza/estimacion.htm
Sustituyendo Z por su valor en este caso particular
Despejando la media muestral y la varianza
Que verifica las condiciones de la definicin.
As, el intervalo de confianza para la media puede escribirse como
En la prctica, de todos los posibles valores de tenemos uno slo y por

tanto un nico intervalo de todos los posibles para distintas muestras.
La importancia del intervalo de confianza para la estimacin est en el hecho

de que el intervalo contiene informacin sobre el estimador puntual (valor
central del intervalo) y sobre el posible error en la estimacin a travs de la
dispersin y de la distribucin muestral del estimador. Obsrvese que el error
102
en la estimacin est directamente relacionado con la distribucin muestral del
estimador y con la varianza poblacional, e inversamente relacionado con el
tamao muestral.
El grfico siguiente ilustra la interpretacin del nivel de confianza para el

intervalo de confianza para la media de una distribucin normal con varianza
conocida. Para los distintos posibles valores de la media, representados
mediante su distribucin muestral, obtenemos distintos intervalos de confianza.
La mayor parte incluye al verdadero valor del parmetro, pero el resto no.
Concretamente el 95% lo incluye y el 5% no, si el nivel de confianza es del
95%.
En la prctica disponemos de una nica repeticin del experimento, y por

tanto de un nico intervalo de confianza, el sealado en negro en el grfico, por
ejemplo. Confiamos en que nuestro intervalo sea de la mayora que con tiene al
verdadero valor objetivo aunque no tenemos la seguridad de que sea as,
tenemos concretamente un riesgo del 5% de equivocarnos.
Grfico 36 Interpretacin del nivel de confianza en el intervalo para la media de

una distribucin normal.
Tomado
http://biplot.usal.es/problemas/confianza/estimacion.htm
103
varianza poblacional desconocida
La situacin prctica ms habitual es aquella en la que no se conoce la

varianza de la poblacin, que habr que estimar a partir de los datos
mustrales. Utilizaremos la cuasi-varianza muestral como estimador por sus
buenas propiedades. La distribucin muestral asociada a la cuasi-varianza es
la siguiente:
Teniendo en cuenta la distribucin normal asociada a las medias y

combinndola con la ji-cuadrado, obtenemos una distribucin t de Student:
Siguiendo el mismo proceso que en el caso de la normal el intervalo de

confianza resulta
Obsrvese la similitud con el intervalo calculado para la distribucin normal,

salvo en el valor crtico y en que la varianza ha sido estimada a partir de la
muestra.
104
Desde el punto de vista prctico esto implica que los valores crticos son un
poco ms grandes y, por tanto el intervalo tiene mayor longitud, este es el
precio que debemos pagar a cambio de no conocer la varianza de la poblacin.
Cuando el tamao muestral es grande, la distribucin t es muy similar a la

normal, de forma que pueden intercambiarse los valores crticos
correspondientes. El intervalo de confianza para la media en muestras grandes
se puede escribir como
45.1 Muestras grandes
El mtodo de estimacin de la media para muestras iguales o mayores a 30

datos se fundamenta en el teorema del lmite central en la unidad anterior, el
cual seala que conforme se incremente el tamao n de cada muestra posible
que se extrae de una poblacin de tamao N, la distribucin muestral de la
media ir adquiriendo la forma de una distribucin normal.
Cuando se conoce la desviacin estndar poblacional, la frmula para

estimar la media de una poblacin a travs de intervalos de confianza, con la
informacin contenida en una muestra con 30 o ms datos es:
105
Cuando no se conoce la desviacin estndar poblacional, la frmula para
estimar la media de una poblacin a travs de intervalos de confianza, con la
informacin contenida en una muestra grande es:
46. Determinacin del tamao de muestra
46.1 concepto del tamao de muestra
Es el nmero de sujetos que componen la muestra extrada de una

poblacin, necesarios para que los datos obtenidos sean representativos de la
poblacin. El tamao de la muestra normalmente es representado por "n" y
siempre es un nmero entero positivo. No se puede hablar de ningn tamao
exacto de la muestra, ya que puede variar dependiendo de los diferentes
marcos de investigacin. Sin embargo, si todo lo dems es igual, una muestra
de tamao grande brinda mayor precisin en las estimaciones de las diversas
propiedades de la poblacin.
Hasta ahora hemos estudiado mtodos para obtener intervalos de confianza

de parmetros de una poblacin, basndonos en la informacin contenida en
una muestra dada. Sin embargo, se puede pensar que el intervalo de confianza
es demasiado amplio reflejando una importante incertidumbre sobre el
parmetro estimado. La nica manera de obtener un intervalo ms preciso, con
un nivel de confianza dado, es aumentando el tamao muestral.
En algunas circunstancias, se puede fijar previamente la amplitud del

intervalo, eligiendo un tamao muestral adecuado. Por ejemplo en el caso de la
106
media de una poblacin normal con conocido, si se fija la amplitud L y se
mantiene el nivel de confianza en 1 el tamao muestral ptimo es:
Es decir, la nica diferencia radica en que la primera frmula utiliza la

desviacin estndar poblacional, mientras que en la segunda frmula se utiliza
la desviacin estndar que se obtiene de la muestra. Observa que ambas
frmulas proporcionan dos valores que definen un intervalo en el que se
encuentra contenida la verdadera media poblacional con un nivel de confianza
que se traduce en la probabilidad de que la media poblacional se encuentre
dentro de nuestro intervalo de confianza. El intervalo de confianza tambin
puede expresarse como:
Observa que el intervalo se encuentra acotado por los dos valores

resultantes. Al valor que se encuentra en la parte izquierda del intervalo se le
conoce como la cota inferior, la cual seala el valor mnimo que puede adquirir
la media poblacional. Al valor que se encuentra en la parte derecha de la
frmula se le conoce como la cota superior, la cual seala el valor mximo que
puede adquirir la media de la poblacin.
Los elementos que conforman el intervalo de confianza son:
107
El primer componente es el estadstico puntual para la media
poblacional, el cual sirve como referencia para establecer el intervalo de
confianza. El segundo componente es un valor que se encuentra

estrechamente relacionado con el nivel de confianza del intervalo y se obtiene
de la tabla de la distribucin normal estandarizada.
El ltimo componente, , es el error estndar de la media muestral o la

desviacin estndar de la distribucin de El nivel de confianza sirve para
determinar el valor de . Para esto, uno determina un nivel de confianza

considerable, por ejemplo, 90%, 95%, 98% o 99%. Este nivel de confianza se
define como (1 ) % y seala el porcentaje de todos los intervalos que se
pueden construir con todas las medias mustrales posibles que contendrn al
verdadero valor de la media poblacional. Cabe sealar que se define como el
nivel de significancia y representa la probabilidad de que el parmetro no se
encuentre considerado dentro del intervalo estimado. Los niveles de confianza
ms comunes y sus respectivos valores de son:
Tabla 4 Niveles de Confianza Ms Utilizados
Tomado: http://gc.initelabs.com
108
Esto quiere decir que, si se est trabajando con un nivel de confianza de (1 )
% = 90%, el valor de que se debe utilizar en la frmula del intervalo de

confianza es 1.645. Lo mismo sucede para los niveles de confianza de 95%,
98% y de 99%, cuyos valores de son 1.96, 2.326 y 2.576,

respectivamente.
No hay que olvidar que este mtodo de estimacin est basado en el

teorema central del lmite, el cual permite asegurar que al extraer una muestra
grande para realizar inferencias sobre el comportamiento de la poblacin, la
media muestral tiene una distribucin normal, sin importar cmo sea la
distribucin original de los datos de la poblacin. En ese sentido, el error que se
puede cometer al utilizar a como estimador de ser de una magnitud
aproximada al valor de E= ( )al que se le conoce como el error

mximo de la estimacin. De una manera ms formal, a continuacin se
expondr el procedimiento para obtener la frmula de intervalos de confianza
para muestras grandes utilizando el teorema del lmite central. Para ello se
utilizar el estadstico Z de la distribucin muestral estandarizada de la media
Si se sabe que, en general es la media de una muestra de tamao n30

tomada de una poblacin con media y desviacin estndar la distribucin
de la media muestral estandarizada es aproximadamente una normal con
media uno y varianza cero, cuyo estadstico se representa por:
109
Ahora bien, recordemos de la unidad 4 que el valor Z seala a qu distancia
se encuentra
alejado un valor especfico de la media de una distribucin. La relacin que

existe entre dos valores
de Z y el porcentaje de datos de la poblacin que se encuentra incluido entre

esos dos valores de Z,
(1 )%, viene dado por:
La frmula anterior establece que la variable aleatoria Z puede adquirir un
valor comprendido en el intervalo que va de con una

probabilidad de 1 , o un porcentaje de (1 )% de. Ver grfico
Grfico 37 Nivel De Confianza
Tomado: http://gc.initelabs.com
47. Estimacin de la Proporcin Poblacional
47.1 Concepto de Estimacin
Estimar qu va a ocurrir respecto a algo (o qu est ocurriendo, o qu

ocurri), a pesar de ser un elemento muy claramente estadstico, est muy
110
enraizado en nuestra cotidianidad. Dentro de ello, adems hacemos
estimaciones dentro de un intervalo de posibilidades.
47.2 Estimacin puntual de la proporcin poblacional
Un estimador de un parmetro poblacional es una funcin de los datos

mustrales. En pocas palabras, es una frmula que depende de los valores
obtenidos de una muestra, para realizar estimaciones. Lo que se pretende
obtener es el valor exacto de un parmetro. Por ejemplo, si se pretende estimar
la talla media de un determinado grupo de individuos, puede extraerse una
muestra y ofrecer como estimacin puntual la talla media de los individuos de la
muestra. La media de la muestra puede ser un estimador de la media de la
poblacin, la cuasivarianza muestral es un buen estimador de la varianza
poblacional y el total muestral es un buen estimador del total poblacional.
Por ejemplo: qu proporcin de posibles votantes optan por un candidato A

frente a otro B? Otras veces interesa saber, qu proporcin de individuos de
una poblacin, presentan una caracterstica A, frente a los que no la presentan.
En cualquier caso, como normalmente no podemos estudiar a todos los

individuos de una poblacin porque, o es muy caro o sencillamente es
imposible, tenemos que tomar una muestra Estudiamos la proporcin de
individuos que presentan la caracterstica, objeto de estudio, en la muestra que
hemos tomado, as tenemos la proporcin de la muestra, que representaremos
por P (p mayscula) ; en general, no coinciden la proporcin de la poblacin, p
y la proporcin de la muestra P.
Sea la muestra que hemos tomado, de n individuos, si al individuo que

presenta la caracterstica objeto de estudio, le asignamos el valor 1 y al que no
la presenta le asignamos el valor 0, tenemos el parmetro de la muestra Sj,
que representa el nmero j de individuos de la muestra, que presentan la
propiedad objeto de estudio.
La proporcin de la muestra, P, es:
111
Si tomamos aleatoriamente muestras de tamao n, el parmetro Sj de las
muestras sigue, una distribucin binomial b(n,p), donde p es la proporcin de
la poblacin.
Y podemos definir la variable xj :
Que tambin sigue una distribucin binomial y que bajo ciertas condiciones,
se puede estndar. Como:
Y xj se ajusta a una distribucin normal estndar, la proporcin de las

muestras de tamao n, P sigue una distribucin normal, de media p (proporcin
de la poblacin) y desviacin tpica:
112
As pues, el valor ms esperado (la media) de las proporciones de las
muestras, P, es la proporcin de la poblacin p y adems cuando aumenta el
tamao de las muestras, P se aproxima a p.
La proporcin de la muestra, P, es un buen estimador para la proporcin de

la poblacin, p. En los prrafos anteriores hemos visto, como, bajo ciertas
condiciones, la distribucin de P , cuando n aumenta, tiende a una distribucin
normal de media p y desviacin tpica :
En la prctica, las condiciones que se consideran suficientes para que la

estima sea aceptable, son:
Sabemos cmo se distribuyen las proporciones mustrales, slo

desconocemos la proporcin de la poblacin. Si supiramos la proporcin de la
poblacin, podramos calcular un intervalo, alrededor de la media de las
proporciones de las muestras (proporcin de la poblacin), tal que con una
probabilidad dada, las proporciones de las muestras estuvieran dentro de ese
intervalo.
Por ejemplo, supongamos que queremos que la probabilidad de que la

proporcin de una muestra est dentro de un intervalo a calcular, sea de 0,95;
slo tenemos que tipificar P y mediante la tabla de la distribucin normal
estndar, calcular t para = 1-0,95=0,05.
113
Como no conocemos la proporcin de la poblacin, p, la sustituimos por la
proporcin de la muestra, P, con lo cual el intervalo ser diferente para cada
muestra, pero, con probabilidad 1- , la proporcin de la poblacin, estar
dentro del intervalo as calculado y tendremos una estimacin de la proporcin
de la poblacin por un intervalo.
47.2.1 Propiedades deseables de un estimador
Las propiedades o criterios para seleccionar un buen estimador son los

siguientes:
47.2.1.1 Insesgadez
Diremos que un estimador * de un parmetro es insesgado si su

esperanza coincide con el verdadero valor del parmetro. E [* ] = . En el
caso de que no coincidan, diremos que el estimador es sesgado.
47.2.1.2 Eficiencia
Dados dos estimadores 1 * y 2 * para un mismo parmetro , se dice que

1 * es ms eficiente que 2 * si: V [1 * ] < V[2 * ].
114
47.2.1.3 Suficiencia
Se dice que un estimador de un parmetro es suficiente cuando para su

clculo utiliza toda la informacin de la muestra.
47.2.1.4 Consistencia
Decimos que un estimador * de un parmetro es consistente si la

distribucin del estimador tiende a concentrarse en un cierto punto cuando el
tamao de la muestra tiende a infinito.
Es frecuente, en los sondeos de opinin, investigar las preferencias de la

poblacin por una determinada opcin A, frente a otra opcin B.
47.3 Mtodos para obtener estimadores
El demostrar que un cierto estimador cumple estas propiedades puede ser

complicado en determinadas ocasiones. Existen varios mtodos que nos van a
permitir obtener los estimadores puntuales. Los ms importantes son:
47.3.1 Mtodo de los momentos
Se basa en que los momentos poblacionales y se estiman mediante los

momentos mustrales. Suelen dar estimadores consistentes.
47.3.2 Mtodo de mnimos cuadrados
Consiste en obtener un estimador que hace mnima una determinada

funcin.
47.3.3 Mtodo de mxima verosimilitud
Consiste en tomar como parmetro poblacional el valor de la muestra que

sea ms probable, es decir, que tenga mayor probabilidad. Se suelen obtener
estimadores consistentes y eficientes. Es el ms utilizado.
La probabilidad de que la media muestral sea igual a la media poblacional es

cero, P [x ] = 0x , es decir, que ser bastante complicado obtener un
115
estimador puntual, por ello se utiliza ms el Intervalo de Confianza y el
Contraste de Hiptesis.
47.4 Estimacin por intervalos de confianza
El intervalo de confianza est determinado por dos valores dentro de los

cuales afirmamos que est el verdadero parmetro con cierta probabilidad. Son
unos lmites o margen de variabilidad que damos al valor estimado, para poder
afirmar, bajo un criterio de probabilidad, que el verdadero valor no los rebasar.
Es una expresin del tipo [1, 2] 1 2, donde es el parmetro a
estimar. Este intervalo contiene al parmetro estimado con una determinada
certeza o nivel de confianza.
En la estimacin por intervalos se usan los siguientes conceptos:
47.4.1 Variabilidad del parmetro
Si no se conoce, puede obtenerse una aproximacin en los datos o en un

estudio piloto. Tambin hay mtodos para calcular el tamao de la muestra que
prescinde de este aspecto. Habitualmente se usa como medida de esta
variabilidad la desviacin tpica poblacional y se denota .
47.4.2 Error de la estimacin
Es una medida de su precisin que se corresponde con la amplitud del

intervalo de confianza. Cuanta ms precisin se desee en la estimacin de un
parmetro, ms estrecho deber ser el intervalo de confianza y, por tanto,
menor el error, y ms sujetos debern incluirse en la muestra estudiada.
Llamaremos a esta precisin E, segn la frmula E = 2 - 1.
47.4.3 Nivel de confianza
Es la probabilidad de que el verdadero valor del parmetro estimado en la

poblacin se site en el intervalo de confianza obtenido. El nivel de confianza
se denota por (1-), aunque habitualmente suele expresarse con un porcentaje
116
((1-) 100%). Es habitual tomar como nivel de confianza un 95% o un 99%,
que se corresponden con valores de 0,05 y 0,01, respectivamente.
47.4.4 Valor
Tambin llamado nivel de significacin. Es la probabilidad (en tanto por uno)

de fallar en nuestra estimacin, esto es, la diferencia entre la certeza (1) y el
nivel de confianza (1-). Por ejemplo, en una estimacin con un nivel de
confianza del 95%, el valor es (100-95)/100 = 0,05.
47.4.5 Valor crtico
Se representa por Z/2. Es el valor de la abscisa en una determinada

distribucin que deja a su derecha un rea igual a /2, siendo 1- el nivel de
confianza. Normalmente los valores crticos estn tabulados o pueden
calcularse en funcin de la distribucin de la poblacin. Por ejemplo, para una
distribucin normal, de media 0 y desviacin tpica 1, el valor crtico para =
0,05 se calculara del siguiente modo: se busca en la tabla de la distribucin
ese valor (o el ms aproximado), bajo la columna "rea"; se observa que se
corresponde con -0,64. Entonces Z/2 = 0,64. Si la media o desviacin tpica
de la distribucin normal no coinciden con las de la tabla, se puede realizar el
cambio de variable t=(X-)/ para su clculo.
Con estas definiciones, si tras la extraccin de una muestra se dice que "3
es una estimacin de la media con un margen de error de 0,6 y un nivel de
confianza del 99%", podemos interpretar que el verdadero valor de la media se
encuentra entre 2,7 y 3,3, con una probabilidad del 99%. Los valores 2,7 y 3,3
se obtienen restando y sumando, respectivamente, la mitad del error, para
obtener el intervalo de confianza segn las definiciones dadas.
Para un tamao fijo de la muestra, los conceptos de error y nivel de

confianza van relacionados. Si admitimos un error mayor, esto es, aumentamos
el tamao del intervalo de confianza, tenemos tambin una mayor probabilidad
de xito en nuestra estimacin, es decir, un mayor nivel de confianza. Por
tanto, un aspecto que debe de tenerse en cuenta es el tamao muestral, ya
117
que para disminuir el error que se comente habr que aumentar el tamao
muestral. Esto se resolver, para un intervalo de confianza cualquiera,
despejando el tamao de la muestra en cualquiera de las frmulas de los
intervalos de confianza que veremos a continuacin, a partir del error mximo
permitido.
47.5 Estimacin por intervalo de la proporcin poblacional.
Estimar un parmetro es proponer un valor para el mismo a partir de la

muestra; un estimador del porcentaje poblacional sera el porcentaje de
diabticas al que se haca mencin anteriormente de una muestra; a este tipo
de estimacin se le llama estimacin puntual. Es bastante probable que el valor
que se obtiene no sea realmente el valor del parmetro en la poblacin.
Una alternativa mejor es la estimacin por intervalos; se da con ella un rango

de valores que contendr el valor del parmetro con una cierta confianza o
seguridad, que habitualmente es del 95%. La afirmacin hecha mediante un
intervalo de confianza (IC) es preferible a la hecha por estimacin puntual, ya
que permite cuantificar la magnitud del error asociado a la estimacin. Un
concepto importante al realizar estimaciones es el error estndar, que est
relacionado con la calidad de la estimacin.
El intervalo de confianza, para la proporcin de una poblacin, con un nivel

de confianza de 1-, teniendo la proporcin, P, de una muestra de tamao n,
es:
Donde t queda determinado en la tabla de la distribucin normal estndar

en funcin de .
47.5.1 Error mximo con una confianza de 1-
118
47.5.2 Determinacin del tamao de muestra para estimar una
proporcin poblacional.
47.5.2.1 Tamao de la muestra
El error mximo depende del tamao de la muestra: a muestras mayores

corresponden errores menores. Normalmente, cuando queremos hacer una
estimacin, con un determinado margen de confianza, nos plantearemos que el
error mximo tenga un determinado valor. Imaginemos por ejemplo que
queremos conocer el porcentaje de alumnos de nuestro centro, que es
favorable a hacer la Fuga de San Diego el da 12 de Noviembre (este carcter
se considerar como xito) en contraposicin con los que la quieren hacer en
otra fecha. Nos marcamos un nivel de confianza del 90%, y queremos que el
error mximo no sobrepase el 10%.
La estimacin de proporciones es de gran importancia en la vida cotidiana,

dado que influyen por ejemplo en la programacin de la tv, los productos que
consumimos, las leyes que se legislan, En los peridicos, revistas, televisin y
los informativos de radio, es muy corriente que se den informes de encuestas.
Sin embargo frecuentemente, se dan porcentajes, sin ninguna indicacin del
grado de confianza, el margen de error o el tamao de la muestra. Sin conocer
estos datos, no podemos tener una idea clara de la calidad de los resultados
obtenidos, por lo que deberas siempre de tratar de conocer la ficha tcnica de
estos estudios.
119
48. Determinacin del tamao de muestra para estimar una proporcin
poblacional.
Los procedimientos utilizados para determinar los tamaos de muestra para

estimar una proporcin de la poblacin son parecidos a los que se utilizan para
estimar una media de poblacin. Suponga que deseamos encuestar a
estudiantes de una universidad grande. Deseamos determinar qu proporcin
de stos est a favor de un nuevo sistema de evaluacin. Nos gustara contar
con un tamao de muestra que nos permita tener una certeza del 90% de que
estamos estimando la proporcin verdadera de la poblacin de 40,000
estudiantes a favor del nuevo sistema de evaluacin, ms menos 0.02.
Desde una perspectiva de sentido comn, si la desviacin estndar de una

poblacin es muy pequea, los valores se agrupan muy cerca de la media y
casi cualquier tamao de muestra los captar y producir informacin precisa.
Por otro lado, si la desviacin estndar de la poblacin es muy grande y los
valores estn bastante dispersos, ser necesaria una muestra muy grande para
incluirlos y obtener informacin correcta. Cmo puede tenerse una idea de la
desviacin estndar de la poblacin antes de iniciar el muestreo? Las
compaas que planean realizar estudios de mercado casi siempre hacen una
investigacin preliminar de la poblacin para estimar la desviacin estndar.
Si el producto se parece a otro que ha estado en el mercado, a menudo es

posible apoyarse en los datos anteriores acerca de la poblacin sin ms
estimaciones.
El intervalo de confianza para estimar una proporcin est determinado por

la estimacin puntual (po) y por la amplitud o anchura de dicho intervalo,
nominada precisin (d).
120
Despejando n, se obtiene la frmula para calcular el nmero de
observaciones o individuos necesarios para estimar una proporcin:
49. Pruebas de Hiptesis
Las pruebas de hiptesis son un procedimiento estadstico que usa datos

mustrales para determinar si una afirmacin acerca del valor de un parmetro
poblacional debe o no rechazarse. Como hiptesis se tienen dos afirmaciones
opuestas acerca de un parmetro poblacional. A una de las afirmaciones se le
llama hiptesis nula (H0) y a la otra, hiptesis alternativa (Ha).
Si se tienen datos histricos o alguna otra informacin, stos proporcionan

una base para suponer que se conoce la desviacin estndar poblacional, el
procedimiento de prueba de hiptesis para la media poblacional se sustenta en
la distribucin normal estndar. Si no se conoce , se usa la desviacin
estndar muestral para estimar y el procedimiento de la prueba de hiptesis
se basa en la distribucin t.
En ambos casos, la calidad de los resultados depende tanto de la forma de

la distribucin de la poblacin como del tamao de la muestra. Si la poblacin
tiene distribucin normal, los dos procedimientos para la prueba de hiptesis
son aplicables, aun con tamaos de muestra pequeos. Si la poblacin no est
distribuida normalmente, se necesitan tamaos de muestra mayores. Se
proporcionaron los lineamientos generales para el tamao de la muestra. En el
caso de pruebas de hiptesis para la proporcin poblacional, en el
procedimiento de la prueba de hiptesis se usa un estadstico de prueba
sustentado en la distribucin normal estndar. En todos los casos el valor del
estadstico de prueba se usa para calcular un valor-p para la prueba.
121
Un valor-p es una probabilidad que se usa para determinar si se rechaza o
no la hiptesis nula. Si el valor-p es menor o igual que el nivel de significancia
, la hiptesis nula puede rechazarse.
Las conclusiones de una prueba de hiptesis tambin pueden obtenerse

comparando el valor del estadstico de prueba con el valor crtico. En pruebas
de la cola inferior, la hiptesis nula se rechaza si el valor del estadstico de
prueba es menor o igual que el valor crtico. En pruebas de la cola superior, la
hiptesis nula se rechaza si el valor del estadstico de prueba es mayor o igual
al valor crtico. En las pruebas de las dos colas hay dos valores crticos: uno en
la cola inferior de la distribucin muestral y otro en la cola superior de la
distribucin muestral. En este caso, la hiptesis nula se rechaza si el valor del
estadstico de prueba es menor o igual al valor crtico de la cola inferior o
mayor o igual que el valor crtico de la cola superior.
Tambin se presentaron extensiones de los procedimientos de prueba de

hiptesis para incluir un anlisis del error tipo II. La prueba de hiptesis
comienza con una suposicin, llamada hiptesis, que hacemos acerca de un
parmetro de poblacin. Despus recolectamos datos de muestra, producimos
estadsticas mustrales y usamos esta informacin para decidir qu tan
probable es que nuestro parmetro de poblacin hipottico sea correcto.
Digamos que suponemos un cierto valor para una media de poblacin. Para
probar la validez de esa suposicin recolectamos datos de muestra y
determinamos la diferencia entre el valor hipottico y el valor real de la media
de la muestra.
Despus juzgamos si la diferencia obtenida es significativa o no. Mientras

ms pequea sea la diferencia, mayor ser la probabilidad de que nuestro valor
hipottico para la media sea correcto. Mientras mayor sea la diferencia, ms
pequea ser la probabilidad. Desafortunadamente, la diferencia entre el
parmetro de poblacin hipottico y la estadstica real rara vez es tan grande
que rechacemos automticamente nuestra hiptesis o tan pequea que la
aceptamos con la misma rapidez. As, en las pruebas de hiptesis como en la
122
mayora de las decisiones importantes de la vida real, las soluciones claras o
bien definidas son la excepcin, no la regla.
Supongamos que una administradora de un gran centro comercial nos dice

que la eficiencia de trabajo promedio de sus empleados es de al menos 90%.
Cmo podemos probar la validez de su hiptesis? Si hiciramos esto y el
estadstico de la muestra resultara ser 95%, aceptaramos sin demora la
afirmacin de la administradora. Sin embargo, si el estadstico de la muestra
resultara ser el 46%, rechazaramos su afirmacin por falsa. Podemos
interpretar estos dos resultados, 95 y 46%, si utilizamos el sentido comn.
49.1 Contraste de hiptesis
El problema central de la inferencia estadstica es un problema de toma de

decisiones, del cual la estimacin y el contraste de hiptesis son aspectos
importantes, diferenciados entre s, pero complementarios.
Un contraste de hiptesis o Test de hiptesis estadstico es una prueba de

significacin o una prueba estadstica, que indican el proceso mediante el cual
decidimos si una proposicin respecto de la poblacin, debe ser aceptada o no.
Esta proposicin es lo que se denomina hiptesis estadstica.
Es una regla de decisin que nos dice cuando aceptar y rechazar las
hiptesis, con esto vemos si los datos de una muestra son compatibles o no
con los de la poblacin.
49.1.2 Una hiptesis estadstica
Es una proposicin acerca de la funcin de probabilidad o de la funcin de

densidad de probabilidad de una variable aleatoria o de varias variables
aleatorias. Tal proposicin debe referirse bien a la forma de la distribucin de
probabilidad, bien al valor o valores de los parmetros que lo definan o bien a
ambos. Hiptesis estadstica es, una afirmacin acerca de la distribucin de la
poblacin. Puede haber hiptesis estadsticas en contextos paramtricos y no
paramtricos.
123
El contraste de hiptesis estadstico se basar en la informacin
proporcionada por la muestra. De modo, que si rechazamos la hiptesis,
queremos indicar que los datos de la muestra ofrecen cierta evidencia sobre su
falsedad. Si la aceptamos simplemente queremos significar que no se rechaza.
Un contraste de hiptesis consiste, por tanto, en estudiar dos hiptesis: H0
(hiptesis nula), H1 (hiptesis alternativa), de manera que el investigador divide
los resultados mustrales en dos zonas; una zona de rechazo y otra de
aceptacin, de manera que segn como obtengamos el resultado, aceptaremos
o rechazaremos la hiptesis.
Al aplicar un contraste de hiptesis, clasificamos los puntos del espacio

muestral en dos regiones excluyentes y complementarias:
49.1.3 Regin de Rechazo o Regin Crtica
Es la formada por el conjunto de los valores del estadstico de contraste que

nos llevan a rechazar la hiptesis nula H0, se llama regin crtica (los puntos
que delimitan la regin crtica se llaman puntos crticos).
49.1.4 Regin de Aceptacin o Regin de No Rechazo
Es la formada por el conjunto de los valores del estadstico de contraste que

nos lleva a aceptar la hiptesis nula H0.
50. Planteamiento de la hiptesis estadstica
Es aquella hiptesis que se desea contrastar se llama hiptesis nula (Ho),

por tanto, la que se acepta o rechaza como conclusin del contraste. La
124
hiptesis nula suele ser una estrategia o medio del que se sirve el investigador
para probar la alternativa. Suele ir acompaada por la hiptesis alternativa o
hiptesis experimental, simbolizada por H1.
La hiptesis alternativa es la que se verifica cuando no se verifica la

hiptesis nula. El planteamiento de Ho permite elaborar un modelo
Probabilstico a partir del cual podemos llegar a la decisin final. A su vez, al
plantear una hiptesis, esta puede ser simple o compuesta. Una hiptesis es
simple si se especifica exactamente el valor del parmetro. Una hiptesis es
compuesta, si contiene dos o ms valores del parmetro. La hiptesis nula (Ho)
por ser ms concreta suele ser simple y la alternativa, compuesta. Es frecuente
plantearlas como complementarias.
50.1 Supuestos
Las suposiciones que podemos hacer dependiendo del tipo de contraste que
necesitemos son:
a) Supuestos acerca de las caractersticas o de los datos que se van a

manipular, como puede ser la independencia de las observaciones, nivel de
medida utilizada, y otros.
b) Supuestos acerca de la forma de distribucin de partida: Normal,

Binomial, entre otros.
La violacin de los supuestos podr invalidar ms o menos el modelo

probabilstico y llevarnos a decisiones errneas. Concierne al investigador
conocer las consecuencias que se derivan de la violacin de tales supuestos
sobre el modelo. Por este motivo, si se plantean los supuestos deben ser
mnimos y no demasiado exigentes.
Por ejemplo, se puede plantear de partida:
Poblaciones de partida: normales.

Muestras independientes.
Observaciones de las muestras: independiente.
125
50.2 Estadstico de Contraste
Estadstico de Contraste es, aquel estadstico (T) que utilizamos para tomar
una decisin en un contraste de hiptesis. Este estadstico es una variable
aleatoria, con una distribucin muestral determinada, que nos dar las
probabilidades asociadas a un valor o un determinado intervalo de valores del
estadstico de contraste. Este deber cumplir todas las caractersticas que se
mencionaron anteriormente cuando se habl de los estadsticos.
50.3 Reglas de decisin
Una regla de decisin es el criterio utilizado para decidir si aceptamos o

rechazamos la hiptesis nula, a partir del espacio muestral de valores del
estadstico de contraste y probabilidades asociadas.
Este criterio consiste en dividir tal espacio en dos zonas mutuamente

excluyentes y exhaustivas: la zona de rechazo o regin crtica y la zona de
aceptacin. La zona de rechazo est constituida por aquellos valores del
estadstico de contraste que se alejan mucho de Ho, por lo tanto es muy poco
probable que ocurran si Ho es verdadera. Por ejemplo, a continuacin se
pueden ver dos ejemplos de contrastes, uno unilateral y otro bilateral, aunque
se pueden crear muchos ms. Un contraste de hiptesis unilateral es de la
forma (hay ms formas):
Ho: = o
H1: >o
Un contraste de hiptesis bilateral es de la forma:
Ho: = o
H1: o
Decidimos que un contraste es unilateral o direccional, si para tomar la

decisin de rechazar Ho nos servimos exclusivamente de los valores muy
grandes o exclusivamente de los valores muy pequeos del estadstico de
contraste.
126
Decidimos que un contraste es bilateral o no direccional, si utilizamos los
valores muy grandes y muy pequeos de los posibles valores del estadstico
de contraste.
Si la distribucin, bajo la H1, slo puede estar a la derecha ser ms potente

si colocamos a la derecha toda la regin crtica.
Si la distribucin, bajo la H1, puede estar a la derecha o la izquierda sera un

test ms potente el que pone parte de la regin crtica a la derecha y parte a la
izquierda. El valor se llama nivel de significacin o nivel de riesgo y
representa a la probabilidad de que un nivel concreto del estadstico de
contraste, caiga en la zona de rechazo o crtica, es decir, es el conjunto de
valores del estadstico de contraste que nos lleva a la decisin de rechazar la
hiptesis nula.
El valor (1-) se llama nivel de confianza, es el conjunto de valores del

estadstico de contraste que nos lleva a la decisin de aceptar la hiptesis nula.
En los contrates unilaterales est concentrada en uno de los dos extremos de
la distribucin, en una nica cola. En los contrastes bilaterales se reparte
entre los dos extremos de la distribucin, en las dos colas. Los contrastes
127
unilaterales suelen ser mejores que los contrates bilaterales. La eleccin de
uno u otro, est condicionada al planteamiento de la hiptesis alternativa.
50.4 Clculo del estadstico y toma de decisin
Antes de poder tomar una decisin se debe recopilar los datos con los que
se van a trabajar, es decir, se obtienen los datos de una o varias muestras y los
estimadores del parmetro (proporcin, media, y otros.) correspondiente,
calculamos el valor concreto del estadstico de contraste y fijado el nivel de
significacin con la zona crtica, si el valor de tal estadstico cae en la zona
crtica, rechazamos las hiptesis nula y por tanto, aceptamos la hiptesis
alternativa. En este caso debemos interpretar que no hay evidencia suficiente
para decidir que es falsa. En caso contrario se aceptar la hiptesis nula.
50.5 Errores en los contrates de hiptesis
Cuando se realiza un contraste de hiptesis, siempre debemos tener en

cuenta que cuando aceptamos o rechazamos una hiptesis puede que
estemos cometiendo un cierto error. Cuando Rechazamos Ho, significa que Ho
es falsa y cuando aceptamos Ho, significa que Ho es verdadera. Por tanto, se
pueden considerar, dos tipos de errores que se pueden cometer cuando se
realiza un contraste:
Error tipo I (): Es el error que se comete en la decisin del contraste cuando
se rechaza la hiptesis nula (Ho), siendo correcta (cierta).
Error tipo II (): Es el error que se comete en la decisin del contraste

cuando se acepta la hiptesis nula (Ho), siendo falsa.
En la siguiente tabla se puede ver de forma ms concreta:
128
De aqu se pueden obtener las siguientes conclusiones que deben de
tenerse en cuenta:
El ERROR II es el ms grave, al que tambin se le conoce como potencia

del contraste, y se representa con la letra .
es el valor de significacin, nos dice a partir de qu valor estamos

cometiendo un error tipo I. As, las probabilidades asociadas a los tipos dos
tipos de Error vienen dadas por las siguientes expresiones:
1.- Nivel de significacin o tamao del contraste ():
=P(error tipo I}=P{rechazar Ho / Ho cierta}
2.- Potencia del contraste ():
= P {rechazar Ho / Ho falsa}=1-P{ Aceptar Ho / Ho falsa}= 1-P{error tipo II}
50.6 Potencia de un contrate
Se llama potencia de un contraste a la probabilidad de rechazar Ho, cuando

es falsa. Su probabilidad es 1-. Ms estrictamente debera llamarse potencia
de regin crtica. No es ms que la probabilidad de que sta detecte una Ho
falsa dado un valor para H1. Los valores de y no tienen la misma
importancia psicolgica. Es el investigador el que en cada caso deber saber
que error tiene ms importancia para tratar de disminuirlo. Para disminuir el
valor de es necesario aumentar el tamao de la muestra.
50.6.1 Curvas de potencia de un contrate
Fijado un nivel de significacin (), una hiptesis nula y una hiptesis

alternativa, tendremos una potencia para cada valor que tome la hiptesis
alternativa (H1). La curva que se obtiene al relacionar los posibles valores de
H1 con los correspondientes (1-), se llama curva de potencia o funcin de
potencia. Cuanto mayor es el nivel de significacin (probabilidad Error Tipo I)
mayor es la potencia.
129
50.7 Efecto del tamao de la muestra en la potencia
Se trata de poner de manifiesto cmo, manteniendo constante , al

aumentar el tamao de la muestra decrece el valor de , y por tanto, se
incrementa la potencia, la capacidad del contraste para distinguir H0 y H1. Al
igual que ocurra en los intervalos de confianza, el tamao de la muestra ser
importante para determinar el error que se comete o cual es el tamao de la
muestra necesario para mantener un determinado error mnimo.
50.8 Violacin de los supuestos en los contrastes de hiptesis
A continuacin, se detalla de forma esquemtica en que situaciones se

deben utilizar otras distribuciones asociadas a la normal.
50.8.1 Utilizacin de la distribucin T-Student, en el contraste de
a) Independencia: m.a.s. y poblacin pequea
b) Normalidad: Si la muestra es grande no presenta serios problemas. Si la

muestra es pequea los contrastes unilaterales aumentan el error. Por lo tanto,
si la muestra es grande haremos un contraste unilateral, si utilizamos la
distribucin t-student y no se puede asumir que la poblacin es normal.
50.8.2 Utilizacin de la distribucin T-Student, en el contraste de 1 - 2
a) Independencia: Muy importante.
b) Normalidad.
c) Igualdad de varianzas
50.8.3 Utilizacin de la distribucin Chi-Cuadrado (x), en el contraste
El supuesto de normalidad lleva consigo un error, que no podemos corregir

aumentando el tamao muestral.
130
50.8.4Utilizacin de la distribucin F-Snedecor en el contraste de 1/
2
No se puede usar si las poblaciones no son normales o los tamaos de las

muestras no son grandes. Tampoco debe utilizarse si la independencia no es
segura.
50.9 Propiedades deseables en los contrastes de hiptesis
El investigador debe seleccionar aquella prueba que le sirve para contrastar

su hiptesis y procurar que se cumplan los supuestos que la sustentan,
adems deben de reunir estas propiedades:
50.9.1 Carencia de Sesgo
Un Contraste de Hiptesis es una prueba insesgada de Ho, si la probabilidad

de rechazar Ho cuando es falsa, es igual o mayor que la probabilidad de
rechazar Ho cuando es cierta. Es decir, si su potencia es mayor igual que su
nivel de significacin.
50.9.2 Consistencia
Una secuencia de contrastes es consistente frente a todas las alternativas

Hi, si su funcin de potencia se aproxima a 1, a medida que n tiende al infinito.
Se supone >0 y constante
50.10 El concepto de p-valor
Cuando se realiza un contraste de hiptesis sabemos que a partir del nivel

de significacin delimitamos la zona de aceptacin y de rechazo. En ocasiones
es muy interesante calcular el nivel de significacin a partir del cual la hiptesis
nula, H0, se va a rechazar. Esta es la idea o concepto del p-valor.
131
El p-valor puede considerarse como el valor lmite para que un contraste sea
significativo, es decir, elegido un nivel de significacin , se rechazar H0 si p
.
51. Formulacin de las hiptesis estadsticas
La formulacin de cualquier hiptesis debe respetar estndares establecidos

por la epistemologa; el cuadro 1 presenta los aspectos ms sobresalientes. De
estos, quiz el ms importante y que ayuda a formular, propiamente dicho, a
una hiptesis es el requisito que establece la forma sintctica, o sea, la manera
en que se redacta o se escribe una hiptesis.
Para analizar la etapa correspondiente a la formulacin de una hiptesis, es

necesario considerar como punto inicial al proceso de percepcin del entorno,
que en trminos sencillos involucra la utilizacin de nuestros sentidos. Ya que
la comprensin habitual de la evolucin del hombre es resultado del hecho de
que entendemos dicho proceso explorando la realidad fsica con nuestros cinco
sentidos. Hasta el momento actual hemos sido seres humanos cinco-
sensoriales. Este camino de la evolucin nos ha permitido comprender los
principios bsicos del Universo de manera concreta.
132
Gracias a nuestros cinco sentidos, sabemos que cada accin es una causa
que provoca un efecto, y que cada efecto posee una causa. De tal forma que el
proceso de percepcin involucra a su vez cuatro etapas, conocidas como:
formacin de imgenes, establecimiento de sensaciones, esclarecimiento de
ideas y elaboracin de conceptos. Estas cuatro etapas en conjunto conducen al
proceso de observacin. De tal forma que la observacin es la utilizacin de los
sentidos para la percepcin de hechos o fenmenos que nos rodean, o son de
inters del investigador.
Entonces, la observacin, permite abordar la realidad, esto es, la totalidad de

hechos existentes y concretos que rodean los fenmenos que se estudian. El
profesor de fsica David Bohm, del Birkbeck College, de la universidad de
Londres dice que la palabra "realidad" est derivada de las races "cosa" (res) y
"pensar" (revi). Realidad, por lo tanto, significa "todo aquello en lo que se puede
pensar". Tal definicin tiene la influencia de la fsica cuntica, que est basada
en la percepcin de un nuevo orden en el universo.
Desde el punto de vista de la Epistemologa, existen tres herramientas

bsicas para abordar a los hechos, o todo aquello que sucede en la naturaleza:
observando, midiendo y experimentando. Lo cual puede realizarse en una
accin a la vez, o las tres de manera simultnea. Esto quiere decir que un
fenmeno se est observando.
Por lo que, la observacin metdica y sistemtica de los hechos, permitir a

travs del tiempo, generar informacin (o datos) acerca de su comportamiento.
De esto resulta, que un hecho o fenmeno, podr observarse en trminos de
fracciones de segundo, como en una reaccin qumica, o de manera perpetua,
como en el movimiento de los planetas, o de alguna variable del clima. Y la
disponibilidad de datos a su vez permite observar, medir o experimentar en
torno al fenmeno estudiado, todo en un proceso dialctico.
50.1 Algunas Caractersticas para la Formulacin de Hiptesis
1. No debe contener palabras ambiguas o no definidas.
133
2. Los trminos generales o abstractos deben ser operacionalizables. Esto
es, tendrn referentes o correspondencias empricas (hechos, objetos,
fenmenos reales).
3. Los trminos abstractos, que no tienen referente emprico, no son

considerados.
4. Los trminos valorativos no se consideran por no comprobarse

objetivamente.
5. Cuando sea posible, debe formularse en trminos cuantitativos.
6. La forma sintctica debe ser la de una proposicin simple. En ningn

caso puede tener la forma de interrogante, prescripcin o deseo.
7. La hiptesis causal o estadstica debe considerar slo dos variables.
8. Deber excluir tautologas. Esto es, repeticin de una palabra o su

equivalente en una frase.
9. Deber evitar el uso de disyunciones; las que aparecen en

proposiciones compuestas del tipo p o q, donde p y q son proposiciones
simples cualesquiera.
10. Deber estar basada en el conocimiento cientfico ya comprobado y

tomarlo como punto de partida. Esto es, considera al marco terico.
11. Deber ser doblemente pertinente:
a).- en su referencia al fenmeno real de investigacin.
b).- en el apoyo terico que la sostiene.
134
12. Deber referirse a aspectos de la realidad que no han sido investigados
an, ya que un objetivo de la actividad cientfica es la produccin de
nuevos conocimientos, y
13. Finalmente, una caracterstica de la Hiptesis Cientfica es su falibilidad.

Esto implica que una vez comprobada puede perfeccionarse a travs del
tiempo.
Los antecedentes modernos para la formulacin de una hiptesis estn en la

lgica matemtica (simblica o proposicional), y a la vez han sido obtenidos de
la lgica formal. La lgica tradicional se dedicaba a estudiar, desde el punto de
vista formal, a los juicios, los conceptos y los razonamientos; todas las formas
discursivas eran consideradas como modificaciones, bien del juicio, bien del
concepto o bien del razonamiento. Por esta razn, la hiptesis era comprendida
por la lgica tradicional como forma especfica del razonamiento o como juicio.
La hiptesis era estudiada en la seccin de razonamientos inductivos.
Recordemos que el juicio es un pensamiento en el que se afirma o se niega

algo de algo. Adems el juicio tiene una estructura cuyos elementos son: el
sujeto (u objeto del juicio: la cosa de la que afirmamos o negamos algo en el
juicio, y si sabemos de qu cosa afirmamos o negamos algo, tenemos el sujeto
del juicio); el predicado (lo que se afirma o niega acerca del objeto), y la cpula
(establece que lo pensado en el predicado es propio o no del objeto del juicio).
Tomando algunos conceptos de la lgica matemtica, se puede decir que la

forma sintctica de una hiptesis es la de una proposicin simple. Las
proposiciones son pensamientos en los que se afirma algo, y que se expresan
por ello mediante enunciados u oraciones declarativas.
Recurdese que las oraciones (conjuntos de palabras que expresan

pensamientos completos; o como lo hemos aprendido desde nuestra formacin
bsica, una oracin tendr sujeto-verbo-complemento), se dividen en
declarativas, imperativas, interrogativas y exclamativas. Reiterando, una
135
proposicin es equivalente a una oracin declarativa, y sta ser la forma de
redactar o formular una hiptesis, la cual tendr Sujeto: la cosa de la que
afirmamos o negamos algo; Verbo: palabra que en una oracin, expresa la
accin o el estado del sujeto; Predicado: lo que se afirma o niega del sujeto.
51. Hiptesis nula y alternativa
51.1 Hiptesis Nula
Para todo tipo de investigacin en la que tenemos dos o ms grupos, se

establecer una hiptesis nula. La hiptesis nula es aquella que nos dice que
no existen diferencias significativas entre los grupos. Una hiptesis nula es
importante por varias razones:
Es una hiptesis que se acepta o se rechaza segn el resultado de la

investigacin. El hecho de contar con una hiptesis nula ayuda a determinar si
existe una diferencia entre los grupos, si esta diferencia es significativa, y si no
se debi al azar.
No toda investigacin precisa de formular hiptesis nula. Recordemos que la

hiptesis nula es aquella por la cual indicamos que la informacin a obtener es
contraria a la hiptesis de trabajo.
Al formular esta hiptesis, se pretende negar la variable independiente. Es

decir, se enuncia que la causa determinada como origen del problema flucta,
por tanto, debe rechazarse como tal.
51.2 Hiptesis Alternativa
Es la complementaria y opuesta a la hiptesis nula. Es aquella donde se

afirma la diferencia. En el ejemplo de la prctica de ajedrez y su incidencia en
el rendimiento escolar de los alumnos de escuela bsica, la hiptesis alterna
seala que habr diferencias en el rendimiento escolar favorables al grupo que
recibi las clases de ajedrez. La importancia de la hiptesis nula radica en que
es de directa comprobacin, o sea, se acepta o se rechaza segn el resultado
de la prueba realizada, adems de contribuir a determinar las diferencias entre
136
los grupos sometidos a prueba (el experimental y el de control), y si dichas
diferencias son significativas.
Al responder a un problema, es muy conveniente proponer otras hiptesis en

que aparezcan variables independientes distintas de las primeras que
formulamos. Por tanto, para no perder tiempo en bsquedas intiles, es
necesario hallar diferentes hiptesis alternativas como respuesta a un mismo
problema y elegir entre ellas cules y en qu orden vamos a tratar su
comprobacin. Las hiptesis, naturalmente, sern diferentes segn el tipo de
investigacin que se est realizando. En los estudios exploratorios, a veces, el
objetivo de la investigacin podr ser simplemente el de obtener los mnimos
conocimientos que permitan formular una hiptesis. Tambin es aceptable que,
en este caso, resulten poco precisas, como cuando afirmamos que "existe
algn tipo de problema social en tal grupo", o que los planetas poseen algn
tipo de atmsfera, sin especificar de qu elementos est compuesto.
52. Hiptesis simples y compuestos
Llamaremos hiptesis simples a aquellas que especifican un nico valor para

el parmetro (por ejemplo m=m0).
Llamaremos hiptesis compuestas a las que especifican un intervalo de

valores (por ejemplo: m>m 0; a< m <b) Se ha definido un contraste de hiptesis
como:
Donde (espacio paramtrico) y Diremos que la hiptesis Hi es simple si

contiene un nico punto, y diremos que la hiptesis Hi es compuesta si
contiene ms de un valor. En particular, si entonces el tamao del contraste es
igual a Entonces si un contraste tiene hiptesis nula simple, el tamao del
contraste es el valor de la funcin de potencia en, y por tanto la probabilidad de
rechazar la hiptesis nula si es cierta ser.
137
52.1 Contrastes De Hiptesis Simple
Diremos que un contraste es de hiptesis simple cuando las hiptesis nula y

alternativa son de la forma, En este caso. La funcin de potencia slo tiene los
valores y Asociada a un contraste de hiptesis simples existen 2 tipos de error:
Rechazar H0 cuando es cierta. (Error de Tipo I).
Aceptar H0 cuando en realidad es falsa (Error de Tipo II)
Si es un contraste para frente a basada en una regin crtica C, los dos tipos
de errores tienen las siguientes probabilidades (Probabilidad de error del tipo I),
(Probabilidad de error del tipo II) El objetivo obvio es encontrar un contraste

que minimice y. Es claro que podemos conseguir contrastes que hagan. Para
ello basta con aceptar siempre que C = 0. Pero entonces:
(Todo el conjunto de resultados) = 1 Nuestro objetivo va a ser en general

minimizar combinaciones lineales dey de.
53. Errores tipo I y II
53.1. El error de tipo I
Tambin denominado error de tipo alfa () o falso positivo, es el error que se

comete cuando el investigador no acepta la hiptesis nula siendo sta
verdadera en la poblacin. Es equivalente a encontrar un resultado falso
positivo, porque el investigador llega a la conclusin de que existe una
diferencia entre las hiptesis cuando en realidad no existe. Se relaciona con el
nivel de significancia estadstica.
53.2 El error de tipo II
Tambin llamado error de tipo beta () o falso negativo, es el error que se

comete cuando el investigador no rechaza la hiptesis nula siendo sta falsa en
la poblacin. Es equivalente a la probabilidad de un resultado falso negativo, ya
que el investigador llega a la conclusin de que ha sido incapaz de encontrar
una diferencia que existe en la realidad. Contrariamente al error tipo I, en la
138
mayora de los casos no es posible calcular la probabilidad del error tipo II. La
razn de esto se encuentra en la manera en que se formulan las hiptesis en
una prueba estadstica. Mientras que la hiptesis nula representa siempre una
afirmacin enrgica. Los errores tipo I y tipo II estn relacionados. Una
disminucin en la probabilidad de uno por lo general tiene como resultado un
aumento en la probabilidad del otro.
Las hiptesis nula y alternativa son afirmaciones opuestas acerca de la

poblacin. Una de las dos, ya sea la hiptesis nula o la alternativa es
verdadera, pero no ambas. Lo ideal es que la prueba de hiptesis lleve a la
aceptacin de H0 cuando H0 sea verdadera y al rechazo de H0 cuando Ha
Tabla 5 Errores y Conclusiones Correctas En Las Pruebas De

Hiptesis
Tomado: Anderson, Sweeney y Williams (2008)
Sea verdadera. Por desgracia, las conclusiones correctas no siempre son

posibles. Como la prueba de hiptesis se basa en una informacin muestral
debe tenerse en cuenta que existe la posibilidad de error. las dos clases de
errores comunes en una prueba de hiptesis. Se muestra lo que sucede
cuando se acepta H0. Si H0 es verdadera la conclusin es correcta.
Pero, si Ha es verdadera se comete un error tipo II; es decir, se acepta H0
cuando es falsa. En el segundo rengln de la tabla 9.1 se muestra lo que
sucede si la conclusin es rechazar H0. Si H0 es verdadera se comete un error
tipo I; es decir, se rechaza H0 cuando es verdadera. Pero si Ha es verdadera,
es correcto rechazar H0.
139
53.1 Nivel De Significancia
El nivel de significancia es la probabilidad de cometer un error tipo I cuando

la hiptesis nula es verdadera como igualdad. Para denotar el nivel de
significancia se usa la letra griega (alfa), y los valores que se suelen usar
para son 0.05 y 0.01. En la prctica la persona responsable de la prueba de
hiptesis especifica el nivel de significancia. Al elegir se controla la
probabilidad de cometer un error tipo I. Si el costo de cometer un error tipo I es
elevado, los valores pequeos de son preferibles. Si el costo de cometer un
Error tipo I no es demasiado elevado, entonces se usan valores mayores

para . A las aplicaciones de la prueba de hiptesis en que slo se controla el
error tipo I se les llama pruebas de significancia. Muchas aplicaciones de las
pruebas de hiptesis son de este tipo.
Aunque en la mayor parte de las aplicaciones de las pruebas de hiptesis se

controla la probabilidad de cometer un error tipo I, no siempre sucede lo mismo
con un error tipo II. Por tanto, si se decide aceptar H0 no es posible establecer
la confianza en esa decisin. Debido a la incertidumbre de cometer un error
tipo II al realizar una prueba de significancia los dedicados a la estadstica
suelen recomendar que se diga no se rechaza H0 en lugar de se acepta H0.
Decir no se rechaza H0 implica la recomendacin de reservarse tanto el juicio
como la accin. En efecto al no aceptar directamente H0, se evita el riesgo de
cometer un error tipo II. Siempre que no se determine y controle la probabilidad
de cometer un error tipo II, no se dir se acepta H0.
En esos casos slo son posibles dos conclusiones: no se rechaza H0 o se

rechaza H0. Aunque controlar el error tipo II en una prueba de hiptesis es
poco comn, es posible. Para controlar y determinar la probabilidad de cometer
un error tipo II. Si se ha establecido un control adecuado de este error, las
medidas basadas en la conclusin se acepta H0 son adecuadas.
140
54. Matriz De Decisin
La matriz de decisin, es una herramienta que permite organizar las

alternativas segn los factores que posean. Te mostramos una serie de
sencillos pasos que te ayudarn a comprender el proceso que se debe seguir.
La matriz de decisin se utiliza para definir la lgica (reglas) que se ha de

utilizar para determinar el resultado de una evaluacin. Las matrices de
decisin se configuran para un paquete de resolucin, es decir, para una
combinacin de producto, gnero y edad. Se puede configurar ms de una
matriz de decisin para un paquete, en funcin del nmero de factores que se
ha de evaluar. Un ejemplo, es un cliente que se ha de evaluar para determinar
la ayuda que requiere para volver al trabajo. La evaluacin se debe realizar
sobre los factores de educacin y habilidades laborales. Cuando se ejecuta una
valoracin, se genera una decisin para cada factor (tipo de matriz de
decisin), para el que se proporcionan respuestas.
55. Seleccin de las pruebas estadsticas
Cuando existen varias pruebas estadsticas disponibles para ser empleadas

en un proceso investigativo, se requiere que la prueba estadstica elegida sea
la ms conveniente y poderosa para el diseo experimental que se utiliza, y
para ello es necesario utilizar un criterio de seleccin. Uno de ellos es el de la
potencia, pues est formulada la hiptesis de investigacin y se necesita
formular la hiptesis nula que contradiga precisamente lo que se quiere lograr:
la probabilidad de rechazar la hiptesis de nulidad cuando realmente sea falsa.
Por tanto, se puede considerar que una prueba estadstica es apropiada

cuando es pequea la probabilidad de rechazar la hiptesis de nulidad (Ho)
cuando sea verdadera; y grande la probabilidad de rechazarla cuando sea
falsa. Adems se necesita especificar el nivel de significacin (a) y el tamao
de la muestra (N). Para (a) = 0.05 se dice que es significativa. Lo que quiere
decir que existe una posibilidad en 20 de equivocarse. Si se hace con (a) =
141
0.01 ser altamente significativa, lo que implica una posibilidad en 100 de
equivocarse.
Tambin, se requiere encontrar o suponer la distribucin muestral de la

prueba estadstica conforme a Ho: si se puede considerar que se acerca o no a
una distribucin normal. Existen otras formas de seleccionar las pruebas
estadsticas como:
La forma en que fue obtenida la muestra.
La naturaleza de la poblacin de donde se obtuvo la muestra.
Las mediciones que fueron realizadas en las definiciones de las variables

usadas.
56. El nivel de significacin y el tamao de la muestra
Al contrastar una cierta hiptesis, la mxima probabilidad con la que

estamos dispuesto a correr el riesgo de cometern error de tipo I, se llama nivel
de significacin. Esta probabilidad, denota a menudo por ser, suele especificar
antes de tomar la muestra, de manera que los resultados obtenidos no influyan
en nuestra eleccin.
En la prctica, es frecuente un nivel de significacin de 0,05 o 0,01, si bien

se une otros valores. Si por ejemplo se escoge el nivel de significacin 0,05 (o
5%) al disear una regla de decisin, entonces hay unas cinco (05)
oportunidades entre 100 de rechazar la hiptesis cuando debiera haberse
aceptado; Es decir, tenemos un 95% de confianza de que hemos adoptado la
decisin correcta. En tal caso decimos que la hiptesis ha sido rechazada al
nivel de significacin 0,05, lo cual quiere decir que tal hiptesis tiene una
probabilidad 0,05 de ser falsa.
56.1 Prueba de Uno y Dos Extremos
Cuando estudiamos ambos valores estadsticos es decir, ambos lados de la

media lo llamamos prueba de uno y dos extremos o contraste de una y dos
colas. Con frecuencia no obstante, estaremos interesados tan slo en valores
142
extremos a un lado de la media (o sea, en uno de los extremos de la
distribucin), tal como sucede cuando se contrasta la hiptesis de que un
proceso es mejor que otro (lo cual no es lo mismo que contrastar si un proceso
es mejor o peor que el otro) tales contrastes se llaman unilaterales, o de un
extremo. En tales situaciones, la regin crtica es una regin situada a un lado
de la distribucin, con rea igual al nivel de significacin.
La siguiente tabla de valores crticos de z para contraste de unos o dos

extremos en varios niveles de significacin.
Tabla 6 Valores crticos de Z
Nivel de
significaci
n 0.10 0.05 0.01 0.005 0.02
Valores
crticos de
z para -1.28 o 1.28 -1.645 o 1.645 -2.33 o 2.33 -2.58 o 2.58 -2.88 o 2.88
Test
Unilaterale
s
Valores
Crticos de
z para - 1.645 y - 1.96 y 1.96 -2.58 y 2.58 -2.81 y 2.81 -3.08 y 3.08
Test 1.645
Bilaterales
Tomado: Anderson, Sweeney y Williams (2008)
56.1.1 Curva Caracterstica Operativa y Curva de Potencia.
Hemos visto como limitar el error de tipo I eligiendo adecuadamente el nivel

de significacin. Es posible evitar el riesgo de cometer error de tipo II
simplemente no aceptado nunca hiptesis, pero en muchas aplicaciones
prcticas esto es inviable. En tales casos se suele recurrir a curvas de
operacin caractersticas o curvas de OC, que son grficos que muestran las
probabilidades de error de tipo II bajo diversas hiptesis.
Proporcionan indicadores de hasta qu punto un test dado nos permitir

evitar un error de tipo II; es decir, nos indicar la potencia de un test a la hora
143
de prevenir decisiones errneas. Son tiles en el diseo de experimentos
porque sugieren entre otras cosas al tamao de muestra a manejar.
56.1.2 Grados de Libertad.
Para el clculo de un estadstico, es necesario emplear tanto observaciones

de muestra como propiedades de ciertos parmetros de la poblacin. Si estos
parmetros son desconocidos, hay que estimarlos a partir de la muestra el
nmero de grados de libertad de un estadstico, generalmente denotado por v
se define como el nmero N de observaciones independientes en la muestra
(o sea, el tamao de la muestra) menos el nmero K de parmetros de la
poblacin, que debe ser estimado a partir de observaciones mustrales. En
smbolos, v = N - k.
57. Zonas de aceptacin y de rechazo de la hiptesis
Regla de decisin Criterio para tomar una decisin sobre H0 utilizando el

estadstico de contraste Consiste en dividir los posibles valores del estadstico
en dos zonas:
Zona de aceptacin: Valores con los que se mantiene H0.
Zona de rechazo o crtica: Valores con los que se rechaza H0
Ambas se establecen en funcin de:
Nivel de significacin o riesgo (). Es la probabilidad de que el estadstico de

contraste caiga en la zona crtica si H0 es verdadera. Suele usarse = 0,05 o
= 0,01 El nivel de confianza es 1- .
57.1Decisin
Puede tomarse en funcin de:
a) zona de aceptacin y rechazo
b) nivel crtico (p), que es la probabilidad asociada al estadstico de

contraste.
144
57.1.1 Mantener H0
a) Si el estadstico de contraste cae en la zona de aceptacin.
b) Mantener H0 si p > No se concluye que H0 es cierta
57.1.2 Rechazar H0
a) Si el estadstico de contraste cae en la zona crtica.
b) si p Se concluye que H0 es falsa
Es la regin complementaria de la anterior .Si el valor evaluado del

estadstico pertenece a ella No rechazamos la hiptesis.(Las hiptesis nunca
se aceptan de forma definitiva, slo se aceptan provisionalmente, es decir ,no
se rechazan, a la espera de una nueva informacin que eventualmente pueda
llevarnos a rechazarla en el futuro). La designaremos por R0. Evidentemente
los conjuntos de puntos que forman ambas regiones son disjuntos.
58. Pruebas de hiptesis en el caso de una sola muestra
Una prueba de cualquier hiptesis estadstica, donde la alternativa es

unilateral como :
145
se denomina prueba de una sola cola Por lo general, la regin crtica para la
hiptesis alternativa > 0 yace en la cola derecha de la distribucin del
estadstico de prueba; en tanto que la regin crtica para la hiptesis alternativa
< 0 yace en la cola izquierda.
59. Pruebas no paramtricas
Es una prueba de hiptesis que no requiere que la distribucin de la

poblacin se caracterice en funcin de determinados parmetros. Por ejemplo,
numerosas hiptesis se basan en el supuesto de que la poblacin sigue una
distribucin normal con los parmetros y . Las pruebas no paramtricas no
tienen este supuesto, de modo que son tiles cuando sus datos sean
firmemente no normales y resistentes a transformaciones.
Sin embargo, las pruebas no paramtricas no estn completamente exentas

de supuestos sobre los datos. Por ejemplo, las pruebas no paramtricas
requieren que los datos sean una muestra aleatoria independiente. Por
ejemplo, los datos sobre salarios son altamente asimtricos a la derecha,
debido a que muchas personas devengan salarios modestos y pocas personas
devengan salarios ms cuantiosos.
Se puede utilizar pruebas no paramtricas en estos datos para responder a

preguntas como las siguientes:
Es la mediana de los salarios de su compaa igual a un determinado

valor? Utilice la prueba de los signos de 1 muestra.
Es la mediana de los salarios de una sucursal bancaria urbana mayor que

la mediana de los salarios de una sucursal bancaria rural? Utilice la prueba de
Mann-Whitney o la prueba de Kruskal-Wallis.
Son las medianas de los salarios diferentes segn si la sucursal bancaria

es rural, urbana y suburbana? Utilice la prueba de la mediana de Mood.
Cmo el nivel de educacin afecta los salarios en la sucursal rural y

urbana? Utilice la prueba de Friedman.
146
Tambin, se denominan pruebas no paramtricas aquellas que no
presuponen una distribucin de probabilidad para los datos, por ello se
conocen tambin como de distribucin libre (distribution free). En la mayor
parte de ellas los resultados estadsticos se derivan nicamente a partir de
procedimientos de ordenacin y recuento, por lo que su base lgica es de fcil
comprensin. Cuando trabajamos con muestras pequeas (n < 10) en las que
se desconoce si es vlido suponer la normalidad de los datos, conviene utilizar
pruebas no paramtricas, al menos para corroborar los resultados obtenidos a
partir de la utilizacin de la teora basada en la normal. En estos casos se
emplea como parmetro de centralizacin la mediana, que es aquel punto para
el que el valor de X est el 50% de las veces por debajo y el 50% por encima.
Vamos a comentar la filosofa de alguna de las pruebas no paramtricas y en
los enlaces se puede aumentar esta informacin.
59.1 Limitaciones de las pruebas no paramtricas
Las pruebas no paramtricas son generalmente menos potentes que las

pruebas correspondientes diseadas para utilizarse con datos que provengan
de una distribucin especfica. Por lo tanto, la probabilidad de que usted
rechace la hiptesis nula cuando sea falsa es menor.
Las pruebas no paramtricas con frecuencia requieren que usted modifique

las hiptesis. Por ejemplo, la mayora de las pruebas no paramtricas sobre el
centro de la poblacin son pruebas sobre la mediana y no sobre la media. La
prueba no responde a la misma pregunta del mismo modo que el
procedimiento paramtrico anlogo.
59.2 Pruebas paramtricas alternativas
Cuando sea posible elegir entre el uso de un procedimiento paramtrico o no

paramtrico, y usted est relativamente seguro de que se cumplen los
supuestos para el procedimiento paramtrico, entonces utilice el procedimiento
paramtrico. La siguiente lista muestra las pruebas no paramtricas junto con
sus alternativas paramtricas.
147
60. Pruebas paramtricas
Se llaman as porque su clculo implica una estimacin de los parmetros de

la poblacin con base en muestras estadsticas. Mientras ms grande sea la
muestra ms exacta ser la estimacin, mientras ms pequea, ms
distorsionada ser la media de las muestras por los valores raros extremos.
Las pruebas paramtricas asumen distribuciones estadsticas subyacentes

a los datos. Por tanto, deben cumplirse algunas condiciones de validez, de
modo que el resultado de la prueba paramtrica sea fiable. Por ejemplo, la
prueba t de Student para dos muestras independientes ser fiable solo si cada
muestra se ajusta a una distribucin normal y si las varianzas son
homogneas.
La ventaja de usar una prueba paramtrica en lugar de una no paramtrica

consiste en que la primera tiene ms potencia estadstica que la segunda. En
otras palabras, una prueba paramtrica tiene mayor capacidad para conducir a
un rechazo de H0. La mayora de las veces, el valor p asociado a una prueba
paramtrica es menor que el valor p asociado a su equivalente no paramtrica
ejecutada sobre los mismos datos.
60.1 Caracterstica de las pruebas paramtricas
Se conoce el modelo de distribucin de la poblacin objeto de estudio y se

desconoce un nmero finito de parmetros de dicha distribucin que hay que
estimar con los datos de la muestra.
Requieren conocer la distribucin de la muestra para poder realizar r

inferencias sobre la poblacin.
148
UNIDAD VI REGRESIN, CORRELACIN, ANOVA, LA CONFIABILIDAD Y
SERIES DE TIEMPO
61. Regresin Lineal
Tcnica estadstica utilizada para estudiar la relacin

entre variables. Se adapta a una amplia variedad de
situaciones. En la investigacin social, el anlisis de
regresin se utiliza para predecir un amplio rango de
fenmenos, desde medidas econmicas hasta diferentes aspectos del
comportamiento humano. En el contexto de la investigacin de mercados
puede utilizarse para determinar en cul de diferentes medios de comunicacin
puede resultar ms eficaz invertir; o para predecir el nmero de ventas de un
determinado producto. En fsica se utiliza para caracterizar la relacin entre
variables o para calibrar medidas.
62. Representacin grfica de la nube de puntos o Diagrama De

Dispersin
Consiste en dos ejes perpendiculares, en cada uno de ellos colocaremos los

valores de cada una de las variables. Para representar el dato correspondiente
al par (xi,yj), colocaremos un punto en las mismas coordenadas.
La representacin grfica ms til para describir el comportamiento conjunto

de dos variables es el diagrama de dispersin o nube de puntos, donde cada
caso aparece representado como un punto en el plano definido por las
variables y Para obtener un diagrama de dispersin la secuencia es:
150
El diagrama de puntos, Permite analizar si existe algn tipo de relacin entre
dos variables. Por ejemplo, puede ocurrir que dos variables estn relacionadas
de manera que al aumentar el valor de una, se incremente el de la otra. En este
caso hablaramos de la existencia de una correlacin positiva. Tambin podra
ocurrir que al producirse una en un sentido, la otra derive en el sentido
contrario; por ejemplo, al aumentar el valor de la variable x, se reduzca el de la
variable y. Entonces, se estara ante una correlacin negativa. Si los valores de
ambas variable se revelan independientes entre s, se afirmara que no existe
correlacin. El diagrama de dispersin es una herramienta grfica que ayuda a
identificar la posible relacin entre dos variables. Representa la relacin entre
dos variables de forma grfica, lo que hace ms fcil visualizar e interpretar los
datos.
63. Clculo de los coeficientes de regresin
Una de las herramientas bsicas para los analistas cientficos o ingenieros

es el coeficiente lineal. Esta tcnica empieza con un juego de datos de dos
variables. La variable independiente suele llamarse "x" y la variable
dependiente "y". La meta de esta tcnica es identificar la lnea, y = mx + b, que
se aproxima al juego de datos.
Esta lnea puede mostrar, grficamente y numricamente, la relacin entre

las variables dependiente e independiente. Para este anlisis de regresin, un
valor para la correlacin puede calcularse tambin.
Pasos para el Clculos de los coeficientes de regresin
1. Identifica y separa los valores de x y de y de tus puntos. Si ests usando

una hoja de clculo, ingrsalos en columnas adyacentes. Debera haber el
mismo nmero de valores de x y de y. Si no es as, el clculo ser inexacto
o la funcin de la hoja de clculo dar error. x = (6, 5, 11, 7, 5, 4, 4) y = (2,
3, 9, 1, 8, 7, 5)
2. Calcula el valor medio de los valores de x y de y dividiendo la suma de

todos los valores por el nmero de valores total en el juego. Estos
151
promedios se llamarn "x_avg" y y_avg". x_avg = (6 + 5 + 11 + 7 + 5 + 4
+ 4) / 7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) / 7 = 5
3. Crea dos nuevos juegos de datos restando el valor de x_avg de cada

valor de x y el valor de y_avg de cada valor de y. x1 = (6 - 6, 5 - 6, 11 - 6,
7 - 6 ... ) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5, ... ) y1 =
(-3, -2, 4, -4, 3, 2, 0)
4. Multiplica cada valor de x1 por cada valor de y1, en orden. x1y1 = (0 * -3,
-1 * -2, 5 * 4, ... ) x1y1 = (0, 2, 20, -4, -3, -4, 0).
5. Eleva al cuadrado cada valor x1. x1^2 = (0^2, 1^2, -5^2, ... ) x1^2 = (0, 1,
25, 1, 1, 4, 4).
6. alcula las sumas de los valores x1y1 y x1^2. sum_x1y1 = 0 + 2 + 20 - 4 -

3 - 4 + 0 = 11 sum_x1^2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36.
7. Divide "sum_x1y1" por "sum_x1^2" para conseguir el coeficiente de

regresin. sum_x1y1 / sum_x1^2 = 11 / 36 = 0.306
64. El coeficiente de determinacin y su interpretacin
Es una medida estadstica de la bondad del ajuste o fiabilidad del modelo

estimado a los datos. Se representa por R2 e indica cul es la proporcin de la
variacin total en la variable dependiente (Y), que es explicada por el modelo
de regresin estimado, es decir, mide la capacidad explicativa del modelo
estimado. Coeficiente que mide el grado de dependencia entre variables,
tomando el valor 0 en caso de correlacin nula o el valor 1 en caso de
correlacin total. Equivale al cuadrado del coeficiente de correlacin.
Si establecemos la hiptesis de que la mejor forma de describir la relacin

entre X e Y es mediante una lnea recta, esto es:
152
El problema inmediato que surge es el obtener los valores numricos de los
parmetros b1 y b2, que determinan la ecuacin lineal concreta que expresa la
relacin de Y con X:
Para ello
acudimos a mtodos de ajuste, bsicamente el mtodo de mnimos cuadrados
1, obteniendo un sistema de dos ecuaciones
Que permiten estimar los parmetros de la relacin. Ahora bien, el carcter

de lnea media, que discurre entre las observaciones y que trata de
sintetizarlas, que adquiere esta ecuacin de regresin, obliga a que se
acompae, como cualquier promedio, de medidas de dispersin que permitan
conocer el grado en que la misma puede sustituir a las observaciones de las
que se obtuvo.
65. Ecuacin de regresin lineal
La ecuacin estimada de regresin (lineal simple) Los parmetros, 0 y 1,

del modelo se estiman por los estadsticos mustrales b0 y b1, los cuales se
calculan usando el mtodo de mnimos cuadrados.
Ecuacin Estimada de regresin lineal simple: = b0 + b1 x
y = 0 + 1 x +
En la regresin lineal simple, la grfica de la ecuacin de regresin se llama

lnea de regresin estimada. es el valor estimado de y para un valor
especfico de x.
153
66. La ecuacin de regresin y su ajuste por el mtodo de mnimos
cuadrados
La dependencia entre dos (o ms) variables puede ser tal que se base en
una relacin funcional (matemtica) exacta, como la existente entre la
velocidad y la distancia recorrida por un mvil; o puede ser estadstica. La
dependencia estadstica es un tipo de relacin entre variables tal que
conocidos los valores de la (las) variable (variables) independiente(s) no puede
determinarse con exactitud el valor de la variable dependiente, aunque si se
puede llegar a determinar un cierto comportamiento (global) de la misma.
Pues bien, el anlisis de la dependencia estadstica admite dos

planteamientos (aunque ntimamente relacionados): El estudio del grado de
dependencia existente entre las variables que queda recogido en la teora de la
correlacin. La determinacin de la estructura de dependencia que mejor
exprese la relacin, lo que es analizado a travs de la regresin. Una vez
determinada la estructura de esta dependencia la finalidad ltima de la
regresin es llegar a poder asignar el valor que toma la variable Y en un
individuo del que conocemos que toma un determinado valor para la variable X
(para las variablesX1, X2,..., Xn ).
En el caso bidimensional, dadas dos variables X e Y con una distribucin

conjunta de frecuencias ( xi, yj ,nij ), llamaremos regresin de Y sobre X ( Y/X)
a una funcin que explique la variable Y para cada valor de X, y llamaremos
regresin de X sobre Y (X/Y) a una funcin que nos explique la variable X para
cada valor de Y.(Hay que llamar la atencin, como se ver ms adelante, que
estas dos funciones, en general, no tienen por qu coincidir).
66.1 Mtodo De Cuadrados Mnimos
Hemos enfatizado sobre la importancia de las representaciones grficas y

hemos visto la utilidad de las versiones linealizadas de los grficos (X, Y) junto
a las distintas maneras de llevar a cabo la linealizacin. A menudo nos
154
confrontamos con situaciones en las que existe o suponemos que existe una
relacin lineal entre las variables X e Y.
Surge de modo natural la pregunta: cul es la relacin analtica que mejor

se ajusta a nuestros datos? El mtodo de cuadrados mnimos es un
procedimiento general que nos permite responder esta pregunta. Cuando la
relacin entre las variables X e Y es lineal, el mtodo de ajuste por cuadrados
mnimos se denomina tambin mtodo de regresin lineal. Observamos o
suponemos una tendencia lineal entre las variables y nos preguntamos sobre
cul es la mejor recta:
Que es una medida de la desviacin total de los valores observados yi

respecto de los predichos por el modelo lineal a x + b. Los mejores valores de
la pendiente a y la ordenada al origen b son aquellos que minimizan esta
desviacin total, o sea, son los valores que remplazados en la Ec.(1) minimizan
la funcinc2. Ec.(2). Los parmetros a y b pueden obtenerse usando tcnicas
matemticas que hacen uso del clculo diferencial. Aplicando estas tcnicas, el
problema de minimizacin se reduce al de resolver el par de ecuaciones:
155
Actualmente, la mayora de los programas de anlisis de datos y planillas de
clculo, realizan el proceso de minimizacin en forma automtica y dan los
resultados de los mejores valores de a y b, o sea los valores indicados por las
ecuaciones.
Grfico de datos asociados a un modelo lineal. La cantidad yi - y(xi)

representa la desviacin de cada observacin de yi respecto del valor predicho
por el modelo y(x). El criterio de mnimos cuadrados reemplaza el juicio
personal de quien mire los grficos y defina cul es la mejor recta. En los
programas como Excel, se realiza usando la herramienta regresin lineal o
ajuste lineal. Los resultados se aplican en el caso lineal cuando todos los
datos de la variable dependiente tienen la misma incertidumbre absoluta y la
incertidumbre de la variable independiente se considera despreciable.
66.2 El mtodo de los mnimos cuadrados para la estimacin de los

coeficientes de regresin
Consiste en explicar una de las variables en funcin de la otra a travs de un

determinado tipo de funcin (lineal, parablica, exponencial, etc.), de forma que
la funcin de regresin se obtiene ajustando las observaciones a la funcin
elegida, mediante el mtodo de Mnimos-Cuadrados (M.C.O.). Elegido el tipo
de funcin ( ) la funcin de regresin concreta se obtendr minimizando la
expresin:
156
(yj - (xi ) ) 2. nij en el caso de la regresin de Y/X
(xi - (yj ) ) 2. nij en el caso de la regresin de X/Y
Puede probarse que es equivalente ajustar por mnimos cuadrados la

totalidad de las observaciones (toda la nube de puntos) que realizar el ajuste
de los puntos obtenidos por la regresin de la media; de forma que la regresin
mnimo-cuadrtica viene ser, en cierto modo, la consecucin de una expresin
analtica operativa para la regresin en sentido estricto. Coeficientes de
regresin. Se llama coeficiente de regresin a la pendiente de la recta de
regresin:
en la regresin Y/X : b = Sxy / Sx2
en la regresin X/Y b' = Sxy / Sy2
El signo de ambos coincidir con el de la covarianza, indicndonos la

tendencia (directa o inversa a la covariacin).Es interesante hacer notar que
b.b'= r2
Bondad Del Ajuste (Varianza residual, varianza de la regresin y coeficiente

de determinacin) Por bondad del ajuste hay que entender el grado de
acoplamiento que existe entre los datos originales y los valores tericos que se
obtienen de la regresin. Obviamente cuanto mejor sea el ajuste, ms til ser
la regresin a la pretensin de obtener los valores de la variable. Obtener
indicadores de esta bondad de ajuste es fundamental a la hora de optar por
una regresin de un determinado tipo u otro. Puesto que la media de los
residuos se anula, el primer indicador de la bondad del ajuste (no puede ser el
error medio) ser el error cuadrtico medio, o varianza del residuo, o varianza
residual:
157
Considerando la regresin Y/X:
Que ser una cantidad mayor o igual que cero. De forma que cuanto ms
baja sea mejor ser el grado de ajuste. Si la varianza residual vale cero el
ajuste ser perfecto (ya que no existir ningn error).
Del hecho de que yi=y*i+ei ,y de que las variables y* e estn

incorrelacionadas se tiene que:
Donde S2y* es la llamada varianza de la regresin y supone la varianza de

la variable regresin:
Igualdad fundamental anterior de la que se deduce que la varianza total de

la variable y puede descomponerse en dos partes una parte explicada por la
regresin ( la varianza de la regresin) y otra parte no explicada (la varianza
residual). Considerando que la varianza nos mide la dispersin de los datos
este hecho hay que entenderlo como que la dispersin total inicial queda, en
parte explicada por la regresin y en parte no. Cuanto mayor sea la proporcin
de varianza explicada (y menor la no explicada) tanto mejor ser el ajuste y
tanto ms til la regresin.
A la proporcin de varianza explicada por la regresin se le llama coeficiente

de determinacin ( en nuestro caso lineal):
158
Que evidentemente estar siempre comprendido entre 0 y 1 y, en
consecuencia, da cuenta del tanto por uno explicado por la regresin. Una
consecuencia importante en la prctica es que la varianza residual ser
obviamente:
Es sencillo probar que en el caso lineal que nos ocupa el coeficiente de

determinacin coincide con el cuadrado del coeficiente de correlacin:
R = r
Con lo cual la varianza residual y la varianza debida a la regresin pueden

calcularse a partir del coeficiente de correlacin:
67. Supuestos bsicos para la aplicacin del mtodo de regresin:

Linealidad, Homocedasticidad.
Linealidad Si no se tiene linealidad se dice que tenemos un error de

especificacin. En el caso de que sean varias variables independientes, la
opcin Analizar-Regresin Lineal-Grficos-Generar todos los grficos parciales
nos da los diagramas de dispersin parcial para cada variable independiente.
En ellos se ha eliminado el efecto proveniente de las otras variables y as la
relacin que muestran es la relacin neta entre las variables representadas.
Independencia de la variable aleatoria residuos (especialmente importante

si los datos se han obtenidos siguiendo una secuencia temporal).
Independencia entre los residuos mediante el estadstico de Durbin-Watson
159
que toma valor 2 cuando los residuos son completamente independientes
(entre 1.5 y 2.5 se considera que existe independencia), DW2 autocorrelacin
negativa
Homocedasticidad o igualdad de varianzas de los residuos y los pronsticos.

Esta condicin se estudia utilizando las variables: ZPRED=pronsticos
tipificados y ZRESID=residuos tipificados mediante:
El estadstico de Levene (ver explorar) un grfico de dispersin .Que se

obtiene en Analizar-Regresin-Lineal-Grficos.
El supuesto de homocedasticidad implica que la variacin de los residuos

sea uniforme en todo el rango de valores de los pronsticos (grfico sin pautas
de asociacin).
68. Concepto y tipos de Correlacin.
La correlacin trata de establecer la relacin o dependencia que existe entre

las dos variables que intervienen en una distribucin bidimensional. Es decir,
determinar si los cambios en una de las variables influyen en los cambios de la
otra. En caso de que suceda, diremos que las variables estn correlacionadas
o que hay correlacin entre ellas.
68.1 Propiedades
1. El coeficiente de correlacin no vara al hacerlo la escala de medicin. Es

decir, si expresamos la altura en metros o en centmetros el coeficiente de
correlacin no vara.
2. El signo del coeficiente de correlacin es el mismo que el de la covarianza.
160
a) Si la covarianza es positiva, la correlacin es directa.
b) Si la covarianza es negativa, la correlacin es inversa.
c) Si la covarianza es nula, no existe correlacin.
3. El coeficiente de correlacin lineal es un nmero real comprendido entre

menos 1 y 1.
1 r 1
4. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la

correlacin es fuerte e inversa, y ser tanto ms fuerte cuanto ms se aproxime
r a 1.
5. Si el coeficiente de correlacin lineal toma valores cercanos a 1 la

correlacin es fuerte y directa, y ser tanto ms fuerte cuanto ms se aproxime
r a 1.
6. Si el coeficiente de correlacin lineal toma valores cercanos a 0, la

correlacin es dbil.
7. Si r = 1 1, los puntos de la nube estn sobre la recta creciente o

decreciente. Entre ambas variables hay dependencia funcional.
68.2 Tipos de correlacin
68.2.1 Correlacin directa
La correlacin directa se da cuando al aumentar una de las variables la otra

aumenta.
La recta correspondiente a la nube de puntos de la distribucin es una recta

creciente.
161
68.2.2 Correlacin inversa
La correlacin inversa se da cuando al aumentar una de las variables la otra

disminuye.
La recta correspondiente a la nube de puntos de la distribucin es una recta

decreciente.
68.2.3 Correlacin nula
La correlacin nula se da cuando no hay dependencia de ningn tipo entre

las variables.
En este caso se dice que las variables son incorreladas y la nube de puntos
tiene una forma redondeada.
162
68.3 Grado de correlacin
El grado de correlacin indica la proximidad que hay entre los puntos de la

nube de puntos. Se pueden dar tres tipos:
68.3.1 Correlacin fuerte
La correlacin ser fuerte cuanto ms cerca esten los puntos de la recta
68.3.2 Correlacin dbil
La correlacin ser dbil cuanto ms separados estn los puntos de la recta.
163
69. Coeficiente de correlacin de r Pearson.
El coeficiente de Pearson (tambin llamado coeficiente de correlacin del

producto-momento), se representa con el smbolo r y proporciona una medida
numrica de la correlacin entre dos variables. Es til reconocer la frmula
usada para calcular el coeficiente de Pearson (es posible que vea documentos
en que se haga referencia a ella). Le entregamos la frmula en una nota al pie
de esta pgina. No deje que la frmula lo intimide. No necesita comprender la
frmula para comprender el concepto de correlacin. Aunque si hace un
esfuerzo va a comprender la frmula en poco tiempo y con claridad.
Es una prueba estadstica que permite analizar la relacin entre dos

variables medidas en un nivel por intervalos o de razn, donde r mide el grado
de asociacin lineal entre dos variables X e Y. La prueba en s no considera a
una como independiente y a otra como dependiente, ya que no se trata de una
prueba que evala causalidad. El coeficiente r de Pearson se estima de
acuerdo a la siguiente frmula:
164
El coeficiente r de puede variar de -1 a 1, donde el signo indica la direccin
de la correlacin y el valor numrico, la magnitud de la correlacin. En este
contexto se resumen algunos criterios de interpretacin:
-1,00 = Correlacin negativa perfecta.
-0,90 = Correlacin negativa muy fuerte.
-0,75 = Correlacin negativa considerable.
-0,50 = Correlacin negativa media.
-0,10 = Correlacin negativa dbil.
0,00 = No existe correlacin lineal alguna entre las variables.
0,10 = Correlacin positiva dbil.
0,50 = Correlacin positiva media.
0,75 = Correlacin positiva considerable.
0,90 = Correlacin positiva muy fuerte.
1,00 = Correlacin positiva perfecta.
A continuacin se presentan algunos ejemplos de diagramas de dispersin con

diferentes valores del coeficiente de correlacin de Pearson (poblacional).
165
Cuando el coeficiente r de Pearson se eleva al cuadrado, el resultado indica
el porcentaje de la variacin de una variable debido a la variacin de la otra y
viceversa. Es decir, el coeficiente de determinacin, r al cuadrado o r, es la
proporcin de la variacin en Y explicada por X. Puede adoptar cualquier valor
entre 0 y 1, inclusive.
70. Matrices de decisiones estadsticas
La toma de decisiones es un proceso durante el cual la persona debe

escoger entre dos o ms alternativas. El problema de la estimacin aparece de
forma natural cuando se considera el estudio de cualquier fenmeno real y
alguna caracterstica X del mismo es objeto de observacin. La mayora de las
veces las observaciones revelan que X es magnitud variable que no puede ser
prevista con certeza. Por ello se asocia a dicho fenmeno real un modelo
aleatorio, de modo que la variable X pueda ser considerada en el mismo como
una v.a. Una matriz de decisin no es un instrumento de evaluacin como tal.
Es un instrumento que sirve para elegir una opcin entre una serie de opciones
posibles, normalmente ms de dos. Ponderando por igual todas.
En la matriz de decisin tenemos tres campos: ttulo y nmero de

competencias y actores.
166
- Ttulo: el ttulo del instrumento
- N de competencias: Es el nmero de opciones a ponderar, p.ej. si

estuviramos ponderando la compra de un coche, seran los distintos coches
entre los que elegir.
- N de actores: Es el nmero de personas que participan en la decisin,

cada uno tendr que ponderar las opciones y finalmente ganar la opcin que
en el cmputo global haya sido marcada ms veces.
Para crear una matriz de decisin es necesario:
1. Definir con claridad cul es la decisin que tienes que tomar en el proyecto.
sta debe ser acordada por todos los miembros del equipo y colocarla por
escrito para poder referirse a ella con frecuencia.
2. Crea una lista de criterios que vayas a utilizar para tomar la decisin. Considera
la posibilidad de criterios tales como los costos, los beneficios y cualquier otra
cosa que ests utilizando para tomar la decisin sobre el proyecto.
3. Define con claridad cul es la decisin que tienes que tomar en el proyecto.
sta debe ser acordada por todos los miembros del equipo y colocarla por
escrito para poder referirse a ella con frecuencia.
4. Asigna un peso a cada uno de los criterios al dividir 10 puntos entre la lista de
criterios. Cuanto mayor sea el nmero asignado a un criterio, ms importante
ser a la hora de tomar la decisin.
5. Dibuja una tabla de decisin de la matriz ponderada listando los criterios en

la primera columna, los pesos en la segunda columna y las alternativas en la
tercera columna.
6. Pondera cada fila en tu tabla de matriz de decisiones mirando el criterio, el

peso y la alternativa al dividir 10 puntos de nuevo.
7. Calcula la matriz de decisin multiplicando los pesos en la segunda columna

y luego sumando los pesos de todas las filas juntas. Selecciona la alternativa
que tenga el puntaje ms alto.
167
71. El anlisis de Varianza
El anlisis de la varianza (o Anova: Analysis of variance) es un mtodo para

comparar dos o ms medias, que es necesario porque cuando se quiere
comparar ms de dos medias es incorrecto utilizar repetidamente el contraste
basado en la t de Student. por dos motivos:
En primer lugar, y como se realizaran simultnea e independientemente

varios contrastes de hiptesis, la probabilidad de encontrar alguno significativo
por azar aumentara. En cada contraste se rechaza la H0 si la t supera el nivel
crtico, para lo que, en la hiptesis nula, hay una probabilidad a. Si se realizan
m contrastes independientes, la probabilidad de que, en la hiptesis nula,
ningn estadstico supere el valor crtico es (1 - a)m, por lo tanto, la
probabilidad de que alguno lo supere es 1 - (1 - a)m, que para valores de a
prximos a 0 es aproximadamente igual a a m. Una primera solucin,
denominada mtodo de Bonferroni, consiste en bajar el valor de a, usando en
su lugar a/m, aunque resulta un mtodo muy conservador.
Por otro lado, en cada comparacin la hiptesis nula es que las dos
muestras provienen de la misma poblacin, por lo tanto, cuando se hayan
realizado todas las comparaciones, la hiptesis nula es que todas las muestras
provienen de la misma poblacin y, sin embargo, para cada comparacin, la
estimacin de la varianza necesaria para el contraste es distinta, pues se ha
hecho en base a muestras distintas.
El mtodo que resuelve ambos problemas es el anova, aunque es algo ms

que esto: es un mtodo que permite comparar varias medias en diversas
situaciones; muy ligado, por tanto, al diseo de experimentos y, de alguna
manera, es la base del anlisis multivariante.
72. Anlisis de varianza factorial y multifactorial
Los modelos factoriales de anlisis de varianza (factorial = ms de un factor)

sirven para evaluar el efecto individual y conjunto de dos o ms factores
168
(variables independientes categricas) sobre una variable dependiente
cuantitativa.
Un anova factorial permite estudiar, por ejemplo, si el salario (variable

dependiente) de los varones y de las mujeres es diferente (efecto del primer
factor) y, al mismo tiempo, si varios grupos de edad tienen distinto salario
(efecto del segundo factor). Pero, adems, tambin permite estudiar si las
diferencias entre varones y mujeres se repiten o no en cada grupo de edad, es
decir, permite determinar si la interaccin entre los factores sexo y grupos de
edad afecta a la variable dependiente salario. Utilizar ms de un factor en un
mismo diseo posee la ventaja de poder estudiar el efecto de la interaccin
entre los factores.
En un modelo de dos factores, los efectos de inters son tres: los dos
efectos principales (uno por cada factor) y el efecto de la interaccin entre
ambos factores. En un modelo de tres factores, los efectos de inters son siete:
los tres efectos principales, los tres efectos de las interacciones dobles (uno por
cada interaccin entre cada dos factores) y el efecto de la interaccin triple
(entre los tres factores). Etc. El procedimiento Univariante incluye todos estos
modelos factoriales de anova. Pero, adems, ofrece la posibilidad de trabajar
tanto con factores de efectos fijos como con factores de efectos aleatorios.
Tambin permite llevar a cabo anlisis de covarianza y anlisis de regresin, y
utilizar modelos aleatorizados en bloques y modelos jerrquicos o con factores
anidados.
En un anlisis de varianza factorial existe una hiptesis nula por cada factor
y por cada posible combinacin de factores:
La hiptesis nula referida a un factor afirma que las medias de las

poblaciones definidas por los niveles del factor son iguales.
La hiptesis referida al efecto de una interaccin afirma que tal efecto es

nulo. Para contrastar estas hiptesis, el ANOVA factorial se sirve de
estadsticos F basados en la lgica ya expuesta en el captulo anterior al
169
estudiar el modelo de un factor. As pues, para cada efecto existe una hiptesis
y para cada hiptesis un estadstico F que permite contrastarla. Y al igual que
en el ANOVA de un factor, el nivel crtico asociado a cada estadstico F es
quien nos permite decidir si podemos mantener o debemos rechazar una hip-
tesis. De modo similar a como ocurre en el ANOVA de un factor, en un ANOVA
factorial se trabaja con tantas poblaciones como casillas resultan de la
combinacin de todos los niveles de los factores involucrados. Por ejemplo, en
un ANOVA de dos factores, con 2 niveles en un factor y 5 en otro, trabajamos
con las 25 = 10 poblaciones definidas por la combinacin de niveles de ambos
factores. El modelo supone que esas 10 poblaciones son normales
(normalidad) y que sus varianzas son iguales (homogeneidad de varianzas u
homocedasticidad). Tambin supone el modelo que las observaciones han sido
aleatoriamente seleccionadas y que, por tanto, son independientes entre s.
73. La prueba F de Fisher
El anlisis de Varianza contrasta la hiptesis de igualdad de las Medias de

ms de dos grupos, y tiene su fundamento en la relacin entre la variacin
explicada por las diferencias entre grupos y la variacin individual.
Prueba en la que el estadstico utilizado sigue una distribucin F si la

hiptesis nula no puede ser rechazada. El nombre fue acuado en honor a
Ronald Fisher. La hiptesis de que las medias de mltiples poblaciones
normalmente distribuidas y con la misma desviacin estndar son iguales. Esta
es, quizs, la ms conocida de las hiptesis verificadas mediante el test F y el
problema ms simple del anlisis de varianza. La hiptesis de que las
desviaciones estndar de dos poblaciones normalmente distribuidas son
iguales, lo cual se cumple.
En muchos casos, el test F puede resolverse mediante un proceso directo.

Se requieren dos modelos de regresin, uno de los cuales restringe uno o ms
de los coeficientes de regresin conforme a la hiptesis nula. El test entonces
se basa en un cociente modificado de la suma de cuadrados de residuos de los
dos modelos como sigue:
170
El estadstico F puede calcularse como:
Dnde:
RSS_0 se refiere al coeficiente de determinacin del modelo sin restringir

(R^2) RSS_1 se refiere al coeficiente de determinacin del modelo restringido
(R^2) m se refiere al nmero de restricciones impuestas a los coeficientes
estimados (coficientes restringidos). k se refiere al nmero de coeficientes
estimados en el modelo sin restricciones. n se refiere al nmero de
observaciones del modelo. El valor resultante debe entonces compararse con
el valor correspondiente de la tabla de valores crticos.
Si F_calculado > F_tablas ; el modelo restringido es mejor.
74. Calculo de la Confiabilidad
Existen diversos procedimientos para calcular la confiabilidad de un

instrumento de medicin. Todos utilizan frmulas que producen coeficientes de
confiabilidad. Estos coeficientes pueden oscilar entre O y 1. Donde un
coeficiente de O significa nula confiabilidad y 1 representa un mximo de
confiabilidad (confiabilidad total). Entre ms se acerque el coeficiente a cero
(0), hay mayor error en la medicin
Los procedimientos ms utilizados para determinar la confiabilidad mediante

un coeficiente son:
74.1 Medida de estabilidad (confiabilidad por test-retest)
En este procedimiento un mismo instrumento de medicin (o tems o

indicadores) es aplicado dos o ms veces a un mismo grupo de personas,
despus de un periodo de tiempo. Si la correlacin entre los resultados de las
diferentes aplicaciones es altamente positiva, el instrumento se considera
171
confiable. Se trata de una especie de diseo panel. Desde luego, el periodo de
tiempo entre las mediciones es un factor a considerar.
Si el periodo es largo y la variable susceptible de cambios, ello puede

confundir la interpretacin del coeficiente de confiabilidad obtenido por este
procedimiento. Y si el periodo es corto las personas pueden recordar cmo
contestaron en la primera aplicacin del instrumento, para aparecer como ms
consistentes de lo que son en realidad (Bohrnstedt, 1976).
74.2 Mtodo de formas alternativas o paralelas
En este procedimiento no se administra el mismo instrumento de medicin,

sino dos o ms versiones equivalentes de ste. Las versiones son similares en
contenido, instrucciones, duracin y otras caractersticas. Las versiones
generalmente dos son administradas a un mismo grupo de personas dentro de
un periodo de tiempo relativamente corto. El instrumento es confiable si la
correlacin entre los resultados de ambas administraciones es
significativamente positiva. Los patrones de respuesta deben variar poco entre
las aplicaciones.
74.3 Mtodo de mitades partidas (split-halves)
Los procedimientos anteriores (medida de estabilidad y mtodo de formas

alternas), requieren cuando menos dos administraciones de la medicin en el
mismo grupo de individuos. En cambio, el mtodo de mitades-partidas requiere
slo una aplicacin de la medicin. Especficamente, el conjunto total de tems
(o componentes) es dividido en dos mitades y las puntuaciones o resultados de
ambas son comparados. Si el instrumento es confiable, las puntuaciones de
ambas mitades deben estar fuertemente correlacionadas. Un individuo con baja
puntuacin en una mitad, tender a tener tambin una baja puntuacin en la
otra mitad.
La confiabilidad vara de acuerdo al nmero de tems que incluya el

instrumento de medicin. Cuantos ms tems la confiabilidad aumenta (desde
luego, que se refieran a la misma variable). Esto resulta lgico, vemoslo con
172
un ejemplo cotidiano: Si se desea probar qu tan confiable o consistente es la
lealtad de un amigo hacia nuestra persona, cuantas ms pruebas le pongamos,
su confiabilidad ser mayor. Claro est que demasiados tems provocarn
cansancio en el respondiente.
74.4 Coeficiente alfa de Cronbach.
Este coeficiente desarrollado por J. L. Cronbach requiere una sola

administracin del instrumento de medicin y produce valores que oscilan entre
O y 1. Su ventaja reside en que no es necesario dividir en dos mitades a los
tems del instrumento de medicin, simplemente se aplica la medicin y se
calcula el coeficiente.
74.5 Coeficiente KR-20. Kuder y Richardson
Es un coeficiente para estimar la confiabilidad de una medicin, su

interpretacin es la misma que la del coeficiente alfa. solo que esta ltima es
expresada para tems continuos y Kuder Richardson para tems dicotmicos.
Existen varios procedimientos para calcular la confiabilidad de una tcnica de
medicin. Todas estas utilizan frmulas que producen coeficientes de
confiabilidad. Estos factores pueden oscilar entre O y 1. Donde un coeficiente
de O significa una confiabilidad nula y 1 representa un mximo de confiabilidad
ptima (confiabilidad total).
Entre ms se acerque el coeficiente a cero (0), hay mayor error en la

medicin y mientras ms se acerque a 1 la medicin ser mejor. Para que sea
efectiva la aplicacin de este mtodo se deben seguir los siguientes supuestos:
El denominador es la varianza de las puntuaciones totales del test.

El numerador es la varianza verdadera, o la suma de covarianzas de
los tems.
173
Si los tems no discriminan sus desviaciones tpicas sern pequeas,
el numerador ser menor y por consiguiente la fiabilidad tambin sera
menor.
Si las desviaciones tpicas son grandes pero los tems no guardan
relacin bajara la fiabilidad, porque esa no relacin entre los tems
hace que las puntuaciones totales no estn diferenciadas.
La fuerza del contenido es compleja de obtener. Primero, es necesario

revisar cmo ha sido utilizada la variable por otros investigadores. Y en base a
esta revisin se elaborara un universo de tems posibles para medir la variable
y sus dimensiones.
75. Series de Tiempo
Una serie de tiempo es un conjunto de datos numricos que se obtienen en

perodos regulares a travs del tiempo. Estos datos pueden ser muy variados,
generalmente son usados para evaluar el comportamiento de las ventas de una
empresa, o para evaluar el comportamiento de los ndices de precio de un pas
o de un tipo de producto pero en general pueden aplicarse a cualquier negocio
y /o rea. Este comportamiento puede tener caractersticas de tipo estacional, o
cclico o siguen alguna tendencia ya sea a la baja, de subida o sin variacin.
Tambin se define como u na serie de tiempo es una lista de fechas, cada

una de las cuales se asocia a un valor (un nmero). Las series de tiempo son
un modo estructurado de representar datos. Visualmente, es una curva que
evoluciona a lo largo del tiempo. Por ejemplo, las ventas diarias de un producto
pueden representarse como una serie de tiempo.
En el sector minorista o en el de manufactura, las series de tiempo son

importantes porque son las representaciones ms cannicas del flujo de
artculos vendido o producido. La representacin de datos comerciales como
series de tiempo generalmente ayuda a los encargados a visualizar la actividad
de sus comercios.
174
Las organizaciones en general evalan peridicamente el comportamiento
de su actividad y/o productos a fin de pronosticar que va a suceder en el futuro
en base a lo que ha venido ocurriendo en el pasado, est sucediendo en el
presente y tiene la tendencia a comportarse de la misma manera en el futuro.
75.1 Componentes de la serie de tiempo
El comportamiento de las series de tiempo, se debe a 4 componentes: la

tendencia, la variacin cclica, la variacin estacional y la variacin irregular.
75.1.1 La tendencia o tendencia secular
Es aquella tendencia a largo plazo sin alteraciones de una serie de tiempo.

Esta tendencia pudiera ser de tipo lineal o no lineal, as como tambin creciente
o decreciente y tambin como una combinacin de alguna de las anteriores.
Muchos productos, servicios e indicadores econmicos siguen un
comportamiento de este tipo, y su anlisis ms generalizado es a travs de
varios aos, teniendo en cuenta los perodos que ms se ajustan a cada
negocio, pudiendo ser semestrales, trimestrales, mensuales, semanales.
75.1.2 La variacin cclica
En la que a travs del perodo de tiempo analizado se producen ascensos y

descensos en varias oportunidades. Este tipo de comportamiento es muy
asociado a variaciones de carcter econmico.
75.1.3 La variacin estacional
Es la que tiene como caracterstica de variacin regular dentro de un ao y

que a su vez se repite cada ao, casos tpicos son la produccin de algunas
frutas y/o comestibles o ventas asociadas a productos como ropa de
temporada. La ltima componente es la componente irregular que adiciona las
caractersticas anteriores pero adems tiene comportamiento extraos
imprevisibles que se dan generalmente en el corto plazo.
Para poder pronosticar cual es el comportamiento futuro de una variable en

funcin a estas caractersticas de comportamiento es necesario poder
175
representarlo matemticamente. Existen mtodos llamados mtodos de
suavizamiento porque su objetivo es suavizar la variacin causada por el
componente irregular de la serie de tiempo, estos mtodos son: el de
promedios mviles, promedios mviles ponderados y suavizamiento
exponencial. La tendencia lineal es la ms sencilla de representar, y utilizar s
es se el comportamiento de nuestra variable analizada.
76. Tendencia de una serie
76.1 Tendencia lineal
La tendencia de una serie viene dada por el movimiento general a largo

plazo de la serie. La tendencia a largo plazo de muchas series de negocios
(industriales y comerciales), como ventas, exportaciones y produccin, con
frecuencia se aproxima a una lnea recta. Esta lnea de tendencia muestra que
algo aumenta o disminuye a un ritmo constante. El mtodo que se utiliza para
obtener la lnea recta de mejor ajuste es el Mtodo de Mnimos Cuadrados.
76.2 Tendencia no lineal
Cuando la serie de tiempo presenta un comportamiento curvilneo se dice

que este comportamiento es no lineal. Dentro de las tendencias no lineales que
pueden presentarse en una serie se encuentran, la polinomial, logartmica,
exponencial y potencial, entre otras.
77. Mtodos de Suavizamiento de la Serie
77.1 Promedio mvil
Un promedio mvil se construye sustituyendo cada valor de una serie por la

media obtenida con esa observacin y algunos de los valores inmediatamente
anteriores y posteriores. Se mostrar este mtodo con los siguientes ejemplos:
Ejemplo 1. Aplicar el mtodo de promedios mviles para el pronstico de

ventas de gasolina a partir de la siguiente informacin: Se considerar el
promedio mvil a partir de las tres observaciones ms recientes. En este caso
se utilizar la siguiente ecuacin:
176
Resumen de clculos para promedios mviles de tres semanas
Los promedios mviles tambin se pueden construir tomando en cuenta

valores adyacentes de las observaciones, por ejemplo: En el caso de
determinar el promedio mvil para tres observaciones adyacentes de la tabla
anterior, se tiene:
177
77.2 Promedios mviles ponderados
Para mostrar el uso de ste mtodo, se utilizar la primera parte del ejemplo
anterior de la venta de gasolina. El mtodo consiste en asignar un factor de
ponderacin distinto para cada dato. Generalmente, a la observacin o dato
ms reciente a partir del que se quiere hacer el pronstico, se le asigna el
mayor peso, y este peso disminuye en los valores de datos ms antiguos. En
este caso, para pronosticar las ventas de la cuarta semana, el clculo se
realizara de la siguiente manera:
Puede observarse que el dato ms alejado (correspondiente a la primera

semana) tiene el factor de ponderacin ms pequeo, el siguiente tiene un
factor de ponderacin del doble que el primero y el dato ms reciente (que
corresponde a la tercera semana) tiene un factor de ponderacin del triple del
primero.
178
78. Pronstico de series de tiempo
El pronstico de las series de tiempo significa que extendemos los valores

histricos al futuro, donde an no hay mediciones disponibles. El pronstico se
realiza generalmente para optimizar reas como los niveles de inventario, la
capacidad de produccin o los niveles de personal.
Existen dos variables estructurales principales que definen un pronstico de

serie de tiempo:
78.1 El perodo
Que representa el nivel de agregacin. Los perodos ms comunes son

meses, semanas y das en la cadena de suministro (para la optimizacin del
inventario). Los centros de atencin telefnica utilizan perodos de cuartos de
hora (para la optimizacin del personal).
78.2 El horizonte
Que representa la cantidad de perodos por adelantado que deben ser

pronosticados. En la cadena de suministro, el horizonte es generalmente igual
o mayor que el tiempo de entrega.
Luego, existen algunas sutilezas relacionadas con la definicin del perodo

mismo, principalmente debido a irregularidades del calendario. Por ejemplo,
uno puede decidir que la agregacin mensual comienza el da N de cada mes
(en lugar del 1.), pero si N es mayor que 28, causa problemas porque no todos
los meses tienen ms de 28 das.
79. Clasificacin descriptiva de las series temporales
Las series temporales se pueden clasificar en:
79.1 Estacionarias
Una serie es estacionaria cuando es estable a lo largo del tiempo, es decir,

cuando la media y varianza son constantes en el tiempo. Esto se refleja
grficamente en que los valores de la serie tienden a oscilar alrededor de una
179
media constante y la variabilidad con respecto a esa media tambin permanece
constante en el tiempo.
79.2 No estacionarias
Son series en las cuales la tendencia y/o variabilidad cambian en el tiempo.

Los cambios en la media determinan una tendencia a crecer o decrecer a largo
plazo, por lo que la serie no oscila alrededor de un valor constante.
80. Procesos Estocsticos
Desde un punto de vista intuitivo, un proceso estocstico se describe como

una secuencia de datos que evolucionan en el tiempo. Las series temporales
se definen como un caso particular de los procesos estocsticos.
80.1 Proceso estocstico estacionario
Un proceso estocstico se dice que es estacionario si su media y su

varianza son constantes en el tiempo y si el valor de la covarianza entre dos
periodos depende solamente de la distancia o rezago entre estos dos periodos
de tiempo y no del tiempo en el cual se ha calculado la covarianza.
80.2 Ruido blanco(white noise)
Un ruido blanco es un caso simple de los procesos estocsticos, donde los

valores son independientes e idnticamente distribuidos a lo largo del tiempo
con media cero e igual varianza, se denota por .Et.
81. Autocorrelacin
En ocasiones en una serie de tiempo acontece, que los valores que toma
una variable en el tiempo no son independientes entre s, sino que un valor
determinado depende de los valores anteriores, existen dos formas de medir
esta dependencia de las variables.
180
CONCLUSIONES
La estadstica como ciencia que estudia la recoleccin, anlisis e

interpretacin de datos, ya sea para socorrer en la toma de decisiones o para
explicar condiciones regulares o irregulares de algn fenmeno o estudio
aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo
estadstica es ms que eso, en otras palabras es el vehculo que permite llevar
a cabo el proceso relacionado con la investigacin.
La utilizacin del programa estadstico(SPSS) es de gran ayuda en la

resolucin de problemas relacionados a trabajos de investigacin, permite
ahorrar tiempo y dinero para llevar acabo la toma de decisiones, ayuda a la
obtencin de datos exactos y verdicos descartando la existencia de errores,
facilita a los estudiantes y profesionales en la obtencin de resultados de
posibles investigaciones cualitativa y permite fortalecer los conocimientos.
181
BIBLIOGRAFA
Castaeda Maria B, C. A. (2010). Procesamiento de Datos y Anlisis

Estdisticos Utilizando el SPSS. Porto Alegre : EDIPUCRS.
Gonzlez, A. L. (2006). Mtodos estadsticos para medir, describir y controlar la

variabilidad. Cantabria: Textos Universitarios .
Gonzlez, A. L. (2006). Mtodos estadsticos para medir, describir y controlar la

variabilidad. Cantabria - Espaa: Textos Universitarios .
Pedroza, H. y. (2006). Sistema de Anlisis Estadstico con SPSS. Managua:

Instituto Nicaragense De Tecnologa Agropecuaria IICA.
Ross, S. M. (2007). Introduccin a la Estadstica. Barcelona - Espaa: Reverte.
Pginas WEB Visitas:
http://www2.dis.ulpgc.es/~ii-pest/sesion3-spss.pdf
https://hhperez.webs.ull.es/mei_mec/Practicas_2009/Tema1%20Practicas
%201%202%203.pdf
182
http://es.slideshare.net/DavidFreireLuna
http://es.slideshare.net/edwinalb/07result?qid=d961d89a-4e98-42c5-b867-
0318fc3ecb50&v=&b=&from_search=
https://www.uam.es/personal_pdi/ciencias/joser/docencia/estap/estap-prac1-
1011.pdf1
http://es.slideshare.net/maricgordon/proyecto-de-estadstica-inferencial-con-
aplicacin-a-spss
http://www.slideshare.net/rruizdeadana/unidad-6-inferencia-estadistica-
mediante-spss
http://estadisticaeducativaudo.blogspot.com/2014/02/distribucion-de-
frecuencias.html
http://www.calest.info/CalEst.aspx
http://www.vitutor.net/2/11/poligonos_frecuencia.html
http://iescastelar.juntaextremadura.net/
http://www.hrc.es/bioest/
Prez Lpez, C. Muestreo estadstico: conceptos y problemas resueltos.

Madrid: Pearson Prentice Hall, 2005. .
http://www.netquest.com/blog/es/blog/es/que-tamano-de-muestra-necesito
183

ESTADISTICA BASICA Maestria Finanza Laguna Rodriguez Stabilito Salazar Stabilito 2016

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

ESTADISTICA BASICA Maestria Finanza Laguna Rodriguez Stabilito Salazar Stabilito 2016

Uploaded by

Copyright:

Available Formats

UNIVERSIDAD DE ORIENTE

Hogla Rodrguez G. C.I: 12.969.576 Edith J. Laguna M. C.I: 16.160.679

ngel M. Stabilito C. C.I: 9.817.598 Eliana C. Stabilito C C.I: 12.816.163

Ins M. Salazar G. C.I: 16.613.588

Prof. MSc. Hamlet Mata Mata

Cantaura, diciembre de 2016

UNIDAD I EL PROGRAMA INFORMTICO SPSS Y EL ANLISIS

1. El Programa Informtico SPSS..................................................................1

1.2 Definicin de SPSS..................................................................................1

2. Caractersticas del SPSS...........................................................................1

3. Instalar el Programa SPSS.........................................................................3

3.1.1 Sistemas operativos..........................................................................4

3.1.2.1 Para sistemas Microsoft XP...........................................................4

3.1.2.2 Para sistemas Microsoft Vista o 7..................................................4

3.1.4 Cdigo de licencia.................................................................................5

5. Estructura del SPSS...................................................................................9

5.1 Archivo de datos del SPSS..................................................................9

5.2 Editor de datos del SPSS..................................................................10

5.3.1 Recodificacin de una Variable...................................................15

5.3.2 Filtrado de datos..........................................................................15

5.4 Modificar archivos de datos en el SPSS............................................16

5.4.1 Trasponer archivos..........................................................................16

5.4.2 Fundir Archivos................................................................................17

5.4.3 Agregar Datos..................................................................................17

5.4.4 Seleccionar archivos........................................................................18

5.4.5 Ponderar casos................................................................................18

5.5 El visor del SPSS...................................................................................18

5.5 Archivo de sntesis del SPSS............................................................20

6. Anlisis Estadstico con el SPSS..........................................................20

7. Aplicacin del SPSS en estadstica inferencial........................................22

8. Solucin de problemas estadsticos con el spss......................................23

Ejercicios con el SPSS.......................................................................................23

UNIDAD II INTRODUCCIN A LA ESTADSTICA DESCRIPTIVA....................25

10. Importancia de la estadstica........................................................................26

11. Estadstica Descriptiva..............................................................................27

11.1 Conceptos Bsicos..................................................................................27

11.1.2.1 Tipos de variables.......................................................................28

12. Recoleccin, organizacin y presentacin de los datos...........................29

13. Datos agrupados y no agrupados:...............................................................30

14. Distribucin de frecuencia............................................................................31

14.1 Tipos de frecuencias.......................................................................32

14.1.1 Frecuencia absoluta.................................................................32

14.1.2 Frecuencia relativa...................................................................32

14.1.3 Frecuencia acumulada..................................................................33

14.1.4 Frecuencia relativa acumulada......................................................33

14.1.5 Distribucin de frecuencias agrupadas.........................................33

14.1.6 Construccin de tablas de frecuencia...........................................34

14.1.7.1 Crear un histograma con el SPSS.............................................36

14.1.8 Polgonos simples y acumulativos................................................38

15.1.1 Tipos de datos...................................................................................40

15.2 Tipos de Grficos....................................................................................40

15.2.1 Grfico de barras..................................................................................40

15.2.2 Grfico de lneas......................................................................................41

15.2.3 Grfico de Pareto.....................................................................................41

15.2.5 Grfica de pastel......................................................................................41

15.2.6 Grfico de dispersin...............................................................................42

15.3.8 Grfico de sectores..................................................................................42

15.3.10 Barras mltiples.....................................................................................43

15.3.11 Grficos circulares.................................................................................43

15.3.12 Grficos de reas..................................................................................43

15.3.13 Grficos Mixtos......................................................................................43

17. La Media Aritmtica......................................................................................44

22. Medidas de dispersin..................................................................................47

28. Solucin de problemas aplicando el Spss:...................................................51