Professional Documents
Culture Documents
"
Anllsls ~lvarlado
Obtencin de porcentajes para las tablas
Elaboracin y lectura de tablas
Formatos de tablas blvariadas
Introducc16n al anllsls multivarlado
continuas y discretas
entre detalles y manejabilldad
entre subgrupos
r .. t .. ~'nrias de respuestas combinadas"
manejo de los "no s"
De~;crlp(:lol:les numricas en la Investigacin
COllllpanlcl.l)nt~S
Puntos principales
Preguntas y ejercicios de repaso
Proyecto de continldad
Lecturas adicionales
Anlisis univariado
todos los anlisis de las ciencias sociales peral rubro general de anlisis multivariaa los que. por tanto. dedicaremos la mayoria
la parte 4. El trmino se refiere Simplemente al
de diversas variables al mismo tiempo. El
de la asociacin simultnea' de edad. eduy prejuicios seria un ejemplo de anlisis
Anlisis de datos
Lo que aprender en este captulo
Al terminm este captulo. llsted ser capaz de ~rectllar
diuersas manipulaciones simples pero poderosas de los
dalos con el.fln de obtener conclusiones cien/meas.
El an6liais univariado es el examen de la -dIstribucin de los casos en una sola variable cada vez. Comenzaremos con la lgica y los rormatos del anlisis de datos univariados.
Distribuciones
,El rormato ms comn para presentar datos unlvaliados es inrormar todos los casos. es decir. elaborar una 'lista del atributo de cada caso del estudio
en trminos de la variable de que se trate. Tomemos los datos de la Encuesta Social General sobre
la asistencia a las ceremonias religiosas. ASIS. La
tabla 15. I presenta los resultados de un anlisis
el) SPSS de esta variable.
Examinemos la tabla parte por part~. Plimero. si
vamos a la parte in(elior veremos que la muestra
que se va a analizar tiene en total ) 500 casos.
Tambien se aprecia que) 7 de los) E.OO entrevista'
dos contestaron "no se- (NSJ o no respondieron
(NRJ a la pregunta. Asi. nuestra evaluacin de la
asistencia de los estadounidenses a ceremonias re'
Iigiosas durante 20 aos entre 1973 Y 1993 se basar en 1483 interrogados.
349
350
Capitulo 1S
Anlisis de datos
Anlisis univariado
Tabla 15.1
Asistencia a ceremonias religiosas segn la ESG, 1973-1993
Asistencia
Frecuencia con
Categoria
que
Af.lo
CADA SEMANA
1
2
3
4
5
6
7
NS, NR
VARIAS VECES AL
Frecuencia
224
139
i80
194
84
136
114
294
NIJNC}'.
Af.lo
118
17
1500
Total
Casos vlidos
Figura 15.1
Grfica de barras de ASIS de la ESG, 1973.1993
1483
351'
Porcentaje
14.9
9.3
12.0
12.9
5.6
9.1
7.6
19.6
7.9
Ll
100.0
17
Porcentaje
Porcentaje
vlido
acumulado
15.1
9.4
12.1
13 .1
5.7
9.2
7.7
19.8
8.0
15.1
24.5
36.6
49.7
55.4
64.5
72.2
92.0
100.0
No aplica
Tendencia central
Adems de los informes de datos marginales. tambin se puede optar por presentar los datos en la
forma de promedio. compendiados o medidas de
tendencia central. Aqu las' opciones son la moda o
modo (el atributo ms frecuente. agrupado o no).
la media aritmtica o la mediana (el atrtbuto ceno
tral en la distrtbucin ordenada de los atributos
observados). Veamos cmo calcular las tres medidas de tendencia central de un conjunto de datos.
Supongamos que realizamos un experimento
con adolescentes como sujetos. Sus edades van de
los 13 a los 19 aos. como se indica en la tabla siguiente:
Cantidad
13
14
15
16
17
18
19
________________________________
20
10
Q)
Il.
0 ........- -....
100.0
Edad
30~------------------
"
6
8
"3
Ahora que hemos visto las edades de los 31 sujetos. cul es su edad en general. o en promedio?
Veamos tres formas de responder tal pregunta.
La medida de tendencia central ms fcil de calcular es el modo. el caso ms frecuente. Como vemos,
haY,ml:! sujetos de 16 aos (ocho) que de cualquier
otra edad. asi que la edad modal es 16. como se indica en la figura 15.2.
Esta figura tambin muestra el clculo de la media. Son tres pasos: (1) multipliqu~ cadll: edad por
el nmero de sujetos que la tienen. (2) sume los
productos de esas multiplicaciones y (3) divida el
total entre el nmero de sujetos. Como se indica en
la figura 15.2. la media de las edades en este ejem.
plo es de 15.87.
'La mediana es el valor" centra]": la mitad de los
datos estn arriba de l. la mitad abajo. Si tuviramos las edades exactas de los sujetos (por ejemplo.
17 aos y 124 das) podriamos ordenar a los sUJetos por edad y la mediana de todo el grupo seria la
edad del sujeto de en medio.
Sin embargo. no conocemos las edades exactas;
al respecto. nuestra informacin son "datqs agruP~dos': por ejemplo. en la ('alegoria de" 13 aos' s~
-;
352
Capitulo IS
Anlisis univariado
Anlisis de datos
del Intervalo. a partir del lmite Inferter y luego. sumames un Intervalo. cemplete a la edad de cada
sujeto sucesivo.. el ltimo. est a medie Intervalo del
lmite supelier.
Por tanto.. le que hiclmes fue calcular hlpetticamente las edades exactas de les eche sujetes (supenlende que seguian una dlslrtbucln unlferme).
Luego. de hacerle. basta sealar la edad del sujeto
central -16.31-. que es la edad mediana del
grupo. .
Desde luego.. cuando. el nmero de los sujetos es
par no. hay une central. En este case. se calcula
simplemente la media de los dos puntes entre les
que queda. Por ejemplo.. supongames que hay un
. sujeto ms de 19 aos. Asi. el nmero medio se situara entre el nmero 16 y el 17. y calculariames
la mediana de este medo.: (16.31 + 16.44)/2 =
16.38.
En la blblfografia de la Investigacin encontrar
tanto medias como medianas. Cada vez que le presenten medias. debe tener presente que son muy
vulnerables a los valores extremos. es decir. con
nmeros muy grandes e muy pequees. Veamos
un ejemplo. para ilustrar la razn.
Para determinar el bienestar de los habitantes
de un pas. los investigadores acuden a diversos Indicadores. Una de las medidas ms empleadas es
el indice de mortalidad irifanti/ ([MI). el nmero. de
nies que mueren durante el primer ao de vida
por cada 1000 nacides vivos. Tomemos el fMI en
1991 de cuatro naclenes que poseen culturas muy
diferentes (Populatlen Reference Bureau. 1993).
Figura 15.2
Tres "medidas de tendencia centra'"
Edad
13
14
15
16
17
18
19
Edad
13
14
"I
1
1,
15
!
'. i
16
17
lB
19
1'1'
Nmero
~~~
~~~~
~~~~~~
~~~~~~~~ ..
~~~~
~~X
~XX
Nmero
~~~
~XX~
~~~~~X
X~~~~~~~
~~~~
~~~
~~~
:1"
Edad
13
14
15
i:
11.
~~~
~~~~
.
13x3=39
J<
Media = 15.B7
Promedio aritmtico
14x4'=56
15x6=90
16x8=12B
17x4=6B
lBx3=54
..
19x3=57
492 + 31 = 15.87
(Total) (Casos)
ndice de ~ortalidad
1-3
Mediana = 16.31
infantil. 1991
Punto medio
4-7
Katar
tE~X~~B-13
~~~~~~~X
17
~~X~
19
Ms frecuente
Nmero.
16
18
Modo = 16
~tt
~~~
25
26
Holanda
6.5
Blgica
9.9
22-25
14
15
16
17
lB
19
20
21
26-2B
.~
29-31
16.06
16.19
16.31
16.44
16.56
16.69
16.Bl
16.94
353
La ecenoma es otro aspecto de la calidad de VIda. y una medida asequible es el producto nacional
bruto per cpita de cada pas. El preducto nacienal
bruto (PNB) es el valor total de les bienes y servicios que produce la nacin: al diVIdirlo entre su pobracln (la productividad media de sus habitantes)
se obtiene un indicador del bienestar ecenmico
del pueblo. La tabla siguiente presenta estos datos
de los cuatro pases de nuestro ejemplo (Populatien
Reference Bureau. 1993).
PNB per cpica. 1991
Emiratos rabes Unidos
Katar
Holanda
Blgica
$19.B70
$/5.870
$IB.560
$/9.300
Dispersin
Las medidas de tendencia central ofrecen al lector
la ventaja especial de que reducen los datos crudos
a su forma ms manejable: un solo nmero (o alribulo.) representa.1 oda la informacin detallada que
If"
il;l
lS4
CapitUlo 15
Anilisls de datos
'JI'
:11'
1";
I'1/:::!
./;"
'!j,
!,:""'I,':'!I:",".,,.,.
'II' ms grande del ms pequeo. Asi. adems de re,,"o portar que nuestros sujetos tienen una edad media
1Ji,
'1;
lil,
"
i~:
lit
Ili
~'
');
de 15.87 aos. tambin indicaramos que SUS edl.ades se extienden de los 13 a los 19. Una med Ic on
un tanto ms elaborada de la dispersin es la desviacin est~dar. Vimos la lgica de esta medida en
el capitulo 8. cuando tratarnos el error estndar de
la distribucin de muestreo.
Hay muchas otrasmedidas'de la dispersin. Por
ejemplo. al entregar ias calificaciones de una prueba de inteligencia se puede determinar el rango IntercuarUl. la gama de calificaciones del 50 por clento central de los sujetos. el.segundo cuarto. etc. Si
el mejor cuarto tuvo calificaciones de 120 a 150 y el
peor de 60 a 90. sealaramos que el ranalgo e~~e
cuartlles es de 120 a 90. el 30. con una c Ifl caclOn
media de. digamos. 102.
,!i
,]j
;,
~i
l'
il":, '
las varables. Para entender por qu. debemos examinar dos clases de variables: continuas y cscre
:I
Ii
Comparaciones
entre subgrupos
Los anlisis univarlados describen las unidades de
anlisis del estudio y. si son una muestra extraida
de una poblacin mayor. nos permiten hacer inferencias descriptivas sobre esta ltima. Los anlisis
bivarlados y mulllvartados se destinan sobre todo
a explicar. Sin embargo. antes de ocuparnos de la
e_\plicacn debemos cOl1slderar el caso de la descripcin de subgrupos.
Muchas veces no es apropiado describir subconjuntos de casos. sujetos o entrevistados. Por ejemplo. la tabla 15.2 presenta los datos de los ingresos
de hombres y mujeres por separado. Adems. indica la proporcin entre la mediana de los Ingresos
de las mujeres y la mediana de los hombres. con lo
que se muestra que las trabajadoras ganan slo un
poco ms de la mitad que los hombres.
En algunas situaciones. el investigador presenta comparaciones entre subgrupos con meros nn~s
descriptivos; pero la mayoria de las veces el proposito de estas descripciones es comparativo; las mujeres ganan menos que los hombres. En este caso.
se supone que hay algo en ser mujer que da por
resultado obtener menores Ingresos. Hacemos la
misma suposicin cuando comparamos negros con
blancos. En estos casos. el anlisis se basa en una
premisa de causalidad: una vartable es la causa de
otra. como el sexo es la causa del ingreso.
Tabla 15.3
Proporcin entre los ingresos anuales
de las trabajadoras de tiempo completo
y los ingresos de los hombres. 1980-1993
Proporcin de la mediana
de los ingresos anuales de las
muj eres respecto a ia mediana
de los Ingresos anuales
de los hombres
entre
Mujeres
Hombres
ambos
Ingresos
$8.618
$1'1.626
.59
8.622
1'1.323
8.+19
14.175
.60
.60
8.565
14.578
.59
8.639
15.254
.57
8.55i
14,778
.58
8.369
14.06'1
.61
8.307
13.993
.59
8.227
13.976
.59
7.763
13.349
58
7.503
13,021
.58
1980
1985
1990
1991
1993
.70
.65
Fue~ Las cllras de 1980 y 1985 se basan en pagos por hora y se tomaron de Mlchael W. HOrrigan y James P. Markey. "Recent Galns in
Women's Earring: Bener Par or Longer Hours1". en Monlhly Labor R~
view Oullo de 1990): 1117, Las cllras de 1990 y 1991 se basan en ingresos anual.. y proceden del U.S, Bureau 01 the Census, serie CPR
P-60. nm. 180, Me"., Income o( Househo/ds. Fomi/ies. ond Person> in rile
Unitod SIOI..: /99/ (Washington, Govemment Printlng Office. 1992),
Los datos de 1993 provienen de U.S. Bureau 01 che Census. Stotistic:o/
AbslrOct o( Ihe Unitod Stotes. /993 (CD-ROM CD-SA9S. abril de
1996): tabla H2.
Cuando en 1978 la Oficina del Censo estadouni. dense public los datos que aparecen en la tabla
, ~5.2. reforz la legitimidad del reclamo creciente
por la discriminacin de las mujeres en la economa de aquel pas. Desde entonces. tanto las medidas politlcas como la Investigacin se han concentrad. en'el tema. pero la discrepancia entre lo que
ganan hombres y mujeres est lejos de resolverse.
Las esladistlcas ms recientes muestran algunos avances. pero de todos modos hay una diferencia notable. Mientras escribo esto. la trabajadora
,promedia de tiempo completo gana 66 centavos por
cada dlar que obtiene su contraparte masculina.
En la tabla 15.3 se anotan las proporciones recientes de los sueldos.
Antes de pasar a la lgica del anlisis causal bivariado. veamos otro ejemplo de comparaciones
entre subgrupos que nos permitir abordar algunas cuestiones sobre el formato de las tablas.
,64
.66
.71
lisis de datos. as que 'en esta seccin y la siguiente nos ocuparemos de dos problemas comunes y
propondremos soluciones.
Para empezar. vayamos a los datos de la tabla
15.4. que se recopilaron durante un sondeo de opinin sobre la ONU que aplicaron el New York Times. CBS News y el Herald Tribune en varios paises en 1985. La pregunta anotada en la tabla se
refiere a las actitudes generales subre el desempeo de la ONU.
El problema es comparar el apoyo que brindan
a las labores de la ONU los ciudadanos de los cinco pases de la tabla 15.4. Al repasar la tabla. notar que hay demasiadas cifras y que no es fcil
hallar un patrn significativo.
Parte del problema de la tabla 15.4 se debe a los
porcentajes relativamente pequeos de los entrevistados que eligieron las dos categorias de respuesta de los extremos. los que dijeron que la ONU
funcionaba muy bien o muy mal. Seria tentador re
ducirse a la segunda linea de la tabla los que contestaron "bien". pero seria incorrecto. Si leemos Slo la segunda fila concluiriamos que Alemania
Occidental y Estados Unidos mostraron las actitudes ms positivas sobre el desempeo de la ONU
3$6
Capitulo 15
An~lisis de datos
Comparaciones entre subgrupos 357
Tabla 15.4
Actitudes hacia la Organizacin de las Naciones Unidas: "Cmo resuelve la ONU los problemas que encaral" ,,:.
Japn
Muy bien
Bien
Mal
Muy mal
No s
2%
'16
21
6
26
7%
39
28
9.
17
.. 2%
45
22
3
28
Fuento:"5-Natlon Survey Find Hope for U.N.... NewYorlc T""d. 26 de junio de 1985. p. 6.
1%
11
43
5
41
Alemania Occidental
46
27
13
10
Tabla 15.5
Combinacin de categorias extremas
Bien o mejor
Malo peor
No s
48%
27
26.
17
28
'18
'11
'lO
10
65%
35
Inglaterra
Francia
55%
45
65%
35
Japn
Estados Unidos
57%
4'1
20%
81
muy importante haber descubierto que un porcentaje tan grande de los Japoneses no tiene opinin.
por ejemplo cuando uno qUiere aveliguar si la gente conoce el trabajo de la ONU. Por otra parte. si
uno desea saber cmo votruia la gente sobre cierto
tema. convendria ms excluir los "no s" en la su
posicin de que no votaran o que dividlrian sus votos entre los dos lados.
Comoquiera que sea. la verdad que contienen su
datos es que un porcentaje contest "no s" y el
resto dividi su opinin en c4antas opciones hubiera. A veces conviene mostrar los datos en ambas
formas -con los "no s" y sin ellos-o para qe los
. lectores saquen sus propias conclusiones.
Descripciones numricas
en la investigacin cualitativa
Aunque este captulo atae principalmente a la investigacin cuantitativa. tenga presente que la ex
posicin tambin es pertinente para los estudios
cualitativos. Los resultados de los estudios cualitativos exhaustivos se verfican mediante pruebas
numricas. As!. por ejemplo. cuando David Sllverman quiso comparar los tratamientos contra el
cancer de pacientes de clinicas privadas con los del
Servicio Nacional de Salud de Inglaterra. escogi en
primer lugar los analisis exhaustivos de las relaciones entre mdicos y pacientes.
MI mtodo de analisis fue en buena medida
cualitativo 1... 1 Me servi de ell:traclos de lo dicho
por mdicos y pacientes y realic una breve
descripcin etnogrMlca del ambiente y de ciertos
datos conductuales. Adems. prepare una forma
de codificacin que me permiti cotejar varias
medidas crudas de las interacciones entre
doctores y enrermos.
ISILn;H.\L\'~.
1993: 1631
358
CaptUlo 15
ANlsis de datos
Los datos numericos de SlIverman no slo afinaron las impresiones que le dejaron sus observaciones cualitativas. sino que adems su comprensin
profunda de la situacin le permiti articular un
anlisis cuantitativo cada vez ms adecuado. 'En
esta larga cita podemos apreciar la Interaccin entre los planteamientos cualitativos y cuantitativos.
MI Impresin general fue que las consultas
privadas duraban considerablemente ms que las
de las cUnlcas del SNS. En efecto. cuando
examine los datos. stos mostraron que las
primeras duraban casi el doble que las segundas
(20 minutos frente a 111. y que la diferencia era
estadisUcamente significativa: Sin embargo.
.
. distingu una de las clnICas del SNS que. por
razones peculiares. daba consultas anormalmente
breves. Me pareci que una comparacin ms
justa de las consultas en ambos sectores deba
e.'Ccluir esta clnica y comprender slo los
exmenes de un solo mdico en los dos casos.
Esta submuestra de los casos revel que la
diferencia de tiempos entre el SNS y las clinlcas
privadas se redujo a un promedio de tres
minutos. Esta cifra an era estadisUcamente
significativa. aunque la signlficancla se redujo.
Por ltimo. Si comparaba slo a los casos nuevos
atendidos por el mismo doclor. los pacientes del
SNS tenian en promedio cuatro minutos ms de
consulta: 34 minutos. frente a los 30 de las
clinicas privadas.
ISILVERMAN. 1993: 163-164)
Anlisis' bivariado
A diferenCia del anlisis onivanado. las comparaciones entre subgrupos constituyen una clase de
anlisis blvarlado' porque concierne a dos vanabies. Como dijimos. el propsito del anlisis univariada es puramente descriptivo. El objetivo de las
comparaciones entre subgrupos tambien es descriptivo -en buena medida describir los grupos
por separado-. pero se aade el elemento de comparacin. En las ciencias sociales. casi todos los
anlisis bivariados suman otro elemento: las rela-
Anlisis bivariado
Tabla 15.7
Cad~
semana .
Menos frecuente
75
(901)
iOO%=
66
(1134)
359
Obtencin de porcentajes
para las tablas
En la figura 15.3 se reVisa la lgica con la que ela~
boramos tablas de porcentajes de dos variables, .
Tomamos como variables el se.xo y las posturas CUlle la igualdad sexual.
.
Veamos otro ejemplo. Supongamos que nos interesa conocer un poco sobre las polticas editoriales
de los peridicos en cuanto a la legalizacin de la
mari~uana. Emprendemos un anlisis de contenidos de los editoriales que han tocado el tema durante cierto ao en una muestra de los diarios de
la nacin. Clasificamos cada editorial como favorable. neutral o desfavorable a la legalizacin de la
manguana. Tal vez queramos examinar la relacin
entre polilicas editoriales y las comunidades donde
se publican 105 peridicos. pues pensamos que los
_diarios rurales sern mas conservadores al respec-
360
Caplwlo 15
Anlisis de datos
Anlisis bivarlado
Figura 15.3
Obtencin de porcentajes para una tabla
15.3
A. Algunos hombres y mujeres que estn en favor (=) de la igualdad sexual o que estn en contra ("l.
..
..
X X
.=X
~ x, ~ , t ~ ~
~~
X~
..
X-
ft
~~
Homb'res
Hombres
= =
= = = = =
= = = =
XXXXXX
.
..
361
..
.. .. ..
KXXX
BO%
60%
C. En cada grupo por sexo, se separan a los que estn en favor de la igualdad
de los que se oponen (variable dependiente).
G. Conclusiones
Mujeres
Hombres
Mientras que la mayorfa de los hombres y las mujeres
estn en favor de la igualdad sexual, stas la apoyan
ms que aqullos.
As, el gnero es una de las causas de las actitudes
hacia la igualdad sexual.
Favorecen
la igualdad
Se oponen
a la igualdad
Tolal
Mujeres
Hombres
BO%
60%
20
40
100%
100%
" "
lo que los urbanos, As, clasificamos cada peridico (y por ende cada editorial) de acuerdo con la po
blacin de la comunidad donde se publica.
362
Capitulo 1S
An!lIsiS de datos
Tabla 15.8
Datos hipotticos de editoriales periodfstic:os sobre la
legalizacin de la mariguana
Polftic;a editorial
sobre la legallzaci6n
de la mariguana
Favorable
Neutral
Desfavorable
100% =
Tamao de la comunidad
Menos de
100000
Mde
100000
11%
29
32%
60
(127)
"O
28.
(438)
Antes de introducir el anlisis multlVarlado. repasemos las pasos de la elaboracin de tablas bivariadas explicativas:
l. Los casos se dividen en grupos de acuerdo con
los atributos de la variable independiente.
variable Independiente. Estas tablas son .comuen las ciencias sociales. pero su formato no esestandarizado. En consecuencia. en la blbllograde la Investigacin se encuentran diversos
Mientras la tabla se lea e interprete con
:il<""'U4'''' no hay razones para luchar por su es tan,aa:nZ,,"'UIl. Sin embargo. se deben seguir varios 11.:Jl'.cu ... ~ ...... ~ en la presentacin de datos tabulados.
La tabla debe tener un encabezado o ttulo que
resuma lo que contiene.
El contenido original de las variables debe
presentarse con claridad (en la misma tabla. si
es pOSible. o en el texto. con una par.Urasls en
la tabla). Esta Informacin es especialmente
crucial cuando una variable procede de las
respuestas a una pregunta de opinin. pues el
significado de stas depender en buena
medida de la redaccin de la pregunta.
3. Deben Indicarse con claridad los atributos de
cada variable. Aunque haya que abreviar
categorias complicadas. su Significado debe
estar claro en la tabla. y. desde luego. en el
texto debe aparecer una descripcin completa.
4. Cuando en la tabla se anoten porcentajes. hay
que Il'Idlcar la base con la qu'e se calcularon.
Es redundante presentar todos los nmeros
crudos de cada categoria. puesto que es posible
reconstruirlos a partir de los porcentajes y las
bases. Adems. la presentacin de cifras y
porcentajes enreda la tabla y dificulta su
let'tura.
5. SI se omiten casos en la tabla por falta de
datos (por ejemplo. "no respondi"). hay que
indicar las cifras.
Introduccin al anlisis
multivariado
La lgica del anlisis mulliv;;!riado es el tema principal del Capitulo 16. Sin embargo. en este punto
ser til explicar brevemente la elaboracin de tao
blas multiuariadas: las que se preparan con ms de
dos variables.
Para elaborar tablas mullivariadas sobre la base
de una descripCin mas complicada de los subgrupos. seguimos en esencia los mismos pasos de las
tablas bivarladas. Sin embargo. en lugar de una
11
!,~~"
364
Capitulo IS
Anlisis de datos
:'.11
~.
;t
1.1
1':
Tabl 15.9
r1:
Tabla 15.10
Relacin multivariada:
asistencia a la iglesia, sexo y edad
f.r
(j,
40 Ymayores
Hombres Mujeres
Hombres
Menos de 40
2""
32"
33%
48%
76
(325)
68
(383)
67
(323)
52
(4S2)
40 y mayores
::
24
(325)
33
(323)
Mujeres
J2
(383)
48
(452)
Aos de trabajo
con el patrn actual
Menos de dos aos
Dos a cuatro aos
Cinco a nueve aos
10 aos o ms
$6.03
$6.78
$7.56
$7.91
Proporcin
mujeres/hombres
.71
.72
.73
.64
Bureau of che Census. Curren, Poputation Repares. serte P-70, nm. 10. Mole-Female Diffo,.n,es in Work Experience. O"upotion, ond
1984 (WashingtOn. U.S. Govemment Prlntlng OIflce. 1987): 4.
de hombres y mujeres sin argumentar discrimlna. cln sexual. Ademas de los aos con el empleador
actual. las varlables que examinaron son las si-
Puntos principales
El anallsis univariado comprende una sola
variable.
La totalidad de los datos reunidos sobre una
variable son. en esa forma. imposibles de
interpretar. La reduccin de los datos es el
proceso de resumir la informacin original para
hacerla mas manejable mientras que se
conservan en buena medida los detalles.
La distribucin de frecuencia muestra el
nmero de casos que tienen los atributos de la
variable considerada.
Los datos agmpados se obtienen mediante la
combinacin de los atnbutos de una variable.
Las medidas de tendencia central (media.
mediana y moda) reducen los datos a una
forma manejable. pero no proporcionan los
detalles de los datos Oriinales.
Las medidas de dispersin dan una indicacin
sumaria de la dislribucin de los casos
alrededor de una medida de tendf'ncia central.
366 Capitulo IS
Anlisis de datos
Preguntas y ejercicios
de repaso
Elabore e interprete una tabla de contingencia
con la siguiente informacin: 150 demcratas
favorecen un aumento del salario mnimo y 50
se oponen: 100 republicanos es tan en favor del
aumento y 300 en contra.
Con los datos de la tabla' siguiente. elabore e
interprete tablas que'muestren:
a. La relacin bivariada entre edad y actitud
hacia el aborto,
b. La relacin bivariada entre tendencia poliUca
)' actitud hacia 'el aborto.
e. La relacin multivariada que vincula la
edad. la lendencia politica y la actitud hacia
el aborto.
- i
Edad
Tendencia
polltica
Actitud
hacia
el aborto
Frecuencia
Joven
Joven
Joven
Joven
Mayor
Mayor
Mayor
Mayor
Uberal
Uberal
Conservador
Conservador
Uberal
Uberal
Consrvador
Conservador
En favor
En contra
En favor
En contra
En favor
En contra
En favor
En contra
90
10
60
40
60
40
20
80
Lecturas adicionales
.,
http://bravo.berkeley.edu/cglbin/hcsa?harc3
El primer paso es elegir dos variables que I~
gustara analizar. Quiz ya conozca el nombre
de algunas variables de la ESG. como ABANY.
CAPPUN. SEX o. GRASS. Tambin puede
localizar algunas variables con la opcin
"Browse Codebook".
Cuando haya encontrado dos variables. elija
la opcin "Run Crosslabulation". Ingrese los
nombres de las variables horizontal y vertical.
Indique que desea un porcentaje vertical y el
"Question Text".
Entregue a su profesor la labia que elabor.
4. Localice tres ejemplos publicados de "medidas
de tendencia central". Identifique el lipo de
medida que se calcul y decida si result
apropiada.
Proyecto de continuidad
Asuma que est llevando a cabo un estudio
cuantitativo de las actitudes hacia la igualdad
sexual. Elabore una tabla bivaJiada de
porcentajes e Interprtela. Una de las variables
debe ser un indicador de las actitudes hacia la
igualdad sexual y la otra debe representar una
causa de dichas actitudes.
l'
!!
'
este captulo...
Estadistica descriptiva
Reduccin de datos
Medidas de asociacin
'otras tcnicas multivariads
Anlisis de trayectortas
Anlisis de series temporales
Anlisis factorial
Estadistica Inferencia!
Inferencias univarladas
f.ruebas de signlficancia estadstica
La lgica de la signiflcancia estadstica
JI cuadrada
Puntos principales
Preguntas y ejercicios de repaso
Proyecto de continuidad
Lecturas adicionales
!R9.unme
Introduccin
Segn mis aos de experiencia, muchos estudiantes le temen a las estadistlcas, pues los hacen sentir
.
.-
Estadsticas sociales
Lo que aprender en este captulo
Aqu ab~rdaremos algunas estadsticas simples usadas con
Jrecuenc!~ e.n la investigacin social. Si siente aversin por
las E'slad!st!cas. se llevar una agradable sorpresa.
A muchas personas les atemoriza la Investigacin empirlca porque no se sienten cmodas con
las matemticas ni con la estadistlca. En efecto,
muchos informes estan llenos de calculas Inexplicados. La funcin de las estadisticas en la Investigacin social es muy Importante, pero tambin es
Importante que usted contemple tal funcin desde
el angulo adecuado.
La investigacin empirlca es, primero y antes
que nada, una operacin lgica, mas que matemalica."Las matematicas son meramente un lenguaje
cmodo y eficaz para realizar las operaciones lgi-
cas Inherentes a un buen analisls de datos. La estadstica es la rama aplicada de las matematicas
especialmente apropiada para diversos analisls de
Investigaciones.
En este capitulo veremos dos clases de estadstica: la descriptiva y la inJerencial. La estadistica
descriptiva es un medio para describir los datos
en formas manejables. Por su parte. la estadstica
inferencia! nos asiste para sacar conclusiones sobre las observaciones; por lo comn. conclusiones
sobre una poblacin a partir del estudio de una
muestra tomada de ella.
,
'i
Estadstica descriptiva
Ya Indiqu que la estadistica descriptiva es un mtodo para presentar descripciones cuantitativas en
una forma manejable. Algunas veces queremos
describir variables nicas; otras. describir las asociaciones que vinculan una variable con otra. Veamos algunas formas de lograrlo.
Reduccin de datos
La investigacin cientfica suele requerir la recopilacin de grandes volmenes de datos. Supongamos que hemos entrevistado a 2000 personas a las
que les formulamos lOO preguntas (un esludio no
muy largo). Tendriamos un asombroso conJunlo de
200 000 respueslas. Nadie podria leer 200 000 respuestas y llegar a ninguna conclusin significati\'a
sobre ellas. As. muchos anlisis cienlificos requie'
369
1',
II
"
370
Capitulo 16
Estadsticas sociales
.1"-'
'.1
t~'
16.1
!.
Sexo
Edad
Escolaridad Ingresos
Tendencias
polfdcas
Afiliacin
religiosa
O
I
"
"2
.
.
Afiliacin
polidea
..
Ocupacin
Importancia
de la religi6n
"
I
Tabla 16.2
Datos crudos hipotticos sobre educacin y prejuicios
Nivel edueativo
Ninguno
Primaria
SecJPrep.
Universidad
Posgrado
23
H
21
156
123
95
67
102
164
23
77
Ii
6
12
Empleado
Desempleado
Total
16
Hombres
Mujeres
Toul
900
100
1000
200
800
1000
1.100
900
2000
J71
CapItUlo 16
Estadlstlcas socIales
Tabla 16.4
Datos hipotticos que relacionan la clase social
con los prejuicios
o\$C)CillCic,ntlS
til
Prejuicios
Escasos
Moderados
AltoS
Clase
baja
200
500
800
Clase
media
alta
400
900
300
700
400
100
.79
Superior
.88
.&1
.80
.71
.83
Amable
Amistoso
.90
.79
.83
.77
.68
.79 .
.72
.89
.78
Clido
.82
.73
.60
.88
.90
.90
Helena Znlnleckl lapita. "Widowhood Ind Husbond Sanctlflcation". en Joumol of Mamare ond rile Fomily (mayo d. 198 1): 439-'150.
que el nio de ms edad es tambin el ms
(parejas "iguales") y aquella en la que el nio .
ms edad es el mas bajo (parejas opuestas").
si Samuel es ms grande y alto que Maria.
riamos la pareja Samuel-Maria como "Igual". SI
muel fuera mayor pero mas baja que Maria. la
reja seria opuesta" (si tuvieran la misma edad o
misma estatura. la Ignoraramos).
Para determinar si la edad y la estatura
relacionadas. comparariamos el nmero de
iguales y el de opuestas. Si las parejas iguales
peraran a las opuestas. concluiramos que hay
relacin positiva entre las dos vaJiables: a
que una aumenta. la otra tambien crece. Si
ra mas opuestas que iguales. concluiriamos
hay una relacin negativa. SI hubiera la misma
cantidad de parejas iguales que de opuestas. conc!ulriamos que la edady la estatura no estn relacionadas. que son independientes una de la otra.
Veamos un ejemplo de las ciencias sociales para
Ilustrar los clculos simples de gamma. Digamos
que usted sospecha que la religin guarda una relacin positiva con el conservadurismo politico. SI la
persona A es ms religiosa que la persona 8. usted
conjetura que A es tambin mas conservadora que
B. Gamma es la proporcin de comparaciones pareadas que coinciden con este patrn.
La tabla 16.4 presenta los datos hipotticos que
relacionan la clase social y los prejuicios. El carnc
ter general de la relacin entre estas dos variables es
que. a medida que la clase social aumenta. los prejuicios disminuyen. Hay una asociacin negativa entre clase social y prejuicios.
Gamma se calcula a partir de dos canudades: (I) el
nmero de pares que tienen el mismo orden en las
dos variables y (2) el numero de pares que tienen el
=830 000.
~Ismo
asociacin. Como las varlal{les nominales no tienen una estructura ordinal. en tales relaciones no
tiene sentido hablar de direccin (una lambda neo
gatlva Indlcaria que uno comeli ms errores al
predeCir los valores de la primera, variable' conociendo los valores de la segunda que sin conocerlos, lo que no es lgicamente posible).
La tabla 16.5 es un ejemplo del uso de gamma
en la investigacin social contempornea. Para estudiar el grado al que las Viudas santificaban a sus
esposos fallecidos. Helena ZnanleckJ Lopata (1981)
aplic un cuestionario a una muestra probabilstica de 301 viudas. En parte. el cuestionarlo peda a
las entrevistadas que caracterizaran a sus difuntos
maridos de acuerdo con la siguiente escala de dife
renciacin semntica:
Caracterstica
gamma
Iguales - opuestos
Iguales + opuestos
Extremo
positivo
Bueno
til
Honesto
Superior
Amable
Amistoso
Clido
Extremo
negativo
2
2
2
2
2
2
2
"
"
"
"
"
4
5
5
5
5
5
6
6
6
6
6
6
5
7
7
7
7
7
7
7
Malo
Intil
Deshonesto
Inferior
Cruel
Hostil
Distante
37.. Capitulo 16
r.
Esadlstlcas sociales
Variables intervalares o de razn SI se asocian variables intervalares o de razn (por ejemplo. edad. ingreso. promediO de calificaciones. etc.). una medida apropiada es la correlacin de producto momenio
de Pearson (rl. La derivacin y el clculo de esta
medida de asociacin es demasiado complicada y
queda fuera del alcance de este libro. por lo que slo haremos algunos comentarlos.
Al Igual que gamma y lambda. r se basa en conjeturar el valor de una variable conociendo otra.
Sin embargo. para variables continuas Intervalares
o de razn. no es probable que uno prediga su valor exacto. Pero. por otro lado. pronosticar slo la
dispOSICin ordinal de 105 valores de dos Variables
no aprovecharla el mayor volumen de Informacin
que comunica una variable intervalar o de razn.
En cierto sentido. r Indica que tanto puede uno
conjeturar el valor de una variable con el conocimiento del valor de otra.
Para entender la lgica de r. piense de qu manera presumitia 105 valores hlpotetlcos que adoptan ciertos casos de determinada Variable. Con las
Variables nominales vimos que uno puede siempre
suponer el valor de la moda. pero con los datos intervalares o de razn minimlzariamos los errores
conjeturando siempre el valor de la media de la va-
Anlisis de regresin
En varios puntos del texto nos hemos referido a
frmula general para describir la asociacin
dos variables: y = f(XI. Esta frmula se lee y
una funcin de X .. lo que significa que los
de Y se e.'C)llican en trminos de las variaciones
los valores de X Para enunciarlo con ms
dlriamos que X causa y. de modo que el valor de
determina el valor de Y. El anlisis de regresin
un mtodo para determinar la funCin
que relaciona y con X. Hay varias formas de
sls de regresin. dependiendo de la complejidad de
las relaciones que se estudian. Comencemos con la',
ms simple.
Regresin lineal El modelo de regresin se aprecia
ms claramente en el caso de una asociacin lineal
perfecta entre dos variables. La figura 16. l es un
diagrama de dispersin que presenta en forma grfica los valores de X y Y que arroj un estudio hi.
pattico. Muestra que. en los cuatro casos de nues
tro estudio. los valores de X y r son idnticos en
cada uno. El caso con un val~r de l en X tambin
llene un valor de l en ): etc. Aqu. la relaCin en.
tre las dos variables se describe con la eCuacin
y =X: sta se llama ecuacin de regresin. Como los
cuatro puntos se encuentran sobre una reCIa. podemos sobreponer la linea a los puntos: se trata de
la linea de regresin.
Este modelo de regresin lineal tiene usos des
criptlvos importantes. La linea de regresin ofrece
una imagen grfica de la asociacin entre X y jo: y
16.1
simple de dispersin de los valores de X y Y
Valores de X
ecuacin de regresin es una forma eficaz de reEl modelo de regreSin tambin tiene un
de inferencia. En la medida en que Ia ecuacin
regresin describa correctamente la asociacin geentre las dos. variables. dicha ecuacin servpara predecir otros valores. Por ejemplo. si sa
que un caso nuevo tiene un valor de 3.5 en
X. podemos predecir el valor de 3.5 tambin en Y.
Desde luego. en la prctica rara vez se limitan
los estudios a cuatro variables. y las asociaciones
de stas casi nunca son tan claras como en la figura 16.1.
Se presenta un ejemplo un poco ms realista en
la figura 16.2. que muestra una relacin hipottica
entre la poblaCin y el ndice de delincuencia de
ciudades pequeas y medianas. Cada punto del
diagrama de dispersin representa una ciudad y su
ubicacin refleja la poblacin de la ciudad y su indice de delincuencia. Como en el ca'so de nue'stro
ejemplo anterior. los valores de Y (indic'es de delincuencia) corresponden a los de X (poblaciones). y si
aumentan los valores de X. tambin se Incremen
tan los de Y. Sin embargo. la asociacin no es tan
clara como en el caso de la figura 16. l.
En la figura 16.2 no podernos sobreponer una linea recta que ,pase por todos los puntos del diagra
ma de dispersin. pero si podemos trazar una linea
aproximada que muestre la mejor representacin
lineal de varios puntos. como hicimos en la grafica.
Y\f
~Ilr!.I"
376
Caplwlo 16
Estadlstlcas sociales
Estadistica descriptiva
l/JI
11"
lU
Diagrama de dispersin de los valores de dos variables con la linea de regresin aadida (hipottico)
r----------"7------------:..:=:.:~.:~::.:::~::::--_J
Iii
5000
11
I,
iJi
..Q
.g
Q)
,i,.i
I1
11 . 1
11"
tU
.t::
o
o
ji,
4000
8o
tU
'O
3000
15
.,9,
.!!!
"
c:
:"
c:
Q)
::l
2000
'O
Q)
'O
Q)
.9
1000
'O
..5
Poblacin
do ~ara calcular r. aunque me imagino que la mayona .de los lectores que apliquen esta medicIn
tendran acceso a programas de computadora des[lOados a esta funcIn.
100000
dISCpulo
1 = CaltIlcacln Inicial del desempeo del
dlscipulo
X, = Combinacin de prctica gUiada y de apoyo
.!12 = Compuesto de dominio del contenido del
maestro
X:t = Compuesto de realimentacin espectllca
sobre la tarea
X4 = Compuesto de presentacin clara y concisa
de la tarea
b = Peso de la regresin
e = Residuo
IAoAPrAOO DE YERG. 1981: 42)
'el!resin parcial ImagIne lo que ocurlila sI le presatencin especial a la relacIn entre dos vacuando se mantiene constante una tercera
de prueba. Asi. podramos examInar el
de la educacin en los prejuIcios mantenlenla edad constante para poner a prueba el efecto
.tn'ler,erIOl,en'e de la educacin. Para ello. calculapor separado la relacin tabular entre educacin y prejuicios en cada grupo de edad.
Lds regresiones parciales se basan en este mls. mo modelo lgico. La ecuacin que resume la rela. cin entre variables se calcula sobre la base de las
variables de prueba que se mantienen constantes.
El resultado puede compararse con la relacin no
controlada entre las dos valiables para aclarar an
ms la relacin general.
Regresin curvilnea Hasta aqu hemos estudiado la
asociacin entre valiables representadas por una
linea recta. aunque en ms'de dos dimensiones.
El modelo de regresin es an ms general de lo
que imp~ica nuestra exposicin hasta este momento.
Si usted tiene conocimientos de geometlia. ya
sabe que las funciones curvas tambien se repre-.
sentan mediante ecuaciones. Por ejemplo. la ecuacin X 2 - \-'2 = 25 describe un circulo con radio
! . 378 Capitulo I6
Esadlsticas sociales
Los tres mtodos que examinaremos son el ande trayectorias. el anlisis de series temporales
anlisis factorial. per' tenga presente que son
cuantas de las numerosas tcnicas
_..,."".."""." qlle utll!zan los cientficos sociales.
observe que los niveles de medicin estl\ en
escala ordinal.
SI usted-qUiere utilizar una variable de nivel
Intervalar o de razn en una tatila cruzada.
.
primero debe recodificarla como variable de nivel'
ordinal.
,"."
Variable independiente
Nominal
Ordinal
Variable
dependiente
Intervalar/de raz6n
Nominal
Ordinal
Tablas cruzadas
Ji cuadrada
Lambda
7bblas cruzados
Ji cuadrada
Lambda
Tablas cruzadas
Ji cuadrada
Lambda
Tablos cruzados
Ji cuadrada
Lambda
Gamma
Tau de Kendall
d de Sommers
Medias
Prueba r
ANOVA
Medios
Prueba t
ANOVA
Intervalar/de raz6n
Corre/adn
r de Pearson
Regresi6n (R)
,.anIRII.SIS
de trayectorias
380
Capitulo 16
Estadlstlcas sociales
OtraS tcnicas multlvarladas 381
Figura 16.3
1~4
."..".-
....
---- ----
-.03
--------7
Linea de regresin
basada en la densidad
demogrfica
.27
..
, .-
1
.- .
..
..
/'
./
./
./
./
./
,,"
./
","
./
./
./
./
./
./
., .
, .-
r>/
. ./
./
./
,;
1950
, " .......
1960
1970
1980
1990
Ao
Fuente: Rodney Stark. Bruee D. Foster. Charles y. Gloek y Harold E. Quinloy. v.\!ywont Shepllents -P,ejudiee and /he P"'te.tant CI.'gr. Copyright
1971 por la liga Antidlfamatoria d. B'nai Brlth. Reimpreso con permiso d. Harper and Row. Publi,hers. Inc.
cifras reales de cada variable y los aos como unidad de amilisls. Luego de obtener la ecuacin de
regresin de mejor ajuste. calculariamos el ndice
de robos de cada ao basados en la densidad demogrfica del periodo respectivo. En aras de la
Simplicidad. supongamos que el tamao de la poblacin (y por tanto su denSidad) se ha incremenlado constantemente. Esto nos llevaria a predecir
un aumento tambin constante en 105 ndices de
robos. Estas estimaciones de regresin se representan con la linea punteada de la figura 16.4_
A menudo. las relaciones en las series temporales son ms complicadas de lo que revela este
ejemplo simple. En primer lugar. puede haber ms
de una Variable causal. Por ejemplo. qUiZ encontremos que los indices de desempleo llenen tam-
bin un efecto fuerte en los robos. Entonces. formularamos una ecuacin para predecir los robos sobre la base de ambas varables causales. Como resultado. las predicciones no se encontraran en
una linea recta Simple.
Mientras que en el primer modelo la densidad
demogrfica aumentaba constantemente. el desempleo aumenta y disminuye. En consecuencia.
nuestras predicciones de los indlces de robo subiran y bajaran.
Al profundizar en las relaciones entre los indices
de robos y desempleo. razonaramos que la gente
no empieza a robar en cuanto se queda sin empleo.
Habitualmente comienza por agotar sus ahorros.
pedir prestado a 105 ami~os y no dejar de esperar
un trabajo. El robo sera el ltimo reclIrso.
Anlisis factorial
El an.Uaia factorial es un planteamiento del anlisis mulUvariado distinto al de regresin. Sus bases
estadsticas son demasiado complicadas y diferentes de la exposicin anterior como para aconsejar
un estudio general aqui.
El anlisis factorial sirve para descubrir patrones entre las variaciones de 'los valores de diversas
variables. En esencia. esto se consigue mediante la
generacin de dimensiones artificiales (factores)
382
Capitulo 16
Estadsticas sociales
que se correlacionan mucho COI) algunas de las vaVeamos un ejemplo de la aplicacin del
I1ables reales y que son Independientes unas de
factorial. Muchos Investigadores sociales han
otras. Hay que usar una computadora para llevar
diado el problema de la delincuencia. Ahora
a cabo esta complicada operacin.
cuando uno profundiza en el problema
Supongamos que un archivo de datos contiene
que hay muchas clases de delincuentes. En
varios Indicadores de los prejuicios de los sujetos.
encuesta de estudiantes de secundarla en un
Cada reactivo debe dar alguna Indicacin de los . queo poblado de Wyoming. Moms
prejuicios. pero ninguno una Indicacin perfecta.
(1980) se propuso crear una tlpologia de la
Adems. todos estos reactivos deben estar muy
cuencia. Su cuestionario peda a los ..",rll'"o _,
correlacionados empirlcamente. En el anlisis facque dijeran si habian cometido una variedad de
torial de los datos. el Investigador crearla un~ ditos delictivos. Entonces. someti las
mensin artificial muy correlacionada con cada
un anlisis factorial. Los resultados se
en la tabla 16.6.
uno de los reactivos que mlden los prejuicios. Cada sujeto recibirla un valor en esa dimensin artiComo se aprecia en la tabla. a la izquierda
ficial. un valor que sera un buen Indicador de los
anotados diversos actos delictivos. Las cifras que.
atributos observados en cada reactivo.
aparecen en el conjunto de la tabla son las cargas
Supongamos ahora que el mismo estudio prode los cuatro factores elaborados en el anlisis.
porcionara varios indicadores de la capacidad para
Observar que Forslund ha rotulado las dimensio~
las matemticas de los sujetos. Es probable que el
nes. Yo trac unas llaves en las cifras de cada factor
anlisis factorial tambin generara una dimensin
que lo llevaron a la eleccin de esos rtulos. Forslund
resume los resultados como Sigue:
artificial muy correlaclonada.con cada uno de tales
reactivos.
En el toLal de la mestra son evidentes cuatro
La salida de un programa de anlisis factorial
patrones bastante claros de actos delictivos. En
consiste en columnas que representan los factores
orden de cantidad de varianza explicada. los'
(dimensiones artificiales) generados a partir de
rotul: 1) Delitos contra la propiedad. que
las relaciones observadas entre las variables ms las
Incluyen vandalismo y robo: 2) Incorregibilidad: 3) :
correlaciones entre cada variable y factor. llamaDrogas/vagabundeo: y 4) Reyertas. Es Interesante .
das cargas factoriales.
y quiz sorprendente ver que el vandalismo y el
En el ejemplo anterior es probable que un facrobo aparecen en el mismo factor. Pareceria que
tor represente ms o menos a los prejuicios y que
los alumnos de secundaria que cometen delitos
otro represente ms o menos la capacidad para las
contra la propiedad tambin participan en actos
de vandalismo y robos. Tambin es interesante
matemticas. Los reactivos de datos que miden los
observar que las drogas. 'el alcohol y el
prejUicios tendran una carga ms elevada en este
vagabundeo se encuentran en el mismo factor.
factor (estaran ms correlaCionados) y menos car(1980: 4)
ga en el factor de la capacidad para las matemticas. Los reactivos de datos que miden la capacidad
Luego de determinar este patrn general. Forspara las matemticas mostraran el patrn opuesto.
lund repUl el anlisis factorial en forma separada
Sin embargo. en la prctica. el anlisis factorial
para nios y nias. En ambos casos surgieron
no procede de esta manera. sino que se introducen
esencialmente los mismos patrones.
las variables en el programa y la salida se compoCreo que este ejemplo muestra que el anlisis
ne de una serie de factores con la carga apropiada.
factorial es un mtodo eficaz para descubrir los pa.
Entonces. uno debe determinar el significado de
trones predominantes entre un nmero grande de
cada factor sobre la base de las variables que tenvariables. En lugar de que usted y el Invesllgador
gan ms carga en l. No obstante. la generacin de
se vean obligados a comparar Incontables correlafactores no remite al significado de las variables.
ciones simples. parCiales y mltiples. pueden rea_ sino slo a las asociaciones empiricas. Se toman en
lizar un analisls factorial para cumplir con esta
cuenta dos criterios: (1) un factor debe explicar
tarea. Dicho sea de paso. se trata de un buen ejemuna porcin relativamenle grande de la varianza
plo del uso provechoso de las computadoras.
que se encuentra en el estudio de las variables. y
El anlisis factorial tambin presenta los datos
(2) cada factor debe ser mas o menos independienen una forma que puedan interpretar el lector o el
te de 105 demas.
investigador. En cada factor. el lector descubre f-
16.6
factorial: actos delictivos. blancos
Delitos contn la
propiedad Factor I
faros callejeros. etc.
ventanas
bardas. tendederos. etc.
cosas de poca monta
el aire de neumticos
cosas de vaior
huevos. basura. etc.
cosas sin valor
cosas de pupitres. etc.. en la escuela
un auto sin permiso del duello
algo
.Desobedecer a los padres
Marcar pupitres. paredes. etc.
Decir cosas crueles para vengarse
Desobedecer los maestros directivos
.669
.637
.621
.616
.587
.126
.093
.186
.187
.5~8
-.017
.339
.393
.232
.172
.237
.6<12
.550
.537
.526
.~86
.~6<1
.<161
.~51
Fumar mariguana
Consumir otras drogas por diversi6n
Falsllicar la firma de un permiso escolar
Seber alcohol en ausencia de los padres
Irse de pinta (hacer novillos)
Golpear a alguien durante una discusi6n
Pelear: golpear o luchar
.05<1
.236
.13-4
.2-40
.232
.373
.05<1
.137
.2-46
.0<19
.101
.309
.2<12
Porcentaje de varianza
67.2
Incorregibilidad
Factor 11
.2~3
.0497
A58
.-4-46
.06-4
.016
.2<19
.247
.252
.088
.266
13.<1
Drogas/vagabundeo
Factor III
.119
.077
.186
.233
.05-4
.276
-.023
.1-43
-.002
.080
.071
.209
- .061
.0-45
.223
.305
.029
.755
~, 1
.395
.358
.319
.181
.070
ReyertaS
Factor IV
.167
.215
.186
.068
.156
.034
.266
.077
.027
.0<10
.250
.039
.021
.100
.195
.058
.135
-.028
.00<1
.189
.175
.181
10.9
.8<131
.602
8.<1
38<4
CapItulo' 6
Estadlsticas sociales
Estlldistlca Inferencia' 385'
Estadstica inferencia!
Muchos de los proyectos de investigacin social
cientfica. si no es que todos. comprenden el examen de los datos recopilados en una muestra tomada de una poblacin mayor. Se entrevista a una
muestra de personas en una encuesta; se codifica
y analiza una muestra de un registro de divorcios;
se examina mediante un anlisis de contenidos
una muestra de peridicos. Nunca o casi nunca est~dlan los investigadores una muestra para deSCriJI.rla per se: en la mayor parte de los casos. el proJoslto ltimo es elaborar afirmaciones sobre la
)oblacln mayor de la que tomaron la muestra. Por
anta. a menudo usted querr interpretar los halazgos muestrales univariados y multlVariados cono la base para hacer injerencias acerca de alguna
)Oblacin.
En esta seccin examinaremos las medidas esa~istlcas con las que se hacen tales Inferencias.
SI como sus fundamentos lgicos. Comenzaremos
on los datos univaliados y pasaremos entonces a
>s mulliValiados.
1 ferencias
univariadas
. n
386 Capitulo 16
Esddlsticas sociales
16.6
Figura 16.5
Poblacin hipottica de hombres y mujeres que favorecen o se oponen a la igualdad sexual
Favorecen
en la igualdad
~ ~
S! ~ ~ ~ S!
S! S! ~ S! S!
S! S! S! S! S!
~ S! ~ S! S!
~ '? ~ '? S!
11 '? '? '? '?
'? 2 2 2
! ! ! !
, t t ,
! ! ! !
Se oponen
a la igualdad
, ! !
! ! !
!
, t ,
! ! !
,,
Mujeres
Favorecen
en la igualdad
Se oponen
a la igualdad
50 k
0
50%
100%
,
,
!
oooooloo
S! ~ S! 000000&0
S! S! ~ 00000000
S! S! S! o o o o o o o o
~ '? ~
'? '? '?
S! '? S!
2 2 '? 2
! ! , !
, , ! !
, , ! !
, ! ! !
! ! , ,
! , ! !
! , ! !
! ! ! ,
Favorecen
la igualdad
..-.......
........-~
_ ~__ ~
50%
100%
~ ~ ~ ~
~ ~ ~
S! S!"S! S!
~
~
S! S! ~
~ S! ~
S! S! S!
S! ~ S!
t
t
t
,
!
!
!
!
'?
<5
relacin entre el sexo y las actitudes hacia la Igualdad. Exactamente la mitad de cada grupo favorece
la igualdad y la otra mitad se opone. Recuerde
nuestra exposicin de la reduccin proporcional de
error. En este caso. conocer el sexo de una persona no disminuira 105 "errores" que cometeramos
al conjeturar cul es su actitud hacia la Igualdad.
La tabla en la parte Infenor de la figura 16.5 nos da
una Imagen tabulada de lo que se observa en el
diagrama.
2 2
~ S!
S! S!
S! ~
! !
, !
t !
! !
~ ~
2 2 o 15 o o
S! S! 15 o
S! 2 15 15 o o
~ ~ 15 o o o
! !
! !
! !
!
.
.
.-..-....-...---..~ ~ ~ ~
! !
! !
! t
! ! ! , ! ! t !
! , ! ! ! ! ! !
Leyenda
~ ~
ooo
oo oo oo
o o o o o o 15 o
15 15 15 o o 15 o o
oooo
15 o o o
oooo
15 o o o
~ ~ ~ ~ 0'0
! !
, ! ! , ! ! t ,
! , !
! ! t !
l ll.e.
.. 1 1 1
1 1 1 e
50%
Se oponen
a la igualdad
_ 1
Hombres
~ ~ ~
~ ~ ~
ooooe ooo
ooooeooo
oooeoeoo
15 o o o o o o o
Hombres
Mujeres
Hombres
Mujeres
~ ~
representativa
~ ~
~ ~
~ ~
Mujeres
Hombres
Favorecen la igualdad
50%
50%
Se oponen a la igualdad
50%
50%
100%
100%
i _
Muestra
entre sexo e Igualdad en la poblacin mayor. SIgUiendo la lgica del muestreo que estudiamos en
el capitulo 8. observaramos que no hay ninguna
relacin entre el sexo y la Igualdad en la muestra:
as. concluiramos que. del mismo modo. no hay
una relacin en la poblaCin total. puesto que se
supone que elegimos la muestra de acuerdo con las
reglas convencionales del muestreo.
Desde luego. las muestras reales rara vez son
reflejos perfectos de las poblaciones de las que pro-
l88
Capitulo 16
Estadlstlcas sociales
16.8
Figura 16.7
i Muestra no representativa
Hombres
Mujeres
Hombres
Mujeres
!2 !2 ~ ~
~ 2 ~ ~
~ 2 !2 ~
!2 !2 ~ 2
!2 2 2 ~
Favorecen
la igualdad
2
!2
!
!
!
!
!
!
2
2
2
2
!2 ~
2 2
!2 2
2 2
2 2 ~
2 2 2
! , ,
! , ,
!
!
!
!
.! ! ! , !
! ! ! ! !
Se oponen
a la igualdad
2
2
2
2
2
2
222
222
!2 2 2
! ! !
! ! !
! ! !
, ! !
, ! !
! , !
oo
oo
ct
ct
o
o
,,
2 !2 2
2 2 !2
2
2
2
2
oooodooo
2 2
2 2
!2 2 2
222
!2 2 2
2 !2 2
2 2 2
222
! ! !
! ! ,
! ! ,
!
00000000
,o o o o o o o o
oooooooo
oooooooo
Favorecen
la igualdad
00000000
o o o ct
oooo
,
!
!
!
!
!
!
!
!
!
!
!
,
,
,
!
! i i i
! i
i i i
i i i i
2 2 2 2 2
2 2 !2 2 !2
2
!2
! ! , ! ! ! ! !
! ! .! , ! ! ! !
Mujeres
Hombres
75%
25%
Favorecen la igualdad
..
2
2
2
2
2
2
! ! !
! ! !
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
o el 00
o o el el
e
,
!
oQoooooo
oooooooo
ooo oo ooo
ooo oo ooo
oooo
oooo
2
2
2
2
!
,
, ! , ! ! i i i
! ! e e e i
,,,,,
Se oponen
a la igualdad
!2 2 2 2 2 2 2
2 !2 !2 !2 2 2 2
i i
i
i i i
i e i
e e e
ee
e
e ieee
Mujeres
Hombres
75%
25%
25%
75%
100%
100%
Favorecen la igualdad
Se oponen a la igualdad
Muestra
Se oponen a la igualdad
25%
75%
100%
100%
Muestra
En cambiO. la n~urn 16.7 representa una muestra que falla en el c-ometldo de rellejar a la poblacin mayor. Observe que se eligieron demasiadas
mujeres defensoras y demasiados hombres opOSilores. Como se lTluestra en la tabla. Ires cuartos de
las mujeres de la Illuestra apoyan lil gualdild. pera apenas un cuarto de los hombres lo har-en. Si
rablemente.
Como recordar. no es de creer que una mues
tra pro~abilstlca bien LOmada sea tan imprecisa
C0ll10 la que se aprecia en la figura 16.7. De hecho.
si en la realidad eligiramos una muestra que nos
diera estos resultados. buscaramos Ol,d explicacin. como lo Ilustra la figura 16.8.
Observe que la mueslra elegida en la figura 1f5.8
tambin Indica una relacin ruerle entre 1"1 se,xo y
390 Capitulo 16
Esadlstfcas sociales
Estadistica inferencial 391
Tabla 16.7
Ilustracin hipottica de ji cuadrada
,. Frecuencias esperadas por celda
Total
'12
18
60
70
30
100
Hombres
Mujeres
Total
20
20
'10
SO
70
30
100
Hombres
Mujeres
2.29
5.33
1.52
3.56
28
12 '.
'ID
Mujeres
Hombres
Asistl6 a la iglesia
No asistl6 a la iglesia
Total
asiste~-
10
60
X2
=12.70
P < .001
e.
nado.
I
edla
Ms en general. cuando examinamos a m
de N, vemos que los grados de libertad son N - l.
392
Capftulo f 6
Estadfstlcas sociales
real. As. acaso estemos convencidos legtimamente de que cierta asociacin no se debe al
',error de muestreo. pero estamos en la posicin de
a1lrmar sin temor a contradelrnos que dos variables se relacionan apenas en forma ligera. Recuerde que el error de muestreo est en funcin Inversa del tamao de la muestra; mientras mayor sea
la muestra. menor es el error esperado. Asi. una
correlacin de. digamos .. 1. bien podra ser significativa [a cierto nivel) si surge de una muestra grande. en tanto que la misma correlacin entre las
mismas dos variables no sera' significativa si apareciera en una muestra ms pequea. Desde luego.
esto llene un sentido perfecto si uno comprende la
lgica bsica de las pruebas de slgnlf1canc1a; en
la muestra grande hay menos probabilidades de que la
correlacin sea un mero producto del error de muestreo. Sin embargo. en ambas muestras podra representar una correlacin esencialmente de cero.
La distincin entre slgnlficancla estadstica y
real se aprecia mejor en los casos en los que hay
una certeza absoluta de que las diferencias observadas no se deben al error de muestreo. Tal sera
el caso si observamos una poblacin completa. Supongamos que somos capaces de conocer las edades de todos los funcionarios pblicos del pas y las
de todos los funcionarios de Rusia. Para facilitar el
argumento. supongamos tambin que la edad promedio de los funcionarios de nuestro pas es de 45
aos y. digamos. de 46 entre los rusos. Como tendriamos las edades de todos los funcionarios. no
tendl'iamos el problema del error de muestreo .. Sabemos con certeza que 105 funcionarios rusos son
mayor~s que sus contrapartes nacionales, Al mismo tiempo. diriamos que la diferencia no tiene signlflcancla real. De hecho. concluiriamos que en
esencia tienen la misma edad.
.
Segundo. y no se deje confundir por este eJemplo hipottico. no calcule la signlflcancia estadsU:
ca de las relaciones observadas en datos reunidos
de poblaciones completas. Recuerde que las pruebas de significancia estadistica miden la probabilidad de que las relaciones entre las variables sean
slo un producto del error de muestreo: si no hay
muestre~. no hay error de muestreo.
Tt'rcero. las pnlebas de significancla se basan
en las mismas premisas del muestreo que usamos
para calcular los intervalos de confianza. En la medida en que el diseo real de muestreo no cumple
con estas premisas. las pruebas de significancia no
son estrictamente legitimas.
SI bien aqui examlnamos'la s.lgnlficancla estadstica en la forma deJi cuadrada. hay otras medidas comunes entre los clentificos sociales. El anlisis de Varianza y las pruebas t son ejemplos con
los que se puede topar en sus estudios.
" Al Igual que en la mayora de los temas que tratamos en este libro. tengo prejUicios personales.
En este caso. son en contra de las pruebas de signlflcancla. No objeto la lgica estadistica de las
pruebas. puesto que est bien fundada. En cambio. me preocupa que esas pruebas confundan en
lugar de arrojar luces. Mis principales reservas son
las siguientes:
l. Las pruebas de slgnlficancla hacen
39" Caplwlo 16
Estadlsdcas sociales
Puntos principales
La estadstica deSCriptiva sirve para resumir
los datos que se estudian. Algunas estadsticas
descriptivas resumen la distribucin de los
atributos de una sola Variable; otras. las
asociaciones entre variables.
Las estadsticas descriptivas que resumen las
relaciones entre Variables se denominan
medidas de asociacin.
La estadistica inferenclal sirve para estimar el
grado de generalizacin a una poblacin mayor
de los hallazgos consegUidos mediante el
amillsls de una muestra tomada de ella.
Algunas esladistlcas inferenciales estiman las
caracteristicas de una sola Variable de la
poblaCin: otras -las pruebas de signiflcancla
estadistica- estiman las relaciones entre
variables de la poblacin:
Muchas medidas de asociacin se basan en un
modelo de reduccin proporcional del error
(RPEI. Este modelo parte de la comparacin de
(1) el nmero de errores que cometeramos al
tratar de conjeturar los atributos de cierta
variable en cada uno de los casos bajo estudio
-si no sabemos nada salvo la distribucin de
esos atributos-o y (2) el nmero de errores que
cometeriamos si conociramos la distribucin
conjunta general y se nos dijera en cada caso
el atributo de una variable cuando se nos
pidiera conjeturar el atributo de otra.
Lambda (A) es una medida apropiada de
asociacin para el analisis de dos Variables
nominales. Tambin brnda una ilustracin
clara del modelo de la RPE.
Gamma (y) es una medida apropiada de
asociacin para el analisis de dos variables
ordinales.
no
396
Capitulo 16
Estadlstlcas sociales
Proyecto de continuidad
En la Web o algn otro medio. localice un analisis
eSladisLico acerca de la igualdad sexual o las
aclltudes hada la misma. Identifique el Lipo de
tecnicas estadisUcas que se emplearon en el
anliSis y comente que tan apropiados resultaron
para los fines del investigador.
Lecturas adicionales
Babble, Earl. Y rred Halley. AdLlentares in
Research. Newbury Park. Cal .. Plne rorge
Press.,1995. Este libro lo Introduce al
de los datos de la Investigacin social
SPSS para Wlndows. Se exponen e ilustran "
vanas tcnicas estadsticas baslcas que
emplean los Investigadores sociales.
Blalock. Hubert M.. Jr.. Social Statistcs. Nueva.
York. McGraw-HIIl. 1979. Durante aos. el
libro de Blalock ha sido el te.xto oficial de los .
estudiantes (y los catedrticos) de ciencias .
sociales. La muerte de Tad Blalock fue una
prdida para todas las ciencias sociales.
Healey. Joseph r .. Statistics: A Toolfor Social
Research. Belmont. Wadsworth. 1990. Eficaz
Introduccin a las estadistlcas sociales para el .
estudiante principiante.
Jendrek. Margaret Platt. Through the Maze:
Statistics with Computer Applications. Belmont.
Wadsworth. 1985. Introduccin prctica e
Innovadora a las estadislicas sociales. Jendrek
explica la lgica de vanas tecnlcas estadislicas
y luego ensea al lector a hacer los clculos
con programas de computadora sencillos. o
mediante el uso de sistemas como SPSS.
Mohr. Lawrence B.. Underslanding Sign!llcance
Testing. Newbury Park. Cal.. Sage. 1990.
E.xamen general excelente del tema: tanto los
detalles tcnicos de las'pruebas de
signlficancia estadsllca como el significado de
tales pruebas.
Schroeder. Larry D.. David L. Sjoqulst y Paula E.
Stephan. Understanding Regresion Analysis: An
Introductor Guide. Newbury Park. Cal.. Sage.
1986. SI desea profundizar en la regresin
como tcnica analitlca. ste seria un excelente
paso sigUiente. Los autores orrecen una
introduccin comprensible a este complicado
tema.
ndices
tica y polltica de la investigacin social
Manejo de la biblioteca
.
Investigacin social en el ciberespaclO
El informe de investigacin
Nmeros aleatorios
P' Distribucin de ji cuadrada
G reas de la curva normal
H Error estimado de muestreo