You are on page 1of 22

Consideraciones epistemolgicas sobre

algunos temas de la estadstica social:


una mirada desde la epistemologa gentica
1
F e r n a n d o Corts
Introduccin
A FINES DEL SIGLO X X LA ESTADSTICA, como casi la totalidad de las disci-
plinas cientficas, ha explotado en una serie de campos especializados.
Actualmente el nmero de personas involucradas en las actividades
acadmicas es formidable, aunque se concentra bsicamente en los pa-
ses desarrollados. L a combinacin de estas dos tendencias arroja como
resultado una voluminosa produccin en cualquier campo especializa-
do del saber, que se transmite por medio de avalanchas de artculos y
libros que hacen imposible estar al da en todos los campos de una disci-
plina especfica.
L a estadstica no es la excepcin. Se ha desmembrado en una serie
de campos particulares que normalmente asumen el nombre propio de
una tcnica estadstica particular. Obviamente, este artculo no abarcar
a la estadstica en general, lo cual estara mucho ms all de mis fuer-
zas, sino que los planteamientos que se presentan se referirn nica-
mente a la estadstica aplicada a las ciencias sociales. Debo dejar claro
que este recorte del campo no es poca cosa. Si bien el desarrollo de l a
estadstica estuvo muy vinculado al de la fsica, especialmente en lo que
se refiere al clculo de probabilidades, no debe olvidarse que a la vuelta
1
Agradezco los comentarios de Rosa Mara Rubalcava as como de los rbitros
annimos que evaluaron una versin anterior de este trabajo. Adems, me benefici de
las ricas discusiones que respecto a estos temas tuvieron lugar en las sesiones del "Semi-
nario de los jueves" de la Seccin de Teora y Metodologa de la Ciencia, del Centro de
Investigacin y de Estudios Avanzados del IPN.
835
836 ESTUDIOS SOCIOLGICOS X V : 45, 1997
del siglo xix, los problemas sociales vividos por el antiguo imperio
condujeron a sembrar las bases del anlisis de correlacin y de regre-
si n (Karl Pearson), as como del anlisis de asoci aci n (Y ul e)
(MacKenzie, 1979:39-50). A comienzos del siglo xx los problemas de
medicin de la inteligencia llevaron a fundar el anlisis factorial. A me-
diados de los cincuenta los trabajos pioneros de Goodman y Kruskal l
buscaron, por una parte, desarrollar instrumentos ms poderosos de an-
lisis de variables no mtricas y, por otra, conectar los enunciados teri-
cos especificados en hiptesis estadsticas, con las distribuciones espe-
radas de las observaciones. Sin embargo, fue a partir de los aos setenta
cuando las demandas analticas planteadas por las ciencias sociales em-
pezaron a orientar los desarrollos estadsticos de punta, que combina-
dos con los avances de la microcomputacin de los aos ochenta, hicie-
ron posible poner en prctica modelos analticos que ya se haban venido
desarrollando en el pasado, pero con pocas posibilidades de aplicacin.
En la actualidad el campo de las ciencias sociales ha sido invadido en
gran medida por diversas tcnicas de anlisis de variables mltiples,
entre las que destacan el anlisis loglineal, las regresiones logsticas y
el anlisis de correspondencias.
No es el propsito de este artculo presentar un anlisis terico-
histrico de la evolucin de la estadstica; sin embargo, sera til para
el lector tener una perspectiva panormi ca de la invasin del anlisis
de variables mltiples en la estadstica y en la investigacin social
emprica.
A mediados de los aos cincuenta aparece en el centro del desarro-
llo de la estadstica aplicada el problema de las relaciones espurias o
ilusorias. Tanto Paul Lazarsfeld como Hubert Simn se preocupan por
desarrollar tcnicas que permitan detectar si una relacin observada es
genuina o ilusoria. Son famosos los ejemplos de Lazarsfeld sobre la re-
lacin entre los nacimientos y las cigeas, y la del nmero de extingui-
dores y los daos provocados por un incendio. Ambos encuentran la
misma solucin al problema, aunque el primero en el campo del anlisis
de asociacin y el segundo en el de la correlacin. L a solucin consisti
en estudiar la asociacin o la correlacin parcial entre dos variables con-
trolando mediante la presencia de una tercera. En los ejemplos seala-
dos, la variable control (tambin llamada variable test) fue el contexto
rural urbano, en el primero, y en el segundo la gravedad del incendio: si
la relacin observada desaparece a l controlar por u n a tercera v a r i a b l e ,
entonces se concluye que esa relacin es espuria o i l u s o r i a . Si no desa-
parece, la pregunta inmediata es no habr otra u otras variables que
haran desaparecer la relacin?, en cuyo caso, de acuerdo con el criterio
empleado, la relacin sera ilusoria. Me parece que esto fue una de las
CORTS: CONSIDERACIONES EPISTEMOLGICAS 837
fuerzas, nacidas en el dominio de las ciencias sociales, que empuj a
desarrollar el anlisis de variables mltiples.
Otra cuestin que impuls los esfuerzos dedicados al anlisis de
variables mltiples fue la disparidad que exista entre las complejidades
del pensamiento conceptual y la disponibilidad de instrumentos. De he-
cho, tal como se ver en la prxima seccin, una de las maneras de
utilizar l a estadstica consiste en expresar los enunciados tericos en
lenguaje estadstico. En los aos sesenta las conceptuaciones podan
establecer conjuntos complejos de relaciones entre variables, pero los
instrumentos estadsticos para tratar variables no mtricas se limitaban
al anlisis de asociacin, o en el mejor de los casos al anlisis de cova-
rianzas de Lazarsfeld, y cuando todas las variables eran mtricas, al
anlisis de regresin. El instrumento disponible impona un cors a la
validacin emprica de la teora. El anlisis de covarianzas se desarroll
matemti camente para considerar al mismo tiempo tres variables
dicotmicas. A pesar de que Lazarsfeld plante que la generalizacin a
ms de dos categoras y a ms de tres variables eraa f o r t i o r i , la verdad
es que se no fue el caso. Por aquella poca no se dispona de una tcni-
ca de anlisis de datos que considerara simultneamente cualquier n-
mero de variables no mtricas sin importar el nmero de categoras,
sujeta slo a la restriccin impuesta por el total de observaciones. L a
regresin se poda extender para incluir en el modelo variables explica-
tivas no mtricas (variables ficticias), pero slo era til para formalizar
teoras que originaban modelos en que una variable endgena se expli-
caba por un conjunto de variables exgenas. L a camisa de fuerza que
impona la tcnica de anlisis de datos al contraste de las teoras fue otro
motor que impuls el desarrollo del anlisis multivariado.
L a tercera vertiente se desprende de la lgica. Es fcilmente com-
prensible desde esta disciplina y perfectamente comprobable por medio
de ejemplos numricos, que es errneo (en el sentido de que las conclu-
siones del anlisis son falsas) establecer una relacin multidimensional
entre un conjunto de variables basndose en las relaciones bidimensio-
nales entre cada factor o variable explicativa o condicionante y la expli-
cada, consecuente o condicionada. L a explicacin a este hecho es sim-
ple: toda relacin bidimensional no controla la presencia de las restantes
variables. Esto se traduce en que la asociacin observada no slo inclu-
ye la relacin entre las dos variables en cuestin sino que, adems, in-
corpora los vnculos que tienen con terceras, cuartas..., variables. As, la
variable explicativa apareceapropindose de efectos que no le pertene-
cen. L a nica manera de resolver este problema es cerrar el campo, es
decir, disponer de teoras suficientemente poderosas, que permitan iden-
tificar los factores relevantes, que stos se puedan traducir en variables
838 ESTUDIOS SOCIOLGICOS X V : 45, 1997
estadsticas vlidas y confiables, y proceder a realizar el anlisis de da-
tos utilizando simultneamente todas las variables. Es decir, analizar
usando alguna tcnica de variables mltiples.
Desde el punto de vista analtico, las tres fuentes que habran i m-
pulsado el desarrollo de la estadstica de variables mltiples se pueden
reducir ni camente a dos. L a denuncia de las relaciones espurias, y su
contrapartida, la identificacin de las genuinas, as como la imposibilidad
de establecer las relaciones multidimensionales a partir de las bidimen-
sionales, llaman, en esencia, al control de las otras variables que puedan
tener incidencia. Es decir, ambas fuentes se originan en un esquema de-
ficiente de control de variables. L a otra fuente es una expresin de l a
necesaria interrelacin entre los avances tericos de las ciencias socia-
les y en especial de la sociologa, la capacidad de traducir los enun-
ciados en proposiciones que se pueden expresar dentro del lenguaje de
la estadstica y los requerimientos que se derivan sobre el tipo de pre-
guntas a las que debera dar respuesta el anlisis de los datos.
Este trabajo se limita exclusivamente a considerar algunos temas
epistemolgicos a partir del uso de la estadstica en las ciencias sociales
y especialmente en la sociologa. El acento est puesto en la estadstica.
No se trata de un anlisis epistemolgico de esta disciplina, sino ms
bien de algunos problemas epistemolgicos, que a mi juicio estn en-
treverados en l a prctica de la investigacin social emprica que utiliza
los mtodos estadsticos para someter a prueba sus hiptesis. Puesto en
otros trminos, esto quiere decir que el eje del desarrollo lo constituir
la relacin entre los enunciados tericos y su validacin emprica. Del i -
mitado as el campo de este artculo, excluye consideraciones sobre
el marco epistmico (Garca, 1986:52 y 53), sobre el efecto del paradig-
ma del observador en la observacin (Russell, 1965), o bien el papel
que juega l a dimensin Z (Holton, 1985:27-29).
Voy a dedicar la parte central de este artculo a tocar tres temas que
considero de inters epistemolgico y que se encuentran incluidos en el
uso que se da a cualquier tcnica estadstica, desde las ms elementales
a las ms complejas. El primero de estos temas se referir a l a perspec-
tiva con que se usa el instrumento estadstico. El segundo, al tratamien-
to de la causalidad en estadstica; y el tercero y ltimo tendr por objeto
hurgar en las preconcepciones en que descansan dos de los mtodos de
estimacin ms utilizados.
CORTS: CONSIDERACIONES EPISTEMOLGICAS 839
El uso del instrumental estadstico: dos enfoques y dos sntesis,
pero una ms sinttica que la otra
Existen dos enfoques dominantes para exponer el material de la estads-
tica. Uno de ellos intenta generar conocimiento a partir de regularidades
empricas, en tanto que el otro adopta una postura de docimasia de hip-
tesis. Abordaremos con un poco ms de detenimiento ambos enfoques.
El primero, que ha dominado ampliamente, consiste sobre todo en
encontrar regularidades en los datos y elevarlas al rango de hallazgos o
findings. Por ejemplo, muchos libros de texto plantean que el anlisis de
regresin debe iniciarse con un diagrama de dispersin que representa
los pares ordenados de las variables en un plano de coordenadas
cartesianas, para establecer si estn o no relacionadas y determinar la
forma de l a relacin.
Como la grfica de tres variables origina una representacin tridi-
mensional, que no es de tan fcil interpretacin, los libros sealan que
en caso de haber tres o ms variables es conveniente usar diagramas
bidimensionales entre la variable explicada y las explicativas. Es as
como la investigacin se transforma en una cacera de relaciones signi-
ficativas, para posteriormente montar un modelo que rena en una sola
expresin matemtica (habitualmente algebraica) el conjunto de varia-
bles explicativas con la variable explicada, procedindose con posterio-
ridad al ajuste del modelo. Esta perspectiva no slo se reduce al anlisis
de regresin; es aplicable tanto a la estadstica descriptiva, como a los
anlisis de correlacin, loglineal, varianza, regresin logstica, etc. En
los ltimos aos ha asumido un nombre particular: anlisis exploratorio
de datos, que incluso ya se encuentra incluido en algunos programas
estadsticos para computadoras.
Tal vez no es necesario abundar respecto a este enfoque porque su
predominio en la enseanza de la estadstica lo hace fcilmente recono-
cible para cualquier lector que se haya visto en la necesidad de estudiar
o aplicar esta disciplina. L o que s me parece interesante es rescatar y
discutir un par de ideas epistemolgicas que sostienen esta prctica.
Detrs de esta forma de exponer el conocimiento estadstico o de
"hacer ciencia" se oculta una de las ideas centrales del empirismo l-
gico. En efecto, al decir de Hempel, "El principio fundamental del empi-
rismo moderno es la idea de que todo conocimiento no analtico se basa
en la experiencia" (1965:115). En este caso particular, la experiencia se
reduce a los datos estadsticos.
2
Vase al respecto la obra de Susana To-
2
En aras de una comunicacin fluida es necesario hacer algunas precisiones
840 ESTUDIOS SOCIOLGICOS X V : 45, 1997
irado, en colaboracin con Mi guel Acua y Vittorio Lorenzi, Informe
sobre la poblacin econmicamente activa en Amrica Latina: 1940
1970 (Santiago, Proelce, 1976). O la introduccin de Susana Torrado a
Investigacin e informacin sociodemogrficas 2: los censos de pobla-
cin y vivienda en la dcada de 1980 en Amrica Latina (Buenos Aires,
Clacso, 1981).
3
Tambin la obra de Emi l i o de Ipola y Susana Torrado,
con la colaboracin de Arturo Len y J uan Mara Carrn, Teora y m-
todo para el estudio de la estructura de clases en Chile (con un anli-
sis concreto: Chile, 1970), tres vol menes, Santiago, Flacso-Proelce,
1976.
4
En consecuencia, el conocimiento generado es significativo por-
que surge de ellos de los datos estadsticos, es decir, de la expe-
riencia. Esta idea se aleja de la concepcin empirista para la cual el
conocimiento del mundo (en nuestro caso, del mundo social) surge de
la recoleccin de datos y el descubrimiento de regularidades.
L a idea de que los datos son dados, que constituyen el punto de
partida de todo conocimiento, que se dan directamente a la percepci n
y que son neutros, es decir, que son los mismos para todos los indivi-
duos y todas las disciplinas (Garca, 1986:46), da el soporte para dis-
terminolgicas. En estadstica suelen usarse como sinnimos los trminos datos y obser-
vaciones. Apoyados en el constructivismo gentico definiremos los "observables" como
datos de la experiencia ya interpretados, y los hechos como relaciones entre observables
(Garca, 1986:49). Desde esta perspectiva el dato estadstico es un observable en la medi-
da en que no es nada dado sino que son registros de la experiencia construidos a partir de
conceptos y teoras. An ms, en Amrica Latina esta idea dio origen a algunas institucio-
nes que dedicaron gran parte de su actividad a cultivarla. Es el caso del programa Elas-
Celade (Proelce), organismo creado en conjunto por la Escuela de Sociologa de Flacso
(Elas) y por el Centro Latinoamericano de Demografa, y el grupo de trabajo "sobre in-
formacin sociodemogrfica" dentro de la Comisin de Poblacin y Desarrollo, de Clacso.
Estas instituciones produjeron una nutrida cantidad de trabajos donde se mostraba y de-
mostraba reiteradamente que el dato se construye.
3
Tal vez la obra culminante en esta lnea sea el esfuerzo realizado por un conjunto
de investigadores coordinados por Emilio de Ipola y Susana Torrado para organizar el
censo chileno de 1970 de acuerdo con las categoras althusserianas.
4
La obra contiene tres partes que van desde la discusin conceptual a la operacio-
nalizacin. El resultado consisti en una cuantificacin de la estructura de clases en
Chile hacia 1970. Pero no slo hay que tomar en cuenta las determinaciones conceptua-
les, las tcnicas y los mtodos empleados en su construccin, sino tambin sus condi-
cionantes polticas (Miles e Irvine, 1979:113-127). En la construccin del dato inter-
vienen una serie de determinaciones que llevan a la conclusin, parodiando a Russell
Hanson, de que "todo dato estadstico est cargado de teora" y si se quiere ser ms
especfico, de teora en sentido amplio, no slo limitada al dominio conceptual sino
tambin a las teoras en que descansan los mtodos y las tcnicas de construccin de
datos estadsticos, a lo que habra que agregar la "carga" poltica en su construccin.
En este sentido los datos no estn dados directamente a la percepcin, ni tienen el mismo
significado para todos los observadores.
CORTS: CONSIDERACIONES EPISTEMOLGICAS 841
criminar entre lo que es y no es cientfico. No es necesario agregar ma-
yores comentarios al siguiente pasaje clebre de Hume:
[...] si tomamos en nuestras manos un volumen, de teologa, metafsica
escolar, por ejemplo, preguntmonos: contiene algn razonamiento abs-
tracto concerniente a la cantidad o al nmero? No. Contiene algn ra-
zonamiento experimental concerniente a la materia de hecho o cosas
existente? No. Entregarlo a las llamas. Pues no puede contener ms que
sofistera y engaos.
L a otra idea que legitima esta prctica est claramente expuesta en
el estudio de Manuel Gi l sobre la concepcin de ciencia a comienzos
del siglo xx. A l estudiar la posicin de Mach, Gi l concluye que: "Como
ya ha afirmado, la tarea de la ciencia es, para Mach, dar cuenta de las
relaciones funcionales de dependencia entre los diversos elementos"
(p. 154). Un poco ms adelante, en la misma pgina, subraya y extien-
de la misma idea "l a propuesta de relaciones funcionales entre los di-
versos elementos es la tarea central de la actividad cientfica en todos
los campos, aun en aquellos, como la economa, en los cuales no pareca
ser as".
El anlisis que hace Gi l de Duhem lleva a las mismas conclusiones:
[...] la parte explicativa puede variar, o incluso no existir para alguien,
sin que esto afecte la certeza de las leyes descubiertas por observacin
de los hechos [...] la teora del calor descansa realmente en los hechos
generales que son inmediatamente dados por observacin. El origen de
las teoras est en los hechos y en ellos ha de tallarse para dar cuenta
de la validez, con independencia de las hiptesis explicativas de las que
aparentemente derivan (p. 168).
En la pgina 169 agrega una cita que Duhem hace de Fourier: "Este
cientfico seala que las causas fundamentales no nos son conocidas,
pero estn sujetas a leyes simples y constantes que pueden ser descu-
biertas por observacin".
Me parece que estos antecedentes arrojan luz sobre las ideas en que
se apoyan aquellos que utilizan la estadstica para salir a la cacera de
datos, establecer regularidades en el comportamiento de las variables y
pescar sus relaciones. Poniendo un poco de atencin a la discusin soste-
nida a comienzos del siglo, se nos hace claro que esta manera de enten-
der y usar la estadstica en la investigacin exuda un fuerte tufillo de
trasnochado empirismo. Digo trasnochado porque los empiristas actua-
les han ganado en sutileza, aunque no estoy seguro si en rigor.
842 ESTUDIOS SOCIOLGICOS X V : 45, 1997
L o que llama poderosamente la atencin es que, al finalizar el siglo
xx, una fuerte dosis de empirismo recorre las aulas universitarias y el
quehacer de la investigacin. L a supuesta certeza de la postura que sos-
tiene que el nico conocimiento vlido es aquel que deriva del anlisis
de los "hechos" y que se limita a establecer relaciones funcionales entre
las variables, conduce a posiciones autoritarias que cada vez dejan me-
nos espacio para la investigacin sustentada a partir de otros principios.
A l parecer nunca se preguntan respecto a l a construccin del dato esta-
dstico, tampoco al porqu seleccionan unas variables y no otras, ni menos
respecto a los criterios para decidir qu variables relacionar ni cmo dis-
tinguir las relaciones ilusorias de aquellas que tienen sentido.
Tambi n la estadstica se puede entender y usar desde una ptica
hipottico-deductiva. Esta perspectiva supone que tomando pie en l a
teora se pueden derivar algunas hiptesis estadsticas para contrastar-
las. Tal sistema suele dar paso a un uso ritual de la estadstica y se en-
cuentra bastante extendido entre aquellos que deben manejar datos en
sus tesis de licenciatura, maestra o doctorado. El esquema que se sigue
es el de la docimasia de hiptesis, que es uno de los temas centrales de
la estadstica elemental. L a idea consiste en generar las distribuciones
de probabilidades correspondientes a las hiptesis nula y alternativa, y
preguntarse acerca de la probabilidad de que un estimador determinado
(media aritmtica, varianza, coeficiente de regresin, una interaccin,
etc.) pertenezca a la poblacin definida por la hiptesis nula o a la(s) de
la(s) hiptesis alternativa(s). En esta perspectiva la estadstica rasura las
hiptesis enviando al averno las rechazadas y manteniendo en el limbo
a las no rechazadas.
5
L o que quiero resaltar es que en esta forma de
conceptuar la investigacin emprica la estadstica se convierte enel juez
ltimo que decide acerca de la validez de una hiptesis tericamente
fundada.
Queda an por mencionar una postura intermedia. Una de las pti-
cas del empirismo moderno sostiene queel enunciado cuantitativo que
se r e f i e r a a l grado de correlacin entre dos variables se acerca ya ms
a l estatuto de u n a ley, pero que la relacin observada se nos puede pre-
5
En el campo de la inferencia estadstica predominan las ideas del falsacionismo
popperiano. En los libros de texto se suele aseverar que las hiptesis no se rechazan pero
que esto no quiere decir que se aceptan, sino ms bien que no hubo suficiente evidencia
emprica para rechazarlas. Esta idea se complementa afirmando que la actitud cientfica
consiste en someter continuamente las hiptesis al rigor de la contrastacin con el prop-
sito de rechazarlas. En la metodologa de las ciencias sociales se ha agregado el d i c t u m
que en tanto ms resistente sea la hiptesis al rechazo, eliminando ms y ms hiptesis
alternativas, ms verosmil se hace (Stinchcombe, 1970:26-39).
CORTS: CONSIDERACIONES EPISTEMOLGICAS 843
sentar distorsionada por el azar, por lo que es ms bien una tendencia, y
agrega:
Para que esa interpretacin sea razonable necesitamos disponer de algn
fundamento, a poder ser teortico y emprico. Ms precisamente, podemos
suponer que una lnea de tendencia oculta una ley slo si i) los datos tienden
efectivamente a fundirse en la lnea y con ella cuando las perturbaciones se
hacen despreciables o ii) se dispone de un modelo teortico que d razn de
la lnea central subyacente al proceso causal (Bunge, 1979:346 y 347).
Si el "o" de esta cita fuera excluyente entonces se concluira que
Bunge concuerda con el empirismo lgico, ya que en ocasiones sera
posible establecer leyes a partir de la pura empina (condicin 1) mien-
tras que tambin da la posibilidad de establecer la conexin entre hipte-
sis tericas, hiptesis estadsticas y datos (condicin 2). Si el "o" no
fuera excluyente, entonces Bunge exigira el cumplimiento de ambas
condiciones para establecer una ley. Independientemente de cul sea la
postura que sostiene, queda claro que la estadstica juega el papel de ins-
trumento de caza o bien se erige en el juez que define la validez de los
hallazgos. Estas imgenes del papel de la estadstica en la investigacin
en ciencias sociales difcilmente son reconocibles en la prctica.
En primer lugar hay que notar que el investigador define un proble-
ma de investigacin que implica determinar un dominio en el cual in-
vestigar el o los fenmenos que le interesan. Este problema de investi-
gacin no surge del aire sino que se encuentra fuertemente condicionado
por el conocimiento y el estadio de desarrollo de la o las teoras perti-
nentes al problema bajo estudio. A partir de aqu el investigador decide
tomar algunos objetos y no otros, construir y estudiar solamente las va-
riables relacionadas a los conceptos tericos y analizar ni camente las
relaciones que tienen sentido dentro del cuerpo de conocimiento acu-
mulado (incluyendo las teoras adecuadas al anlisis del problema). L a
estadstica es un poderoso auxiliar para caracterizar y detectar relacio-
nes significativas entre las variables bajo estudio, as como para apoyar
el proceso de abstraccin emprica, a partir del cual se construyen nue-
vas teorizaciones y conceptos que se aplican a un cierto dominio de la
realidad.
6
Este proceso de asimilacin del material emprico a la con-
6
L a abstraccin emprica refiere a la lectura de los observables. Como ya hemos
visto esta lectura es mediada por los conceptos y teoras, as como por los instrumen-
tos lgicos y matemticos a disposicin del investigador. En tanto, la abstraccin re-
flexiva es el proceso por el cual los conceptos se amplan a otros dominios (Piaget y
Garca, 1982:190-194; Piaget, 1975:26).
844 ESTUDIOS SOCIOLGICOS X V : 45, 1997
ceptuacin conlleva la generacin de nuevos conceptos derivados de
los primitivos que se aplican a nuevos dominios, utilizando para ello un
proceso de abstraccin reflexiva. En esta parte del proceso de investiga-
cin la estadstica puede volver a jugar un papel, esta vez controlando l a
validez emprica de las hiptesis generadas por el proceso de abstrac-
cin reflexiva.
De lo anterior debemos destacar que esta forma de conceptuar el
proceso de investigacin da un nuevo sentido a la posicin empirista
superndola por cuanto otorga un papel significativo a la experiencia.
Pero va ms all a medida que reconoce que el recorte o el cierre del
campo de investigacin implica la movilizacin de conceptos, teoras
y conocimiento acumulado. Pero tambin lo hace con la posicin hi-
pottico-deductiva al considerar que se generan nuevos conceptos y
teoras que se aplican a otros dominios por medio del proceso de abs-
traccin reflexiva, pero la supera en tanto reconoce la posibilidad de
generacin de nuevo conocimiento mediante la abstraccin emprica.
Tenemos entonces una conceptuacin del proceso de investigacin que
a la vez que representa adecuadamente la actividad de los investigado-
res en su accionar, nos permite entender los papeles bsicos que se le
adscriben a l a estadstica dentro del proceso de investigacin.
Se nos podra argumentar que no habra diferencias sustantivas en-
tre este planteamiento y el presentado por la versin moderna del positi-
vismo si considersemos el "o" como no excluyente. Tal vez esta obje-
cin podra ser aceptada, aunque habra que discutirlo; sin embargo,
es claro que el planteamiento de Bunge se detiene en la contrastacin.
Una vez que se someti a prueba el enunciado terico o la hiptesis, el
proceso es terminal llevando al rechazo o no de la hiptesis. Sin embar-
go, todos sabemos que en muchas ocasiones el rechazo de una hiptesis
normalmente implica el inicio de una serie de acciones.
Suponiendo que no hay duda acerca de la seleccin del fenmeno a
estudiar, antes de rechazar su hiptesis el investigador analiza si la rela-
cin tiene una estructura matemtica diferente; por ejemplo, considera
la posibilidad de que la relacin sea no lineal, que su variable opere slo
en presencia de otras (interaccin) y no por s misma, que la asociacin
slo sea vlida para un subconjunto de la poblacin y no para su totali-
dad (por ejemplo, que slo sea vlida para mujeres y no para hombres),
etc. Una vez que despej este conjunto de interrogantes y la situacin
no mejora, suele analizarse con detalle la validez de la medicin, es
decir, explicitar y sistematizar los conceptos incluidos en el dato esta-
dstico y comparar su contenido con el concepto que se quiere medir;
tambi n se estudia la confiabilidad y se procura tener una idea acerca
del proceso de construccin cuando se trata de informacin secundaria,
CORTS: CONSIDERACIONES EPISTEMOLGICAS 845
o bien se revisa el procedimiento seguido si la construccin fue propia.
Una vez que se tiene la seguridad de que no hay dificultades mayores
con los datos estadsticos, la atencin del investigador se vuelca sobre l a
hiptesis.
El rechazo de una hiptesis obliga a acomodar la teora y los con-
ceptos, pero no necesariamente lleva a rechazar todo el planteamiento
conceptual. L a acumulacin de contradicciones entre las consecuencias
de una teora y la experiencia termina por plantear la necesidad de pasar
a otro estadio de la teorizacin. L a nueva teora contiene algunos con-
ceptos de l a anterior, es aplicable a los dominios de la teorizacin anti-
gua y reconoce nuevos dominios. Adems:
El producto (resultado) de una abstraccin reflexiva con respecto a una
teora se torna la base observable (el punto de partida observable) de
una abstraccin emprica con respecto a la teora de orden superior (Piaget
y Garca, 1982:194).
Es claro ahora que el marco de referencia que nos ofrece la episte-
mol og a gentica no slo provee de una buena caracterizacin del pro-
ceso de investigacin tal como acontece en la prctica, por lo menos en
ciencias sociales, sino que supera la posicin del empirismo lgico, la
hipottico-deductiva y la versin moderna del empirismo. Adicional-
mente el conceptuar la investigacin como lo que es, es decir, como un
proceso, permite localizar el papel de la estadstica tanto en los procesos
de abstraccin emprica como reflexiva.
Pasemos ahora a considerar el tratamiento de la causalidad en la
estadstica.
El anlisis causal
En el ao de 1964*Hubert Blalock publica en los Estados Unidos de
Norteamrica su obraC a u s a l Inferences i n N o n e x p e r i me n t a l Research;
en 1968, en Francia, ve la luz el libro de Raymond Boudon, U Analyse
Ma t h e m a t i q u e des F a i t s Sociaux. Estas obras marcan el inicio de una
moda que se extingue poco a poco a medida que se aproximan los aos
ochenta y pasa a ser una ms del acervo de tcnicas estadsticas, pero
con el nombre de anlisis de trayectorias, anlisis de senderos o path
analysis. Por qu el cambio de nombre? Es ste el indicio de proce-
sos ms profundos? Con el propsito de esbozar una respuesta echaremos
una mirada a vuelo de pjaro a los principales hitos en la evolucin del
otrora llamado anlisis causal.
846 ESTUDIOS SOCIOLGICOS X V : 45, 1997
Si bien el auge de la tcnica se sita a mediados de los sesenta, sus
bases se plantearon por primera vez en un artculo publicado por Sewall
Wright en la revistaJ o u r n a l of A g r i c u l t u r a l Research, en 1921 y en los
Annals of Ma t h e m a t i c a l Statistics en 1934. Inexplicablemente Wright
no vuelve a escribir sobre este tema hasta 1954, justamente el ao en
que Hubert Simn publicara su famoso "Spurious Correlation a Causal
Interpretation" en el J o u r n a l of the A m e r i c a n Statistical Association.
Hacia el final de la dcada de los sesenta el influyente anuario Sociolo
gical Methodology dedic su edicin al anlisis causal, y en los dos
nmeros siguientes el mismo tema ocup un lugar destacado. De ah en
adelante el furor empez a menguar hasta convertirse en una tcnica
estadstica ms.
Me parece que el apogeo del anlisis causal en la sociologa y l a
ciencia poltica tuvo un doble motor. Por una parte, fue el primer cuer-
po de anlisis estadstico producido por cientficos sociales, y por lo
tanto se consider adecuado a los problemas que preocupaban a esas
disciplinas en los sesenta, y por la otra, se supona que permita abordar
empricamente el estudio de la causalidad.
L a tcnica Simon-Blalock o los coeficientes de dependencia de
Boudon permitan tratar estadsticamente el conjunto de relaciones en-
tre las variables consideradas; es decir, a partir de los planteamientos
de estos autores ya no era necesario limitarse a esquemas en que hubiese
una variable explicada y varias explicativas; el nuevo tipo de anlisis
necesitaba hacer la distincin entre variables exgenas (no determinadas
por el sistema de ecuaciones) y endgenas (determinadas por el sistema
de ecuaciones). Los modelos admitan que cada variable endgena fuese
funcin tanto de otras variables endgenas como de las exgenas. Se
supona que esta generalizacin de los tradicionales modelos de regre-
sin y de correlacin a la que haban arribado los cientficos sociales
permita acercarse a la complejidad de los fenmenos que estudiaban, as
como cerrar el hiato entre teora y mtodos o tcnicas de investigacin.
L a euforia empez a disminuir conforme esta tcnica requera que
las variables se midieran en escala mtrica, ya fuera en escala de inter-
valo o de razn, en tanto que gran parte de las variables tpicas en la
sociologa y la ciencia poltica son ordinales o nominales. Este hecho
puso un lmite claro a la universalidad de su aplicacin. En esa poca
esta limitacin poda ser tratada slo en el caso de que las variables no
mtricas fueran exgenas al modelo. Slo la investigacin realizada
durante los setenta, que desemboc en la regresin logstica, permiti
tratar el caso de variables endgenas no mtricas.
El segundo motor se par al ponerse en duda que esta tcnica per-
mitira evaluar el ligamen causal entre las variables. El golpe ms con-
CORTS: CONSIDERACIONES EPISTEMOLGICAS 847
tundente a la pretensin de los socilogos y politlogos de haber creado
un nuevo cuerpo estadstico se lo propin un econometrista, Arthur
Goldberger, quien en su artculo "On Boudon's Method of Linear
Causal Analysis", publicado en 1970 en la A m e r i c a n Sociologycal
Review, demostr que el pretendido anlisis causal no era ms que un
sistema de ecuaciones lineales recursivas en que se supona que los
residuos de las ecuaciones no estaban relacionados y que este tema se
encontraba bien desarrollado en pocas pginas en cualquier libro ele-
mental de econometra.
En la actualidad la estadstica plantea que slo sera posible esta-
blecer una relacin causal entre dos variables si: i) hay una variacin
concomitante entre ellas, es decir, covaran o bien estn correlacionadas;
ii) presentan una asimetra temporal, o sea, es posible establecer cul
interviene primero y cul despus; y i i i ) se ha eliminado todo aquel
factor causal que pueda producir la relacin observada entre las varia-
bles (Asher, 1983:12). Las primeras dos condiciones pareceran no cons-
tituir obstculos mayores. En efecto, la primera se resuelve calculando
un simple coeficiente de correlacin. L a segunda a primera vista parece
inocente, pero en muchas ocasiones no es posible establecer con clari-
dad l a prioridad temporal.
L a tercera condicin merece una consideracin aparte. En efecto, el
ttulo del artculo de Simn haca referencia a correlaciones espurias o
ilusorias y la idea central de este trabajo estaba dirigida a utilizar el an-
lisis causal para detectar este tipo de relaciones. Este mismo aspecto
provocaba por aquella poca la preocupacin de Paul Lazarsfeld quien
dise el anlisis de covarianzas para reconocer las asociaciones iluso-
rias. Simn plantea, entonces, la posibilidad de utilizar las ideas de Wright
para resolver empricamente el vnculo causal entre las variables.
L a tercera condicin de Asher lleva directamente a considerar el
control de variables. Para estudiar una relacin entre dos o ms varia-
bles, eliminando el efecto que puedan tener otras, la estadstica dispone
de varias estrategias. Una consiste en aleatorizar el efecto de las otras
variables. Por ejemplo, si interesa establecer la relacin entre los mto-
dos alternativos para ensear a leer y la velocidad de aprendizaje, se
forman grupos con miembros asignados al azar de manera que la cla-
se social, la inteligencia, la disponibilidad de capital cultural en el hogar,
etc., estn igualmente presentes en todos los grupos, de modo que las
diferencias que se observen en la velocidad de aprendizaje no se expli-
quen por alguna de ellas. Una idea equivalente, aunque tcnicamente
distinta, es la de las observaciones pareadas. En este caso se comparan
dos o ms observaciones que slo difieren en las variables explicativas.
Siguiendo con el ejemplo anterior, este mtodo conducira a comparar
848 ESTUDIOS SOCIOLGICOS X V : 45, 1997
puntajes de velocidad de aprendizaje en nios que tuviesen las mismas
calificaciones en las otras variables. Przeworski y Teune (1970:32-34)
estudiaron con detenimiento las debilidades de este mtodo, especfica-
mente en el campo de l a investigacin social. El anlisis de asociacin
controla variables mantenindolas constantes. Por ejemplo, para el i mi -
nar el efecto de la clase social sobre la relacin entre edad y preferencia
partidaria se examina sta para los electores de, por ejemplo, la clase
alta y la clase baja. En cada una de estas subpoblaciones est controlada
la clase porque todos los electores pertenecen a la misma clase social.
El anlisis de regresin y todas las tcnicas derivadas de l controlan
eliminando el efecto de las otras variables. Por ejemplo, si para analizar
la preferencia partidaria se ajustara una regresin lineal entre la prefe-
rencia partidaria (variable explicada) y la edad y la clase social (varia-
bles explicativas), el coeficiente de regresin parcial de l a edad mide el
efecto neto de esta variable, descontado el impacto lineal de la clase
social.
Dejando a un lado las diferencias metodolgicas y tcnicas obvias
entre estos cuatro mtodos de control, debe notarse que los tres ltimos
requieren que las variables por controlar sean explcitamente incorpora-
das al anlisis; no acontece lo mismo con la aleatorizacin. Como ya
hemos dicho, el anlisis causal se basa en un sistema de ecuaciones re-
cursivas cuya base terico-estadstica se encuentra en el anlisis de
regresin. En consecuencia, para controlar el efecto de las otras varia-
bles habra que incluir en el modelo todos los factores explicativos del
fenmeno bajo estudio. Esto quiere decir que se debe disponer de teo-
ras lo suficientemente poderosas para identificar todos los determinan-
tes, as como las tcnicas, los instrumentos y los recursos necesarios
para recabar la informacin. No creo que sea exagerado sostener que el
desarrollo de las ciencias sociales dista mucho de satisfacer estas exi-
gencias es decir, no se cumple el tercer criterio de Asher, y que
por lo tanto a partir nicamente de correlaciones y asimetras tempora-
les no es posible establecer el sentido de las conexiones causales ni
mucho menos evaluar estadsticamente su fuerza.
L a nica puerta abierta para establecer la direccin causal es, en
palabras de Asher:
La tcnica de los modelos recursivos lineales no permite determinar la
relacin causal entre dos variables; si hay una relacin causal entre dos
variables, entonces el investigador tendr que establecerla desde fuera,
presumiblemente basndose en consideraciones tericas y sustantivas.
CORTS: CONSIDERACIONES EPISTEMOLGICAS 849
Creo que las conclusiones de este anlisis son ntidas: hoy la esta-
dstica reconoce que en cualquier situacin prctica la direccin de la
causalidad se atribuye a la regularidad emprica, y en segundo lugar,
queda claro el argumento sustancial que llev a sustituir el nombre de
anlisis de causalidad por el de anlisis de trayectoria, anlisis de sen-
dero opath analysis.
Dos mtodos de estimacin en anlisis de variables mltiples
En las ciencias sociales se recurre cada vez ms a utilizar tcnicas de va-
riables mltiples para analizar los datos. En el ajuste de este tipo de mo-
delos tienden a predominar los mtodos de estimacin mnimo cuadrtico
y de mxi ma verosimilitud. Si bien hay razones tcnicas para preferir
uno u otro dependiendo del problema de que se trate, no nos detendre-
mos en estos aspectos sino en las ideas que dan sustento a ambos pro-
cedimientos de estimacin.
L a estimacin mnimo cuadrtica ordinaria, as como sus variantes,
se ha utilizado profusamente en el ajuste de modelos de regresin, ya
sean lineales o susceptibles de ser linealizados. El problema que se in-
tenta resolver, as como las ideas centrales, se pueden exponer para el
caso ms simple (una variable explicada y una variable explicativa) sin
prdida de generalidad respecto a los propsitos de este trabajo. Consi-
deremos entonces que por alguna razn se postula que hay una relacin
lineal entre la variable explicativa X y la explicada Y , de manera que si
se tiene un conjunto de n pares ordenados (X, Y ) se genera un sistema
de n ecuaciones con dos incgnitas: la ordenada al origen a y la pen-
diente p. L a solucin matemtica a este problema se debe a Adrien
Legendre, quien en el apndice a su trabajo Nouvelles mthodes pour l a
determination des orbites des comtes, publicado el 6 de marzo de 1805,
propone para resolver este problema "l a tcnica m ni mo cuadrtica"
(Stigler, 1986:12). Aun cuando en el desarrollo del modelo de regresin
est presente con toda su fuerza el problema que abord Legendre, el
planteamiento moderno sostiene que los valores de la variable explica-
da estn compuestos por una parte sistemtica que vara con la variable
explicativa y una parte aleatoria (e), de modo que el sistema de ecuaciones
responde a:
Y . =a +pX. +e. (i =1, 2, . . . )
A las incgnitas a y p se agregan la media y la varianza de la varia-
ble aleatoria e. En l a versin ms simple de este modelo se supone que
850 ESTUDIOS SOCIOLGICOS X V : 45, 1997
la esperanza matemtica y la varianza de son 0 y a
2
respectivamente.
Ntese que el supuesto sostiene que todas las variables aleatorias e, una
para cada ecuacin, tienen la misma media y la misma varianza o, pues-
to en otros trminos, que las medias y varianzas de las variables aleatorias
son independientes de las observaciones.
Esta es una pildora sinttica de los planteamientos estadsticos en
que se basa el modelo de regresin y tiene por propsito disponer de un
lenguaje bsico para detenernos en lo que me parece ms relevante des-
de el punto de vista epistemolgico: las ideas que llevan a distinguir l a
parte sistemtica y aleatoria de la variable explicada y los argumentos
que justifican la introduccin del trmino e.
El trmino estocstico se incluye en el modelo para representar:
i) que el modelo no considera todos los factores que influyen sobre Y
(sino slo los relevantes). Para fijar las ideas, presumamos que hay ra-
zones conceptuales para suponer que entreX y Y hay una relacin l i -
neal, por ejemplo, que el consumo de los hogares (Y ) depende del i n-
greso neto que logran acumular sus perceptores ( X) , sin embargo, en los
hechos ste no es el nico factor que influye sobre Y , ya que el consumo
tambin estar afectado por el tamao y la composicin del hogar, por
la antigedad de la pareja, por algunas caractersticas particulares de los
miembros por ejemplo, si el padre es un aficionado a las carreras de
caballos, es un bebedor, un jugador de poker o bien la madre es adicta a
la moda parisina, a los automviles importados, etc.. Esta fuente de ex-
plicacin del trmino aleatorio supone que el modelo incorpora todas
las variables significativas que condicionan o afectan los valores de l a
variable explicada, y que ninguna de las no consideradas es relevante en
la explicacin, de modo que dado un valor deX . , es decir, de todas las
unidades que tienen el mismo nivel de ingreso,' e puede asumir valo-
res por arriba o por debajo del valor sistemtico dependiendo de los va-
lores que alcancen las variables no explcitamente consideradas en el
modelo, ii) Una segunda razn para incluir el trmino estocstico son
los errores de medicin en la variable explicada. Los valores registrados
de Y no reflejan los valores dados por la teora y representados en la
ecuacin. En nuestro ejemplo, esto quiere decir que los errores de
medi ci n en el ni vel de consumo de los hogares se consideran
incorporados en e i i i ) En ocasiones se agrega como tercer factor la
existencia de un elemento impredecible en la respuesta humana (J ohnston,
1984:14).
Me parece que, detrs de la primera fuente que racionaliza la incor-
poracin de un trmino estocstico en la ecuacin de regresin, se halla
subyacente una imagen del mundo muy peculiar, segn la cual para te-
ner una explicacin perfecta de la variable dependiente bastara con in-
CORTS: CONSIDERACIONES EPISTEMOLGICAS 851
cluir todos y cada uno de sus factores condicionantes. El nico proble-
ma que se podra presentar es que el nmero de incgnitas supere al de
ecuaciones (o de observaciones, si se quiere) (J ohnston, 1984:14). A l
estirar las consecuencias que entraa esta perspectiva se podra concluir
que la acumulacin de datos sera un camino vlido para llegar a identi-
ficar las determinantes de los fenmenos bajo estudio. L a idea que se
esconde detrs de este planteamiento es que lo aleatorio surge de la i n-
capacidad de los seres humanos para tratar la naturaleza multidimensio-
nal de los fenmenos sociales. En esta concepcin lo aleatorio se define
como un testigo de la incapacidad humana para dar cuenta de los proce-
sos reales. Si el carcter estocstico del fenmeno se justifica de esta
manera, la tercera fuente se transforma en un caso particular de la pri-
mera. En efecto, el comportamiento humano sera aleatorio debido a
que no conocemos todos los factores que lo determinan. Por lo tanto,
las fuentes de la aleatoriedad se reduciran nicamente a dos, las mis-
mas que estuvieron presentes en el origen del mtodo de estimacin
m ni mo cuadrtico, en 1805.
El mtodo de estimacin mnimo cuadrtico en su nacimiento estu-
vo asociado a tres problemas planteados en el siglo xix: /) representar
y determinar matemticamente los movimientos de la Luna; ii) dar cuenta
de una desigualdad no peridica en los movimientos de los planetas
J piter y Saturno; y Hi) determinar la forma de la Tierra. Todos estos
problemas envolvan, por una parte, observaciones astronmicas, y por
otra, la teora de la gravitacin (Stigler, 1986:17). Se trataba entonces
de ajustar las ecuaciones derivadas de la teora a los resultados de las
observaciones astronmicas. El ajuste implicaba ms ecuaciones que
i ncgni tas en l a medida en que las primeras i ncl u an unos pocos
parmetros y se tena un nmero apreciable de observaciones. Parecera
que en estos estudios no se dudaba acerca de la teora; sta era tomada
por buena, las desviaciones entre los resultados que arrojaba el modelo
y los datos observados tenan su origen en los errores de medicin, los
cuales obviamente eran considerados aleatorios.
Quiero llamar la atencin sobre el hecho de que las ideas bsicas
que originaron la tcnica m ni mo cuadrtica se encuentran presentes en
las versiones modernas que justifican la inclusin del trmino estocstico
en el modelo de regresin. Las teoras nos informan slo sobre los fac-
tores relevantes que explican un fenmeno. El resto se incluye en el
trmino estocstico que ayuda a medir qu tanto no estamos conside-
rando en la explicacin estadstica. Segn esta concepcin existira la
posibilidad de dar cuenta exhaustiva de un fenmeno, pero nos encon-
tramos con la limitacin de que el nmero de factores es de tal magni-
tud que sera prcticamente imposible recabar los datos necesarios para
852 ESTUDIOS SOCIOLGICOS X V : 45, 1997
tener ms ecuaciones que incgnitas. Adems, habra que considerar
que de todas maneras existiran obstculos para emprender esta tarea,
ya que la aleatoriedad surge tambin de los errores de medicin. De este
breve anlisis se desprende la conclusin de que el poderoso paradigma
newtoniano est subrepticiamente presente en una parte importante de
l a estadstica aun al finalizar el siglo xx.
El mtodo de mxi ma verosimilitud supone que las observaciones
fueron generadas por una di stri buci n de probabilidades cuyos
parmetros hay que estimar. Para llevar a cabo la estimacin se constru-
ye l a funcin de verosimilitud, que es una medida de la incertidumbre
en l a estimacin de valores hipotticos del o de los parmetros. Supon-
gamos que el valor hipottico del parmetro 6 es 6', entonces la funcin
de verosimilitud ser:
L (G'/Y , M) =K (Y ) P (Y /0')
donde la funcin de verosimilitud L representa la incertidumbre asocia-
da a 0', dadas las observaciones (Y ) y el modelo (M). El mtodo consis-
te en encontrar el valor de 0' que maximiza la verosimilitud de que el
modelo haya generado los datos observados. Son muchos los recovecos
tcnicos de este mtodo de estimacin, sin embargo dejaremos su pre-
sentacin en este punto para enfocarnos hacia las ideas centrales que
organizan esta forma de enfrentar el problema.
Queremos destacar el hecho de que el planteamiento del mtodo de
estimacin mxi mo verosmil introduce el supuesto de que las observa-
ciones han sido generadas por un mecanismo aleatorio. Esto es una for-
ma de "organizar" la experiencia. Reconoce un papel activo del sujeto:
es ste quien decide si el modelo adecuado para representar un conjunto
de datos es la distribucin binomial, multinomial, hipergeomtrica,
exponencial, normal, etc. El modelo que se selecciona para representar
l a distribucin observada de los datos no se elige arbitrariamente, sino
que la decisin se apoya en el examen del procedimiento que se sigui
para generar las observaciones y las caractersticas tericas de las distri-
buciones de probabilidades.
Razones esencialmente tcnicas han confinado al campo de la re-
gresin al mtodo de estimacin mnimo cuadrtico as como sus deri-
vaciones. Esto a pesar de que la tcnica de mxima verosimilitud aplica-
da a la regresin lineal arroja, en esencia, los mismos resultados. Sin
embargo, las nuevas tcnicas estadsticas multivariadas, de amplia aplica-
cin en las ciencias sociales (anlisis de cohortes, anlisis de sobrevi-
vencia, anlisis loglineal, regresin logstica), emplean el mtodo de
mxi ma verosimilitud. Pero ambos procedimientos no slo poseen di -
CORTS: CONSIDERACIONES EPISTEMOLGICAS 853
ferentes atributos que los hacen aplicables a problemas de naturaleza
distinta, sino que conciben de manera diferente la aleatoriedad. En efec-
to, el mtodo de estimacin m ni mo cuadrtico supone que la aleatorie-
dad deriva de la incapacidad de especificar todas y cada una de las va-
riables explicativas de Y , y de los errores en su medicin; l a idea central
subyacente a este procedimiento es que sera posible dar cuenta exacta
de la variable en cuestin. Esto es una posibilidad terica, ya que aun
cuando se consideraran todas las variables explicativas habra que ge-
nerar suficientes casos como para tener ms ecuaciones que incgnitas
y estar as en condiciones de estimar los parmetros; en tanto que el
mtodo de mxi ma verosimilitud reconoce que l a variable en s es
aleatoria y que para realizar la estimacin se debe postular un modelo
estadstico. En este planteamiento hay un reconocimiento explcito a la
construccin conceptual de la experiencia as como del dato.
En conclusin, los desarrollos estadsticos recientes, fuertemente con-
dicionados por las demandas planteadas por las ciencias sociales, tienden
a abandonar la naturaleza determinstica de la experiencia, remplazn-
dola por una concepcin que reconoce el carcter aleatorio de la misma,
y a reconocer el papel activo del sujeto en la construccin del objeto.
Conclusin
En una famosa conferencia, Albert Einstein recomienda a los interesa-
dos en el mtodo de la fsica: "no escuches sus palabras [refirindose a
los fsicos tericos], pon atencin a lo que hacen".
7
Haciendo un parale-
lo podramos decir: no te fijes en lo que se dice respecto a la aplicacin
de la estadstica en l a investigacin emprica, sino en lo que se hace en
la investigacin. A partir de las concepciones de la epistemologa gentica
el proceso de investigacin se puede ver como una espiral que se eleva
por l a contradi cci n entre l a teora y las observaciones (Corts y
Rubalcava, 1987:I ntroduccin). En este proceso la estadstica juega un
papel central en la investigacin emprica.
Algunas tcnicas estadsticas son ms propias para estudiar regula-
ridades y verificar l a consistencia de las hiptesis con los datos (abs-
traccin emprica), otras lo son para calibrar el sustento emprico de la
aplicacin de las hiptesis a nuevos dominios empricos (abstraccin
reflexiva).
7
The Herbert Spencer Lecture, Oxford, 10 de junio, 1933.
854 ESTUDIOS SOCIOLGICOS X V : 45, 1997
El desarrollo del anlisis causal ha llegado a la conclusin de que
dada una relacin estadstica, el investigador debe establecer la causa-
lidad desde fuera basado en consideraciones tericas y sustantivas. Esta
idea se enriquece y precisa en el conocimiento desarrollado por la epis-
temologa gentica. En efecto, esta corriente de pensamiento, basndo-
se en minuciosas investigaciones empricas, ha concluido que las rela-
ciones causales se conceptan como la atribucin de necesidad lgica y
coherencia terica a la experiencia (Piaget y Garca, 1973; Halbwachs,
1977; Garca, 1986:51).
Las diferentes concepciones de la aleatoriedad tienen fuerte rela-
cin con el estudio de los sistemas dinmicos abiertos. L a equilibracin
de las estructuras cognitivas (Piaget, 1975), una de las obras centra-
les de la epistemologa gentica, es el estudio de la evolucin del siste-
ma cognitive Una de las caractersticas centrales es que su desarrollo
no es continuo, sino que evoluciona por niveles movindose hacia esta-
dios de desarrollo superiores. L a acumulacin de contradicciones en
un estadio desata el proceso de desequilibrio que lleva al sistema a un
reequilibrio en otro estadio; este proceso no tiene lmite, est abierto
por arriba. Uno de los temas que abre esta forma de conceptuar la evo-
lucin del sistema cognitivo es el mecanismo de la equilibracin. Para
entenderlo se puede recurrir a la idea de autoorganizacin de I lya Prigo
gine(1979). L o que me interesa destacar es que la equilibracin combi-
na momentos de estructuracin con otros dedesestructuracin. En los
primeros la aleatoriedad se puede conceptuar como desconocimiento,
mientras que en los segundos, como una caracterstica intrnseca de los
fenmenos, sujeta a las leyes de la estadstica.
Recibido en abril de1996
Revisado en diciembre de1996
Correspondencia: El Colegio de Mxico/Centro de Estudios Sociolgicos/Ca-
mino al Ajusco 20/Col. Pedregal de Santa Teresa/C. P. 10740 Mxico, D. F./
fax 645 04 64
CORTS: CONSIDERACIONES EPISTEMOLGICAS 855
Bibliografa
Asher, Herbert B. (1983), Ca u s a l Modeling, Berverly Hills, California, Sage
Publications.
Blalock, Hubert (1964), Causal Inference in Nonexperimental Research, Chapel
Hill, The University of North Carolina Press.
Borgatta, Edgard y George Bohrnstedt (eds.) (1970), Sociological Methodology
1 9 7 0 , San Francisco, Jossey-Bass.
Boudon, Raymond (1968), L'analyse mathematique des f a i t socieux, Pars,
Plon.
Bunge, Mario (1979), L a investigacin cientfica: su estrategia y su filosofa,
Barcelona, Ariel.
Corts, Fernando y Rosa Mara Rubalcava (1987), Mtodos estadsticos apli-
cados a la investigacin social: anlisis de asociacin, Mxico, El Cole-
gio de Mxico.
De Ipola, Emilio et al. (1976), Teora y mtodo p a r a el estudio de la estructura
de clases en Chile (con un anlisis concreto: Chile, 1 9 7 0 ) , Santiago,
Flacso-Proelce, tres volmenes.
Einstein, Albert (1981), "On the methods of Theoretical Physics", en Cari
Seeling (ed.), Albert Einstein Ideas and Opinions, Pars, Laurel Editions.
Garca, Rolando (1986), "Conceptos bsicos para el estudio de sistemas com-
plejos", en Enrique Leff (coord.), El problema del conocimiento y la pers-
pectiva ambiental del desarrollo, Mxico, Siglo XXI.
Gil, Antn Manuel (1985), Crtica epistemolgica a la concepcin de ciencia
en Max Weber, Mxico, IPN, tesis de doctorado, Centro de Investigacin y
de Estudios Avanzados del Instituto Politcnico Nacional.
Halbwachs, Fr. (1977), "Reflexiones de la causalidad fsica", en Mario Bunge
et al, Las teoras de la causalidad, Salamanca, Sigeme.
Hempel, Cari G. (1965), "Problemas y cambios en el criterio empirista de signi-
ficado", en A. J. Ayer, El positivismo lgico, Mxico, Fondo de Cultura
Econmica.
Holton, Gerald (1985), L a imaginacin cientfica, Mxico, Conacyt-Fondo de
Cultura Econmica.
Hume, David (1921), A n enquirity concerning human understanding and se-
lectionsfrom a treatise of human na t ur e , Chicago, Open Court, Philo
sophical classics, Religin of Science Library, nm. 45.
Johnston, J. (1984), Econometric Methods, Singapur International Student
Edition.
Lazarsfeld, Paul (1974a), "La interpretacin de las relaciones estadsticas como
propiedad de investigacin", en Raymond Boudon y Paul Lazarsfeld, Me-
todologa de las ciencias sociales II: Anlisis emprico y causalidad, Bar-
celona, Laia.
(1974b), "El lgebra de los sistemas dicotmicos", en Raymond Boudon
y Paul Lazarsfeld, Metodologa de las ciencias sociales II: Anlisis emp-
rico y causalidad, Barcelona, Laia.
856 ESTUDIOS SOCIOLGICOS X V : 45, 1997
McKenzie, Donald (1979), "Eugenics and the Rise of Mathematical Statistics
in Britain", en John Irvine, Ian Miles y J. Evans (eds.), Demystifying So-
c i a l Statistics, Londres, Pluot Press.
Miles, Ian y John Irvine (1979), "The Critique of Official Statistcs", en John
Irvine, Ian Miles y J. Evans (eds.), Demystifying Social Statistics, Lon-
dres, Pluot Press.
Piaget, Jean (1975), L a e q u i l i b r a t i o n de las estructuras cognitivas: el proble-
ma c e nt r a l del desarrollo, Espaa, Siglo XXI.
y Rolando Garca (1973) ,Las explicaciones causales, Barcelona, Barral
editores.
(1982), Psicognesis e historia de la ciencia, Mxico, Siglo XXI.
Prigogine, Ilya e Isabelle Stengers (1983), L a nueva a l i a n z a : metamorfosis de
la ciencia, Madrid, Alianza Editorial.
Przeworski, Adam y Henry Teune (1970), The Logic of Comparative Social
Inquiry, Nueva York, John Wiley.
Russell Hanson, Norwood (1965), Patterns of Discovery: An Inquiry into the
Conceptual Foundations of Science, Londres, Cambridge University Press.
Simon, Herbert (1957), "Spurious correlation a causal interpretation", en H. A.
Simon, Models of Man; social and r a t i o na l , Nueva York, John Wiley.
Stigler, Stephen M. (1986), The History of Statistics: The measurement of
Uncertainty before 1 9 9 0 , Cambridge, Mass., Belknap.
Stinchcombe, Arthur (1970), L a construction de teoras sociales, Buenos
Aires, Nueva Visin.
Torrado, Susana (1981), "Introduccin", en Susana Torrado, Investigacin e
informacin sociodemogrficas 2: los censos de poblacin y vivienda en
la dcada de 1 9 8 0 en Amrica L a t i n a , Buenos Aires, Clacso.
, Miguel Acua y Vittorio Lorenzi (1976), Informe sobre la poblacin
econmicamente activa en Amrica L a t i n a : 1 9 4 0 - 1 9 7 0 , Santiago, Proelce.
Wright, Sewall (1921), "Correlation and Causation", Journal of the Ag r i c u l t u r a l
Research, nm. 20.

You might also like