Este documento presenta una introducción al uso de técnicas de análisis de variables múltiples en la estadística aplicada a las ciencias sociales. Explica que tres fuerzas impulsaron el desarrollo de estas técnicas: 1) la necesidad de distinguir entre relaciones genuinas y espurias al controlar por terceras variables, 2) la disparidad entre la complejidad de las teorías y la disponibilidad de instrumentos estadísticos, y 3) la imposibilidad de establecer relaciones multidimensionales a partir de relaciones bidimension
Original Description:
Original Title
Fernando Cortés - Estadística Social desde la mirada de la epistemología genética
Este documento presenta una introducción al uso de técnicas de análisis de variables múltiples en la estadística aplicada a las ciencias sociales. Explica que tres fuerzas impulsaron el desarrollo de estas técnicas: 1) la necesidad de distinguir entre relaciones genuinas y espurias al controlar por terceras variables, 2) la disparidad entre la complejidad de las teorías y la disponibilidad de instrumentos estadísticos, y 3) la imposibilidad de establecer relaciones multidimensionales a partir de relaciones bidimension
Este documento presenta una introducción al uso de técnicas de análisis de variables múltiples en la estadística aplicada a las ciencias sociales. Explica que tres fuerzas impulsaron el desarrollo de estas técnicas: 1) la necesidad de distinguir entre relaciones genuinas y espurias al controlar por terceras variables, 2) la disparidad entre la complejidad de las teorías y la disponibilidad de instrumentos estadísticos, y 3) la imposibilidad de establecer relaciones multidimensionales a partir de relaciones bidimension
una mirada desde la epistemologa gentica 1 F e r n a n d o Corts Introduccin A FINES DEL SIGLO X X LA ESTADSTICA, como casi la totalidad de las disci- plinas cientficas, ha explotado en una serie de campos especializados. Actualmente el nmero de personas involucradas en las actividades acadmicas es formidable, aunque se concentra bsicamente en los pa- ses desarrollados. L a combinacin de estas dos tendencias arroja como resultado una voluminosa produccin en cualquier campo especializa- do del saber, que se transmite por medio de avalanchas de artculos y libros que hacen imposible estar al da en todos los campos de una disci- plina especfica. L a estadstica no es la excepcin. Se ha desmembrado en una serie de campos particulares que normalmente asumen el nombre propio de una tcnica estadstica particular. Obviamente, este artculo no abarcar a la estadstica en general, lo cual estara mucho ms all de mis fuer- zas, sino que los planteamientos que se presentan se referirn nica- mente a la estadstica aplicada a las ciencias sociales. Debo dejar claro que este recorte del campo no es poca cosa. Si bien el desarrollo de l a estadstica estuvo muy vinculado al de la fsica, especialmente en lo que se refiere al clculo de probabilidades, no debe olvidarse que a la vuelta 1 Agradezco los comentarios de Rosa Mara Rubalcava as como de los rbitros annimos que evaluaron una versin anterior de este trabajo. Adems, me benefici de las ricas discusiones que respecto a estos temas tuvieron lugar en las sesiones del "Semi- nario de los jueves" de la Seccin de Teora y Metodologa de la Ciencia, del Centro de Investigacin y de Estudios Avanzados del IPN. 835 836 ESTUDIOS SOCIOLGICOS X V : 45, 1997 del siglo xix, los problemas sociales vividos por el antiguo imperio condujeron a sembrar las bases del anlisis de correlacin y de regre- si n (Karl Pearson), as como del anlisis de asoci aci n (Y ul e) (MacKenzie, 1979:39-50). A comienzos del siglo xx los problemas de medicin de la inteligencia llevaron a fundar el anlisis factorial. A me- diados de los cincuenta los trabajos pioneros de Goodman y Kruskal l buscaron, por una parte, desarrollar instrumentos ms poderosos de an- lisis de variables no mtricas y, por otra, conectar los enunciados teri- cos especificados en hiptesis estadsticas, con las distribuciones espe- radas de las observaciones. Sin embargo, fue a partir de los aos setenta cuando las demandas analticas planteadas por las ciencias sociales em- pezaron a orientar los desarrollos estadsticos de punta, que combina- dos con los avances de la microcomputacin de los aos ochenta, hicie- ron posible poner en prctica modelos analticos que ya se haban venido desarrollando en el pasado, pero con pocas posibilidades de aplicacin. En la actualidad el campo de las ciencias sociales ha sido invadido en gran medida por diversas tcnicas de anlisis de variables mltiples, entre las que destacan el anlisis loglineal, las regresiones logsticas y el anlisis de correspondencias. No es el propsito de este artculo presentar un anlisis terico- histrico de la evolucin de la estadstica; sin embargo, sera til para el lector tener una perspectiva panormi ca de la invasin del anlisis de variables mltiples en la estadstica y en la investigacin social emprica. A mediados de los aos cincuenta aparece en el centro del desarro- llo de la estadstica aplicada el problema de las relaciones espurias o ilusorias. Tanto Paul Lazarsfeld como Hubert Simn se preocupan por desarrollar tcnicas que permitan detectar si una relacin observada es genuina o ilusoria. Son famosos los ejemplos de Lazarsfeld sobre la re- lacin entre los nacimientos y las cigeas, y la del nmero de extingui- dores y los daos provocados por un incendio. Ambos encuentran la misma solucin al problema, aunque el primero en el campo del anlisis de asociacin y el segundo en el de la correlacin. L a solucin consisti en estudiar la asociacin o la correlacin parcial entre dos variables con- trolando mediante la presencia de una tercera. En los ejemplos seala- dos, la variable control (tambin llamada variable test) fue el contexto rural urbano, en el primero, y en el segundo la gravedad del incendio: si la relacin observada desaparece a l controlar por u n a tercera v a r i a b l e , entonces se concluye que esa relacin es espuria o i l u s o r i a . Si no desa- parece, la pregunta inmediata es no habr otra u otras variables que haran desaparecer la relacin?, en cuyo caso, de acuerdo con el criterio empleado, la relacin sera ilusoria. Me parece que esto fue una de las CORTS: CONSIDERACIONES EPISTEMOLGICAS 837 fuerzas, nacidas en el dominio de las ciencias sociales, que empuj a desarrollar el anlisis de variables mltiples. Otra cuestin que impuls los esfuerzos dedicados al anlisis de variables mltiples fue la disparidad que exista entre las complejidades del pensamiento conceptual y la disponibilidad de instrumentos. De he- cho, tal como se ver en la prxima seccin, una de las maneras de utilizar l a estadstica consiste en expresar los enunciados tericos en lenguaje estadstico. En los aos sesenta las conceptuaciones podan establecer conjuntos complejos de relaciones entre variables, pero los instrumentos estadsticos para tratar variables no mtricas se limitaban al anlisis de asociacin, o en el mejor de los casos al anlisis de cova- rianzas de Lazarsfeld, y cuando todas las variables eran mtricas, al anlisis de regresin. El instrumento disponible impona un cors a la validacin emprica de la teora. El anlisis de covarianzas se desarroll matemti camente para considerar al mismo tiempo tres variables dicotmicas. A pesar de que Lazarsfeld plante que la generalizacin a ms de dos categoras y a ms de tres variables eraa f o r t i o r i , la verdad es que se no fue el caso. Por aquella poca no se dispona de una tcni- ca de anlisis de datos que considerara simultneamente cualquier n- mero de variables no mtricas sin importar el nmero de categoras, sujeta slo a la restriccin impuesta por el total de observaciones. L a regresin se poda extender para incluir en el modelo variables explica- tivas no mtricas (variables ficticias), pero slo era til para formalizar teoras que originaban modelos en que una variable endgena se expli- caba por un conjunto de variables exgenas. L a camisa de fuerza que impona la tcnica de anlisis de datos al contraste de las teoras fue otro motor que impuls el desarrollo del anlisis multivariado. L a tercera vertiente se desprende de la lgica. Es fcilmente com- prensible desde esta disciplina y perfectamente comprobable por medio de ejemplos numricos, que es errneo (en el sentido de que las conclu- siones del anlisis son falsas) establecer una relacin multidimensional entre un conjunto de variables basndose en las relaciones bidimensio- nales entre cada factor o variable explicativa o condicionante y la expli- cada, consecuente o condicionada. L a explicacin a este hecho es sim- ple: toda relacin bidimensional no controla la presencia de las restantes variables. Esto se traduce en que la asociacin observada no slo inclu- ye la relacin entre las dos variables en cuestin sino que, adems, in- corpora los vnculos que tienen con terceras, cuartas..., variables. As, la variable explicativa apareceapropindose de efectos que no le pertene- cen. L a nica manera de resolver este problema es cerrar el campo, es decir, disponer de teoras suficientemente poderosas, que permitan iden- tificar los factores relevantes, que stos se puedan traducir en variables 838 ESTUDIOS SOCIOLGICOS X V : 45, 1997 estadsticas vlidas y confiables, y proceder a realizar el anlisis de da- tos utilizando simultneamente todas las variables. Es decir, analizar usando alguna tcnica de variables mltiples. Desde el punto de vista analtico, las tres fuentes que habran i m- pulsado el desarrollo de la estadstica de variables mltiples se pueden reducir ni camente a dos. L a denuncia de las relaciones espurias, y su contrapartida, la identificacin de las genuinas, as como la imposibilidad de establecer las relaciones multidimensionales a partir de las bidimen- sionales, llaman, en esencia, al control de las otras variables que puedan tener incidencia. Es decir, ambas fuentes se originan en un esquema de- ficiente de control de variables. L a otra fuente es una expresin de l a necesaria interrelacin entre los avances tericos de las ciencias socia- les y en especial de la sociologa, la capacidad de traducir los enun- ciados en proposiciones que se pueden expresar dentro del lenguaje de la estadstica y los requerimientos que se derivan sobre el tipo de pre- guntas a las que debera dar respuesta el anlisis de los datos. Este trabajo se limita exclusivamente a considerar algunos temas epistemolgicos a partir del uso de la estadstica en las ciencias sociales y especialmente en la sociologa. El acento est puesto en la estadstica. No se trata de un anlisis epistemolgico de esta disciplina, sino ms bien de algunos problemas epistemolgicos, que a mi juicio estn en- treverados en l a prctica de la investigacin social emprica que utiliza los mtodos estadsticos para someter a prueba sus hiptesis. Puesto en otros trminos, esto quiere decir que el eje del desarrollo lo constituir la relacin entre los enunciados tericos y su validacin emprica. Del i - mitado as el campo de este artculo, excluye consideraciones sobre el marco epistmico (Garca, 1986:52 y 53), sobre el efecto del paradig- ma del observador en la observacin (Russell, 1965), o bien el papel que juega l a dimensin Z (Holton, 1985:27-29). Voy a dedicar la parte central de este artculo a tocar tres temas que considero de inters epistemolgico y que se encuentran incluidos en el uso que se da a cualquier tcnica estadstica, desde las ms elementales a las ms complejas. El primero de estos temas se referir a l a perspec- tiva con que se usa el instrumento estadstico. El segundo, al tratamien- to de la causalidad en estadstica; y el tercero y ltimo tendr por objeto hurgar en las preconcepciones en que descansan dos de los mtodos de estimacin ms utilizados. CORTS: CONSIDERACIONES EPISTEMOLGICAS 839 El uso del instrumental estadstico: dos enfoques y dos sntesis, pero una ms sinttica que la otra Existen dos enfoques dominantes para exponer el material de la estads- tica. Uno de ellos intenta generar conocimiento a partir de regularidades empricas, en tanto que el otro adopta una postura de docimasia de hip- tesis. Abordaremos con un poco ms de detenimiento ambos enfoques. El primero, que ha dominado ampliamente, consiste sobre todo en encontrar regularidades en los datos y elevarlas al rango de hallazgos o findings. Por ejemplo, muchos libros de texto plantean que el anlisis de regresin debe iniciarse con un diagrama de dispersin que representa los pares ordenados de las variables en un plano de coordenadas cartesianas, para establecer si estn o no relacionadas y determinar la forma de l a relacin. Como la grfica de tres variables origina una representacin tridi- mensional, que no es de tan fcil interpretacin, los libros sealan que en caso de haber tres o ms variables es conveniente usar diagramas bidimensionales entre la variable explicada y las explicativas. Es as como la investigacin se transforma en una cacera de relaciones signi- ficativas, para posteriormente montar un modelo que rena en una sola expresin matemtica (habitualmente algebraica) el conjunto de varia- bles explicativas con la variable explicada, procedindose con posterio- ridad al ajuste del modelo. Esta perspectiva no slo se reduce al anlisis de regresin; es aplicable tanto a la estadstica descriptiva, como a los anlisis de correlacin, loglineal, varianza, regresin logstica, etc. En los ltimos aos ha asumido un nombre particular: anlisis exploratorio de datos, que incluso ya se encuentra incluido en algunos programas estadsticos para computadoras. Tal vez no es necesario abundar respecto a este enfoque porque su predominio en la enseanza de la estadstica lo hace fcilmente recono- cible para cualquier lector que se haya visto en la necesidad de estudiar o aplicar esta disciplina. L o que s me parece interesante es rescatar y discutir un par de ideas epistemolgicas que sostienen esta prctica. Detrs de esta forma de exponer el conocimiento estadstico o de "hacer ciencia" se oculta una de las ideas centrales del empirismo l- gico. En efecto, al decir de Hempel, "El principio fundamental del empi- rismo moderno es la idea de que todo conocimiento no analtico se basa en la experiencia" (1965:115). En este caso particular, la experiencia se reduce a los datos estadsticos. 2 Vase al respecto la obra de Susana To- 2 En aras de una comunicacin fluida es necesario hacer algunas precisiones 840 ESTUDIOS SOCIOLGICOS X V : 45, 1997 irado, en colaboracin con Mi guel Acua y Vittorio Lorenzi, Informe sobre la poblacin econmicamente activa en Amrica Latina: 1940 1970 (Santiago, Proelce, 1976). O la introduccin de Susana Torrado a Investigacin e informacin sociodemogrficas 2: los censos de pobla- cin y vivienda en la dcada de 1980 en Amrica Latina (Buenos Aires, Clacso, 1981). 3 Tambin la obra de Emi l i o de Ipola y Susana Torrado, con la colaboracin de Arturo Len y J uan Mara Carrn, Teora y m- todo para el estudio de la estructura de clases en Chile (con un anli- sis concreto: Chile, 1970), tres vol menes, Santiago, Flacso-Proelce, 1976. 4 En consecuencia, el conocimiento generado es significativo por- que surge de ellos de los datos estadsticos, es decir, de la expe- riencia. Esta idea se aleja de la concepcin empirista para la cual el conocimiento del mundo (en nuestro caso, del mundo social) surge de la recoleccin de datos y el descubrimiento de regularidades. L a idea de que los datos son dados, que constituyen el punto de partida de todo conocimiento, que se dan directamente a la percepci n y que son neutros, es decir, que son los mismos para todos los indivi- duos y todas las disciplinas (Garca, 1986:46), da el soporte para dis- terminolgicas. En estadstica suelen usarse como sinnimos los trminos datos y obser- vaciones. Apoyados en el constructivismo gentico definiremos los "observables" como datos de la experiencia ya interpretados, y los hechos como relaciones entre observables (Garca, 1986:49). Desde esta perspectiva el dato estadstico es un observable en la medi- da en que no es nada dado sino que son registros de la experiencia construidos a partir de conceptos y teoras. An ms, en Amrica Latina esta idea dio origen a algunas institucio- nes que dedicaron gran parte de su actividad a cultivarla. Es el caso del programa Elas- Celade (Proelce), organismo creado en conjunto por la Escuela de Sociologa de Flacso (Elas) y por el Centro Latinoamericano de Demografa, y el grupo de trabajo "sobre in- formacin sociodemogrfica" dentro de la Comisin de Poblacin y Desarrollo, de Clacso. Estas instituciones produjeron una nutrida cantidad de trabajos donde se mostraba y de- mostraba reiteradamente que el dato se construye. 3 Tal vez la obra culminante en esta lnea sea el esfuerzo realizado por un conjunto de investigadores coordinados por Emilio de Ipola y Susana Torrado para organizar el censo chileno de 1970 de acuerdo con las categoras althusserianas. 4 La obra contiene tres partes que van desde la discusin conceptual a la operacio- nalizacin. El resultado consisti en una cuantificacin de la estructura de clases en Chile hacia 1970. Pero no slo hay que tomar en cuenta las determinaciones conceptua- les, las tcnicas y los mtodos empleados en su construccin, sino tambin sus condi- cionantes polticas (Miles e Irvine, 1979:113-127). En la construccin del dato inter- vienen una serie de determinaciones que llevan a la conclusin, parodiando a Russell Hanson, de que "todo dato estadstico est cargado de teora" y si se quiere ser ms especfico, de teora en sentido amplio, no slo limitada al dominio conceptual sino tambin a las teoras en que descansan los mtodos y las tcnicas de construccin de datos estadsticos, a lo que habra que agregar la "carga" poltica en su construccin. En este sentido los datos no estn dados directamente a la percepcin, ni tienen el mismo significado para todos los observadores. CORTS: CONSIDERACIONES EPISTEMOLGICAS 841 criminar entre lo que es y no es cientfico. No es necesario agregar ma- yores comentarios al siguiente pasaje clebre de Hume: [...] si tomamos en nuestras manos un volumen, de teologa, metafsica escolar, por ejemplo, preguntmonos: contiene algn razonamiento abs- tracto concerniente a la cantidad o al nmero? No. Contiene algn ra- zonamiento experimental concerniente a la materia de hecho o cosas existente? No. Entregarlo a las llamas. Pues no puede contener ms que sofistera y engaos. L a otra idea que legitima esta prctica est claramente expuesta en el estudio de Manuel Gi l sobre la concepcin de ciencia a comienzos del siglo xx. A l estudiar la posicin de Mach, Gi l concluye que: "Como ya ha afirmado, la tarea de la ciencia es, para Mach, dar cuenta de las relaciones funcionales de dependencia entre los diversos elementos" (p. 154). Un poco ms adelante, en la misma pgina, subraya y extien- de la misma idea "l a propuesta de relaciones funcionales entre los di- versos elementos es la tarea central de la actividad cientfica en todos los campos, aun en aquellos, como la economa, en los cuales no pareca ser as". El anlisis que hace Gi l de Duhem lleva a las mismas conclusiones: [...] la parte explicativa puede variar, o incluso no existir para alguien, sin que esto afecte la certeza de las leyes descubiertas por observacin de los hechos [...] la teora del calor descansa realmente en los hechos generales que son inmediatamente dados por observacin. El origen de las teoras est en los hechos y en ellos ha de tallarse para dar cuenta de la validez, con independencia de las hiptesis explicativas de las que aparentemente derivan (p. 168). En la pgina 169 agrega una cita que Duhem hace de Fourier: "Este cientfico seala que las causas fundamentales no nos son conocidas, pero estn sujetas a leyes simples y constantes que pueden ser descu- biertas por observacin". Me parece que estos antecedentes arrojan luz sobre las ideas en que se apoyan aquellos que utilizan la estadstica para salir a la cacera de datos, establecer regularidades en el comportamiento de las variables y pescar sus relaciones. Poniendo un poco de atencin a la discusin soste- nida a comienzos del siglo, se nos hace claro que esta manera de enten- der y usar la estadstica en la investigacin exuda un fuerte tufillo de trasnochado empirismo. Digo trasnochado porque los empiristas actua- les han ganado en sutileza, aunque no estoy seguro si en rigor. 842 ESTUDIOS SOCIOLGICOS X V : 45, 1997 L o que llama poderosamente la atencin es que, al finalizar el siglo xx, una fuerte dosis de empirismo recorre las aulas universitarias y el quehacer de la investigacin. L a supuesta certeza de la postura que sos- tiene que el nico conocimiento vlido es aquel que deriva del anlisis de los "hechos" y que se limita a establecer relaciones funcionales entre las variables, conduce a posiciones autoritarias que cada vez dejan me- nos espacio para la investigacin sustentada a partir de otros principios. A l parecer nunca se preguntan respecto a l a construccin del dato esta- dstico, tampoco al porqu seleccionan unas variables y no otras, ni menos respecto a los criterios para decidir qu variables relacionar ni cmo dis- tinguir las relaciones ilusorias de aquellas que tienen sentido. Tambi n la estadstica se puede entender y usar desde una ptica hipottico-deductiva. Esta perspectiva supone que tomando pie en l a teora se pueden derivar algunas hiptesis estadsticas para contrastar- las. Tal sistema suele dar paso a un uso ritual de la estadstica y se en- cuentra bastante extendido entre aquellos que deben manejar datos en sus tesis de licenciatura, maestra o doctorado. El esquema que se sigue es el de la docimasia de hiptesis, que es uno de los temas centrales de la estadstica elemental. L a idea consiste en generar las distribuciones de probabilidades correspondientes a las hiptesis nula y alternativa, y preguntarse acerca de la probabilidad de que un estimador determinado (media aritmtica, varianza, coeficiente de regresin, una interaccin, etc.) pertenezca a la poblacin definida por la hiptesis nula o a la(s) de la(s) hiptesis alternativa(s). En esta perspectiva la estadstica rasura las hiptesis enviando al averno las rechazadas y manteniendo en el limbo a las no rechazadas. 5 L o que quiero resaltar es que en esta forma de conceptuar la investigacin emprica la estadstica se convierte enel juez ltimo que decide acerca de la validez de una hiptesis tericamente fundada. Queda an por mencionar una postura intermedia. Una de las pti- cas del empirismo moderno sostiene queel enunciado cuantitativo que se r e f i e r a a l grado de correlacin entre dos variables se acerca ya ms a l estatuto de u n a ley, pero que la relacin observada se nos puede pre- 5 En el campo de la inferencia estadstica predominan las ideas del falsacionismo popperiano. En los libros de texto se suele aseverar que las hiptesis no se rechazan pero que esto no quiere decir que se aceptan, sino ms bien que no hubo suficiente evidencia emprica para rechazarlas. Esta idea se complementa afirmando que la actitud cientfica consiste en someter continuamente las hiptesis al rigor de la contrastacin con el prop- sito de rechazarlas. En la metodologa de las ciencias sociales se ha agregado el d i c t u m que en tanto ms resistente sea la hiptesis al rechazo, eliminando ms y ms hiptesis alternativas, ms verosmil se hace (Stinchcombe, 1970:26-39). CORTS: CONSIDERACIONES EPISTEMOLGICAS 843 sentar distorsionada por el azar, por lo que es ms bien una tendencia, y agrega: Para que esa interpretacin sea razonable necesitamos disponer de algn fundamento, a poder ser teortico y emprico. Ms precisamente, podemos suponer que una lnea de tendencia oculta una ley slo si i) los datos tienden efectivamente a fundirse en la lnea y con ella cuando las perturbaciones se hacen despreciables o ii) se dispone de un modelo teortico que d razn de la lnea central subyacente al proceso causal (Bunge, 1979:346 y 347). Si el "o" de esta cita fuera excluyente entonces se concluira que Bunge concuerda con el empirismo lgico, ya que en ocasiones sera posible establecer leyes a partir de la pura empina (condicin 1) mien- tras que tambin da la posibilidad de establecer la conexin entre hipte- sis tericas, hiptesis estadsticas y datos (condicin 2). Si el "o" no fuera excluyente, entonces Bunge exigira el cumplimiento de ambas condiciones para establecer una ley. Independientemente de cul sea la postura que sostiene, queda claro que la estadstica juega el papel de ins- trumento de caza o bien se erige en el juez que define la validez de los hallazgos. Estas imgenes del papel de la estadstica en la investigacin en ciencias sociales difcilmente son reconocibles en la prctica. En primer lugar hay que notar que el investigador define un proble- ma de investigacin que implica determinar un dominio en el cual in- vestigar el o los fenmenos que le interesan. Este problema de investi- gacin no surge del aire sino que se encuentra fuertemente condicionado por el conocimiento y el estadio de desarrollo de la o las teoras perti- nentes al problema bajo estudio. A partir de aqu el investigador decide tomar algunos objetos y no otros, construir y estudiar solamente las va- riables relacionadas a los conceptos tericos y analizar ni camente las relaciones que tienen sentido dentro del cuerpo de conocimiento acu- mulado (incluyendo las teoras adecuadas al anlisis del problema). L a estadstica es un poderoso auxiliar para caracterizar y detectar relacio- nes significativas entre las variables bajo estudio, as como para apoyar el proceso de abstraccin emprica, a partir del cual se construyen nue- vas teorizaciones y conceptos que se aplican a un cierto dominio de la realidad. 6 Este proceso de asimilacin del material emprico a la con- 6 L a abstraccin emprica refiere a la lectura de los observables. Como ya hemos visto esta lectura es mediada por los conceptos y teoras, as como por los instrumen- tos lgicos y matemticos a disposicin del investigador. En tanto, la abstraccin re- flexiva es el proceso por el cual los conceptos se amplan a otros dominios (Piaget y Garca, 1982:190-194; Piaget, 1975:26). 844 ESTUDIOS SOCIOLGICOS X V : 45, 1997 ceptuacin conlleva la generacin de nuevos conceptos derivados de los primitivos que se aplican a nuevos dominios, utilizando para ello un proceso de abstraccin reflexiva. En esta parte del proceso de investiga- cin la estadstica puede volver a jugar un papel, esta vez controlando l a validez emprica de las hiptesis generadas por el proceso de abstrac- cin reflexiva. De lo anterior debemos destacar que esta forma de conceptuar el proceso de investigacin da un nuevo sentido a la posicin empirista superndola por cuanto otorga un papel significativo a la experiencia. Pero va ms all a medida que reconoce que el recorte o el cierre del campo de investigacin implica la movilizacin de conceptos, teoras y conocimiento acumulado. Pero tambin lo hace con la posicin hi- pottico-deductiva al considerar que se generan nuevos conceptos y teoras que se aplican a otros dominios por medio del proceso de abs- traccin reflexiva, pero la supera en tanto reconoce la posibilidad de generacin de nuevo conocimiento mediante la abstraccin emprica. Tenemos entonces una conceptuacin del proceso de investigacin que a la vez que representa adecuadamente la actividad de los investigado- res en su accionar, nos permite entender los papeles bsicos que se le adscriben a l a estadstica dentro del proceso de investigacin. Se nos podra argumentar que no habra diferencias sustantivas en- tre este planteamiento y el presentado por la versin moderna del positi- vismo si considersemos el "o" como no excluyente. Tal vez esta obje- cin podra ser aceptada, aunque habra que discutirlo; sin embargo, es claro que el planteamiento de Bunge se detiene en la contrastacin. Una vez que se someti a prueba el enunciado terico o la hiptesis, el proceso es terminal llevando al rechazo o no de la hiptesis. Sin embar- go, todos sabemos que en muchas ocasiones el rechazo de una hiptesis normalmente implica el inicio de una serie de acciones. Suponiendo que no hay duda acerca de la seleccin del fenmeno a estudiar, antes de rechazar su hiptesis el investigador analiza si la rela- cin tiene una estructura matemtica diferente; por ejemplo, considera la posibilidad de que la relacin sea no lineal, que su variable opere slo en presencia de otras (interaccin) y no por s misma, que la asociacin slo sea vlida para un subconjunto de la poblacin y no para su totali- dad (por ejemplo, que slo sea vlida para mujeres y no para hombres), etc. Una vez que despej este conjunto de interrogantes y la situacin no mejora, suele analizarse con detalle la validez de la medicin, es decir, explicitar y sistematizar los conceptos incluidos en el dato esta- dstico y comparar su contenido con el concepto que se quiere medir; tambi n se estudia la confiabilidad y se procura tener una idea acerca del proceso de construccin cuando se trata de informacin secundaria, CORTS: CONSIDERACIONES EPISTEMOLGICAS 845 o bien se revisa el procedimiento seguido si la construccin fue propia. Una vez que se tiene la seguridad de que no hay dificultades mayores con los datos estadsticos, la atencin del investigador se vuelca sobre l a hiptesis. El rechazo de una hiptesis obliga a acomodar la teora y los con- ceptos, pero no necesariamente lleva a rechazar todo el planteamiento conceptual. L a acumulacin de contradicciones entre las consecuencias de una teora y la experiencia termina por plantear la necesidad de pasar a otro estadio de la teorizacin. L a nueva teora contiene algunos con- ceptos de l a anterior, es aplicable a los dominios de la teorizacin anti- gua y reconoce nuevos dominios. Adems: El producto (resultado) de una abstraccin reflexiva con respecto a una teora se torna la base observable (el punto de partida observable) de una abstraccin emprica con respecto a la teora de orden superior (Piaget y Garca, 1982:194). Es claro ahora que el marco de referencia que nos ofrece la episte- mol og a gentica no slo provee de una buena caracterizacin del pro- ceso de investigacin tal como acontece en la prctica, por lo menos en ciencias sociales, sino que supera la posicin del empirismo lgico, la hipottico-deductiva y la versin moderna del empirismo. Adicional- mente el conceptuar la investigacin como lo que es, es decir, como un proceso, permite localizar el papel de la estadstica tanto en los procesos de abstraccin emprica como reflexiva. Pasemos ahora a considerar el tratamiento de la causalidad en la estadstica. El anlisis causal En el ao de 1964*Hubert Blalock publica en los Estados Unidos de Norteamrica su obraC a u s a l Inferences i n N o n e x p e r i me n t a l Research; en 1968, en Francia, ve la luz el libro de Raymond Boudon, U Analyse Ma t h e m a t i q u e des F a i t s Sociaux. Estas obras marcan el inicio de una moda que se extingue poco a poco a medida que se aproximan los aos ochenta y pasa a ser una ms del acervo de tcnicas estadsticas, pero con el nombre de anlisis de trayectorias, anlisis de senderos o path analysis. Por qu el cambio de nombre? Es ste el indicio de proce- sos ms profundos? Con el propsito de esbozar una respuesta echaremos una mirada a vuelo de pjaro a los principales hitos en la evolucin del otrora llamado anlisis causal. 846 ESTUDIOS SOCIOLGICOS X V : 45, 1997 Si bien el auge de la tcnica se sita a mediados de los sesenta, sus bases se plantearon por primera vez en un artculo publicado por Sewall Wright en la revistaJ o u r n a l of A g r i c u l t u r a l Research, en 1921 y en los Annals of Ma t h e m a t i c a l Statistics en 1934. Inexplicablemente Wright no vuelve a escribir sobre este tema hasta 1954, justamente el ao en que Hubert Simn publicara su famoso "Spurious Correlation a Causal Interpretation" en el J o u r n a l of the A m e r i c a n Statistical Association. Hacia el final de la dcada de los sesenta el influyente anuario Sociolo gical Methodology dedic su edicin al anlisis causal, y en los dos nmeros siguientes el mismo tema ocup un lugar destacado. De ah en adelante el furor empez a menguar hasta convertirse en una tcnica estadstica ms. Me parece que el apogeo del anlisis causal en la sociologa y l a ciencia poltica tuvo un doble motor. Por una parte, fue el primer cuer- po de anlisis estadstico producido por cientficos sociales, y por lo tanto se consider adecuado a los problemas que preocupaban a esas disciplinas en los sesenta, y por la otra, se supona que permita abordar empricamente el estudio de la causalidad. L a tcnica Simon-Blalock o los coeficientes de dependencia de Boudon permitan tratar estadsticamente el conjunto de relaciones en- tre las variables consideradas; es decir, a partir de los planteamientos de estos autores ya no era necesario limitarse a esquemas en que hubiese una variable explicada y varias explicativas; el nuevo tipo de anlisis necesitaba hacer la distincin entre variables exgenas (no determinadas por el sistema de ecuaciones) y endgenas (determinadas por el sistema de ecuaciones). Los modelos admitan que cada variable endgena fuese funcin tanto de otras variables endgenas como de las exgenas. Se supona que esta generalizacin de los tradicionales modelos de regre- sin y de correlacin a la que haban arribado los cientficos sociales permita acercarse a la complejidad de los fenmenos que estudiaban, as como cerrar el hiato entre teora y mtodos o tcnicas de investigacin. L a euforia empez a disminuir conforme esta tcnica requera que las variables se midieran en escala mtrica, ya fuera en escala de inter- valo o de razn, en tanto que gran parte de las variables tpicas en la sociologa y la ciencia poltica son ordinales o nominales. Este hecho puso un lmite claro a la universalidad de su aplicacin. En esa poca esta limitacin poda ser tratada slo en el caso de que las variables no mtricas fueran exgenas al modelo. Slo la investigacin realizada durante los setenta, que desemboc en la regresin logstica, permiti tratar el caso de variables endgenas no mtricas. El segundo motor se par al ponerse en duda que esta tcnica per- mitira evaluar el ligamen causal entre las variables. El golpe ms con- CORTS: CONSIDERACIONES EPISTEMOLGICAS 847 tundente a la pretensin de los socilogos y politlogos de haber creado un nuevo cuerpo estadstico se lo propin un econometrista, Arthur Goldberger, quien en su artculo "On Boudon's Method of Linear Causal Analysis", publicado en 1970 en la A m e r i c a n Sociologycal Review, demostr que el pretendido anlisis causal no era ms que un sistema de ecuaciones lineales recursivas en que se supona que los residuos de las ecuaciones no estaban relacionados y que este tema se encontraba bien desarrollado en pocas pginas en cualquier libro ele- mental de econometra. En la actualidad la estadstica plantea que slo sera posible esta- blecer una relacin causal entre dos variables si: i) hay una variacin concomitante entre ellas, es decir, covaran o bien estn correlacionadas; ii) presentan una asimetra temporal, o sea, es posible establecer cul interviene primero y cul despus; y i i i ) se ha eliminado todo aquel factor causal que pueda producir la relacin observada entre las varia- bles (Asher, 1983:12). Las primeras dos condiciones pareceran no cons- tituir obstculos mayores. En efecto, la primera se resuelve calculando un simple coeficiente de correlacin. L a segunda a primera vista parece inocente, pero en muchas ocasiones no es posible establecer con clari- dad l a prioridad temporal. L a tercera condicin merece una consideracin aparte. En efecto, el ttulo del artculo de Simn haca referencia a correlaciones espurias o ilusorias y la idea central de este trabajo estaba dirigida a utilizar el an- lisis causal para detectar este tipo de relaciones. Este mismo aspecto provocaba por aquella poca la preocupacin de Paul Lazarsfeld quien dise el anlisis de covarianzas para reconocer las asociaciones iluso- rias. Simn plantea, entonces, la posibilidad de utilizar las ideas de Wright para resolver empricamente el vnculo causal entre las variables. L a tercera condicin de Asher lleva directamente a considerar el control de variables. Para estudiar una relacin entre dos o ms varia- bles, eliminando el efecto que puedan tener otras, la estadstica dispone de varias estrategias. Una consiste en aleatorizar el efecto de las otras variables. Por ejemplo, si interesa establecer la relacin entre los mto- dos alternativos para ensear a leer y la velocidad de aprendizaje, se forman grupos con miembros asignados al azar de manera que la cla- se social, la inteligencia, la disponibilidad de capital cultural en el hogar, etc., estn igualmente presentes en todos los grupos, de modo que las diferencias que se observen en la velocidad de aprendizaje no se expli- quen por alguna de ellas. Una idea equivalente, aunque tcnicamente distinta, es la de las observaciones pareadas. En este caso se comparan dos o ms observaciones que slo difieren en las variables explicativas. Siguiendo con el ejemplo anterior, este mtodo conducira a comparar 848 ESTUDIOS SOCIOLGICOS X V : 45, 1997 puntajes de velocidad de aprendizaje en nios que tuviesen las mismas calificaciones en las otras variables. Przeworski y Teune (1970:32-34) estudiaron con detenimiento las debilidades de este mtodo, especfica- mente en el campo de l a investigacin social. El anlisis de asociacin controla variables mantenindolas constantes. Por ejemplo, para el i mi - nar el efecto de la clase social sobre la relacin entre edad y preferencia partidaria se examina sta para los electores de, por ejemplo, la clase alta y la clase baja. En cada una de estas subpoblaciones est controlada la clase porque todos los electores pertenecen a la misma clase social. El anlisis de regresin y todas las tcnicas derivadas de l controlan eliminando el efecto de las otras variables. Por ejemplo, si para analizar la preferencia partidaria se ajustara una regresin lineal entre la prefe- rencia partidaria (variable explicada) y la edad y la clase social (varia- bles explicativas), el coeficiente de regresin parcial de l a edad mide el efecto neto de esta variable, descontado el impacto lineal de la clase social. Dejando a un lado las diferencias metodolgicas y tcnicas obvias entre estos cuatro mtodos de control, debe notarse que los tres ltimos requieren que las variables por controlar sean explcitamente incorpora- das al anlisis; no acontece lo mismo con la aleatorizacin. Como ya hemos dicho, el anlisis causal se basa en un sistema de ecuaciones re- cursivas cuya base terico-estadstica se encuentra en el anlisis de regresin. En consecuencia, para controlar el efecto de las otras varia- bles habra que incluir en el modelo todos los factores explicativos del fenmeno bajo estudio. Esto quiere decir que se debe disponer de teo- ras lo suficientemente poderosas para identificar todos los determinan- tes, as como las tcnicas, los instrumentos y los recursos necesarios para recabar la informacin. No creo que sea exagerado sostener que el desarrollo de las ciencias sociales dista mucho de satisfacer estas exi- gencias es decir, no se cumple el tercer criterio de Asher, y que por lo tanto a partir nicamente de correlaciones y asimetras tempora- les no es posible establecer el sentido de las conexiones causales ni mucho menos evaluar estadsticamente su fuerza. L a nica puerta abierta para establecer la direccin causal es, en palabras de Asher: La tcnica de los modelos recursivos lineales no permite determinar la relacin causal entre dos variables; si hay una relacin causal entre dos variables, entonces el investigador tendr que establecerla desde fuera, presumiblemente basndose en consideraciones tericas y sustantivas. CORTS: CONSIDERACIONES EPISTEMOLGICAS 849 Creo que las conclusiones de este anlisis son ntidas: hoy la esta- dstica reconoce que en cualquier situacin prctica la direccin de la causalidad se atribuye a la regularidad emprica, y en segundo lugar, queda claro el argumento sustancial que llev a sustituir el nombre de anlisis de causalidad por el de anlisis de trayectoria, anlisis de sen- dero opath analysis. Dos mtodos de estimacin en anlisis de variables mltiples En las ciencias sociales se recurre cada vez ms a utilizar tcnicas de va- riables mltiples para analizar los datos. En el ajuste de este tipo de mo- delos tienden a predominar los mtodos de estimacin mnimo cuadrtico y de mxi ma verosimilitud. Si bien hay razones tcnicas para preferir uno u otro dependiendo del problema de que se trate, no nos detendre- mos en estos aspectos sino en las ideas que dan sustento a ambos pro- cedimientos de estimacin. L a estimacin mnimo cuadrtica ordinaria, as como sus variantes, se ha utilizado profusamente en el ajuste de modelos de regresin, ya sean lineales o susceptibles de ser linealizados. El problema que se in- tenta resolver, as como las ideas centrales, se pueden exponer para el caso ms simple (una variable explicada y una variable explicativa) sin prdida de generalidad respecto a los propsitos de este trabajo. Consi- deremos entonces que por alguna razn se postula que hay una relacin lineal entre la variable explicativa X y la explicada Y , de manera que si se tiene un conjunto de n pares ordenados (X, Y ) se genera un sistema de n ecuaciones con dos incgnitas: la ordenada al origen a y la pen- diente p. L a solucin matemtica a este problema se debe a Adrien Legendre, quien en el apndice a su trabajo Nouvelles mthodes pour l a determination des orbites des comtes, publicado el 6 de marzo de 1805, propone para resolver este problema "l a tcnica m ni mo cuadrtica" (Stigler, 1986:12). Aun cuando en el desarrollo del modelo de regresin est presente con toda su fuerza el problema que abord Legendre, el planteamiento moderno sostiene que los valores de la variable explica- da estn compuestos por una parte sistemtica que vara con la variable explicativa y una parte aleatoria (e), de modo que el sistema de ecuaciones responde a: Y . =a +pX. +e. (i =1, 2, . . . ) A las incgnitas a y p se agregan la media y la varianza de la varia- ble aleatoria e. En l a versin ms simple de este modelo se supone que 850 ESTUDIOS SOCIOLGICOS X V : 45, 1997 la esperanza matemtica y la varianza de son 0 y a 2 respectivamente. Ntese que el supuesto sostiene que todas las variables aleatorias e, una para cada ecuacin, tienen la misma media y la misma varianza o, pues- to en otros trminos, que las medias y varianzas de las variables aleatorias son independientes de las observaciones. Esta es una pildora sinttica de los planteamientos estadsticos en que se basa el modelo de regresin y tiene por propsito disponer de un lenguaje bsico para detenernos en lo que me parece ms relevante des- de el punto de vista epistemolgico: las ideas que llevan a distinguir l a parte sistemtica y aleatoria de la variable explicada y los argumentos que justifican la introduccin del trmino e. El trmino estocstico se incluye en el modelo para representar: i) que el modelo no considera todos los factores que influyen sobre Y (sino slo los relevantes). Para fijar las ideas, presumamos que hay ra- zones conceptuales para suponer que entreX y Y hay una relacin l i - neal, por ejemplo, que el consumo de los hogares (Y ) depende del i n- greso neto que logran acumular sus perceptores ( X) , sin embargo, en los hechos ste no es el nico factor que influye sobre Y , ya que el consumo tambin estar afectado por el tamao y la composicin del hogar, por la antigedad de la pareja, por algunas caractersticas particulares de los miembros por ejemplo, si el padre es un aficionado a las carreras de caballos, es un bebedor, un jugador de poker o bien la madre es adicta a la moda parisina, a los automviles importados, etc.. Esta fuente de ex- plicacin del trmino aleatorio supone que el modelo incorpora todas las variables significativas que condicionan o afectan los valores de l a variable explicada, y que ninguna de las no consideradas es relevante en la explicacin, de modo que dado un valor deX . , es decir, de todas las unidades que tienen el mismo nivel de ingreso,' e puede asumir valo- res por arriba o por debajo del valor sistemtico dependiendo de los va- lores que alcancen las variables no explcitamente consideradas en el modelo, ii) Una segunda razn para incluir el trmino estocstico son los errores de medicin en la variable explicada. Los valores registrados de Y no reflejan los valores dados por la teora y representados en la ecuacin. En nuestro ejemplo, esto quiere decir que los errores de medi ci n en el ni vel de consumo de los hogares se consideran incorporados en e i i i ) En ocasiones se agrega como tercer factor la existencia de un elemento impredecible en la respuesta humana (J ohnston, 1984:14). Me parece que, detrs de la primera fuente que racionaliza la incor- poracin de un trmino estocstico en la ecuacin de regresin, se halla subyacente una imagen del mundo muy peculiar, segn la cual para te- ner una explicacin perfecta de la variable dependiente bastara con in- CORTS: CONSIDERACIONES EPISTEMOLGICAS 851 cluir todos y cada uno de sus factores condicionantes. El nico proble- ma que se podra presentar es que el nmero de incgnitas supere al de ecuaciones (o de observaciones, si se quiere) (J ohnston, 1984:14). A l estirar las consecuencias que entraa esta perspectiva se podra concluir que la acumulacin de datos sera un camino vlido para llegar a identi- ficar las determinantes de los fenmenos bajo estudio. L a idea que se esconde detrs de este planteamiento es que lo aleatorio surge de la i n- capacidad de los seres humanos para tratar la naturaleza multidimensio- nal de los fenmenos sociales. En esta concepcin lo aleatorio se define como un testigo de la incapacidad humana para dar cuenta de los proce- sos reales. Si el carcter estocstico del fenmeno se justifica de esta manera, la tercera fuente se transforma en un caso particular de la pri- mera. En efecto, el comportamiento humano sera aleatorio debido a que no conocemos todos los factores que lo determinan. Por lo tanto, las fuentes de la aleatoriedad se reduciran nicamente a dos, las mis- mas que estuvieron presentes en el origen del mtodo de estimacin m ni mo cuadrtico, en 1805. El mtodo de estimacin mnimo cuadrtico en su nacimiento estu- vo asociado a tres problemas planteados en el siglo xix: /) representar y determinar matemticamente los movimientos de la Luna; ii) dar cuenta de una desigualdad no peridica en los movimientos de los planetas J piter y Saturno; y Hi) determinar la forma de la Tierra. Todos estos problemas envolvan, por una parte, observaciones astronmicas, y por otra, la teora de la gravitacin (Stigler, 1986:17). Se trataba entonces de ajustar las ecuaciones derivadas de la teora a los resultados de las observaciones astronmicas. El ajuste implicaba ms ecuaciones que i ncgni tas en l a medida en que las primeras i ncl u an unos pocos parmetros y se tena un nmero apreciable de observaciones. Parecera que en estos estudios no se dudaba acerca de la teora; sta era tomada por buena, las desviaciones entre los resultados que arrojaba el modelo y los datos observados tenan su origen en los errores de medicin, los cuales obviamente eran considerados aleatorios. Quiero llamar la atencin sobre el hecho de que las ideas bsicas que originaron la tcnica m ni mo cuadrtica se encuentran presentes en las versiones modernas que justifican la inclusin del trmino estocstico en el modelo de regresin. Las teoras nos informan slo sobre los fac- tores relevantes que explican un fenmeno. El resto se incluye en el trmino estocstico que ayuda a medir qu tanto no estamos conside- rando en la explicacin estadstica. Segn esta concepcin existira la posibilidad de dar cuenta exhaustiva de un fenmeno, pero nos encon- tramos con la limitacin de que el nmero de factores es de tal magni- tud que sera prcticamente imposible recabar los datos necesarios para 852 ESTUDIOS SOCIOLGICOS X V : 45, 1997 tener ms ecuaciones que incgnitas. Adems, habra que considerar que de todas maneras existiran obstculos para emprender esta tarea, ya que la aleatoriedad surge tambin de los errores de medicin. De este breve anlisis se desprende la conclusin de que el poderoso paradigma newtoniano est subrepticiamente presente en una parte importante de l a estadstica aun al finalizar el siglo xx. El mtodo de mxi ma verosimilitud supone que las observaciones fueron generadas por una di stri buci n de probabilidades cuyos parmetros hay que estimar. Para llevar a cabo la estimacin se constru- ye l a funcin de verosimilitud, que es una medida de la incertidumbre en l a estimacin de valores hipotticos del o de los parmetros. Supon- gamos que el valor hipottico del parmetro 6 es 6', entonces la funcin de verosimilitud ser: L (G'/Y , M) =K (Y ) P (Y /0') donde la funcin de verosimilitud L representa la incertidumbre asocia- da a 0', dadas las observaciones (Y ) y el modelo (M). El mtodo consis- te en encontrar el valor de 0' que maximiza la verosimilitud de que el modelo haya generado los datos observados. Son muchos los recovecos tcnicos de este mtodo de estimacin, sin embargo dejaremos su pre- sentacin en este punto para enfocarnos hacia las ideas centrales que organizan esta forma de enfrentar el problema. Queremos destacar el hecho de que el planteamiento del mtodo de estimacin mxi mo verosmil introduce el supuesto de que las observa- ciones han sido generadas por un mecanismo aleatorio. Esto es una for- ma de "organizar" la experiencia. Reconoce un papel activo del sujeto: es ste quien decide si el modelo adecuado para representar un conjunto de datos es la distribucin binomial, multinomial, hipergeomtrica, exponencial, normal, etc. El modelo que se selecciona para representar l a distribucin observada de los datos no se elige arbitrariamente, sino que la decisin se apoya en el examen del procedimiento que se sigui para generar las observaciones y las caractersticas tericas de las distri- buciones de probabilidades. Razones esencialmente tcnicas han confinado al campo de la re- gresin al mtodo de estimacin mnimo cuadrtico as como sus deri- vaciones. Esto a pesar de que la tcnica de mxima verosimilitud aplica- da a la regresin lineal arroja, en esencia, los mismos resultados. Sin embargo, las nuevas tcnicas estadsticas multivariadas, de amplia aplica- cin en las ciencias sociales (anlisis de cohortes, anlisis de sobrevi- vencia, anlisis loglineal, regresin logstica), emplean el mtodo de mxi ma verosimilitud. Pero ambos procedimientos no slo poseen di - CORTS: CONSIDERACIONES EPISTEMOLGICAS 853 ferentes atributos que los hacen aplicables a problemas de naturaleza distinta, sino que conciben de manera diferente la aleatoriedad. En efec- to, el mtodo de estimacin m ni mo cuadrtico supone que la aleatorie- dad deriva de la incapacidad de especificar todas y cada una de las va- riables explicativas de Y , y de los errores en su medicin; l a idea central subyacente a este procedimiento es que sera posible dar cuenta exacta de la variable en cuestin. Esto es una posibilidad terica, ya que aun cuando se consideraran todas las variables explicativas habra que ge- nerar suficientes casos como para tener ms ecuaciones que incgnitas y estar as en condiciones de estimar los parmetros; en tanto que el mtodo de mxi ma verosimilitud reconoce que l a variable en s es aleatoria y que para realizar la estimacin se debe postular un modelo estadstico. En este planteamiento hay un reconocimiento explcito a la construccin conceptual de la experiencia as como del dato. En conclusin, los desarrollos estadsticos recientes, fuertemente con- dicionados por las demandas planteadas por las ciencias sociales, tienden a abandonar la naturaleza determinstica de la experiencia, remplazn- dola por una concepcin que reconoce el carcter aleatorio de la misma, y a reconocer el papel activo del sujeto en la construccin del objeto. Conclusin En una famosa conferencia, Albert Einstein recomienda a los interesa- dos en el mtodo de la fsica: "no escuches sus palabras [refirindose a los fsicos tericos], pon atencin a lo que hacen". 7 Haciendo un parale- lo podramos decir: no te fijes en lo que se dice respecto a la aplicacin de la estadstica en l a investigacin emprica, sino en lo que se hace en la investigacin. A partir de las concepciones de la epistemologa gentica el proceso de investigacin se puede ver como una espiral que se eleva por l a contradi cci n entre l a teora y las observaciones (Corts y Rubalcava, 1987:I ntroduccin). En este proceso la estadstica juega un papel central en la investigacin emprica. Algunas tcnicas estadsticas son ms propias para estudiar regula- ridades y verificar l a consistencia de las hiptesis con los datos (abs- traccin emprica), otras lo son para calibrar el sustento emprico de la aplicacin de las hiptesis a nuevos dominios empricos (abstraccin reflexiva). 7 The Herbert Spencer Lecture, Oxford, 10 de junio, 1933. 854 ESTUDIOS SOCIOLGICOS X V : 45, 1997 El desarrollo del anlisis causal ha llegado a la conclusin de que dada una relacin estadstica, el investigador debe establecer la causa- lidad desde fuera basado en consideraciones tericas y sustantivas. Esta idea se enriquece y precisa en el conocimiento desarrollado por la epis- temologa gentica. En efecto, esta corriente de pensamiento, basndo- se en minuciosas investigaciones empricas, ha concluido que las rela- ciones causales se conceptan como la atribucin de necesidad lgica y coherencia terica a la experiencia (Piaget y Garca, 1973; Halbwachs, 1977; Garca, 1986:51). Las diferentes concepciones de la aleatoriedad tienen fuerte rela- cin con el estudio de los sistemas dinmicos abiertos. L a equilibracin de las estructuras cognitivas (Piaget, 1975), una de las obras centra- les de la epistemologa gentica, es el estudio de la evolucin del siste- ma cognitive Una de las caractersticas centrales es que su desarrollo no es continuo, sino que evoluciona por niveles movindose hacia esta- dios de desarrollo superiores. L a acumulacin de contradicciones en un estadio desata el proceso de desequilibrio que lleva al sistema a un reequilibrio en otro estadio; este proceso no tiene lmite, est abierto por arriba. Uno de los temas que abre esta forma de conceptuar la evo- lucin del sistema cognitivo es el mecanismo de la equilibracin. Para entenderlo se puede recurrir a la idea de autoorganizacin de I lya Prigo gine(1979). L o que me interesa destacar es que la equilibracin combi- na momentos de estructuracin con otros dedesestructuracin. En los primeros la aleatoriedad se puede conceptuar como desconocimiento, mientras que en los segundos, como una caracterstica intrnseca de los fenmenos, sujeta a las leyes de la estadstica. Recibido en abril de1996 Revisado en diciembre de1996 Correspondencia: El Colegio de Mxico/Centro de Estudios Sociolgicos/Ca- mino al Ajusco 20/Col. Pedregal de Santa Teresa/C. P. 10740 Mxico, D. F./ fax 645 04 64 CORTS: CONSIDERACIONES EPISTEMOLGICAS 855 Bibliografa Asher, Herbert B. (1983), Ca u s a l Modeling, Berverly Hills, California, Sage Publications. Blalock, Hubert (1964), Causal Inference in Nonexperimental Research, Chapel Hill, The University of North Carolina Press. Borgatta, Edgard y George Bohrnstedt (eds.) (1970), Sociological Methodology 1 9 7 0 , San Francisco, Jossey-Bass. Boudon, Raymond (1968), L'analyse mathematique des f a i t socieux, Pars, Plon. Bunge, Mario (1979), L a investigacin cientfica: su estrategia y su filosofa, Barcelona, Ariel. Corts, Fernando y Rosa Mara Rubalcava (1987), Mtodos estadsticos apli- cados a la investigacin social: anlisis de asociacin, Mxico, El Cole- gio de Mxico. De Ipola, Emilio et al. (1976), Teora y mtodo p a r a el estudio de la estructura de clases en Chile (con un anlisis concreto: Chile, 1 9 7 0 ) , Santiago, Flacso-Proelce, tres volmenes. Einstein, Albert (1981), "On the methods of Theoretical Physics", en Cari Seeling (ed.), Albert Einstein Ideas and Opinions, Pars, Laurel Editions. Garca, Rolando (1986), "Conceptos bsicos para el estudio de sistemas com- plejos", en Enrique Leff (coord.), El problema del conocimiento y la pers- pectiva ambiental del desarrollo, Mxico, Siglo XXI. Gil, Antn Manuel (1985), Crtica epistemolgica a la concepcin de ciencia en Max Weber, Mxico, IPN, tesis de doctorado, Centro de Investigacin y de Estudios Avanzados del Instituto Politcnico Nacional. Halbwachs, Fr. (1977), "Reflexiones de la causalidad fsica", en Mario Bunge et al, Las teoras de la causalidad, Salamanca, Sigeme. Hempel, Cari G. (1965), "Problemas y cambios en el criterio empirista de signi- ficado", en A. J. Ayer, El positivismo lgico, Mxico, Fondo de Cultura Econmica. Holton, Gerald (1985), L a imaginacin cientfica, Mxico, Conacyt-Fondo de Cultura Econmica. Hume, David (1921), A n enquirity concerning human understanding and se- lectionsfrom a treatise of human na t ur e , Chicago, Open Court, Philo sophical classics, Religin of Science Library, nm. 45. Johnston, J. (1984), Econometric Methods, Singapur International Student Edition. Lazarsfeld, Paul (1974a), "La interpretacin de las relaciones estadsticas como propiedad de investigacin", en Raymond Boudon y Paul Lazarsfeld, Me- todologa de las ciencias sociales II: Anlisis emprico y causalidad, Bar- celona, Laia. (1974b), "El lgebra de los sistemas dicotmicos", en Raymond Boudon y Paul Lazarsfeld, Metodologa de las ciencias sociales II: Anlisis emp- rico y causalidad, Barcelona, Laia. 856 ESTUDIOS SOCIOLGICOS X V : 45, 1997 McKenzie, Donald (1979), "Eugenics and the Rise of Mathematical Statistics in Britain", en John Irvine, Ian Miles y J. Evans (eds.), Demystifying So- c i a l Statistics, Londres, Pluot Press. Miles, Ian y John Irvine (1979), "The Critique of Official Statistcs", en John Irvine, Ian Miles y J. Evans (eds.), Demystifying Social Statistics, Lon- dres, Pluot Press. Piaget, Jean (1975), L a e q u i l i b r a t i o n de las estructuras cognitivas: el proble- ma c e nt r a l del desarrollo, Espaa, Siglo XXI. y Rolando Garca (1973) ,Las explicaciones causales, Barcelona, Barral editores. (1982), Psicognesis e historia de la ciencia, Mxico, Siglo XXI. Prigogine, Ilya e Isabelle Stengers (1983), L a nueva a l i a n z a : metamorfosis de la ciencia, Madrid, Alianza Editorial. Przeworski, Adam y Henry Teune (1970), The Logic of Comparative Social Inquiry, Nueva York, John Wiley. Russell Hanson, Norwood (1965), Patterns of Discovery: An Inquiry into the Conceptual Foundations of Science, Londres, Cambridge University Press. Simon, Herbert (1957), "Spurious correlation a causal interpretation", en H. A. Simon, Models of Man; social and r a t i o na l , Nueva York, John Wiley. Stigler, Stephen M. (1986), The History of Statistics: The measurement of Uncertainty before 1 9 9 0 , Cambridge, Mass., Belknap. Stinchcombe, Arthur (1970), L a construction de teoras sociales, Buenos Aires, Nueva Visin. Torrado, Susana (1981), "Introduccin", en Susana Torrado, Investigacin e informacin sociodemogrficas 2: los censos de poblacin y vivienda en la dcada de 1 9 8 0 en Amrica L a t i n a , Buenos Aires, Clacso. , Miguel Acua y Vittorio Lorenzi (1976), Informe sobre la poblacin econmicamente activa en Amrica L a t i n a : 1 9 4 0 - 1 9 7 0 , Santiago, Proelce. Wright, Sewall (1921), "Correlation and Causation", Journal of the Ag r i c u l t u r a l Research, nm. 20.