You are on page 1of 8

Metodologa de la Investigacin Social I

Captulo 11: Nocin y estructura del dato


Guillermo Pablo Abritta

La nocin de dato se puede definir como aquella informacin extrada


de la realidad que tiene que ser registrada en algn soporte fsico o
simblico, que implica una elaboracin conceptual, y adems que se
pueda expresar a travs de alguna forma de lenguaje.
Los principales componentes se exponen a continuacin: (Segn Gil
Flores)
1. Una elaboracin conceptual.
2. Un contenido informativo.
3. un registro en algn soporte fsico.
4. La expresin de los mismos en alguna forma de lenguaje, y sea
numrico o no numrico.
Tales componentes operan durante todo el proceso de la
investigacin, esto es, desde la seleccin del tema, la elaboracin del
diseo y hasta el informe final, pero se plasman durante la etapa de
recoleccin de datos, a travs de la administracin de las tcnicas de
investigacin (encuesta, entrevista, cuestionario), que pueden ser
cualitativas o cuantitativas. Tambin est la alternativa mediante la
cual el investigador encuentra los datos que han sido producidos por
otros investigadores o investigados (datos de segunda mano).
En este sentido, Galtung define el trmino dato de la siguiente
manera: Todo dato es una Unidad de anlisis que en una Variable
asumir un determinado Valor.
- Unidad de Anlisis: son los elementos menores y no divisibles que
componen el universo de estudio de una investigacin. (pueden ser
individuos o colectivos sociales)
- Variable: Un concepto acerca de algn aspecto de una unidad de
anlisis capaz de asumir diferentes magnitudes.
- Valor o categoras: Es una de las diferentes alternativas que
presenta la variable, donde alguna es adoptada por la unidad de
anlisis.
As, para este autor, lo que constituye un dato son estos tres
elementos considerados de forma conjunta a travs de las relaciones
que mantienen entre s.
Otro autor, Samaja, agrega a sta ecuacin el componente
indicadores, que permiten calcular el valor de la variable, es decir,
permiten aproximarnos al conocimiento de ciertas caractersticas de

1
un objeto que no se pueden medir directamente (una variable
compleja; alto grado de abstraccin).

Clasificacin de los datos


Las fuentes de datos son clasificadas en:
- Fuentes primarias: Aquellos que son relevados por el investigador
para realizar el estudio. Su ventaja es que los mismos responden al
problema, delimitacin, objetivos y perspectiva terica. La desventaja
que tienen los estudios con los datos primarios es que los costos
suelen ser muy elevados.
- Fuentes secundarias: Aquellos datos que han sido relevados por otro
investigador pero que son usados por el para realizar la investigacin.
Su ventaja es que tienen costos reducidos o nulos. Su desventaja es
muy probable que dichos datos hayan sido recogidos en funcin de
otra problemtica, otros objetivos y perspectiva terica.
- Fuentes mixtas: Implica la combinacin en un mismo estudio de
datos primarios y secundarios (tanto cualitativos como cuantitativos).
Los datos pueden ser:
- Datos numricos: datos duros, se rigen por tcnicas estadsticas.
- Datos no numricos: datos blandos, como por ejemplo, notas de
campo.
Tipologa de los datos:
Datos
Primarios Secundarios
Primarios Secundarios
Numricos
Datos Numricos Numricos
Primarios Secundarios
No Numricos
No Numricos No Numricos

Confeccin de una matriz de datos


Una vez realizado el trabajo de campo y hecha la revisin (o edicin)
de los datos obtenidos, es necesario efectuar el procesamiento de los
datos, es decir, que los mismos se preparan para se analizados, para
eso se utilizan dos tcnicas de elaboracin de los datos, codificacin y
tabulacin (Pg. 4).
- La codificacin: (perspectiva cuantitativa) es un procedimiento
tcnico mediante el cual los datos obtenidos se clasifican en
categoras y se traducen en smbolos, es decir, se asigna a cada
opcin de respuesta un nmero o una letra que permita tabularla
rpidamente. Desde un punto de vista lgica, la codificacin depende
del sistema de categoras o valores que adopte la variable o
alternativas que presente la pregunta de la encuesta.

2
- Matriz de datos: se lleva a cabo una vez realizada la codificacin de
datos. La matriz de datos es un modo de ordenar los datos de manera
que sea particularmente visible la forma tripartita (unidad de anlisis,
variable y valor).
En efecto, cada fila de la matriz Matriz de datos
corresponde a una unidad de
anlisis, cada columna a una Unidad de Variables
variable, y en cada celda figura el anlisis
V1 V2 V3 V4
valor que cada unidad asume para
cada variable (las respuestas dadas). UA1 1 1 30 2
As su configuracin es como una UA2 2 2 27 3
planilla electrnica de clculo,
compuesta por filas, columnas y UA3 2 1 43 3
celdas. UA4 1 4 19 1
UA5 1 3 60 1
Ejemplo

Referencia de la matriz de
datos
UA: Unidad de anlisis.
V: Variable.
La forma misma de la matriz y la
V3. Edad: definicin conducen a los 3
V1. Sexo:
Pregunta principios de Galtung:
1. Masculino. abierta.
1) Principio de comparabilidad: se
2. Femenino.
afirma que cada combinacin de
unidad de anlisis/ variable debe
tener sentido, es decir, debe ser
V2. Estado V4. NSE: verdadero o falso que dicha
1. Bajo. combinacin brinde un
civil:
2. Medio. determinado valor. Por lo tanto, las
1. Soltero. 3. Alto. variables han de ser en la matriz,
2. Casado. variables de la unidad a investigar.
3. Divorciado. 2) Principio de clasificacin: implica
4. Viudo. que el sistema de categoras de
una variable debe cumplir con dos
requisitos lgicos, los principios de exhaustividad y exclusividad.
Exhaustivo en el sentido de que ninguna unidad de anlisis quede
fuera del sistema de categoras, y excluyente de manera que cada
unidad de anlisis asuma un valor en cada variable.
Adems, segn Erradonea, existe un tercer requisito, que el sistema
de categoras de una variable debe responder a una sola idea (al
mismo criterio clasificatorio).
3) Principio de integridad: a diferencia de los dos primeros que aluden
a la lgica de la matriz, ste se refiere al trabajo emprico de llenar la

3
matriz, y dice que no se debe dejar ninguna celda vaca. En otras
palabras, la cantidad de celdas sin informacin debe ser lo ms baja
posible.

Diferentes tipos de anlisis que se pueden efectuar de una


matriz de datos
1) Anlisis centrado en la variable: (anlisis vertical) aqu los valores
que corresponden a las diferentes unidades se comparan conforme al
principio de comparabilidad. En otras palabras, para cada valor o
categora posible se da el nmero de unidades de anlisis que tienen
ese valor (o categora) de la variable. Este tipo de anlisis tiene un
perfil bsicamente univariable y cuantitativo.
2) Anlisis centrado en la unidad de anlisis: (anlisis horizontal) en el
mismo se analizan las filas separadamente, en cuanto a la
informacin que dan acerca de las unidades de anlisis. Los valores
de las diferentes variables no son comparables, por lo tanto es un tipo
de anlisis con un perfil ms cualitativo.
3) Anlisis combinado: (anlisis vertical y horizontal) puede ser
bivariable o multivariable. Adems se puede comenzar con un anlisis
horizontal (construyendo un ndice), y luego se puede efectuar un
anlisis vertical en una nueva columna (incorporando los valores que
aporta el ndice para todas las unidades).

Tabulacin de datos
Luego de confeccionar la matriz de datos, se procede a la tabulacin
de los mismos. Este es el proceso mediante el cual los datos
recopilados se organizan y concentran, con base a determinadas
ideas o hiptesis, en tablas o cuadros para su tratamiento estadstico.
Entonces, tabular es contar las unidades de anlisis que estn en
cada categora de una variable. As, la tabulacin puede ser:
- Simple: univariable.
- Cruzada: bivariable o multivariable.
Por supuesto que esto requiere un plan de tabulacin, esto es,
determinar de antemano qu resultados de las variables se van a
presentar y cules relaciones entre las mismas se van a analizar, con
el fin de brindar respuesta al problema y objetivos formulados.
Luego de contar las unidades que hay por cada categora, se procede
al recuento, para saber la frecuencia absoluta, y a partir de sta se
obtiene la frecuencia relativa o porcentual. Como resultado se obtiene
una tabla (con su respectivo nmero y ttulo).
Ejemplo 1 de tabulacin
Siguiendo la matriz de datos usada a modo de ejemplo, supondremos
que es una tabulacin simple univariada (v: sexo):

4
Tabla N1
Distribucin segn sexo

Sexo Frecuencia Frecuencia


Absoluta Porcentual
1) Masculino 3 60%

2) Femenino 2 40%

Total 5 100%

- Frecuencia absoluta: es el nmero de veces que se observa cada


valor o categora de la variable.
- Frecuencia relativa o porcentual: resulta de dividir cada una de las
frecuencias absolutas de la tabla sobre el total de casos, y
multiplicando el resultado por 100.
Ejemplo
Siguiendo el anterior ejemplo, y tomando la frecuencia absoluta de la
categora masculino sera:
3/5= 0,6 *100= 60%
* Tambin not que se puede hacer con regla de tres simple: (no es la
forma que indica el libro) 3*100=300/5= 60%
- Grfico: en caso que as se decida, a partir de la distribucin se
puede elaborar un grfico para visualizar la misma.
Ejemplo
Distribucin de la muestra segn sexo

Ejemplo 2 de tabulacin
Siguiendo la matriz de datos de ejemplo, se supondr que es una
tabulacin cruzada bivariada: v1: sexo y v2: estado civil.
Como resultado del cruce de estas dos variables, la tabla va a constar
de 8 celdas de cruce, correspondientes a las 8 posibles
combinaciones que se tienen como resultado de la relacin de las
categoras de ambas variables. Cada celda, donde se da el cruce de

5
las variables, va a tener el nmero de veces que una unidad de
anlisis eligi esa combinacin de categoras de las variables. (Se
supone que al ser una gran cantidad de casos, no como en el
ejemplo, ninguna celda estar vaca).
Tabla N1
Estado civil segn sexo
Estado 1. 2. Femenino Total
civil Masculino
1. Soltero 1 1 2
2. Casado 1 1
3. 1 1
Divorciado
4. Viudo 1 1
Total 3 2 5
Esta es
una tabla de contingencia.
Anlisis e interpretacin de los datos
Una vez que se ha concluido con la recoleccin, codificacin y
tabulacin de los datos, sigue la etapa de anlisis y luego de
interpretacin de los datos.
- Anlisis de los datos: consiste en separar los elementos bsicos de
la informacin y examinarlos con el propsito de responder a las
distintas cuestiones planteadas en la investigacin. En otras palabras,
consiste en descomponer la informacin, para lo cual es necesario
efectuar previamente un plan de anlisis. Este consiste en describir
el tipo de tratamiento (cuantitativo/cualitativo) que se le dar a la
informacin.
- Interpretacin de datos: es el proceso mental mediante el cual se
trata de encontrar un significado ms amplio de la informacin
emprica recabada. En otras palabras, apunta a darle sentido a los
datos, efectuando una recomposicin terica para luego redactar el
informe final de la investigacin.
* Tabla de contingencia: consiste en un cierto nmero de celdas en las
que, como resultado de un proceso de tabulacin, se han volcado las
frecuencias absolutas correspondientes a cada combinacin de
valores de varias variables.
El nmero de celdas en una tabla de contingencia vara en funcin del
nmero de categoras que tengan las variables incluidas en ella.
La combinacin mnima posible es de 2x2 (4 celdas), es decir, dos
valores (categoras) x dos valores (categoras), y de ah, en ste caso
mnimo se desprenden 4 combinaciones posibles.
Ejemplo
Siguiendo el ejemplo anterior la combinacin sera de 2 valores
posibles (sexo: masculino/ femenino) x 4 valores posibles (estado

6
civil: soltero/ casado/ etc.), siendo un total de 8 combinaciones
posibles.
Esto se puede representar de la siguiente manera, que sera
equivalente al cuadro anterior (Tabla N1, estado civil segn sexo):

Definiciones:
1) n se denomina frecuencia de orden cero, ya que no se refiere a
ninguna variable, sino que representa a la totalidad de unidades que
conforman la muestra o el universo.
2) Se denomina frecuencias marginales o de primer orden a las
frecuencias que estn horizontal y vertical a n. Estas son
frecuencias respecto a una sola variable por vez.
3) A las frecuencias del interior del cuadro se las denomina
frecuencias condicionales o de segundo orden. Se refieren a la
relacin entre dos variables de manera simultnea. Aqu cada unidad
asume un valor de X y un valor de Y, de manera combinada. Por
ejemplo: X1Y1, asume el valor 1.

Anlisis de los datos


Segn Baranger, el primer paso de cualquier anlisis es verificar si se
cumplen las relaciones aritmticas que debe satisfacer cada cifra; en
caso contrario hay algn error en la tabulacin.

7
8

You might also like