Professional Documents
Culture Documents
CURSO DE GEOESTADISTICA I
TEMA 4: VARIABLES Y DISTRIBUCION DE
FRECUENCIAS
Por: Ing. MSc. Roger Gonzales Aliaga
Variables.
Elementos bsicos de la geoestadstica
Resumen de informacin muestral
Tablas estadsticas y distribucin de frecuencias
Grficos estadsticos
1. VARIABLES
Las observaciones o mediciones sobre los elementos de una poblacin constituyen la materia
prima con la cual se trabaja en Geoestadstica. La variable estadstica se representan con un
smbolo o letra mayscula tal como X, Y, Z, A, etc. Ahora los valores que puede tomar una
variable se representan mediante letras minsculas x1 , x2 , x3 . Xn.
Si la variable toma un solo valor se denomina constante; se acostumbra clasificar las variables en
dos grandes grupos.
Es necesario distinguir los diversos tipos de variables que puedan encontrar en diversos tipos de
estudios e investigaciones, de acuerdo a esto las se dividen en:
1.1. Segn su naturaleza las variables pueden ser de dos tipos:
a) Variables cualitativas o estadsticas de atributos: expresan una cualidad caracterstica o
atributo tienen carcter cualitativo, no se pueden medir numricamente (por ejemplo: tipo de
alteracin en un afloramiento, estado de alteracin de una roca, nacionalidad, color de la piel,
sexo, etc.).
b) Variables cuantitativas: tienen valor numrico (edad, ley de mineral, contenido de arsnico
en una muestra de agua, contenido de mercurio en la piel de una trucha, contenido de oro en
una veta (ley), el pH, la temperatura del agua de un rio, precio del platino o de la plata, ingresos
anuales por canon minero, etc.).
1. VARIABLES
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
variables discretas
Una variable discreta es aquella que puede asumir valores enteros o mejor dicho que varen de
un en uno. Por ejemplo el numero de personas que habitan en una casa el numero de dientes en
una rueda dentada.
variables continuas
Una variable continua es cuando puede tomar cualquier valor, dependiendo principalmente de
la precisin con que se trabaje. As por ejemplo los resultados de leyes o contenidos de un
agente contaminante en un rio , que puede ser: 100.27 ppm de Hg, la velocidad de un vehculo
puede ser 80,3 km/h, ley de mineral (g/tn), rea, volumen...etc.
1.2. Segn la relacin entre variables:
a) Variables dependientes, son aquellas que se explican por otras variables, son los efectos o
los resultados respecto a los cuales hay que buscar su motivo, causa o razn de ser. Es la
variable que traduce la consecuencia del efecto de una o varias razones o causas de otras
variables.
b) Variables independientes, son las variables explicativas o predictivas, cuyas asociacin,
relacin o influencia en la variable dependiente se pretende describir en la investigacin.
1. VARIABLES
Variables categorizadas
En contraposicin a las variables cuantitativas, aqu hacemos referencia a aquellas
variables cuya escala de medida es un conjunto de categoras. Entre ellas podemos
distinguir al menos:
Categorizadas nominales, como la orientacin de un conjunto de vetas que se
podra considerar como Norte, Sur, Este, Oeste o la combinacin de estas.
Normalmente estas variables se utilizan en Geologa Estructural con un diagrama de
roseta.
Categorizadas ordinales, como el grado de alteracin de una roca que puede ser
"severo", "moderado" o "leve.
Es importante sealar que las variables continuas se pueden discretizar (por ejemplo
tomando intervalos) y as ser tratadas como discretas o que cuando una variable discreta
asume una gran variedad de valores.
a.
a.
Los datos o valores que alcanzan las unidades en las variables estudiadas, las cuales
son las respuestas o resultados que se obtienen luego de un anlisis geoqumico de
una muestra de roca.
b.
c.
d.
e.
f.
Columna
matriz
Encabezamiento
Prospecto
2009
2010
2011
Total
Rio Blanco
120
200
521
841
Rio Azul
135
125
112
372
Rio Rojo
140
129
30
299
Rio Negro
110
122
32
264
Total
505
576
695
1776
Fuente
Nota
Pie
Titulo
Cuerpo
Yi=Yi-1 Yi+1
Ahora se denomina frecuencia absoluta al nmero de veces que el valor de la variable
se repite en el conjunto de datos y se representa por (fi). La frecuencia absoluta
acumulada es la suma de los valores de la columna de fi, por lo tato el ultimo valor debe
ser igual a n; a la frecuencia absoluta acumulada se le representa por (Fi).
Otra columna importante dentro de la tabla de frecuencias, es la frecuencia relativa (hi)
que asociada con un valor dado, puede ser considerada como una estimacin de la
probabilidad de ocurrencia de dicho valor. Una propiedad que cumplen las frecuencias
relativas es que su suma es igual a 1. La sumatoria de la frecuencia relativa debe ser
igual a 1.
En la sexta columna se calculan las frecuencias relativas acumuladas (Hi), sumando las
frecuencias relativas de la misma manera que se sumaron las frecuencias absolutas para
obtener las absolutas acumuladas. Ahora el ultimo valor de Hi debe ser igual a 1 como
dice la propiedad antes mencionada.
Yi-1 - Yi+1
Marca de clase
Frecuencia
absoluta
Frecuencia absoluta
acumulada
Frecuencia
relativa
Frecuecnia relativa
acumulada
Yi
fi
Fi
hi
Hi
0.07
- 1.49
0.78
50
50
0.71
0.71
1.49
- 2.91
2.20
57
0.10
0.81
2.91
- 4.33
3.62
65
0.11
0.93
4.33
- 5.75
5.04
66
0.01
0.94
5.75
- 7.17
6.46
68
0.03
0.97
7.17
- 8.59
7.88
69
0.01
0.99
8.59
- 10.01
9.30
70
0.01
1.00
TOTAL
70
Curso
Nota
Xi
Geofsica
13.52
Geoestadstica
14.20
Mineraloga
13.80
Hidrogeologa
17.12
Petrologa
11.30
5. GRAFICOS ESTADISTICOS
Para la representacin de una distribucin los grficos son las formas usuales de
presentar las distribuciones teniendo la ventaja de que las hacen mas intelegibles.
Los grficos son las representaciones visuales de los datos en donde se evidencian
fundamentalmente 3 caractersticas:
a.
b.
c.
Forma
Acumulacin o tendencia
Dispersin o variabilidad
5. GRAFICOS ESTADISTICOS
Las partes de un grafico estadstico son:
a.
b.
5. GRAFICOS ESTADISTICOS
c. Cuerpo del grfico, es la ilustracin de los valores asociados a los datos presentados
mediante los siguientes elementos:
Figura Conjunto de puntos, lneas, barras, polgonos o figuras utilizados en la
representacin de los datos estadsticos.
Escala o eje de valores Es la lnea recta segmentada que representa la escala de medicin
a la que corresponden los datos estadsticos del grfico. Si se visualizan los rtulos de
datos, es optativo mostrar u ocultar el eje de valores.
Leyenda Es la descripcin de la simbologa utilizada, sea sta mediante colores,
densidades de color, sombreados o tipos de lnea usados para diferenciar conceptos a los
que se refieren los datos estadsticos. Contiene una muestra de la simbologa y el rtulo
del concepto con que se asocia. Corresponde a las caractersticas que en el ttulo,
generalmente, vienen precedidas de la preposicin "por".
d. Pie del grfico, constituye la parte inferior del grfico y comprende las notas, llamadas y
fuente. Se destina para anotar aquellas aclaraciones o sealamientos particulares y
generales sobre la informacin, necesarios para una mejor interpretacin de sta por
parte del usuario. Si los grficos estn acompaados de cuadros, el uso del pie de grfico
es optativo.
5. GRAFICOS ESTADISTICOS
Piura
Titulo
600
Figura
500
Leyenda
400
Eje de valores
Ao 2009
300
Ao 2010
Cuerpo
Ao 2011
200
100
Eje de conceptos
0
Rio Blanco
Fuente
Nota
Rio Azul
Rio Rojo
Rio Negro
Pie
5. GRAFICOS ESTADISTICOS
Principales clases o tipos de grficos:
a.
b.
c.
d.
e.
f.
g.
h.
i.
j.
k.
l.
m.
n.
Histogramas y polgonos
Polgono de frecuencia
Ojiva
Grficos lineales
Diagrama de frecuencias
Crono diagramas
Lnea de regresin
Grafico tela de araa
Grafico de barras
Grficos circulares
Grafico de pirmide
Estereogramas (3D)
Pictogramas
Cartogramas (mapas)
5. GRAFICOS ESTADISTICOS
Grficos lineales, son aquellas que representan la informacin a travs de
lneas, rectas o curvas. Como ejemplo graficaremos las notas de 10 semestres de
un alumno de geologa.
Notas por semestre
Semestre
Promedio
11
18
II
14
16
III
12
14
IV
13
15
VI
12
VII
13
VIII
11
IX
15
16
12
10
Promedio
8
6
4
2
0
I
II
III
IV
VI
VII
VIII
IX
5. GRAFICOS ESTADISTICOS
Crono diagramas, son diagramas lineales, se utilizan cuando se trabajan con
series de tiempo en el eje X pueden ir los aos meses, das, horas, etc. Como
ejemplo graficaremos la produccin de cobre en sud Amrica de Per y Chile.
450000
Aos
Produccin de cobre
400000
350000
Per
Chile
1980
269000
197000
300000
1981
297000
250000
250000
1982
310000
295000
200000
1983
245000
360000
150000
1984
210000
420000
100000
Peru
Chile
50000
0
1980
1981
1982
1983
1984
5. GRAFICOS ESTADISTICOS
Grfico de barras, se construye sobre el sistema de ejes cartesianos. Para cada
categora se traza una barra vertical en que la altura es la frecuencia absoluta de
la categora; el ancho de la barra es arbitrario pero tiene la misma dimensin.
Graficaremos la desnutricin crnica en el ao 1999.
200000
180000
Sexo
Nios
censados
Desnutridos
Normales
crnicos
160000
140000
120000
100000
Masculino
333183
161494
171689
Femenino
320671
176353
144318
60000
Total
653854
337847
316007
40000
Nios normales
80000
Desnutridos cronicos"
20000
0
Masculino
Femenino
5. GRAFICOS ESTADISTICOS
Grfico circular o torta, esta es otra forma de representar los datos, en especial cuando se
trata de cualidades. Es un grfico dibujado desde dentro de un crculo; para esto es
necesario calcular el porcentaje de cada categora respecto del total y luego repartir
proporcionalmente estos porcentajes en los 360 del crculo.
Para transformar la frecuencia relativa a grados sexagesimales se aplica el siguiente
mtodo.
Como ejemplo pondremos al numero de clientes que trabajan en el sector minero en los
cuatro bancos principales de nuestro pas.
Bancos
Nro. de
clientes
Grados
Banco de Crdito
Banco Continental
Banco Scotiabank
Banco de la Nacion
Total
10000
5000
3500
2000
20500
48.8
24.4
17.1
9.8
100
175.6
87.8
61.5
35.1
360
Banco de Credito
Banco Continental
Banco Scotiabank
Banco de la Nacion
5. GRAFICOS ESTADISTICOS
Histogramas y polgonos de frecuencia, se construyen sobre el sistema de
coordenadas cartesianas. Se utiliza cuando la variable en estudio es continua o esta
agrupada en una tabla de frecuencia con intervalos en cada categora.
En el eje X se identifica la variable en estudio y en el eje Y s grfica la frecuencia
absoluta o la frecuencia relativa. Consiste en una serie de rectngulos en donde su
altura depende del valor de cada frecuencia.
Cada categora de la variable se representa por una barra. El ancho de cada barra
depende de la amplitud del intervalo.
El polgono se grfica uniendo la punta superior de cada barra por segmento de
recta. Para que el polgono quede cerrado se considera un punto en la recta
horizontal, antes y despus de las anotadas.
El polgono se dibuja midiendo los puntos medios de cada barra, que corresponde a
la marca de clase.
5. GRAFICOS ESTADISTICOS
El polgono se dibuja midiendo los puntos medios de cada barra, que corresponde a
la marca de clase.
5. GRAFICOS ESTADISTICOS
Histogramas y ojivas, tambin se grfica la columna de frecuencia absoluta
acumulada. El grfico siempre ser en forma ascendente. La ojiva se dibuja midiendo
segmentos de recta en la parte superior de cada barra, y no se cierra.
5. GRAFICOS ESTADISTICOS
Barras subliminales, es un grfico de barras muy apropiado para comprobar
subdivisiones en la variable. Por ejemplo: % de estudiantes en diferentes carreras,
separadas por sexo. Cada barra es un 100%.
5. GRAFICOS ESTADISTICOS
EJEMPLO en el aso de una variable discreta; en una
unidad minera ubicada al sur del Per, la
asistenta social hizo una encuesta para un
presupuesto familiar, a 21 trabajadores respecto
a n de hijos en cada familia.
Variable x = n de hijos
Los datos son los siguientes:
3, 1, 2, 0, 3, 2, 1, 1, 3, 3, 2, 4, 2, 2, 0, 2, 1, 3, 4, 2, 3
x1 x2
x21