You are on page 1of 48

ESTIMACION GEOESTADISTICA DE RESERVAS

ING. REYNALDO CANAHUA LOZA

CAPITULO I
ESTADISTICA DESCRIPTIVA DE DATOS

2.1 LA ESTADISTICA DESCRIPTIVA Es una ciencia que analiza series de datos (por ejemplo, edad de una poblacin, altura de los estudiantes, temperatura en los meses de verano, leyes de mineralizacion, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables. Las variables pueden ser de dos tipos: A) Variables cualitativas o atributos: no se pueden medir numricamente (por ejemplo: nacionalidad, color de la piel, estrato, tipo de roca, etc). B) Variables cuantitativas: tienen valor numrico (edad, precio de un producto, ley de mineral, dureza, etc).

Las variables tambin se pueden clasificar en:

1)Variables unidimensionales: slo recogen informacin sobre una caracterstica (por ejemplo: ley de mineral, edad de los alumnos de una clase). 2) Variables bidimensionales: recogen informacin sobre dos caractersticas de la poblacin (por ejemplo: ley y profundidad). 3)Variables pluridimensionales: recogen informacin sobre tres o ms caractersticas (por ejemplo: ley, profundidad, tipo de roca).

Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas: a) Discretas: slo pueden tomar valores enteros (1, 2, 8, etc.). Por ejemplo: Dureza de la roca, nunca podr ser 3,45). b)Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la ley del taladro puede ser 0,89 %, 94,57 km/h...etc.

Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:

Individuo: cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si estudiamos la ley de Cu de un taladro, cada taladro es un individuo; si estudiamos el precio de los metales, cada metal es un individuo. Poblacin: conjunto de todos los individuos (personas, objetos, etc.) que porten informacin sobre el fenmeno que se estudia. Por ejemplo, si estudiamos el precio de los metales en una zona, la poblacin ser el total de minas de dicha zona. Muestra: subconjunto que seleccionamos de la poblacin. As, si se estudia la ley de un yacimiento, lo normal ser no recoger informacin sobre todo el yacimiento (sera una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo (taladros diamantinos)

2.2 Distribucin de frecuencia


La distribucin de frecuencia es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recogido sobre la variable que se estudia.
Distribucin de frecuencia

La distribucin de frecuencia es la representacin estructurada, en forma de tabla, de toda la informacin que se ha recogido sobre la variable que se estudia. Variable (Valor) x Frecuencias absolutas Simple x Acumulada x Frecuencias relativas Simple x Acumulada x

X1
X2 ... Xn-1 Xn

n1
n2 ... nn-1 nn

n1
n1 + n2 ...

f1 = n1 / n
f2 = n2 / n ...

f1
f1 + f2 ...

n1 + n2 +..+ f1 + f2 +..+fnfn-1 = nn-1 / n nn-1 1 Sn fn = nn / n Sf

Siendo X los distintos valores que puede tomar la variable. Siendo n el nmero de veces que se repite cada valor. Siendo f el porcentaje que la repeticin de cada valor supone sobre el total

Veamos un ejemplo: Medimos la ley de Cu para un yacimiento el cual se muestreado por canales obtenemos los siguientes resultados (%):

Muestra x Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6 Muestra 7 Muestra 8 Muestra 9 Muestra 10

Ley (%) x 1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29

Muestra x Muestra 11 Muestra 12 Muestra 13 Muestra 14 Muestra 15 Muestra16 Muestra17 Muestra 18 Muestra19 Muestra20

Ley (%) x 1,23 1,26 1,30 1,21 1,28 1,30 1,22 1,25 1,20 1,28

Muestra x Muestra 21 Muestra 22 Muestra 23 Muestra 24 Muestra 25 Muestra 26 Muestra 27 Muestra 28 Muestra 29 Muestra 30

Ley (%) x 1,21 1,29 1,26 1,22 1,28 1,27 1,26 1,23 1,22 1,21

Si presentamos esta informacin estructurada obtendramos la siguiente tabla de frecuencia:


Variable (Valor) x 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 Frecuencias absolutas Simple x 1 4 4 2 1 2 3 3 4 3 3 Acumulada x 1 5 9 11 12 14 17 20 24 27 30 Frecuencias relativas Simple x 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% Acumulada x 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces conviene agruparlos por intervalos, ya que de otra manera obtendramos una tabla de frecuencia muy extensa que aportara muy poco valor a efectos de sntesis. (tal como se ver en la siguiente leccin).

Distribuciones de frecuencia agrupada Supongamos que la ley de las muestras nos dan los siguientes resultados (%):
Muestra Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6 Muestra 7 Muestra 8 Muestra 9 Muestra 10 (%) 1,15 1,48 1,57 1,71 1,92 1,39 1,40 1,64 1,77 1,49 Muestra Muestra 11 Muestra 12 Muestra 13 Muestra 14 Muestra 15 Muestra 16 Muestra 17 Muestra 18 Muestra 19 Muestra 20 (%) 1,53 1,16 1,60 1,81 1,98 1,20 1,42 1,45 1,20 1,98 Muestra Muestra 21 Muestra 22 Muestra 23 Muestra 24 Muestra 25 Muestra 26 Muestra 27 Muestra 28 Muestra 29 Muestra 30 (%) 1,21 1,59 1,86 1,52 1,48 1,37 1,16 1,73 1,62 1,01

Si presentramos esta informacin en una tabla de frecuencia obtendramos una tabla de 30 lneas (una para cada valor), cada uno de ellos con una frecuencia absoluta de 1 y con una frecuencia relativa del 3,3%. Esta tabla nos aportara escasa informacin

: En lugar de ello, preferimos agrupar los datos por intervalos, con lo que la informacin queda ms resumida (se pierde, por tanto, algo de informacin), pero es ms manejable e informativa:
Ley % Frecuencias absolutas Simple Acumulada Frecuencias relativas Simple Acumulada

x
1,01 - 1,10 1,11 - 1,20 1,21 - 1,30 1,31 - 1,40 1,41 - 1,50 1,51 - 1,60 1,61 - 1,70 1,71 - 1,80

x
1 3 3 2 6 4 3 3

x
1 4 7 9 15 19 22 25

x
3,3% 10,0% 10,0% 6,6% 20,0% 13,3% 10,0% 10,0%

x
3,3% 13,3% 23,3% 30,0% 50,0% 63,3% 73,3% 83,3%

1,81 - 1,90
1,91 - 2,00

2
3

27
30

6,6%
10,0%

90,0%
100,0%

El nmero de tramos en los que se agrupa la informacin es una decisin que debe tomar el analista: la regla es que mientras ms tramos se utilicen menos informacin se pierde, pero puede que menos representativa e informativa sea la tabla.

2.3 Medidas de posicin central

Las medidas de posicin nos facilitan informacin sobre la serie de datos que estamos analizando. Estas medidas permiten conocer diversas caractersticas de esta serie de datos. Las medidas de posicin son de dos tipos:

a) Medidas de posicin central: informan sobre los valores medios de la serie de datos.
b) Medidas de posicin no centrales: informan de como se distribuye el resto de los valores de la serie.

a) Medidas de posicin central

Las principales medidas de posicin central son las siguientes: 1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las ms utilizadas: a) Media aritmtica: se calcula multiplicando cada valor por el nmero de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra:

Xm =

(X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn) --------------------------------------------------------------------------------------n

b) Media geomtrica: se eleva cada valor al nmero de veces que se ha repetido. Se multiplican todo estos resultados y al producto final se le calcula la raz "n" (siendo "n" el total de datos de la muestra). Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la media geomtrica.

La media geomtrica se suele utilizar en series de datos como tipos de inters anuales, inflacin, etc., donde el valor de cada ao tiene un efecto multiplicativo sobre el de los aos anteriores. En todo caso, la media aritmtica es la medida de posicin central ms utilizada

2.- Mediana: Es el valor de la serie de datos que se sita justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores). No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su clculo toda la informacin de la serie de datos (no pondera cada valor por el nmero de veces que se ha repetido). 3.- Moda: Es el valor que ms se repite en la muestra.

Ejemplo: vamos a utilizar la tabla de distribucin de frecuencias con los datos de las leyes del muestreo por canales.

Variable (%) x 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30

Frecuencias absolutas Simple x 1 4 4 2 1 2 3 3 4 3 3 Acumulada x 1 5 9 11 12 14 17 20 24 27 30

Frecuencias relativas Simple x 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% Acumulada x 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

Vamos a calcular los valores de las distintas posiciones centrales: 1.- Media aritmtica:

(1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3) Xm = -------------------------------------------------------------------------------------------------30

Luego: Xm = 1,253 Por lo tanto, la ley media de este grupo de muestras es de 1,253 % Cu.

2.- Media geomtrica: X = ((1,20^ 1) * (1,21^4) * (1,22^ 4) * .....* (1,29^3)* (1,30^3)) ^ (1/30)

Luego: Xm = 1,253

En este ejemplo la media aritmtica y la media geomtrica coinciden, pero no tiene siempre por qu ser as

3.- Mediana: La mediana de esta muestra es 1,26 , ya que por debajo est el 50% de los valores y por arriba el otro 50%.

Esto se puede ver al analizar la columna de frecuencias relativas acumuladas.


En este ejemplo, como el valor de la ley 1,26 se repite en 3 ocasiones, la media se situara exactamente entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la divisin entre el 50% inferior y el 50% superior.

4.- Moda:

Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto esta seria cuenta con 3 modas.

2.4 Medidas de posicin no central


Medidas de posicin no centrales Las medidas de posicin no centrales permiten conocer otros puntos caractersticos de la distribucin que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales: Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.

Ejemplo: Vamos a calcular los cuartiles de la serie de datos referidos a la ley del yacimiento. Los deciles y centiles se calculan de igual manera, aunque hara falta distribuciones con mayor nmero de datos.
(Ley) x 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 Simple x 1 4 4 2 1 2 3 3 4 3 3 Acumulada x 1 5 9 11 12 14 17 20 24 27 30 Simple x 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% Acumulada x 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

1 cuartil: es el valor 1,22 ya que por debajo suya se sita el 25% de la frecuencia (tal como se puede ver en la columna de la frecuencia relativa acumulada). 2 cuartil: es el valor 1,26 ya que entre este valor y el 1 cuartil se sita otro 25% de la frecuencia. 3 cuartil: es el valor 1,28 ya que entre este valor y el 2 cuartil se sita otro 25% de la frecuencia. Adems, por encima suya queda el restante 25% de la frecuencia.

2.5 Medidas de dispersin


Estudia la distribucin de los valores de la serie, analizando si estos se encuentran ms o menos concentrados, o ms o menos dispersos. Existen diversas medidas de dispersin, entre las ms utilizadas podemos destacar las siguientes: 1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor ms elevado y el valor ms bajo. 2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el nmero de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamao de la muestra.

La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms concentrados estn los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms dispersos estn.

3.- Desviacin tpica: Se calcula como raz cuadrada de la varianza.

4.- Coeficiente de variacin de Pearson: se calcula como cociente entre la desviacin tpica y la media.

Ejemplo: Vamos a utilizar la serie de datos de las leyes y vamos a calcular sus medidas de dispersin.
Variable (Ley) x 1,20 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 Frecuencias absolutas Simple x 1 4 4 2 1 2 3 3 4 3 3 Acumulada x 1 5 9 11 12 14 17 20 24 27 30 Frecuencias relativas Simple x 3,3% 13,3% 13,3% 6,6% 3,3% 6,6% 10,0% 10,0% 13,3% 10,0% 10,0% Acumulada x 3,3% 16,6% 30,0% 36,6% 40,0% 46,6% 56,6% 66,6% 80,0% 90,0% 100,0%

1.- Rango: Diferencia entre el mayor valor de la muestra (1,30) y el menor valor (1,20). Luego el rango de esta muestra es 10 %.

2.- Varianza: Recordemos que la media de esta muestra es 1,253. Luego, aplicamos la frmula:

Por lo tanto, la varianza es 0,0010

3.- Desviacin tpica: Es la raz cuadrada de la varianza

Luego:

4.- Coeficiente de variacin de Pearson: Se calcula como cociente entre la desviacin tpica y la media de la muestra.

Cv = 0,0320 / 1,253 Luego, Cv = 0,0255

El inters del coeficiente de variacin es que al ser un porcentaje permite comparar el nivel de dispersin de dos muestras. Esto no ocurre con la desviacin tpica, ya que viene expresada en las mismas unidas que los datos de la serie.

2.6 Distribuciones bidimensionales


Las distribuciones bidimensionales son aquellas en las que se estudian al mismo tiempo dos variables de cada elemento de la poblacin: Por ejemplo: Ley y profundidad de un yacimiento. Para representar los datos obtenidos se utiliza una tabla de correlacin:
X/Y x1 x2 ..... xn-1 xn y1 n1,1 n2,1 x nn-1,1 nn,1 y2 n1,2 n2,2 x nn-1,2 nn,2 ..... x x x x x ym-1 n1,m-1 n2,m-1 x nn-1,m-1 nn,m-1

ym
n1,m n2,m x nn-1,m nn,m

Las "x" representan una de las variables y las "y" la otra variable. En cada interseccin de una valor de "x" y un valor de "y" se recoge el nmero de veces que dicho par de valores se ha presentado conjuntamente

Ejemplo: Medimos la ley y la profundidad de un muestreo y obtenemos los siguientes resultados


Muestra x Muestra 1
Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6 Muestra 7 Muestra 8 Muestra 9 Muestra 10

Ley x 1,25
1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29

Profun. x 32
33 31 34 32 31 34 32 32 35

Ley x Muestra 11
Muestra 12 Muestra 13 Muestra 14 Muestra 15 Muestra 16 Muestra 17 Muestra 18 Muestra 19 Muestra 20

Profun. x 1,25
1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29

Ley Profun. Ley Profun. x x x x 31 Muestra 21 1,25 33


35 34 33 33 31 35 32 31 33 Muestra 22 1,28 Muestra 23 1,27 Muestra 24 1,21 Muestra 25 1,22 Muestra 26 1,29 Muestra 27 1,30 Muestra 28 1,24 Muestra 29 1,27 Muestra 30 1,29 32 34 34 35 31 34 33 35 34

Esta informacin se puede representar de un modo ms organizado en la siguiente tabla de correlacin


Ley / Prof.
1,21 % 1,22 % 1,23 % 1,24 % 1,25 % 1,26 % 1,27 % 1,28 % 1,29 % 1,30 %

31 m
0 0 0 0 1 0 2 0 3 0

32 m
0 1 0 2 1 0 1 1 0 0

33 m
1 1 0 1 1 0 0 1 1 0

34 m
2 0 0 0 0 0 2 0 1 2

35 m
0 1 0 0 0 0 1 1 1 1

Tal como se puede ver, en cada casilla se recoge el nmero de veces que se presenta conjuntamente cada par de valores (x,y). Tal como vimos en las distribuciones unidimensionales si una de las variables (o las dos) presentan gran nmero de valores diferentes, y cada uno de ellos se repite en muy pocas ocasiones, puede convenir agrupar los valores de dicha variable (o de las dos) en tramos

2.7 Distribuciones marginales

Al analizar una distribucin bidimensional, uno puede centrar su estudio en el comportamiento de una de las variables, con independencia de como se comporta la otra.
Estaramos as en el anlisis de una distribucin marginal. De cada distribucin bidimensional se pueden deducir dos distribuciones marginales: una correspondiente a la variable x, y otra correspondiente a la variable y.

Distribucin marginal de X
X x x1 x2 ..... xn-1 xn ni. x n1. n2. ... nn-1. nn.

Distribucin marginal de Y
Y x y1 y2 ..... ym-1 ym n.j x n.1 n.2 ... n.m-1 n.m

Ejemplo: a partir del ejemplo que vimos en la leccin anterior (serie con las leyes y profundidad) vamos a estudiar sus distribuciones marginales.
Ley / Prof.
1,21 % 1,22 % 1,23 % 1,24 % 1,25 % 1,26 % 1,27 % 1,28 % 1,29 % 1,30 %

31 m
0 0 0 0 1 0 2 0 3 0

32 m
0 1 0 2 1 0 1 1 0 0

33 m
1 1 0 1 1 0 0 1 1 0

34 m
2 0 0 0 0 0 2 0 1 2

35 m
0 1 0 0 0 0 1 1 1 1

Las variables marginales se comportan como variables unidimensionales, por lo que pueden ser representadas en tablas de frecuencias

a) Distribucin marginal de la variable X (ley) Obtenemos la siguiente tabla de frecuencia:


Variable (Ley) 1,21 1,22 1,23 1,24 1,25 1,26 1,27 1,28 1,29 1,30 Frecuencias absolutas Simple Acumulada 3 3 0 3 3 0 6 3 6 3 3 6 6 9 12 12 18 21 27 30 Frecuencias relativas Simple Acumulada 10,0% 10,0% 0,0% 10,0% 10,0% 0,0% 20,0% 10,0% 20,0% 10,0% 10,0% 20,0% 20,0% 30,0% 40,0% 40,0% 60,0% 70,0% 90,0% 100,0%

b) Distribucin marginal de la variable Y (profundidad) Obtenemos la siguiente tabla de frecuencia:

Variable (Prof.) 31 32 33 34 35

Frecuencias absolutas Simple Acumulada 6 6 6 12 6 18 7 25 5 30

Frecuencias relativas Simple Acumulada 20,0% 20,0% 20,0% 40,0% 20,0% 60,0% 23,3% 83,3% 16,6% 100,0%

2.8 Coeficiente de correlacin lineal


En una distribucin bidimensional puede ocurrir que las dos variables guarden algn tipo de relacin entre si.

Por ejemplo, si se analiza la ley y la profundidad es muy posible que exista relacin entre ambas variables: mientras ms profundo se la muestra , mayor ser la ley.
El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre las variables. Este coeficiente se aplica cuando la relacin que puede existir entre las variables es lineal (es decir, si representremos en un grfico los pares de valores de las dos variables la nube de puntos se aproximara a una recta).

No obstante, puede que exista una relacin que no sea lineal, sino exponencial, parablica, etc. En estos casos, el coeficiente de correlacin lineal medira mal la intensidad de la relacin las variables, por lo que convendra utilizar otro tipo de coeficiente ms apropiado. Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es representar los pares de valores en un grfico y ver que forma describen.

El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula:

Es decir: Numerador: se denomina covarianza y se calcula de la siguiente manera: En cada par de valores (x,y) se multiplica la "x" menos su media, por la "y" menos su media. Se suma el resultado obtenido de todos los pares de valores y este resultado se divide por el tamao de la muestra. Denominador se calcula el producto de las varianzas de "x" y de "y", y a este producto se le calcula la raz cuadrada.

Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1

Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra). La correlacin es tanto ms fuerte cuanto ms se aproxime a 1.
Por ejemplo: Profundidad y ley: A mayor profundidad mayor Ley.

Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la otra). La correlacin negativa es tanto ms fuerte cuanto ms se aproxime a -1.

Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de correlacin (parablica, exponencial, etc.) De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco esto quiere decir obligatoriamente que existe una relacin de causa-efecto entre las dos variables, ya que este resultado podra haberse debido al puro azar.

Ejemplo: vamos a calcular el coeficiente de correlacin de la siguiente serie de datos de ley y profundidad:
Muestra
Muestra 1 Muestra 2 Muestra 3 Muestra 4 Muestra 5 Muestra 6 Muestra 7 Muestra 8 Muestra 9 Muestra 10

Ley
1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29

Profun.
32 33 31 34 32 31 34 32 32 35

Ley
Muestra 11 Muestra 12 Muestra 13 Muestra 14 Muestra 15 Muestra 16 Muestra 17 Muestra 18 Muestra 19 Muestra 20

Profun.
1,25 1,28 1,27 1,21 1,22 1,29 1,30 1,24 1,27 1,29

Ley
31 35 34 33 33 31 35 32 31 33

Profun.

Ley

Profun.
33 32 34 34 35 31 34 33 35 34

Muestra 21 1,25 Muestra 22 1,28 Muestra 23 1,27 Muestra 24 1,21 Muestra 25 1,22 Muestra 26 1,29 Muestra 27 1,30 Muestra 28 1,24 Muestra 29 1,27 Muestra 30 1,29

Aplicamos la frmula:
(1/30) * (0,826) r = ---------------------------------------------------------(((1/30)*(0,02568)) * ((1/30)*(51,366)))^(1/2) Luego, r = 0,719

Por lo tanto, la correlacin existente entre estas dos variables es elevada (0,7) y de signo positivo

2.9 Regresin lineal


Representamos en un grfico los pares de valores de una distribucin bidimensional: la variable "x" en el eje horizontal o eje de abscisa, y la variable "y" en el eje vertical, o eje de ordenada. Vemos que la nube de puntos sigue una tendencia lineal:

El coeficiente de correlacin lineal nos permite determinar si, efectivamente, existe relacin entre las dos variables. Una vez que se concluye que s existe relacin, la regresin nos permite definir la recta que mejor se ajusta a esta nube de puntos.

Una recta viene definida por la siguiente frmula: y = a + bx


Donde "y" sera la variable dependiente, es decir, aquella que viene definida a partir de la otra variable "x" (variable independiente). Para definir la recta hay que determinar los valores de los parmetros "a" y "b": El parmetro "a" es el valor que toma la variable dependiente "y", cuando la variable independiente "x" vale 0, y es el punto donde la recta cruza el eje vertical. El parmetro "b" determina la pendiente de la recta, su grado de inclinacin

La regresin lineal nos permite calcular el valor de estos dos parmetros, definiendo la recta que mejor se ajusta a esta nube de puntos. El parmetro "b" viene determinado por la siguiente frmula:

Es la covarianza de las dos variables, dividida por la varianza de la variable "x".

El parmetro "a" viene determinado por:

Es la media de la variable "y", menos la media de la variable "x" multiplicada por el parmetro "b" que hemos calculado.

PRONOSTICO DE PRECIOS
La situacin de los precios de venta a largo plazo es uno de los problemas mas difciles del modelo econmico, mas aun cuando la vida de la mina ser de 20 a 30 aos lo que hace que la prediccin de todos los costos relacionados a los precios futuros sea evaluado constantemente. EJEMPLO

No X 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 136

Periodo
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007

Ctv Cu $/Lb Y 103,47 86,79 104,59 133,16 104,26 103,22 72,02 71,34 82,26 71,68 70,49 80,58 129,42 166,4 304,9 323,17 2007,75

X2 1 4 9 16 25 36 49 64 81 100 121 144 169 196 225 256 1496

YX 103,47 173,58 313,77 532,64 521,3 619,32 504,14 570,72 740,34 716,8 775,39 966,96 1682,46 2329,6 4573,5 5170,72 20294,71

En base al mtodo de los mnimos cuadrados tenemos las siguientes ecuaciones :

Calculando el valor de b:

Calculando el valor de a:

9,49

44,76

Estimando Y tenemos:

Y = 44,7635 + 9,49 x

Calculando el valor estimado a:

No X 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32

Periodo 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 2020 2021 2022 2023

Ctv Cu $/Lb Y 206,20525 215,701824 225,198397 234,694971 244,191544 253,688118 263,184691 272,681265 282,177838 291,674412 301,170985 310,667559 320,164132 329,660706 339,157279 348,653853

400 350 300 250 Axis Title 200 150 100 50 0 2005

2010

2015

2020

2025

You might also like