You are on page 1of 25

Correlacin

Decimos que dos variables, X e Y, estn correlacionadas cuando


hay una relacin cuantitativa entre ellas. X suele ser la variable
independiente e Y la dependiente (Y depende de X).
Altura y peso de nios. Peso = f(Altura)
Velocidad mxima que alcanza un coche y potencia de su motor. Velocidad = f(Potencia)
Presupuesto para adquisiciones y nmero de libros que puede adquirir una biblioteca.
Libros = f(Presupuesto)
Si se hace una lista ordenando las palabras segn su frecuencia de aparicin en un
texto extenso, se encuentra que hay una correlacin entre frecuencia y posicin o rango
en esa lista. Frecuencia = f(Rango) =>(Ley de Zipf)
La relacin puede ser claramente causal o no.
La potencia del motor de un coche es la causa de que alcance una mayor velocidad, as como
un mayor presupuesto el que se puedan comprar ms libros. (X es la causa de Y)
En cambio, el rango de una distribucin tipo Zipf no es la causa de la frecuencia; en todo
caso, la frecuencia es la causa del rango. (Y es la causa de X)
La relacin altura peso tiene parte de causalidad, pero tambin existen otros factores. (X
y otros factores son la causa de Y)
Cuando se hacen correlaciones hay que analizar bien el
fenmeno para no caer en errores
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Correlaciones espreas
Hay que evitar las denominadas correlaciones espreas o
espurias, es decir, que llevan a conclusiones errneas.
Ocurren cuando dos variables, X e Y, son realmente
independientes entre s, pero dependientes ambas de una
misma causa comn, Z.
Ejemplo de correlacin esprea: Cierto bilogo ingls public un estudio en el
que se comprueba que en los pueblos y ciudades con ms cigeas en los
campanarios, X, nacen ms nios, Y. Lleg a la conclusin de que los nios los
trae la cigea.
Lo cierto es que tanto el nmero de cigeas, X, como el de nios, Y, dependen
de la causa comn, Z, que es el tamao del pueblo o ciudad. En las poblaciones
grandes hay siempre ms cigeas y ms nios. Tanto cigeas como nios
estn correlacionados con el tamao de la poblacin, pero no entre ellos
mismos.
X Y
Z
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Nubes de Puntos
Sea un conjunto de pares de valores de las variables X e Y. Si los
representamos en un diagrama de dispersin obtendremos una nube de
puntos que nos dar una idea grfica de la posible correlacin entre ambas
variables.
No hay correlacin Correlacin positiva Correlacin negativa
X X X
Y
Y Y
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Algunos tipos de correlaciones
Correlacin lineal positiva Correlacin lineal negativa
Potencial
Logartmica
Otros tipos
Potencial
Exponencial
positiva
Otros tipos
Potencial
inversa
Exponencial
negativa
Otros tipos
Modelo Lineal
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Modelos Lineales
a .- Ordenada en el orgen. Punto de corte con el eje de ordenadas o eje y.
En este punto x est en el origen es decir x=0
b .- Pendiente. Grado de inclinacin de la recta. Si es
positiva, la recta es creciente. Si es negativa es decreciente.
Es el cociente entre el incremento que se produce en la
variable dependiente, Y, cuando se incrementa la variable
independiente, X.
Los valores de y se
calculan multiplicando
x por la pendiente, b, y
sumndole la ordenada
en el origen, a
y
x
a
b
y = a + bx
Ecuacin Explcita de la Recta
Y A
X A
X
Y
A
A
=
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Ejemplos de Rectas
-4
-3
-2
-1
0
1
2
3
4
5
6
7
8
9
10
-3 -2 -1 0 1 2 3 4 5
x
y
-3
-2
-1
0
1
2
3
4
5
6
7
8
9
-5 -4 -3 -2 -1 0 1 2 3 4 5 6 7
x
y
Recta creciente, ya que la
pendiente es positiva
La recta crece dos unidades de y
por cada unidad de x, es decir b=2
Cuando x=0, y=1. La ordenada en
el origen, a, vale 1
Recta decreciente, ya que la
pendiente es negativa
La recta decrece una unidad de y
por cada unidad de x, es decir b=-1
Cuando x=0, y=4. La ordenada en
el origen, a, vale 4
x y 2 1+ = x y = 4
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Recta de Regresin Mnimo-
Cuadrtica
La recta de regresin es la que se obtiene a partir de la nube de puntos y
es la que representa mejor la distribucin de esos puntos como modelo
lineal.
Se suele emplear el mtodo de los Mnimos Cuadrados, que consiste en
encontrar aquella recta tal que la suma de los cuadrados de las distancias,
d
i
, de los puntos a la recta sea la mnima posible.
d
1

d
2

d
3

d
4

d
5

d
6

d
8
d
9

d
10

Mnimo d d d d d
n i i
+ + + + + =

2 2 2
2
2
1
2
... ...
Bajo esta condicin se puede
demostrar que la pendiente, b, y la
ordenada en el origen, a, se determinan
mediante:
x
y
( )

=
2
2
i i
i i i i
x x n
y x y x n
b
n
x b y
a
i i

=
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Ejemplo 1. Regresin Lineal
y = x + 2
-2
-1
0
1
2
3
4
5
6
7
8
-4 -3 -2 -1 0 1 2 3 4 5 6
X
Y
x y
0 2
1 3
2 4
3 5
( )

=
2
2
i i
i i i i
x x n
y x y x n
b
n
x b y
a
i i

=
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Covarianza
En una distribucin bidimensional puede ocurrir que las dos variables guarden algn tipo de relacin entre si.

Por ejemplo, si se analiza la estatura y el peso de los alumnos de una clase es muy posible que exista relacin entre ambas
variables: mientras ms alto sea el alumno, mayor ser su peso.
El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre las variables. Este coeficiente se aplica cuando la relacin que puede existir entre las varables es lineal (es decir, si representaramos en un gfico los pares de valores de las dos variables la nube de puntos se aproximara a una recta).

No obstante, puede que exista una relacin que no sea lineal, sino exponencial, parablica, etc. En estos casos, el coeficiente de correlacin lineal medira mal la intensidad de la relacin las variables, por lo que convendra utilizar otro tipo de coeficiente ms apropiado.
Para ver, por tanto, si se puede utilizar el coeficiente de correlacin lineal, lo mejor es representar los pares de valores en un grfico y ver que forma describen.
El coeficiente de correlacin lineal se calcula aplicando la siguiente frmula:

Es decir:

Numerador: se denomina covarianza y se calcula de la siguiente manera: en cada par de valores (x,y) se multiplica la "x"
menos su media, por la "y" menos su media. Se suma el resultado obtenido de todos los pares de valores y este resultado se
divide por el tamao de la muestra.
Denominador se calcula el produto de las varianzas de "x" y de "y", y a este produto se le calcula la raz cuadrada.

Los valores que puede tomar el coeficiente de correlacin "r" son: -1 < r < 1
Si "r" > 0, la correlacin lineal es positiva (si sube el valor de una variable sube el de la otra). La correlacin es tanto ms
fuerte cuanto ms se aproxime a 1.
Por ejemplo: altura y peso: los alumnos ms altos suelen pesar ms.
Si "r" < 0, la correlacin lineal es negativa (si sube el valor de una variable disminuye el de la otra). La correlacin negativa es
tanto ms fuerte cuanto ms se aproxime a -1.
Por ejemplo: peso y velocidad: los alumnos ms gordos suelen correr menos.
Si "r" = 0, no existe correlacin lineal entre las variables. Aunque podra existir otro tipo de correlacin (parablica,
exponencial, etc.)
De todos modos, aunque el valor de "r" fuera prximo a 1 o -1, tampoco esto quiere decir obligatoriamente que existe una
relacin de causa-efecto entre las dos variables, ya que este resultado podra haberse debido al puro azar.

El coeficiente de correlacin lineal mide el grado de intensidad de esta posible relacin entre las variables. Este coeficiente
se aplica cuando la relacin que puede existir entre las varables es lineal (es decir, si representaramos en un gfico los pares
de valores de las dos variables la nube de puntos se aproximara a una recta).

Media aritmtica: Suma de los valores que toma una variable dividida entre el
nmero total, n, de valores sumados.
n
x
x
i
=
Varianza: Es una medida de lo que se dispersan los valores de una muestra
respecto de su media. Se determina con cualquiera de las formulas equivalentes
siguientes:
( ) 2
2
2
x x
2
2
S V mediante bien o x
n
x
n
x x
S V
i i
x x
= =

= =

La varianza, V, es tambin el cuadrado de la desviacin tpica, S.
Recordemos que...
Cuando se trata de una distribucin bidimensional...
Covarianza: Es una medida de lo que se dispersan los valores de una muestra
bidimensional tanto del valor medio de la x como del valor medio de la y. Se
determina mediante la expresin:
( )( )
y x
n
y x
S
n
y y x x
S V
i i
xy
i i
xy xy
= =

= =

xy
V mediante bien o
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Coeficiente de Correlacin de Pearson, r
Bondad de los ajustes
El coeficiente de correlacin de Pearson, r, nos permite saber si el ajuste de
la nube de puntos a la recta de regresin obtenida es satisfactorio.
Se define como el cociente entre la covarianza y el producto de las
desviaciones tpicas (raiz cuadrada de las varianzas)
y x
xy
y x
xy
y x
xy
S S
S
S S
S
V V
V
r = = =
2 2
Teniendo en cuenta el valor de la covarianza y las varianzas, se puede evaluar
mediante cualquiera de las dos expresiones siguientes:
|
|
.
|

\
|

|
|
.
|

\
|

=


2
2
2
2

y
n
y
x
n
x
y x
n
y x
r
i i
i i
( ) | | ( ) | |
2
2
2
2




=
i i i i
i i i i
y y n x x n
y x y x n
r
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Grado de Correlacin
El coeficiente de correlacin, r, presenta valores entre 1 y +1.
Cuando r es prximo a 0, no hay correlacin lineal entre las variables. La
nube de puntos est muy dispersa o bien no forma una lnea recta. No se
puede trazar una recta de regresin.
Cuando r es cercano a +1, hay una buena correlacin positiva entre las
variables segn un modelo lineal y la recta de regresin que se determine
tendr pendiente positiva, ser creciente.
Cuando r es cercano a -1, hay una buena correlacin negativa entre las
variables segn un modelo lineal y la recta de regresin que se determine
tendr pendiente negativa: es decreciente.
No hay
correlacin
0 ~ r
Correlacin lineal
positiva
1 + ~ r
Correlacin lineal
negativa
1 ~ r
Hay correlacin
no lineal
0 ~ r
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Coeficiente de Determinacin, R
2
Para estimar la bondad de un ajuste frecuentemente se prefiere utilizar el
Coeficiente de Determinacin, R
2
, que es el Coeficiente de Correlacin elevado
al cuadrado.
Se determina mediante cualquiera de las dos expresiones siguientes:

|
|
.
|

\
|

|
|
.
|

\
|

|
|
.
|

\
|

2
2
2
2
2
2

y
n
y
x
n
x
y x
n
y x
R
i i
i i
( )
( ) | | ( ) | |
2
2
2
2
2
2




=
i i i i
i i i i
y y n x x n
y x y x n
R
Su valor oscila entre 0 y +1.
Cuando hay una buena correlacin lineal, R
2
es muy cercano a +1.
Normalmente se acepta para valores de R
2
>= 099.
Cuando no hay correlacin o bien sta no es lineal, R
2
es bajo e incluso
cercano a cero
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Ejemplo 2: Regresin lineal
y = 1,13x - 2,2
R
2
= 0,9902
-4
-3
-2
-1
0
1
2
3
4
5
-2 -1 0 1 2 3 4 5 6 7
X
Y
x y
1 -1,1
2 0,2
3 1
4 2,1
( )

=
2
2
i i
i i i i
x x n
y x y x n
b
n
x b y
a
i i

=
( )
( ) | | ( ) | |
2
2
2
2
2
2




=
i i i i
i i i i
y y n x x n
y x y x n
R
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Potencia y velocidad son dos variables
correlacionadas segn un modelo lineal, cuya
ecuacin es:

El ajuste es excelente.
La correlacin es positiva, ya que la
pendiente tambin lo es.
Por cada CV de potencia, la velocidad
mxima se incrementa en 075 Km/h
Es posible predecir qu velocidad se podra
alcanzar a partir de una potencia
determinada o bien a la inversa, determinar
qu potencia se necesita para alcanzar una
velocidad.
Estas predicciones se pueden realizar sin
restricciones dentro del rango analizado
(Interpolacin). En cambio, fuera del rango
slo son posibles si no nos alejamos
excesivamente de l (Extrapolacin)
y = 0,7468x + 116,91
R
2
= 0,9915
0
50
100
150
200
250
0 50 100 150
Potencia, P (CV)
V
e
l
o
c
i
d
a
d

m

x
i
m
a
,

V

(
K
m
/
h
)
Correlacin Potencia - Velocidad
1.5D SX Furio
1.1i SX
1,4i SX
1.6i VTS
1.6i 16V VTS
Conclusiones:
V = 075 P + 117 R
2
= 09915
Ejemplo 3: Citron Saxo
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Interpolacin y Extrapolacin
Modelo Citron Saxo P
(CV)
V
(Km/h)
V (Km/h)
calculada

% Error
1.5D SX Furio
58 158 58x075+117 =
160
(160-158)/158*100
= 13%
1.1i SX
60 162 162 0%
1.4i SX
75 175 173 -11%
1.6i VTS
100 193 192 -0.5%
1.6i 16V VTS
120 205 207 1%
Nuevo Modelo Intermedio
90 ------ 184
Este caso es una
interpolacin y como el
ajuste es muy bueno, el
resultado es correcto.
Nuevo Modelo muy Potente
150 ------ 229
Resultado razonable. La
extrapolacin es tambin
razonable.
Nuevo Modelo poco Potente
10 ------ 124
? Demasiada velocidad
para tan poca potencia.
Se ha hecho una
extrapolacin excesiva
Ecuacin:
991 ' 0 117 75 ' 0
2
= + = R P V
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Ejemplo 4: Relacin Profesores/Alumnos
en las Universidades Espaolas
Universidades Alumnos Profesores
Aragn 36154 2043
Asturias 34441 1442
Baleares 9519 385
Cantabria 11962 737
Castilla la Mancha 15123 787
Castilla Len 74272 4030
Extremadura 17678 865
Madrid 214402 10971
Murcia 26407 1248
1. Trazar la grfica de la distribucin
2. Calcular parmetros de la distribucin
3. Cul es la Universidad con mejor proporcin
profesor/alumno?
4. Qu Universidad tiene la peor ratio y cuntos
profesores necesitara para equilibrarla?
5. Calcular los valores tericos de profesores de
la Universidad de Granada si sta tena 55123
alumnos en el curso 1994-95.
6. Calcular los valores de la FBD si sta tena
1100 alumnos
R
2
=0.998 b=0.0515 a=-17
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Ejemplo 4: Grfica de distribucin
Relacin Profesores/Alumnos en
Universidades
0
2000
4000
6000
8000
10000
12000
14000
0 100000 200000 300000
Alumnos
P
r
o
f
e
s
o
r
e
s
0
500
1000
1500
2000
2500
3000
0 10000 20000 30000 40000 50000
Alumnos
P
r
o
f
e
s
o
r
e
s
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Modelos No Lineales
Modelo Potencial Exponencial Logartmico
Ecuacin
Ecuacin
Linealizada
----------
Grfica
Y Log y Ln y y
X Log x x Log x
A Log a Ln a a
B b b b
a A
b B B B
b
ax y =
x b a y log log log + =
bx
ae y =
x b a y log + =
bx a y + = ln ln
Log y
Log x
Ln y
x
y
Log x
A
10
A
e
Antes de proceder a la regresin, hay que transformar la ecuacin no lineal,
y = f(x), en otra del tipo Y = A + BX, donde Y, X, A y B son funciones de y, x,
a y b respectivamente.
(c) Rosario Ruiz Baos. Departamento de Biblioteconoma y Documentacin. Universidad de Granada (Espaa)
Ejemplo 5: El Pndulo de
Galileo
L(m) T(s)
0,1 0,6
0,3 1,1
1,0 2,1
3,0 3,4
6,0 5,0
9,0 6,0
El Pndulo de Galileo
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
0,0 2,0 4,0 6,0 8,0 10,0
Longitud del pndulo, L(m)
T
i
e
m
p
o

d
e

o
s
c
i
l
a
c
i

n
,

T
(
s
)
Una de las principales aportaciones de Galileo Galilei (1564-
1642), fue encontrar la relacin entre el tiempo o periodo de
oscilacin de un pndulo y su longitud. Esto permiti construir
por primera vez en la historia relojes de gran precisin basados
en pndulos. Dicen que la idea de correlacionar estas variables
se le ocurri en la iglesia de su ciudad natal, Pisa, mientras,
absorto, observaba cmo oscilaban las lmparas del techo...
Estos datos podran corresponder a
un hipottico experimento realizado
por Galileo...
(c) Rosario Ruiz Baos. Departamento de Biblioteconoma y
Documentacin. Universidad de Granada (Espaa)
Las deducciones de Galileo
Para encontrar el modelo que relaciona periodo de oscilacin, T, con la longitud del
pndulo, L, Galileo bien pudo hacer las siguientes deducciones...
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
0,0 2,0 4,0 6,0 8,0 10,0
L
T
0,1
1,0
10,0
0,0 2,0 4,0 6,0 8,0 10,0
L
l
o
g

T
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
0,1 1,0 10,0
log L
T
0,1
1,0
10,0
0,1 1,0 10,0
log L
l
o
g

T
No es lineal No es exponencial
Tampoco es logartmica
Es potencial
(c) Rosario Ruiz Baos. Departamento de Biblioteconoma y Documentacin. Universidad de Granada (Espaa)
Clculos de la Regresin Potencial
para el Pndulo de Galileo
L(m) T(s) X = log x Y = log y
x y X Y XY X^2 Y^2
0,1 0,6 -1 -0,22185 0,221849 1 0,049217
0,3 1,1 -0,52288 0,041393 -0,02164 0,273402182 0,001713
1,0 2,1 0 0,322219 0 0 0,103825
3,0 3,4 0,477121 0,531479 0,25358 0,227644692 0,28247
6,0 5,0 0,778151 0,69897 0,543904 0,605519368 0,488559
9,0 6,0 0,954243 0,778151 0,742545 0,910578767 0,605519
Sumas 0,686636 2,150363 1,740235 3,017145009 1,531304
n= 6
Como vamos a ajustar a un modelo potencial, hacemos el cambio de variables: X = log x e Y = log y.
Por lo dems se procede exactamente igual a una regresin lineal, ajustando a una expresin del tipo
Y = A + BX. Por ltimo, de B y A calculados se despejan b y a respectivamente.
( )
5085 , 0
) 686636 , 0 ( 01745009 . 3 6
150363 , 2 686636 , 0 740235 , 1 6
2 2
2
=


=

=


i i
i i i i
x x n
y x y x n
B
3002 , 0
6
686636 , 0 5085 , 0 150363 , 2
=

=

=

n
x b y
A
i i
( )
( ) | | ( ) | |
9988 . 0
2
2
2
2
2
2
=


=


i i i i
i i i i
y y n x x n
y x y x n
R
5085 , 0 = = B b
9962 , 1 10 10
3002 , 0
= = =
A
a
b
aL T =
b
ax y =
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Ley del Pndulo
y = 1,9962x
0,5085
R
2
= 0,9988
0,1
1,0
10,0
0,1 1,0 10,0
log L
l
o
g

T
y = 1,9962x
0,5085
R
2
= 0,9988
0,0
1,0
2,0
3,0
4,0
5,0
6,0
7,0
0,0 2,0 4,0 6,0 8,0 10,0
L
T
L L L T 2 2 2
2
1
5 ' 0
= = =
Generalizando...
L k T =
El periodo de oscilacin de un pndulo es
proporcional a la raz cuadrada de su longitud
Se deduce que...
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
Ejemplo 6: Regresin Exponencial.
Mtodo del C14 para datacin
arqueolgica
A partir de los datos adjuntos en los que se
dan valores de carbono 14 residual
respecto del tiempo transcurrido,
determina:
a) Parmetros de la distribucin de
%C14-Tiempo, sabiendo que es
exponencial negativa
b) Cunto C14 quedar en el hueso que
llevo en la mano si ambos tenemos
12.000 aos.
0
20
40
60
80
100
120
0 5000 10000 15000 20000 25000
Edad, t (aos)
%
C
1
4

r
e
s
i
d
u
a
l
Edad, t (aos) %C14 residual
0 100
1000 92
5000 53
10000 30
20000 9,3
1
10
100
1000
0 5000 10000 15000 20000 25000
Edad, t (aos)
%
C
1
4

r
e
s
i
d
u
a
l
E
s
c
a
l
a

l
o
g
a
r

t
m
i
c
a
Se observa que la nube de
puntos se alinea cuando se
toman logaritmos en la y. Por
tanto, el modelo es exponencial,
y como decrece, es exponencial
negativo.
bt
bx
ae C
ae y
=
=
14 %
Solucin:
residual C de % 24 %
9992 , 0
10 194 , 1
100
14 14
2
4
=
=
=
=

C
R
b
a
(c) Rosario Ruiz Baos. Departamento de Biblioteconoma
y Documentacin. Universidad de Granada (Espaa)
Clculo de la Regresin Exponencial
para el C14
Como se est ajustando un MODELO EXPONENCIAL hacemos el cambio de variable Y =LN(y),
quedando x igual (X = x). En este caso A = Ln(a) y B = b.
( )
4
2 4 8
4
2
2
10 194 , 1
) 10 6 , 3 ( 10 26 , 5 5
72846 , 18 10 6 , 3 5 , 102985 5

=


=

=


i i
i i i i
x x n
y x y x n
B
58933 , 4
5
) 10 6 , 3 10 194 , 1 ( 72846 , 18
4 4
=

=

=


n
x b y
A
i i
4
10 194 , 1

= = B b
100 4 , 98
58933 , 4
~ = = = e e a
A
Edad, t (aos) %C14 residual X=x Y=Ln(y)
x y X Y XY X^2 Y^2
0 100 0 4,60517 0 0 21,20759
1000 92 1,0E+03 4,521789 4521,789 1,0E+06 20,44657
5000 53 5,0E+03 3,970292 19851,46 2,5E+07 15,76322
10000 30 1,0E+04 3,401197 34011,97 1,0E+08 11,56814
20000 9,3 2,0E+04 2,230014 44600,29 4,0E+08 4,972964
Sumas: 3,6E+04 18,72846 102985,5 5,260E+08 73,95849
n= 5,0
(c) Rosario Ruiz Baos. Departamento
de Biblioteconoma y Documentacin.
Universidad de Granada (Espaa)
LOS MODELOS EN BIBLIOMETRA
La Bibliometra est fundamentada en un conjunto de leyes empricas. Estas leyes se han
establecido gracias a estudios cuantitativos en los que interviene el recuento de n de artculos, n
de revistas, n de autores, etctera. Las distribuciones que correlacionan estas variables se ajustan
mediante regresin lineal por el mtodo de los mnimos cuadrados.
Las principales leyes y el tipo de modelo al que corresponden son las siguientes:
Ley
Bibliomtrica
Ecuacin Modelo Grfico
Ley de Price del
crecimiento
exponencial de la
Ciencia
Exponencial positivo
Ley de Lotka de la
productividad de los
autores
Potencial inverso
Ley de Bradford de
las revistas y su
dispersin
Logartmico (En la
zona perifrica al
ncleo)
Ley de Zipf de la
distribucin de
palabras en los
textos
Potencial inverso
Ley de Brookes del
envejecimiento de la
informacin
Exponencial negativo
bt
ae T =
o
T
k
A =
r b a R log + =
R
k
F =
t
a U U
0
=
(c) Rosario Ruiz Baos. Departamento de Biblioteconoma y Documentacin. Universidad de Granada (Espaa)

You might also like