Professional Documents
Culture Documents
Prefacio
Ser la Gerencia General creada por la Direccin Ejecutiva de Produccin Faja de Petrleos de Venezuela, S.A (PDVSA), pone en
nuestras manos el reto de formar tcnicamente a los hombres y mujeres de la Industria Petrolera que llevan a cabo los procesos
medulares del negocio asociado a la cadena de valor, esto cobra ms sentido, cuando visualizamos esta accin bajo los
preceptos humanistas y socialistas impartidos y divulgados por el Comandante Eterno Hugo Chvez y orgullosamente podemos
decir que, al ser su Legado seguimos las lneas trazadas por nuestro mximo Lder.
Siendo as, la responsabilidad se vuelve exponencialmente determinante, porque se trata del proceso de construir la Soberana
del Conocimiento dentro de Petrleos de Venezuela, S.A, enmarcado en el Socialismo y tomando como modelo la Gerencia
del Conocimiento. Este concepto es la carta de navegacin de los Programas de Formacin que viene aplicando y diseando la
Gerencia General de Formacin Faja (GGFF).
La GGFF tiene entre sus acciones estratgicas los procesos de socializacin del conocimiento, sumado al fortalecimiento
sociocultural, comunicacin tcnica, crecimiento personal, destacando la formacin sociopoltica. Ciertamente, lo que se busca
con este proceso continuo e integrado es internalizar en las trabajadoras y trabajadores petroleros el papel protagnico que
tienen, para lograr la revolucin intelectual dentro y fuera de la frontera de nuestro pas.
La misin de la Gerencia General de Formacin Faja Petrolfera del Orinoco Hugo Chvez es promover, ejecutar y garantizar la
formacin Tcnica integral especializada de los trabajadores en el rea Tcnico Artesanal y Profesional de los procesos
medulares de la Faja Petrolfera del Orinoco Hugo Chvez Fras, en concordancia con el Plan de la Patria, los lineamientos de
PDVSA y las necesidades de las organizaciones que conforman la Direccin Ejecutiva de Produccin de Faja; brindando
programas de formacin de excelencia, inclusivos, participativos y equitativos, orientados a mejorar la productividad y eficiencia.
Nuestra actividad es contagiosa y suma voluntades, porque entendemos que de la formacin profesional y artesanal depende el
xito del Plan Siembra Petrolera, en este sentido hemos dado una sobremarcha a nuevos procesos para captar, transformar,
procesar, usar, utilizar, divulgar, medir y registrar todos los recursos intelectuales, que a partir de este momento se vuelven
protagnicos para PDVSA.
Los Manuales son los productos tangibles de ese potencial de saberes, que sern las evidencias histricas de la maduracin que
significa registrar cada transferencia de conocimiento de los hombres y mujeres de la Nueva PDVSA.
Evidentemente, Tu conocimiento es nuestra mayor reserva, este es el horizonte que tenemos: lograr la formacin de
hombres y mujeres especialistas del mundo petrolero con conocimientos plenos, sustentados, validados, ejemplo para todas las
latitudes del globo terrqueo y con comprobada experiencia.
El presente material ha sido compilado por el instructor con propsitos didcticos y est en proceso de
continua revisin.
3
Informacin de control
Identificacin
Creacin, revisin y
aprobacin
Responsable
Confidencialidad
Fecha
Elaboracin
Ricardo Ambrosio
Septiembre 2015
Revisin
Aprobacin
Firma
Sobre el manual
Objetivo
Alcance
Despus de este curso, el participante estar familiarizado con los conceptos de Estadstica
y Geoestadstica necesarios para aprovechar las herramientas bsicas de modelado
geoestadstico disponibles en los programas comerciales de modelado de yacimientos. El curso
no contempla adiestramiento especializado en el uso de dichos programas.
Audiencia
Dirigido a cualquier profesional del rea de petrleo o ciencias de la tierra que requiera
entender los mtodos bsicos de la geoestadstica y su papel en el modelado de yacimientos.
Recomendaciones
El manual ser utilizado como gua a lo largo del desarrollo del programa, es conveniente
que las secciones vistas cada da sean revisadas antes de la siguiente sesin. Posteriormente
el material puede ser utilizado como referencia para tpicos especficos a medida que las
actividades del participante lo requieran.
Convenciones
tipogrficas
Le ayuda a identificar
Informacin de destacada importancia dentro del contenido.
Puntos de especial inters sobre el tema en desarrollo.
Tabla de contenido
Mdulo I: Geoestadstica ...........................................................................................................9
Captulo I: Introduccin ........................................................................................................... 10
Objetivos ...................................................................................................................................14
Alcances y Expectativas.............................................................................................................15
Mapa Mental .............................................................................................................................16
Capitulo II: Fundamentos de Probabilidad y Estadstica ............................................................ 18
Probabilidades ...................................................................................................................................26
Variables Aleatorias ...........................................................................................................................36
Esperanza y Varianza .........................................................................................................................45
Covarianza y Correlacin ...................................................................................................................54
Distribuciones Especiales ..................................................................................................................59
Muestras y Poblacin ........................................................................................................................68
Introduccin a la Simulacin .............................................................................................................72
7
Mdulo I
Geoestadstica
Capitulo I
Introduccin
Introduccin
12
Introduccin
Los fenmenos tienden a ser suficientemente complejos como para limitar
el uso de modelos simplistas como:
Valores constantes en el interior de polgonos.
Funciones matemticas.
13
Ejemplos
Interpolacin.
Estimacin de valores de variables regionalizadas sobre localizaciones sin mediciones
Tpicamente sobre un mallado o modelo de celdas.
Estimacin de indicadores.
Eventos representados por variables binarias.
Simulacin.
Imgenes que honran la verdadera fluctuacin del fenmeno.
14
Objetivos
Proveer una base estadstica suficiente para comprender los procesos geoestadsticos
tpicos.
Proveer una base geoestadstica suficiente para aplicar procesos y tomar decisiones
durante el procesos de modelado geoestadstico de yacimientos.
Proveer a los participantes de una visin capaz de interpretar y evaluar los resultados
de un modelado geoestadstico.
15
Alcances y Expectativas
La base terica del curso desde el punto de vista matemtico y estadstico est dirigida a profesionales de
las reas de ciencias de la tierra, por lo cual numerosos detalles sern omitidos o discutidos de manera
informal.
Los tpicos asociados al modelado estadstico de yacimientos estn orientados a entender las base terica
y el funcionamiento de tareas especficas que o forman parte del flujos de trabajo tpicos.
Los mtodos estudiados estn asociados especficamente a tareas que involucran conceptos
principalmente geoestadsticos, no se discutirn detalles sobre otras disciplinas, el modelado de
yacimientos es una tarea intrnsecamente multidisciplinaria.
16
Mapa Mental
BaseLCC16
TopMCC25
TopLCC13
TopLCC16
BaseT3-1
TopT3-1
TopT3-2
29Ut021 [SSTVD]
29Ub14 [SSTVD]
SSTVD -14.11 GRTO 407.32 -0.04 PHIE_F 0.46 -0.09 VCLAV_F 1.10 0.3865 SW_F 1.0558
773
Descripcin
894
BaseMCC25
900
TopMCC25
TopMCC25
910
825
TopUCC14
TopUCC14
930
Procesamiento de
datos
875
940
900
Tidal Channel
-3.36
-3.22
-3.08
-2.94
-2.80
-2.66
-2.52
-2.38
-2.24
-2.10
-1.96
-1.82
-1.68
-1.54
-1.40
-1.26
-1.12
-0.98
-0.84
-0.70
-0.56
-0.42
-0.28
-0.14
0.00
0.14
0.28
0.42
0.56
0.70
0.84
0.98
1.12
1.26
1.40
1.54
1.68
1.82
1.96
2.10
2.24
2.38
2.52
2.66
2.80
2.94
3.08
3.22
3.36
Reescalamiento
Elementos de
probabilidad
TopUCC14
TopMCC16
TopMCC16
TopMCC16
950
925
960
Transformacin
TopLCC16
Tidal Channel
TopLCC16
TopLCC16
950
Tidal Flat
970
975
BaseLCC16
BaseLCC16
980
TopMCC16
BaseLCC16
TopMCC16
Tidal Flat
1000
Tidal Channel
990
Tidal Flat
999
1031
Muestras /
poblaciones
Modelado
geomtrico
Elementos de
estadstica
Orientacin
Resolucin
Condiciones
Fundamentos
Estadsticos /
Indicadores
Integracin
de datos
Modelado
Geoestadstico
de Yacimientos
Anlisis
integrado
Variables
secundarias
0,400
0,350
Mtodos
0,300
0,250
0,200
Aplicaciones
0,150
0,100
0,050
0,000
1
Mapas
1,5
2,5
Mtodos
descriptivos
Mtodos
geoestadsticos
Modelado de
propiedades
Transformaciones
Kriging / Simulacin
Mtodos
predictivos
Variogramas
Modelado de
facies
Interpolacin
TopUCC14
920
BaseMCC25
Tidal Flat
Tidal Flat
TopUCC14
BaseMCC25
850
TopUCC14
1025
0,5
BaseMCC25
TopLCC13
800
BaseMCC25
Distribuciones
Environ
BaseMCC25
TopLCC13
Tidal Flat
TopMCC25
Variables
aleatorias
SSTVD -2.05 GRTO 416.93 -0.04 PHIE_F 0.44 -0.05 VCLAV_F 1.10 0.2831 SW_F 1.0652
Environments
TopLCC13
Kriging
Simulacin
17
TopMCC16
Temario
Captulo II
Fundamentos de Probabilidad
y Estadstica
Tpicos a tratar
Experimentos y sucesos.
Probabilidades.
Definicin.
Funcin de probabilidad.
Eventos independientes.
Probabilidad condicional
Distribuciones especiales.
Distribucin Uniforme.
Distribucin Binomial.
Distribucin Normal e Intervalos de confianza.
Distribucin Log Normal.
Introduccin a la simulacin por mtodos de Montecarlo.
20
Experimentos y sucesos
21
Experimentos y sucesos
22
Experimentos y sucesos
23
Experimentos y sucesos
Podra llover
Llover
SI
Seco
Resultado Incierto
No Llover
Escenarios Plausibles
NO
Toma de decisiones:
LLEVAR PARAGUAS
SI
NO
Mojado
Utilidades y Prdidas
Incmodo
Irrelevante
24
Conjuntos
Recordemos la unin e interseccin de conjuntos dado que nos referiremos a estos trminos
para entender la relacin entre eventos.
AB
ABC
AC
A
B
C
BC
AUBUC
25
Conjuntos
Recordemos la unin e interseccin de conjuntos dado que nos referiremos a estos trminos
para entender la relacin entre eventos.
Eventos disjuntos
A
B
D
Eventos exhaustivos y
mutuamente excluyentes
26
Probabilidades
Probabilidades
Interpretacin subjetiva
Probabilidad que una persona asigna a uno de los posibles resultados de un
proceso.
Basado en el juicio propio sobre la verosimilitud.
El juicio estar basado en las opiniones e informacin que tenga la persona sobre
el proceso.
Interpretacin frecuentista
Frecuencia relativa con la que se obtendra un resultado si un proceso se
repitiera un nmero grande de veces en condiciones similares.
28
Probabilidades
Axiomas
Para cualquier evento A, P(A) 0
La probabilidad de todo suceso es no negativa.
P Ai P( Ai )
i
i
29
AB
AUBUC
ABC
AC
BC
Funcin de Probabilidad
P(A)=0.25
P(B)=0.25
P(C) = 0.50
31
Funcin de Probabilidad
d1/d2
P (x=11)
P (x=10)
5/36
P (x=7)
10
P (x=6)
10
11
10
11
12
0,06
0,08
P (x=9)
0,03
0,11
P (x=8)
0,14
0,17
0,14
P (x=5)
0,11
P (x=4)
0,08
P (x=3)
P (x=2)
0,06
0,03
32
Eventos independientes
33
Probabilidad condicional
P(A)=P(A)/P(S)
AB
P(A|B)=P(AB)/P(B)
34
x50
P(Azul)=20/100
P(Verde) = 50/100
P(Amarillo) = 30/100
x30
x20
Eventos independientes.
Eventos condicionales.
35
Probabilidad Total
18 19 20
48 49 50
28 29 30
0.153
98 99 100 98 99 100 98 99 100
x50
x30
x20
P(Azul)=20/100
P(Verde) = 50/100
P(Amarillo) = 30/100
36
Variables Aleatorias
Variables aleatorias
0,375
0,375
0,125
x=0
0,125
x=1
x=2
x=3
38
Variables aleatorias
Continuas:
Discretas:
Facies geolgicas.
39
-3.36
-3.15
-2.94
-2.73
-2.52
-2.31
-2.10
-1.89
-1.68
-1.47
-1.26
-1.05
-0.84
-0.63
-0.42
-0.21
0.00
0.21
0.42
0.63
0.84
1.05
1.26
1.47
1.68
1.89
2.10
2.31
2.52
2.73
2.94
3.15
3.36
Funcin de distribucin
P( X A) f ( x)dx
A
f ( x)dx 1
40
Funcin de distribucin
F ( x) P( X x)
f (t )dt
1
0,9
P( x 0,5) 0,70
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-0,1
-3,5
-3
-2,5
-2
-1,5
-1
-0,5
0,5
1,5
2,5
3,5
41
-3.36
-3.15
-2.94
-2.73
-2.52
-2.31
-2.10
-1.89
-1.68
-1.47
-1.26
-1.05
-0.84
-0.63
-0.42
-0.21
0.00
0.21
0.42
0.63
0.84
1.05
1.26
1.47
1.68
1.89
2.10
2.31
2.52
2.73
2.94
3.15
3.36
Funcin de distribucin
F(x) = f(x)
f(x)
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-0,1
F(x)
-3,5
-3
-2,5
-2
-1,5
-1
-0,5
0
0,5
1
1,5
2
2,5
3
3,5
42
Percentiles y Escenarios
43
Percentiles y Escenarios
El percentil 0.1 (10%, p10) define un escenario pesimista: slo con 10% de
chance habr menos de esa cantidad de reservas.
El percentil 0.9 (90%, p90) define un escenario optimista: es factible, pero con
90% de chance habr una menor cantidad de reservas.
El percentil 0.5 (50%, p50) define el ms verosmil (most likely), con igual
chance de observar mayor o menor volumen de reservas.
44
Percentiles y Escenarios
Escenarios.
1
F(x)=0.9
0,9
0,8
0,7
0,6
F(x)=0.5
0,5
0,4
0,3
0,2
F(x)=0.1
0,1
0
P10
P50
P90
-0,1
-3,5
-3
-2,5
-2
-1,5
-1
-0,5
0,5
1,5
2,5
3,5
45
Esperanza y Varianza
Caso Discreto.
E ( x) xP ( x)
x
Caso Continuo.
E ( x) xf ( x)dx
47
0,50
0,30
0,45
0,40
0,35
0,20
0,30
0,25
0,15
0,20
0,15
0,10
0,15
0,05
0,10
0,05
0,05
3,95
0,00
0
10
X=1
X=2
X=3
X=4
X=5
X=6
X=7
Var ( X ) E[( X m x ) 2 ]
Var ( X ) E[ X 2 ] E 2 [ X ]
Cuantifica la incertidumbre sobre los valores posibles de una variable aleatoria una vez
conocida su media.
Varianza
Ejemplo de Dispersin
Ejemplo de Dispersin
-1
-1
-2
-2
-3
-3
-4
-4
-4
-3
-2
-1
-4
-3
-2
-1
50
Propiedades importantes
51
Propiedades importantes
Var(aX+b) = a2Var(X)
(1)
(2)
(3)
Si X1 y X2 no son independientes.
(4)
52
Desviacin estndar
DesviacionEst ( x) Var ( x)
No es aditiva.
53
120
100
Moda
0,5
60
f ( x)dx
20
40
Frecuencia
80
0.5
40
Mediana
60
80
Media
100
120
140
160
180
1
xi
n i
54
Covarianza y Correlacin
Covarianza y correlacin
( X ,Y )
Cov( X , Y )
XY
Cov( X , Y )
1 ( X , Y ) 1
56
Covarianza y correlacin
Cov( X , Y ) E[( X m x )(Y m y )]
(X < mx)*(Y > my)
( - )*( + )
( + )*( + )
( - )*( - )
( + )*( - )
57
Covarianza y correlacin
y=x
R = 1
(x,y) =0.01
R = 0,4604
R = 0,0924
R = 0,0002
(x,y) =0.31
(x,y) =0.68
(x,y) =1
58
Correlacin
Existe una relacin perfecta entre las dos variables, pero sta no es lineal.
y = -1x2 - 3E-15x + 3
R = 1
(X,Y) = 0.08
59
Distribuciones Especiales
Distribuciones especiales
f ( x) P( X x)
1
k
16.7%
16.7%
16.7%
16.7%
16.7%
15%
10%
5%
0%
x
61
Distribuciones especiales
Distribucin de Bernoulli.
f ( x) p x (1 p)1 x
Media = p
Varianza = p(1-p)
40%
20%
0%
0
1
x
62
Distribuciones especiales
Distribucin Binomial.
n
f ( x) p x (1 p) n x
x
Media = np
Varianza = np(1-p)
26.68%
23.35%
20.01%
20%
12.11%
10.29%
10%
3.68%
2.82%
0.90%
0.14%
0.01%
0.00%
10
0%
0
63
Distribuciones especiales
Distribucin Uniforme continua.
Todos los sub-intervalos del mismo tamao tienen la misma probabilidad de ocurrir.
f ( x)
1
ba
Media = (a+b)/2
Varianza = (b-a)2/12
0.0
0.2
0.4
0.6
Probabilidad
2.0
2.5
3.0
3.5
4.0
4.5
5.0
x
64
Distribuciones especiales
Distribucin Normal.
1 x m 2
1
f ( x)
exp
2
Media
0.12
1
xi
n i
Varianza
0.06
s 2
1
( xi x ) 2
n 1 i
Desviacin Estndar
0.00
Probabilidad
10
15
20
25
30
s s 2
x
65
Distribuciones especiales
Su media es m = 0 y su varianza 2 = 1.
0.5
0.4
0.2
0.3
Normal(0,1)
zi
( xi m )
0.0
0.1
Normal(3,2)
-10
-5
10
66
Distribuciones especiales
Distribucin Log-Normal.
Una variable Log-Normal, es aquella cuyo logaritmo sigue una distribucin normal.
1 Ln( x) m 2
1 1
f ( x)
exp
2
2 x
0.2
0.4
0.6
0.0
Probabilidad
10
15
x
67
Distribuciones especiales
Media
Varianza
s2
S2
s2
M exp m
2
0.4
0.3
0.0
0.1
0.2
Probabilidad
0.3
0.2
0.1
0.0
Probabilidad
0.4
0.5
exp(Y)=X~Log-Normal
0.5
Y~Normal(0,1)
-4
-2
2
y
10
20
30
40
50
68
Muestras y Poblaciones
Muestras y poblaciones
70
Muestras y poblaciones
71
Muestras y poblaciones
Riesgo de sobreajuste.
72
Introduccin a la simulacin
Introduccin a la Simulacin
Conceptos bsicos.
74
Introduccin a la Simulacin
U ~ Uniforme[0,1].
Transformacin de U.
75
Introduccin a la Simulacin
Transformacin de U.
76
Introduccin a la Simulacin
Transformacin de U.
1.- x = 1 si U p
2.- x = 0 si U > p
1 si verdadero.
0 si falso.
x = 1*(U p)
77
Introduccin a la Simulacin
x=0
yi = Bernoulli(p)
x = x + yi
78
Introduccin a la Simulacin
P(x=1) = p1
P(x=2) = p2
P(x=3) = p3
P1+ P2+ P3
P1+ P2
rea = P1
rea = P2
rea = P3
79
Introduccin a la Simulacin
Aplicar frmula:
z 2 ln(U1 ) * Seno(2U 2 )
Transformacin de z
1.- Escala: z* x
2.- Localizacin: x = z* x + mx
80
Introduccin a la Simulacin
til cuando se trata de una variable aleatoria para la cual no conocemos una
frmula previamente.
Simulacin x ~ f(x)
x = F-1(U)
81
Captulo III
Geoestadstica
Tpicos a tratar
Variables regionalizadas.
Correlacin espacial.
Variogramas.
Conceptos y mtodos para el clculo de variogramas experimentales.
Modelado de variogramas.
Variograma terico.
Modelos autorizados.
Elipse de anisotropa.
Kriging y Simulacin
Caractersticas del kriging ante otros mtodos de interpolacin.
Tipos de kriging y prediccin mediante simulacin.
83
Variables Regionalizadas
Variables regionalizadas
85
Variables regionalizadas
Comparacin entre el punto de vista estadstico y geoestadstico.
40
Mapa de Observaciones
31 32
33
31
33
33 3333
30
26
25
35
32
27
29
39
39
36
37
3535
34
27
28
30
32
36
35
33
28
31
31
37
30
30
30
30 33
31
29
33 33
30
28 2828
32 33
33 33
33
28
28
29
28 24
28
27
2929
29
28
32
32
32
27 26
27
29
29
24
28 29
27
25
27
28
25
28
30
29 31
28
26
30
24
29
25
29
28
29
29
24
29
28
29
24
28
2424
28
30
28 27
27
27
28
26
23 23
26
25
26
29 28 28
20 22
27 28
28
24
10
38
30
2626
38
37
33
33 34
29
27
38
38
38
37
34
31
31
27
27
20
37
34
32
32
31
32
32
Z
0.15
2.70
0.88
3.25
1.65
1.64
3.88
2.62
4.02
4.07
4.19
3.90
1.30
2.61
0.87
1.45
0.26
4.02
2.79
3.10
10
20
30
34
34
3434
32
32 32
31
31 31
30
30
40
Variables regionalizadas
Histograma de z(x)
30
Percent of Total
Nmero de observaciones
20
10
160
Mnimo (Z)
20,41
Media (Z)
29,98
Mediana (Z)
29,16
Mximo (Z)
39,17
3,8
0
20
25
30
35
40
z(x)
87
Variables regionalizadas
Identificacin de percentiles.
F(Z) - FDA Emprica
34.7
100%
90%
32.7
80%
70%
F(Z)
60%
29.2
50%
40%
27.5
30%
20%
25.4
10%
40
0%
20
22
24
26
28
30
32
34
36
38
40
35
Z
Z<=P(10% )
P(10% )<Z<=P(25% )
P(25% )<Z<=P(50% )
30
x2
25
20
P(50% )<Z<=P(75% )
P(75% )<Z<=P(90% )
15
P(90% )<Z
10
5
0
0
10
15
20
25
30
35
40
x1
88
Estacionariedad
Histograma de X
0.0 0.1 0.2 0.3 0.4
Density
Variable Estacionaria
-3
-2
-1
89
Estacionariedad
Ejemplos de variables no estacionarias.
Subpoblaciones
Tendencias
Variable NO Estacionaria
Variable NO Estacionaria
Variable NO Estacionaria
400
200
Frequency
600
Porosidad Total
0.00
0.05
0.10
0.15
0.20
0.25
0.30
0.35
Porosidad
90
Heterogeneidad
91
Anisotropa
92
Superficies de Tendencia
Superficies de Tendencia
De acuerdo al objetivo del estudio podemos querer analizar los efectos regionales o los
residuales.
Tendencia
18
16
6
5
4
3
14
12
2
1
10
8
6
y = -2,3x + 15,4
4
2
0
0
0
-1
-2
-3
-4
-5
-6
-7
0
94
Superficies de Tendencia
Superficie de ajuste
40
20
10
0
z 0 1 x1 2 x2
x2
30
10
20
x1
30
40
95
Superficies de Tendencia
z 0 1 x1 2 x2 3 x1 4 x2 5 x1 x2
2
f ( x1 , x2 )
r s p
x x2
r ,s 1
96
Superficies de Tendencia
Esta prediccin slo puede honrar el comportamiento regional, los residuales sern
tratados como ruido aleatorio.
97
Superficies de Tendencia
40
Superficie de orden=1
20
10
Intercepto
0
21,71
Coeficiente. x1
1
0,17
Coeficiente. x2
2
0,24
x2
30
Parmetro estimado
10
20
30
40
x1
98
Superficies de Tendencia
z(x)
x1
x2
99
Superficies de Tendencia
40
30
20
10
x2
Residuales
10
20
x1
30
40
Residuales Positivos.
Residuales Negativos.
100
Interpolacin
Observaciones y mallado
El mallado o grid representa un arreglo regular que se desea poblar con valores de las
propiedades de inters.
10
9
8
7
6
5
4
3
2
1
0
0
10
102
Interpolacin
El kriging es considerado como ptimo debido a que minimiza la varianza de las estimaciones,
pero otras formas de interpolacin son frecuentemente ms rpidas y por lo tanto, pueden
ser tiles.
Existen otros mtodos de estimacin directa, incluso a partir de una sola observacin, pueden
ser muy rpidos, pero sufren de un muy bajo aprovechamiento de la informacin.
103
Interpolacin
Global
Estratificada
Local
Mixta
Por ejemplo: Local dentro de estratos homogneos (caso de uso muy frecuente).
104
Interpolacin
Interpolacin Global/Local.
Global
Local
Observaciones
Punto a estimar
105
Interpolacin
Interpolacin Estratificada.
Estrato A
Estrato B
Si las observaciones estn separadas en subgrupos,
estratos o clusters con comportamientos distintos (al
menos bajo suposicin), es conveniente utilizar
interpolacin estratificada.
Es necesario identificar el subgrupo asociado a cada
observacin.
Se calcula local o globalmente, pero siempre se tomarn
slo observaciones pertenecientes al mismo subgrupo.
Puntos a estimar.
Observaciones.
106
Interpolacin
La interpolacin estratificada, se concentra en las diferencias entre los grupos.
Porosidad en Arenas
20
15
10
0
0.1
0.2
0.3
Porosidad|Arena
Porosidad en Arcillas
25
Percent of Total
20
15
10
5
0
0.1
0.2
0.3
Porosidad|Arcilla
107
Interpolacin
dmin
Observaciones
Punto a estimar
108
Interpolacin
20
10
0
x2
30
40
Residuales
10
20
30
40
x1
109
Interpolacin
20
10
0
x2
30
40
Residuales
10
20
x1
30
40
R=7
110
Interpolacin
Interpolacin Global
N
z * ( x0 ) i z ( xi )
i 1
Interpolacin Local
n
z * ( x0 ) i z ( xi )
n = Nmero de observaciones
pertenecientes a la vecindad.
i 1
z * ( x0 ) i z ( xi )
r = Radio de vecindad.
xi r
Interpolacin Estratificada
z * ( x0 Aj )
Como escoger n r ?
z( x )
xi A j
111
Estimacin de i
Interpolacin
Existen muchas formas de calcular los coeficientes i para obtener predicciones razonables (y an se pueden
proponer mtodos).
La resolucin de las ecuaciones de kriging arroja coeficientes ptimos (de acuerdo a ciertos criterios), sin
embargo, modelar la estructura espacial de los datos puede ser complicado y tomar tiempo valioso.
i 1
112
Interpolacin
1
di
1
j 1
d2
di
1
dj
d3
1
d1
d1
d1
d2
d3
113
Interpolacin
R=4
R = 10
114
Kriging y simulacin
Kriging
Los valores de una propiedad especfica son conocidos en ciertas localizaciones, pero se
necesitan en cada punto de un mallado para generar mapas continuos.
x2
8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40
x1
Mallado
Posicin aleatoria
116
Kriging
Antes de la aplicacin de los mtodos geoestadsticos, los mapas de contornos eran dibujados
manualmente en base a la intuicin y el conocimiento de las condiciones locales.
Los mtodos geoestadsticos proveen una base slida para la prediccin, as como para la
evaluacin de los resultados obtenidos.
Propiedad Esimada
117
Kriging
Los grupos de observaciones cercanas (clusters) son reducidos a un slo punto equivalente,
de modo que el sobremuestreo en reas pequeas no sesgar el resultado.
118
Kriging
La estimacin del error est basada slo en la estructura espacial de los datos NO en los
VALORES DE LOS DATOS.
Adems provee la varianza de las predicciones en cada observacin como parte del proceso
de estimacin de pesos.
La solucin depende del modelo de variabilidad espacial, por lo tanto la calidad del resultado
est directamente relacionada con la del modelo.
119
Covarianza espacial
Z(x)
x
h
Z(x + h)
x+h
120
Variogramas
Covarianza espacial
122
Variograma
(h)
1
[ z ( x) z ( x h)]2
2 N ( h) N ( h )
123
Variograma
El variograma no depende de los valores observados sino de la estructura espacial
de los datos.
Ubicacin
A
B
C
1
2
3
4
5
6
7
8
9
10
--+-- --+-- --+-- --+-- --+-- --+-- --+-- --+-- --+-- --+-- Media
1
2
3
4
5
6
7
8
9
10
5,5
1
6
2
7
3
8
4
9
5
10
5,5
1
8
5
2
3
9
7
10
6
4
5,5
Varianza
9,2
9,2
9,2
Min
1
1
1
Max
10
10
10
Comparacin de variogramas
18
16
14
Variograma
12
10
8
6
4
2
0
Distancia
Variograma A
Variograma B
Variograma C
124
Variograma
Comparacin.
Comparacin de variogramas
12
18
16
10
8
12
Variable
Variograma
14
10
8
6
4
6
4
2
2
0
Variograma B
Ubicacin
Distancia
Variograma A
Variograma C
Variable A
Variable B
Variable C
125
10
Variograma
126
Variograma
h
En este caso, para cada direccin
mostrada habr siempre un punto a
distancia h, tal que siempre encontraremos
una observacin en x + nh a lo largo de la
direccin q.
127
Variograma
128
Variograma
Definimos valores de tolerancia, tal que podamos encontrar puntos que satisfacen un criterio.
Tolerancia Dh (distancia).
Tolerancia Dh
h=1
Dh = 0.5
Bin
x1
h-Dh
x2
h+Dh
x3
x4
x5
x6
129
Variograma
Definimos valores de tolerancia, tal que podamos encontrar puntos que satisfacen un criterio.
Tolerancia Dq (azimut).
Tolerancia Dq
Puntos
descartados
q Dq
Puntos
aceptados
Dq
q Dq
q
Puntos
aceptados
Puntos
descartados
Tolerancia
Lateral
130
Variograma
Aplicando estas condiciones sobre cada una de las observaciones de la muestra podemos
mejorar el aprovechamiento de la informacin.
Bin
h
2h
131
Variograma
Variograma h=8
5
45
Variograma h=5
10
15
20
135
45
Variograma h=2
10
15
20
135
45
10
15
20
135
Semivariograma
Semivariograma
Semivariograma
10
15
20
Distancia
10
15
20
Distancia
10
15
20
Distancia
132
Variograma
Para escoger el tamao del lag h existen distintos criterios, como utilizar la distancia promedio
entre observaciones.
Frecuentemente se requiere de ensayo y error para conseguir el tamao ptimo del lag.
La curva cuenta con suficientes puntos como para ser ajustada con precisin.
Los puntos que guan la curva son promedios de suficientes pares de puntos como para
evitar un comportamiento errtico.
133
Variograma
En la prctica lo ms conveniente es utilizar tantos lags (h) como sea posible (es decir una
distancia h pequea) pero procurando que en cada ventana (Bin) tenga suficientes puntos
para una estimacin robusta (no menos de 100 observaciones).
134
Mapa de Variograma
Este mapa muestra, a partir del centro, el valor del variograma en diferentes direcciones y
distancias.
dy
4
0
-5
1
-10
-10
-5
dx
135
Modelos de Variograma
No decreciente.
Casos a considerar:
Crece indefinidamente.
Remover tendencias.
Efecto hole.
Esfrico.
Exponencial.
Gaussiano.
Algunos modelos autorizados
Rango
1,2
Sill
1
0,8
0,6
0,4
0,2
Nugget
0
0
250
500
Esfrico
750
Exponencial
1000
1250
1500
Gaussiano
137
Modelos autorizados ms comunes (ecuaciones normalizadas -> Rango =1; Sill = 1):
Esfrico.
si h 1
Exponencial.
(h) 1 e h
Gaussiano.
(h) 1 e
h2
138
Esfrico.
si h rango
Exponencial.
Gaussiano.
(h) sill * (1 e
( h / rango) 2
)
139
El ajuste de los parmetros puede hacerse mediante la estimacin por mnimos cuadrados o
mediante ajuste manual, en ningn caso se recomienda el ajuste no supervisado.
Ajuste del Variograma
10
45
Valor
Modelo
Exponencial
Nugget
Rango
Anisotropa
0.52
Sill
Proporcional a la
varianza de Z
30
135
semivariance
Caracterstica
20
10
20
30
distance
140
Kriging Simple.
Variable estacionaria.
Media conocida.
Variable estacionaria.
Media desconocida.
Kriging universal.
Variable no estacionaria.
Media desconocida.
141
Variable no estacionaria.
Media desconocida.
Cokriging.
m(x) es estimada localmente como un escalamiento de otra variable disponible sobre toda el
rea de estudio.
Simulacin
Aprovecha que la salida del kriging provee tanto la estimacin como la varianza del error
(media y varianza).
Valores
Simulados
143
Kriging vs Simulacin
La textura no es la de la propiedad.
144
Simulacin
Realizacin 1
Realizacin 2
Realizacin 3
Realizacin 4
145
Sill
1
0,8
0,6
0,4
0,2
Nugget
0
0
250
500
Esfrico
750
Exponencial
1000
1250
1500
Gaussiano
146
0,5
1,5
2,5
147
0,400
0,300
0,200
rm/rM = 0.3
0,100
0,000
0
0,5
1,5
0,400
0,300
0,200
rm/rM = 0.5
0,100
0,000
0
0,5
1,5
0,400
0,300
0,200
rm/rM = 0.7
0,100
0,000
0
0,5
1,5
148
0,5
0
-1
-0,5
0,5
0,5
0,5
-0,5
-1
1
0,5
0
-1
-0,5
-0,5
-1
1
0,5
0
-1
-0,5
-0,5
149
1,200
1,000
0,800
0,600
0,400
0,200
0,000
0
0,5
1,5
2,5
150
Captulo IV
Elementos esenciales del modelado de
yacimientos
Tpicos a tratar
Modelado geoestadstico.
Modelado geomtrico.
Datos de entrada.
Reescalamiento de pozos.
Modelado de facies.
Guas.
Simulacin de indicadores.
Modelado de propiedades.
Transformaciones tpicas.
Flujo de trabajo.
152
Flujo de trabajo
153
Flujo de trabajo
154
Modelado geomtrico
Separacin de bloques.
Insumos.
Conceptualizacin geolgica.
Ssmica.
155
Modelado geomtrico
rea de inters:
Disponibilidad de datos.
156
Modelado Geomtrico
Modelado geomtrico
Superficies.
Unidades de inters.
158
Modelado geomtrico
Orientacin de celdas.
159
Modelado geomtrico
Unidades estratigrficas.
160
Modelado geomtrico
Resolucin vertical.
161
Modelado geomtrico
Mnimo
2,50
Media
29,3298
Mx imo
52,06
162
Reescalamiento de pozos
Proceso tpico.
Volumen de arcilla.
Porosidad.
Permeabilidad.
Saturacin de agua:
164
Reescalamiento de pozos
Tanto para variables continuas como discretas debemos hallar un valor representativo en cada
celda para los valores medidos en pozos dentro de la misma.
Observacin
Perdida
Promedio No
Representativo
165
Reescalamiento de pozos
166
Reescalamiento de pozos
Reescalamiento de facies.
Pozo
Most of (moda).
Celda
Arena
Arena
Arena
Resultante = Arena
Arcilla
Arcilla
Arena
Resultante = Arena
Arena
167
Reescalamiento de pozos
Reescalamiento de facies.
Most of (moda).
168
169
Reescalamiento de pozos
Reescalamiento de propiedades.
Pozo
Phie
Sw
Arena
0,21
0.38
Arena
0,24
0.45
Arena
0,19
0.48
Arcilla
0,08
0.55
Arcilla
0,07
0.60
Arena
0,20
0.64
Arena
0,27
0.71
Celda
Phie Celda
Sw Celda
Arena
0.213
0,436
0.235
0,68
Arena
170
Reescalamiento de pozos
Tipos de promedio.
Aritmtica
1
ma xi
n
Adecuada para porosidad y
saturacin.
Puede generar resultados muy
optimistas para la permeabilidad,
sin embargo es correcta para
capas homogneas con flujo
paralelo a las capas.
Geomtrica
Harmnica
mg xi
1
n
1
1
mh
xi
n
171
Reescalamiento de pozos
Tipos de promedio.
Aritmtica
1
ma xi
n
Adecuada para porosidad y
saturacin.
Puede generar resultados muy
optimistas para la permeabilidad,
sin embargo es correcta para
capas homogneas con flujo
paralelo a las capas.
Geomtrica
Harmnica
mg xi
1
n
1
1
mh
xi
n
172
173
Modelado de Facies
Modelado de facies
Mtodos de modelado.
Geoestadstica multipunto.
Kriging.
Imgenes de entrenamiento.
175
Modelado de facies
Mtodos de modelado.
Kriging
Aplica las ecuaciones de kriging y la simulacin secuencial para generar el modelo de facies.
Cada celda se simula como una observacin tipo bernoulli a partir de la probabilidad obtenida
por la solucin del kriging.
176
Modelado de facies
Informacin gua.
177
Modelado de facies
Informacin gua.
178
Modelado de facies
Informacin gua.
37%
39%
49%
53%
59%
62%
Probabilidad
63%
61%
51%
47%
41%
38%
70%
30%
72%
28%
79%
21%
80%
20%
87%
13%
91%
100%
100%
100%
100%
100%
9%
179
Modelado de Propiedades
Modelado de propiedades
Modelado de propiedades.
181
Modelado de propiedades
Modelado de propiedades.
182
Modelado de propiedades
Transformaciones tpicas.
Truncamiento.
Remocin de tendencia.
Normalizacin.
Modelado de propiedades
Truncamiento.
Registros de pozos.
Ignorar los valores descartados tanto para el clculo de los variogramas como para
el proceso de interpolacin.
Truncamiento de salida.
Si algn valor generado por la simulacin se encuentra fuera del rango de valores
aceptables, descartar y repetir.
184
Modelado de propiedades
Tendencias.
Remover la tendencia a cada observacin para continuar el modelado con los efectos no
sistemticos debidos a otras causas.
Residuales
Tendencia
18
16
6
5
4
3
14
12
2
1
10
8
6
y = -2,3x + 15,4
4
2
0
0
0
-1
-2
-3
-4
-5
-6
-7
0
185
Modelado de propiedades
Normalizacin.
Transformar los datos para que su distribucin se aproxime a una distribucin normal.
Logaritmo.
Probabilidad
Probabilidad
10
20
30
40
50
-4
-2
186
Modelado de propiedades
Normalizacin.
Transformar los datos para que su distribucin se aproxime a una distribucin normal.
Normal Scores.
F(U)
F(Z)
0,9
0,9
0,8
0,8
0,7
0,7
0,6
0,6
0,5
0,5
0,4
0,4
0,3
0,3
0,2
0,2
0,1
0,1
0
0
0,2
0,4
0,6
0,8
-3
-2,5
-2
-1,5
-1
-0,5
0,5
1,5
2,5
187
3,5
Modelado de propiedades
Una vez que las propiedades han sido analizadas y se garantizan las condiciones para la
aplicacin del kriging se procede al poblar las celdas vacas de acuerdo a la propiedad.
Porosidad.
Permeabilidad.
188
Modelado de propiedades
Saturacin de agua.
La saturacin de agua tiene caractersticas particulares dado que viene dada por la
diferenciacin de fluidos por su densidad.
Sus variaciones no son paralelas a las superficies, los fluidos se adaptan a la forma
del recipiente.
Si la distribucin del fluido no est asociada a la separacin por densidad, sino que guarda una
relacin estricta con otras propiedades ser necesario analizar la relacin con las otras
variables y considerar una funcin matemtica o aplicar mtodos de estimacin usando
variables secundarias.
189
Mdulo II
Introduccin a las redes
neuronales
Captulo I
Introduccin
Introduccin
192
Introduccin
Vehculos auto-guiados.
Reconocimiento de imgenes.
Reconocimiento de voz.
Deteccin de fraude.
Biologa.
Comercio electrnico.
Robtica.
Redes sociales.
Video juegos.
Muchos otros.
Ciencias de la tierra.
193
Objetivos
194
Alcances y Expectativas
La base terica del curso desde el punto de vista matemtico, estadstico y computacional
est dirigida a profesionales de las reas de ciencias de la tierra, por lo cual numerosos
detalles sern omitidos o discutidos de manera informal.
Los tpicos asociados al uso de redes mtodos de aprendizaje automtico estn orientados a
entender las base terica y el funcionamiento de tareas especficas que o forman parte del
flujos de trabajo tpicos.
195
Mapa Mental
Aprendizaje
automtico
Inteligencia
artificial
reas
relacionadas
Regresin
Contexto
Redes
neuronales
Fundamentos
Modelos de
aprendizaje
Mtodos de
aprendizaje
Estructura de
las redes
neuronales
Mtodos de
agrupamiento
Mtodos
Clasificacin
Clasificacin
Supervisada
Tipos de
soluciones
Clasificacin
No
supervisada
196
Captulo II
Tecnologas de aprendizaje
automtico
Aprendizaje Automtico
(Machine learning)
Inteligencia artificial
198
Inteligencia artificial
Aprendizaje.
Comportamiento.
Lgica (ideal).
Aprendizaje automtico
201
202
Modelado estadstico
Modelado estadstico
Prediccin del consumo de un carro (millas por galn) en funcin del los caballos de fuerza
(hp) y el peso (wt, en miles de libras).
Interpretacin directa.
35,0
30,0
=37,980,0323,77
Prediccin
1/MPG
25,0
20,0
15,0
Prediccin
10,0
5,0
mpg
Modelo
204
Modelado estadstico
El modelo de regresin lineal requiere comprender las relaciones entre las variables, este
modelo en s mismo representa un hiptesis sobre la relacin entre las variables.
(1)
Una vez propuesto, el modelo no cambia con los datos, la informacin contenida en los datos
se utiliza para estimar los parmetros b0, b1 y b2.
b0 representa el intercepto.
b1 representa el efecto de la variable a hp en la estimacin del valor de mpg.
b2 representa el efecto de la variable a wt en la estimacin del valor de mpg.
Para estimar una nueva observacin basta con evaluar la frmula (1).
205
Aprendizaje automtico
No se plantea una hiptesis sobre la relacin entre los datos de entrada y salida,
aunque es conveniente verificar que exista alguna relacin de informacin.
El modelo no recibe una estructura formal de la relacin entre las variable como la
frmula del modelo de regresin.
Redes neuronales
La estructura bsica de los nodos de una red puede representarse como un grafo (simplificado)
x1
Pesos
sinpticos
Procesamiento
Salida
w1
Entrada
wp
xp
207
Informacin, conocimiento y
aprendizaje
Escribir un programa es como dar instrucciones a una persona que piensa muy rpido, pero
carece totalmente de creatividad y su interpretacin de nuestras rdenes es estrictamente
literal.
Literal
Inteligente
=
Pero no podemos describir en
detalle el proceso mediante el
cual establecemos la relacin
entre la entrada y la salida
209
Tareas inteligentes
Tareas que ejecutamos de manera rutinaria pero que no podemos describir paso a paso
con el detalle necesario para elaborar un programa.
Adaptabilidad
Los programas usualmente son rgidos y una vez escritos e instalados no cambian, sin
embargo, algunas tareas pueden cambiar en el tiempo, o cambiar de acuerdo al usuario
o al entorno. En este sentido las herramientas de aprendizaje automtico interactan con
el ambiente y se adaptan de acuerdo a la experiencia de manera natural.
Informacin y conocimiento
X1
X2
Relacin
Salida
10
15
11
?
211
Aprendizaje
212
Tipos de Aprendizaje
La clasificacin del aprendizaje depende del tipo de tarea que se pretende ejecutar,
por lo existen diversos paradigmas de aprendizaje que pueden generar una
clasificacin.
Supervisado
La interpretacin no es directa, el
analista debe buscar sentido a los
subgrupos identificados por el sistema.
214
Pasivo
215
En lnea
Captulo III
Estructura tpica de las redes
neuronales
Una red neuronal est conformada por un conjunto de unidades de procesamiento que
se comunican enviando seales a travs de conexiones ponderadas.
Utilizar la seal para computar una salida que es propagada hacia otras unidades.
218
Perceptrn
Perceptrn
Un nodo de salida.
Entrada (xi)
x1
Pesos
Sinpticos (wi)
Procesamiento
Combinacin de
entrada y pesos
w1
w2
x2
1
Sesgo
( + q)
Funcin de activacin
1
> 0
=
1
Salida
Resultado
de f(s)
Funcin de
Activacin
= + q
Sesgo
q: Es un valor de corte
Perceptrn
= + q
as que 1 1 + 2 2 + q =
1
> 0
as que la recta 1 1 + 2 2 + q = 0 define la
1
salida
2 =
2 1
221
Perceptrn
+ 1 = + ()
= d x
q + 1 = q + q ()
q = d x
El Perceptrn
Ejemplo perceptrn ( 1 )
2,5
R1
R2
1,5
R3
D
-2
-1,5
-1
d(xC) = 1
y(xC) = -1
d(xD) = 1
y(xD)
0 = -1
B
-2,5
0,5
-0,5
0
-0,5
0,5
1,5
2,5
-1
223
El Perceptrn
Ejemplo perceptrn ( 2 )
2,5
La red falla.
1,5
-1
+1
0,5
B
-2,5
-2
-1,5
-1
-0,5
0,5
1,5
2,5
-0,5
-1
224
Entrada
Capa oculta
Procesamiento
Salida
x1
xp
225
Recordemos que:
El conocimiento de la red se almacena en los pesos sinpticos que son una medida
de la fuerza de la conexin entre dos nodos o neuronas de una red.
227
En el ejemplo del Perceptrn vimos que el aprendizaje del sistema viene dado por el
ajuste (aditivo) de los pesos sinpticos.
Aprendizaje Hebbiano:
h: tasa de aprendizaje
h: tasa de aprendizaje
Aprendizaje competitivo:
Hebbiano
229
Tasa de aprendizaje [0-1]: controla el tamao de los cambios en los pesos sinpticos
y el sesgo, puede reducir la velocidad de aprendizaje de la red para evitar saltos.
Momento [0-1]: incluye una fraccin del valor anterior de los pesos sinpticos.
Promedia el valor actual con el valor anterior.
230
Captulo IV
Fundamentos de estadstica
Bayesiana
Conceptos bsicos
232
Conceptos bsicos
Estadstica Bayesiana
Estadstica Bayesiana
Bayesiana
La trayectoria de la pelota es
aleatoria, el aro es constante, no
sabemos si la pelota lo atravesar
Estadstica Bayesiana
P(A2)=0.25
| =
( )
( )
=
P(A3) = 0.50
= 1 B 2 3
| =
( )
()
Probabilidad un elemento de
la particin dado que ocurri
el evento B
= (| )
| =
( )
(| )
236
Estadstica Bayesiana
Diagnstico correcto
Diagnstico correcto
El teorema de Bayes permite calcular la probabilidad de los elementos de la particin (Enfermo / No enfermo)
a partir de la probabilidad condicional del evento (resultado de la prueba + / -)
La probabilidad de estar enfermo es el parmetro de inters / el resultado de la prueba son los datos
237
Estadstica Bayesiana
+ = 0,9
= 0,85
Supongamos 2 escenarios
Previa
Previa
| + = +
Escenario 1: 0,9
Escenario 2:
0,9
+
+
0,045
()+
0,2 =
0,18
0,18+0,08
= 0,69
( )
()
Estadstica Bayesiana
Una variable aleatoria sigue una distribucin f(x|) y nuestro inters es estimar el
parmetro .
(|x) (|) ()
La distribucin posterior podra ser la nueva previa ante una actualizacin de los datos, modelando
as un proceso de aprendizaje
239
Captulo V
Algoritmos de aprendizaje
automtico
Clasificacin:
Mtodos no supervisados.
Mtodos supervisados.
Regresin:
Mtodos duales:
Algoritmos que pueden ser utilizados tanto para regresin como para clasificacin.
241
Clasificacin vs regresin
Clasificacin
Variables discretas.
Supervisados:
Regresin
No supervisados:
Clasificacin
Supongamos que deseamos clasificar las siguientes observaciones
>4
patas
0
patas
2
patas
Invertebrados
Pelos / plumas
Vertebrados
Invertebrados
4
patas
243
Clasificacin
Se recomienda usar los mtodos supervisados para clasificar sobre tipos ya definidos:
Por ejemplo, queremos identificar facies geolgicas, y ya sabemos que queremos separar arenas de
arcillas.
Por ejemplo, queremos identificar facies geolgicas de acuerdo a un conjunto de atributos, pero no
sabemos exactamente cuntos tipos o cules tipos esperamos encontrar.
No supervisada: slo sobre las arenas, para verificar si hay distintos tipos de arena que puedan ser de
inters de acuerdo a sus propiedades.
Como en todos los mtodos estadsticos la calidad de la solucin depende mucho ms de que
la pregunta planteada sea adecuada.
244
El problema vs la herramienta
Consideremos una aplicacin mvil de asistente de ruta:
La aplicacin ejecuta un algoritmo inteligente que nos ayuda a decidir la ruta ptima para
llegar del punto A al punto B.
245
Algoritmos de agrupamiento
En todos los casos el objetivo es separar las observaciones en grupos tales que:
Cada uno de los k-grupos se asocia a un centroide (media) - Muy sencillo de aplicar.
Agrupacin jerrquica:
247
Jerrquico
Aglomerativo:
K-medias
Total
Rama1
Rama 1.1
Divisivo:
Rama2
Rama 1.2
248
Ejemplo 1 de clasificacin
Variable
Caracterstas
Pelo
Tiene pelos
Plumas
Tiene plumas
Huevos
Pone huevos
Leche
Produce leche
Vuela
Vuela
Acutico
Depredador
Es depredador
Espina Dorsal
Respira aire
Venenoso
Produce veneno
Aletas
Tiene aletas
Cola
Tiene cola
Nmero de patas
Variables binarias
Entero ordinal
249
Ejemplo 1 de clasificacin
Cada observacin est descrita por 13 variables:
Rbalo
Jabal
D21
Bfalo
D31
D32
Bagre
D41
D42
D43
Guepardo
D51
D52
D53
D54
Guepardo
Bagre
Bfalo
Jabal
13
=1
Rbalo
Matriz de distancias:
Matriz cuadrada de NxN
N=cantidad de observaciones.
Simtrica.
Cada celda contiene la distancia entre dos
observaciones en un espacio M dimensional
(M variables)
La matriz de distancias se puede definir con
diferentes tipos de distancia o medidas de
disimilitud.
0
250
Ejemplo 1 de clasificacin
Una vez que tenemos la matriz de distancia el mtodo organiza las observaciones de acuerdo
a sus distancias. La herramienta para visualizar esta organizacin se llama dendograma
Al cortar a mayor altura
obtendremos menos grupos,
pero ms diferentes
Es responsabilidad del
analista definir la cantidad de
grupos y su interpretacin
Bichos
Terrestres
Aves
Acuticos
Reptiles /
Anfibios
Arcnidos
Moluscos
Crustceos
Gusanos
Insectos
Aves
Peces
4 grupos
8 grupos
Mamferos
terrestres
251
Utilicemos otro ejemplo para entender el procesamiento que debe darse a las
variables para obtener una clasificacin adecuada.
252
= max()
253
Clasificador de Bayes
Clasificador de Bayes
Supone que las variables independientes (de entrada) son independientes entre s.
Las variables que no aportan informacin son ignoradas, por lo que es un buen
mtodo para probar gran cantidad de variables.
255
Clasificador de Bayes
Toma como previa de los datos la proporcin en que las clases de entrenamiento son
observadas.
Obtiene una distribucin posterior de cada clase de acuerdo a las variables de entrada.
Clasifica cada nueva observacin en funcin de la clase con mayor probabilidad posterior.
256
Clasificador de Bayes
(rojo) = 6/20
(azul) = 14/20
(rojo) = 6/20
(azul) = 14/20
Clasificador de Bayes
f(x|rojo) = 2/6
f(x|azul) = 1/14
f(x|azul) = 1/14
f(x|rojo)= 2/6
Clasificador de Bayes
Ahora veamos un ejemplo de lo que el mtodo es capaz de lograr.
Cada observacin est representada por una cadena binaria de 16 dgitos que ordenados en una
matriz de 16x16 representan el nmero trazado a mano (16 variables explicativas).
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
1
1
1
0
1
1
0
0
0
0
0
0
0
0
0
0
1
1
1
0
1
1
0
1
0
0
0
0
0
0
0
1
1
1
0
0
1
1
1
1
1
0
0
0
0
0
1
1
1
0
0
0
1
1
1
0
0
0
0
0
0
0
1
1
0
0
0
0
1
1
1
0
0
0
0
0
0
1
1
1
0
0
0
0
1
1
1
1
0
0
0
0
1
1
1
0
0
0
0
0
1
1
1
1
0
0
0
1
1
1
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
1
1
0
1
1
1
1
1
0
0
0
0
0
0
0
0
1
1
0
0
1
1
1
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
1
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
1
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
1
1
1
1
0
0
0
0
1
1
0
0
0
0
0
0
1
0
1
1
0
0
0
1
1
1
0
0
0
0
0
1
1
0
1
1
0
0
1
1
1
1
1
0
0
0
0
1
1
0
1
1
0
0
1
1
1
1
1
0
0
0
0
1
1
0
1
1
0
1
1
0
0
1
1
0
0
0
1
1
1
0
1
1
1
1
1
0
0
1
1
1
0
0
1
1
1
0
0
1
1
1
0
0
0
0
1
1
0
0
1
1
1
0
0
1
1
1
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
1
1
1
1
0
1
1
1
1
0
0
0
0
0
0
1
1
1
0
0
0
0
0
1
1
1
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
1
1
1
1
1
1
1
0
0
0
0
0
0
0
1
1
1
1
1
0
0
1
1
0
0
0
0
0
0
1
1
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
0
1
1
0
0
0
0
0
0
0
1
1
0
1
1
0
0
0
1
0
0
0
0
0
0
1
1
0
0
1
0
0
0
0
1
0
0
0
0
0
0
1
1
0
1
1
0
0
0
0
1
0
0
0
0
0
0
1
0
0
1
1
0
0
0
0
1
0
0
0
0
0
1
1
0
0
1
1
0
0
0
0
1
1
0
0
0
0
1
1
0
0
1
1
0
0
0
0
1
1
0
0
0
0
1
1
0
0
1
1
0
0
0
0
1
1
0
0
0
0
1
0
0
0
1
1
0
0
0
0
0
1
0
0
0
1
1
0
0
0
1
1
0
0
0
0
0
1
0
0
1
1
1
0
0
0
1
1
0
0
0
0
0
1
1
0
1
1
0
0
0
0
1
1
0
0
0
0
0
1
1
1
1
1
0
0
0
0
1
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
1
1
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
0
0
0
0
0
0
0
0
0
1
1
0
1
1
1
0
0
0
0
0
0
0
1
1
0
0
1
0
1
1
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
1
1
0
1
1
1
1
1
0
0
0
0
0
0
0
1
1
0
0
0
0
1
1
1
0
0
0
0
0
0
0
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
1
0
0
0
1
1
1
1
0
0
0
0
0
0
0
1
1
0
0
1
1
1
1
1
0
0
0
0
0
0
0
1
1
1
1
1
1
0
0
1
1
0
0
0
0
0
0
0
1
1
1
1
0
0
0
1
1
0
0
0
0
0
0
0
1
1
1
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
0
1
1
1
1
1
1
1
1
1
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
1
1
0
0
0
0
0
0
1
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
1
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
1
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
1
1
0
0
1
1
1
1
1
0
0
0
1
0
0
0
1
1
1
0
1
1
1
1
1
1
0
0
1
0
0
0
0
1
1
1
1
1
0
0
1
1
0
0
1
0
0
0
0
0
1
1
0
0
0
0
0
1
1
0
1
0
0
0
0
0
1
1
0
0
0
0
0
0
1
0
1
1
0
0
0
0
1
1
1
0
0
0
0
0
1
1
1
1
0
0
0
1
1
1
1
0
0
0
0
0
1
1
0
1
1
0
0
1
1
1
1
1
0
0
0
0
0
1
0
1
1
1
1
1
1
1
1
1
0
0
0
0
0
1
0
0
1
1
1
1
1
0
0
1
1
0
0
0
1
1
0
0
0
0
0
0
0
0
0
1
1
1
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
1
1
0
0
0
1
1
1
0
0
0
0
0
0
0
0
1
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
1
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
1
0
0
0
0
0
1
1
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
0
0
0
1
1
0
0
0
0
0
1
1
0
0
0
0
0
0
0
0
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
0
0
1
1
0
1
1
1
1
1
1
0
0
0
0
0
0
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
1
1
1
1
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
1
1
0
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
1
1
0
0
0
0
1
1
1
1
1
0
0
0
0
0
1
1
1
0
0
1
1
1
0
0
0
0
0
0
0
0
0
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
1
0
0
0
0
0
0
0
0
0
0
0
1
1
0
1
1
1
0
0
0
0
0
0
0
0
0
1
1
1
0
0
1
1
1
0
0
0
0
0
0
0
0
1
1
0
0
0
0
1
1
0
0
0
0
0
0
0
1
1
0
0
0
0
0
0
1
1
1
1
1
1
1
1
0
0
0
0
0
El clasificador de Bayes se
entren con 1500 dgitos
escritos a mano
Previa
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
259
Clasificador de Bayes
Matriz de confusin
Respuesta Correcta /
Instancia real
Salida de la clasificacin
0
1
2
3
4
5
6
7
8
9
0
100%
0%
0%
0%
0%
0%
0%
0%
0%
0%
1
2
3
4
5
6
7
8
9
0% 0% 0% 0% 0% 0% 0% 0% 0%
100% 0% 0% 0% 0% 0% 0% 0% 0%
10% 60% 0% 10% 0% 10% 0% 10% 0%
15% 0% 77% 0% 0% 0% 0% 0% 8%
25% 0% 0% 63% 0% 13% 0% 0% 0%
0% 0% 0% 0% 92% 8% 0% 0% 0%
0% 0% 0% 0% 0% 100% 0% 0% 0%
0% 0% 0% 0% 0% 0% 100% 0% 0%
11% 0% 0% 0% 0% 0% 0% 89% 0%
0% 0% 0% 0% 0% 0% 0% 29% 71%
Mapas auto-organizados
Mapas auto-organizados
X1
X2
X3
X4
X5
Xn
Mapas auto-organizados
Mallado en desorden
263
Mapas auto-organizados
1000 Iteraciones
Variacin de propiedades en el mapa
20 Iteraciones
264
Mapas auto-organizados
Aprendizaje competitivo
Los pesos sinpticos son vectores de la misma dimensin de los que conforman los
datos.
Mapas auto-organizados
xi
Cada observacin se
presenta a la red y se
compara su similitud el
peso de todas neuronas
La neurona ms similar al
valor de entrada se activa
(neurona ganadora)
Mapas auto-organizados
Rapia
Aves
Acuticas
Insectos
Reptiles
Voladores
Raro
Terrestres
Acuticos
Mamferos
267
Mapas auto-organizados
Pelo
Vuela
Bpedo
Aunque tanto los insectos como las aves vuelan, slo las aves son bpedas
El mapa es bidimensional, pero la clasificacin es n-dimensional
268
El principal uso de las redes neuronales para resolver problemas de regresin se basa
en la dificultad que enfrentan los mtodos estadsticos tradicionales para modelar
relaciones no lineales.
= 0,19
30
20
20
10
10
0
0
0,2
0,4
0,6
0,8
-10
-10
-20
-20
-30
= 0,14
30
-30
x1
0,2
0,4
0,6
0,8
x2
270
Pero podemos entrenar una red neuronal para que encuentre le patrn que
relaciona la entrada con la salida de los datos.
30
20
10
0
-10
-20
-30
Estimado
Real
El entrenamiento de la red se ve
reflejado en los valores finales de los
pesos sinpticos y valores del sesgo.
Entrada
Salida
Capa oculta
272
-10
Slo se ha detectado el
componente sinusoidal
-20
-30
Estimado
Real
273
Subestimacin
sistemtica
-10
-20
-30
Estimado
Real
274
Tasa de aprendizaje.
Consideraciones generales
Explorar las variables: tratar de entender las relaciones que puedan existir entre las
variables o transformaciones de las mismas.
Identificar grupos: a veces las relaciones entre las variables pueden ser distintas
dependiendo de si las observaciones pertenecen sub-poblaciones, en este caso es
conveniente identificar los grupos y luego aplicar los mtodos de regresin dentro de
cada grupo.
277
Durante el estudio de los yacimiento existen tres tipos de tareas que pueden
desarrollarse con el apoyo de algoritmos de aprendizaje automtico.
Clasificacin de facies geolgicas: utilizar las variables que mejor describen las
facies identificadas para clasificar los tipos en localidades no observadas. Esto
puede llevarse a cabo con mtodos de clasificacin supervisada.
280
Matriz de distancias
Ideas Finales
La estadstica es la nica ciencia incapaz de demostrar nada.
282
Ideas Finales
No existen modelos estadsticos correctos, simplemente, algunos son tiles.
283
Ideas Finales
GRACIAS!
284
Glosario de Trminos
Glosario de Trminos
1.
Variable aleatoria: funcin que asigna un nmero real X(s) a cada resultado posible s
experimento concreto.
S en un
2.
Funcin de probabilidad: funcin definida sobre la recta real, acotada en el intervalo [0,1], cuyo valor es la
probabilidad del suceso {X = x} .
3.
Funcin de distribucin acumulativa: funcin definida sobre la recta real, acotada en el intervalo [0,1],
cuyo valor es la probabilidad del suceso {X x} .
4.
5.
6.
Covarianza: medida de la tendencia de dos variables aleatorias a variar de manera conjunta en lugar de
independientemente.
7.
8.
Simulacin por mtodos de Monte Carlo: proceso de simulacin basado en la toma de observaciones
provenientes de una distribucin de probabilidad especfica.
9.
Realizacin: se llama realizacin a cada observacin tomada de una distribucin especfica mediante el
algoritmo de simulacin.
10.
Semilla: valor asociado al estado del generador de nmero aleatorios, permite generar realizaciones
idnticas y reproducir resultados basados en simulacin estocstica.
286
Variable regionalizada: conjunto de valores de una funcin aleatoria para cada valor de la localizacin de
la propiedad en el espacio.
12.
13.
14.
Anisotropa: propiedad general de la materia, segn la cual sus propiedades o caractersticas varan segn
la direccin en que sean examinadas.
15.
16.
17.
Variograma: funcin que cuantifica la covarianza espacial de una variable para cada distancia definida
entre pares de puntos.
18.
Sill o meseta: parmetro del variograma asociado a la variabilidad total de la variable, valor mximo
alcanzado, o asinttico del variograma.
19.
Nugget o pepita: parmetro del variograma asociado a la variabilidad a distancias pequeas, valor del
intercepto del variograma.
287
Rango: distancia a la cual el variograma alcanza el sill o meseta, a distancias mayores al rango la variable
se considera incorrelacionada.
21.
Reescalamiento: proceso de reduccin de la resolucin de una variable, usualmente aplicado para mejorar
el desempeo computacional de los modelos.
22.
Facies: cuerpo de roca con caractersticas especficas, las caractersticas pueden estar asociadas a aspectos
observacionales, genticos, ambientales o composicionales.
23.
Porosidad: indicador de la capacidad de la roca para almacenar fluidos, relacin entre el volumen poroso y
el volumen total de la roca.
24.
25.
Saturacin de fluidos: indicador de la proporcin de volumen que ocupa un fluido especfico en el espacio
poroso de la roca, relacin entre el volumen del fluido y el volumen poroso total de la roca.
26.
27.
Inteligencia artificial: rea de las ciencias que estudia el diseo de sistemas capaces de resolver problemas
por s mismos usando como paradigma la inteligencia humana
28.
Aprendizaje automtico: rama de la inteligencia artificial que trata de crear programas capaces de
generalizar comportamientos a partir de informacin suministrada a modo de ejemplos
29.
Neurona: unidad de procesamiento que se comunica enviando seales a travs de conexiones ponderadas
31.
32.
Mapa auto-organizado: tipo de red neuronal entrenada mediante aprendizaje no supervisado que
permite una visualizacin discreta del espacio de las observaciones en un mapa
33.
Peso sinptico: peso de la conexin existente entre cada par de neuronas de una red.
289
Bibliografa
Bibliografa
M. DeGroot. Probabilidad y estadstica. Addison-Wesley 1975.
Ch. Grinstead, J. Snell. Introduction to probability. American Mathematical Society, 1997.
M. Martnez. Elaboracin de un algoritmo para generar mapas de heterogeneidad a partir de datos petrofsicos
de un yacimiento. Tesis UCV 2013.
M. Corrales. Implementacin de un algoritmo para la simulacin estocstica de modelado de facies, basado en
el mtodo de geoestadstica multipunto. Tesis UCV 2014.
S. Haykin. Neural Networks, Macmillan 1994.
B. Krse, P. Van der Smagt. Introduction to neural networks. University of Amsterdam 1996.
Sh. Swartz, B. David. Understanding Machine learning, from theory to algorithms. Cambridge 2014.
J. Hair. Multivariate Data Analysis. Pearson 2009.
291