Professional Documents
Culture Documents
Clasificacin
C A P T U L O
Clasificacin
Introduccin
El Proceso de
Clasificacin
Reconocimiento de
Patrones
Entrenamiento
Primero, el sistema computacional debe ser entrenado para reconocer patrones en los datos. El
entrenamiento es el proceso de definir los criterios por los cuales sern reconocidos estos
patrones (Hord 1982). El entrenamiento puede realizarse con un mtodo supervisado o no
supervisado, como se explicar posteriormente.
Entrenamiento Supervisado
El entrenamiento supervisado es controlado estrechamente por el analista. En este proceso, el
usuario selecciona pxeles que representan patrones o rasgos de la cobertura terrestre que l
reconoce, o que l puede identificar con ayuda de otras fuentes, como fotografas areas, datos
de verdad de terreno o mapas. Antes de la clasificacin se requiere conocer los datos y las clases
deseadas.
Mediante la identificacin de patrones, usted puede entrenar el sistema computacional para
identificar pxeles con caractersticas similares. Si la clasificacin es exacta, las clases
resultantes representan las categoras de datos que usted identific originalmente.
Field Guide
213
Clasificacin
Entrenamiento No Supervisado
El entrenamiento no supervisado es ms automatizado. Le permite al usuario especificar
algunos parmetros que el computador usa para revelar patrones estadsticos que son inherentes
a los datos. Estos patrones no necesariamente corresponden a las caractersticas directamente
significativas de la escena, como reas contiguas y fcilmente reconocidas de un determinado
tipo de suelo o uso de la tierra. Ellos simplemente son conglomerados de pxeles con
caractersticas espectrales similares. En algunos casos, puede ser ms importante identificar
grupos de pxeles con caractersticas espectrales similares que ordenar los pxeles dentro de
categoras reconocibles.
El entrenamiento no supervisado depende de los datos en s mismos para la definicin de las
clases. Este mtodo normalmente se usa cuando no se conocen muy bien los datos antes de la
clasificacin. Es entonces responsabilidad del analista, despus de la clasificacin, agregar
significado a las clases resultantes (Jensen 1996). La clasificacin no supervisada slo es til si
las clases pueden interpretarse apropiadamente.
Firmas
Ver apndice A "Temas de Matemticas" para informacin sobre las imgenes del
espacio de caractersticas y cmo es su creacin.
Regla de Decisin
214
Despus que las firmas son definidas, se ordenan los pxeles de la imagen en clases basadas en
las firmas para uso de una regla de decisin de clasificacin. La regla de decisin es un
algoritmo matemtico que, usando los datos contenidos en la firma, realiza el ordenamiento real
de los pxeles en distintos valores de clase.
ERDAS
Notas sobre
Clasificacin
Esquemas de
Clasificacin
Anderson, J.R., et al 1976. "A Land Use and Land Cover Classification System for Use
with Remote Sensor Data." U.S. Geological Survey Professional Paper 964.
Cowardin, Lewis M., al del et. 1979. Classification of Wetlands and Deepwater Habitats of
the United States. Washington, D.C.. U.S. Fish and Wildlife Service.
Florida Topographic Bureau, Thematic Mapping Section. 1985. Florida Land Use, Cover
and Forms Classification System. Florida Department of Transportation, Procedure No.
550-010-001-a.
Michigan Land Use Classification and Reference Committee. 1975. Michigan Land
Cover/Use Classification System. Lansing, Michigan. State of Michigan Office of Land
Use.
Field Guide
215
Clasificacin
Clasificacin
Iterativa
Un proceso es iterativo cuando repite una accin. El objetivo del sistema ERDAS IMAGINE es
permitir al usuario crear, refinar firmas y clasificar archivos iterativamente hasta llegar a una
clasificacin final deseada. Las utilidades de clasificacin de ERDAS IMAGINE son
herramientas que se usan cuando sea necesario, no una lista numerada de pasos que siempre
deben seguirse en orden.
La clasificacin total puede lograrse con mtodos supervisados o no supervisados o una
combinacin de ambos. Algunos ejemplos son:
Entrenamiento
Supervisado vs. No
Supervisado
Las firmas creadas con los dos entrenamientos, supervisado y no supervisado, pueden
unirse y agregarse unas a otras.
Las herramientas para la evaluacin de firmas se pueden usar para indicar cules firmas son
similares espectralmente. Esto ayudar a determinar cules firmas deben unirse o borrarse.
Estas herramientas tambin ayudan a definir combinaciones ptimas de bandas para la
clasificacin. El uso de la combinacin ptima de bandas puede reducir el tiempo requerido
para realizar un proceso de clasificacin.
Dado que las clasificaciones (supervisadas o no supervisadas) pueden basarse en una rea
de inters particular (definida en una capa raster o en una capa .aoi), pueden generarse
firmas y clasificaciones a partir de los resultados de una clasificacin previa.
Clasificacin de
Datos Realzados
Para muchas aplicaciones especializadas, los datos clasificados que han sido unidos, realzados
o fusionados espectralmentecon componentes principales, lgebra de imgenes u otras
transformacionespuede producir resultados muy especficos y significativos. Sin embargo, si
no existe una buena comprensin de los datos y de los mejoramientos usados, se recomienda
que slo sean clasificados los datos adquiridos remotamente.
Dimensionalidad
216
ERDAS
Entrenamiento Supervisado
Use Signature Editor para evaluar la separabilidad para calcular el mejor subconjunto
de combinaciones de capas. Use las funciones de Image Interpreter para fusionar o
recortar capas. Use la herramienta Image Information (en la barra de herramientas del
Visor) para borrar una(s) capa(s).
Entrenamiento
Supervisado
El entrenamiento supervisado requiere informacin a priori (ya conocida) sobre los datos,
como:
Qu clases son las que probablemente estn presentes en los datos? Es decir, qu tipos de
cobertura terrestre, suelos o vegetacin (u otra variable) estn representados por los datos?
Field Guide
217
Clasificacin
Muestras de
Entrenamiento y
Objetos del Espacio
de Caractersticas
Las muestras de entrenamiento (tambin llamadas muestras) son conjuntos de pxeles que
representan lo que es reconocido como un patrn discernible o una clase potencial. El sistema
calcula las estadsticas de los pxeles de la muestra para crear una firma paramtrica para la
clase.
Los siguientes trminos a veces se acostumbra a intercambiarlos cuando se hace referencia a
muestras de entrenamiento. Por claridad, ellos son usados en esta documentacin como sigue:
Los objetos del espacio de caractersticas son definidos por el usuario como AOI's en la imagen
del espacio de caractersticas. La firma en el espacio de caractersticas se basa en estos objetos.
Seleccin de las
Muestras de
Entrenamiento
Es importante que las muestras de entrenamiento sean representativas de las clases que usted
intenta identificar. Esto no necesariamente significa que ellas deban contener un gran nmero
de pxeles o deban dispersarse a travs de una gran regin de los datos. La seleccin de las
muestras de entrenamiento depende hasta del conocimiento que usted tenga de los datos de
estudio y de la clase que desea extraer.
ERDAS IMAGINE permite identificar muestras de entrenamiento usando uno o ms de los
siguientes mtodos:
Polgonos
Digitalizados
identificando una muestra de entrenamiento de pxeles contiguos dentro de cierta rea, con
o sin caractersticas espectrales similares
usando una clase de capa raster temtica de un archivo de imagen de la misma rea ( es
decir, el resultado de una clasificacin no supervisada)
218
ERDAS
Polgonos Definidos
por el Usuario
Usando sus habilidades para reconocimiento de patrones (con o sin informacin de verdad del
terreno complementaria), usted puede identificar muestras examinado una imagen desplegada
y dibujando un polgono alrededor del (los) sitio(s) de inters. Por ejemplo, si usted conoce que
los rboles de roble reflejan cierta frecuencias de luz verde e infrarroja, de acuerdo con la verdad
del terreno, usted puede basar su seleccin de la muestra con estos datos (teniendo en cuentra
condiciones atmosfricas, ngulo solar, hora, fecha y otras variables). El rea dentro del (los)
polgono(s) se usara para crear una firma.
Use la herramienta AOI para definir el (los) polgono(s) a ser usados como muestras de
entrenamiento. Use Signature Editor para crear firmas a partir de muestras de
entrenamiento identificadas con los polgonos.
Identificacin de los
Pxeles Semilla
Con el dilogo Seed Properties y las herramientas AOI, el cursor (tijera) puede usarse para
identificar un slo pxel (pxel semilla) que sea representativo de la muestra de entrenamiento.
Este pxel semilla es usado como pxel modelo, con el cual se comparan los pxeles contiguos
basados en los parmetros especificados por usted.
Cunado se acepta uno o ms de los pxeles contiguos, se calcula la media de la muestra con los
pxeles aceptados. Luego, los pxeles contiguos de la muestra se comparan de la misma manera.
Este proceso se repite hasta que ningn pxel contiguo a la muestra satisfaga los parmetros
espectrales. En efecto, la muestra crece hacia afuera del pxel modelo con cada iteracin. Estos
pxeles homogneos se convierten de pxeles raster individuales a un polgono y se usan como
capas AOI.
Las muestras de entrenamiento identificadas con el mtodo del pxel semilla pueden limitarse a
una regin particular definiendo las distancias y un rea geogrfica.
Las capas vectoriales (polgono o lneas) pueden desplegarse como las capas superiores
en el Visor y sus lmites pueden usarse como AOI para las muestras de entrenamiento
definidas en Seed Properties.
Capas Raster
Temticas
Una muestra de entrenamiento puede ser definida usando valores de clase de una capa raste
temtica (ver Tabla 6-1 en la pgina 220). Los valores en la muestra de entrenamiento son
usados para crear una firma. La muestra de entrenamiento puede ser definida con tantos valores
de clase como se desee.
NOTA: Las capas raster temticas debe tener el mismo sistema de coordenadas que el archivo
de la imagen que se est clasificando.
Field Guide
219
Clasificacin
Evaluacin de la
Muestras de
Entrenamiento
Ventajas
Desventajas
Polgonos Digitalizados
Pixel Semilla
Ver "Evaluacin de Firmas" en la pgina 231 para referencia sobre mtodos para
determinar la exactitud de las firmas creadas a partir de sus muestras de entrenamiento.
Las herramientas Feature Space de ERDAS IMAGINE le permite definir interactivamente los
objetos del espacio de caractersticas (AIOs) en la imagen de tal espacio. Una imagen de espacio
de caractersticas es un grfico simple de los niveles digitales de una banda contra los valores
de otra banda (a menudo llamado diagrama de dispersin). En ERDAS IMAGINE, una imagen
del espacio caracterstico tiene la misma estructura de datos que una imagen raster; por
consiguiente, las imgenes de los espacios caractersticos pueden utilizarse con otras utilidades
de ERDAS IMAGINE, incluyendo zoom, segmentacin a nivel de color, desplazamiento
virtual, Spatial Modeler y Map Composer.
band 2
Seleccin de
Objetos en el
Espacio de
Caractersticas
band 1
220
ERDAS
Cuando usted despliega el archivo de una imagen del espacio de caractersticas (.fsp.img)
en el visor, los colores reflejan la densidad de puntos para ambas bandas. Los tonos
brillantes reflejan una densidad alta y los tonos oscuros reflejan una densidad baja.
Creacin de Firmas
No Paramtricas
Usted puede definir un objeto en el espacio de caractersticas (AOI) en la imagen del espacio de
caractersticas y usarlo directamente como una firma no paramtrica. Debido a que los visores
para la imagen del espacio caracterstico y la imagen que se est clasificando estn enlazados
con Signature Editor de ERDAS IMAGINE, es posible enmascarar AOIs de la imagen que se
est clasificando a la imagen del espacio caracterstico y viceversa. Usted puede enlazar
directamente el cursor del visor de la imagen con el visor del espacio caracterstico. Esta funcin
le ayuda a determinar una localizacin para el AOI en la imagen del espacio caracterstico.
Para definir una firma puede usarse solo una imagen del espacio caracterstico, pero mltiples
AOIs. Esta firma se toma dentro de la imagen del espacio caracterstico, no de la imagen que se
est clasificando. Los pxeles de la imagen que corresponden a los niveles digitales en la firma
(es decir en el objeto del espacio caracterstico) son asignados a esa clase.
Una diferencia fundamental entre el uso de la imagen del espacio caracterstico para definir una
muestra de entrenamiento y los otros mtodos tradicionales es aquella es una muestra no
paramtrica. Las decisiones que se hacen en el proceso de clasificacin no dependen de las
estadsticas de los pxeles. Esto ayuda a mejorar la exactitud de la clasificacin para clases
anormales especficas, tales como zonas urbanas y roca expuesta (Faust et al 1991).
Field Guide
221
Clasificacin
Usando las herramientas Feature Space, es posible usar una firma del espacio caracterstico para
generar una mscara. Una vez definida como una mscara, se identifican los pxeles bajo la
mscara en la imagen y se resaltan en el Visor. La imagen desplegada en el Visor debe ser la
misma a la que se le cre la imagen de espacio caracterstico. Esta proceso le ayudar a analizar
visualmente las correlaciones entre varias bandas espectrales para determinar cul combinacin
de bandas resalta las caractersticas deseadas en la imagen.
Usted puede tener tantas imgenes del espacio caracterstico con diferentes combinaciones de
bandas como desee. Cualquier polgono o rectngulo en estas imgenes del espacio de
caractersticas puede usarse como una firma no paramtrica. Sin embargo, solo una imagen del
espacio de caractersticas puede usarse por firma. Los polgonos en la imagen del espacio
caracterstico pueden modificarse fcilmente y/o enmascararse hasta que las regiones deseadas
en la imagen se hayan identificado.
Use la herramienta Feature Space en Signature Editor para crear una imagen del espacio
de caractersticas y enmascarar la firma. Use las herramienta AOI para dibujar los
polgonos.
222
ERDAS
Entrenamiento No Supervisado
Desventajas
Entrenamiento
No Supervisado
El entrenamiento no supervisado requiere de usted solo una entrada mnima. Sin embargo, usted
tiene la tarea de interpretar las clases que sean creadas por el algoritmo de entrenamiento no
supervisado.
El entrenamiento no supervisado tambin se llama aglomeracin (clustering), porque est
basado en agrupaciones naturales de pxeles en los datos de la imagen cuando ellos son
graficados en el espacio de caractersticas. De acuerdo con los parmetros especificados, estos
grupos pueden unirse, desagregarse, ser manipulados o usados como base para una firma.
Los conglomerados son definidos con un algoritmo de aglomeracin, que usa a menudo todos
o muchos de los pxeles de un archivo de datos de entrada para su anlisis. El algoritmo de
conglomerado no considera la contigidad de los pxeles que definen cada conglomerado.
Cada uno de estos mtodos se explica luego, junto con sus ventajas y desventajas.
Algunos de los trminos estadsticos usados en esta seccin son explicados en el apndice
A "Temas de Matemticas".
Aglomeracin
ISODATA
Field Guide
223
Clasificacin
El mtodo ISODATA usa la mnima distancia espectral para asignar un conglomerado a cada
pxel candidato. El proceso empieza con un nmero especificado de conglomerados arbitrarios
o con los valores medios de las firmas existentes y luego procesa repetidamente, para que estos
promedios se desplacen a los promedios de los conglomerados en los datos.
Como el mtodo ISODATA es interactivo, no est influenciado por los niveles digitales
iniciales, como ocurre en los algoritmos de conglomeracin de un paso.
224
ERDAS
Entrenamiento No Supervisado
Band B
data file values
B+ B
B
B- B
0
0
A -
A+A
Band A
data file values
Cluster
4
Cluster
5
Band B
data file values
Cluster
3
Cluster
2
Cluster
1
Band A
data file values
Figura 6-4: Primer Paso del ISODATA
Field Guide
225
Clasificacin
Band B
data file values
Band A
data file values
Figura 6-5: Segundo Paso del ISODATA
Porcentaje Inalterado
Despus de cada iteracin, el porcentaje normalizado de pxeles cuyas asignaciones no se
alteran desde la ltima iteracin es desplegado en el dilogo. Cuando este nmero llegue a T (el
umbral de aglomeracin), el programa termina.
Es posible que el porcentaje de pxeles que no se alteran, nuncan converja o alcance a T (el
umbral de convergencia). Por consiguiente, puede ser beneficioso supervisar el porcentaje o
especificar un nmero mximo razonable de iteraciones, M, para que el programa no corra
indefinidamente.
226
ERDAS
Entrenamiento No Supervisado
Desventajas
Por ser iterativo, la aglomeracin no se influencia El proceso de aglomeracin puede gastar bastante
geogrficamente por los pxeles iniciales o finales tiempo, porque puede repetirse muchas veces.
del archivo de datos.
Este algoritmo es altamente exitoso en el hallazgo No tiene en cuenta la homogeneidad espacial de
de conglomerados espectrales inherentes en los
los pixeles.
datos. No importa donde se localizan las medias
iniciales de los conglomerados, con tal que se
permitan bastantes iteraciones.
Se crea una capa raster temtica perliminar, que da
resultados similares a los de usar el clasificador de
mnima distancia (como se explica luego) con las
firmas que se crean. Estas capas raster temticas
pueden ser usadas para analizar y manipular las
firmas antes que la clasificacon real se lleve a
cabo.
227
Clasificacin
Aglomeracin
RGB
Las funciones RGB Clustering y Advanced RGB Clustering de Image Interpreter crean
una capa raster temtica. Sin embargo, no se crea ningn archivo de firmas y no se usa
ninguna otra regla de decisin de clasificacin. En la prctica, la aglomeracin RGB
difiere bastante de los otros mtodos de conglomeracin, no obstante ella emplea un
algoritmo de aglomeracin.
La aglomeracin RGB es una tcnica simple de clasificacin y compresin de datos para datos
de tres bandas y de 8 bits. Este es un algoritmo rpido y simple que comprime rpidamente las
tres bandas de la imagen en una sola banda seudo color, sin clasificar necesariamente alguna
caracterstica particular.
El algoritmo grafica todos los pxeles en el espacio de caractersticas tridimensional y luego
divide este espacio en conglomerados, en una grilla. En la versin ms simple de esta funcin,
cada uno de estos conglomerados se vuelve una clase en la capa raster temtica de salida.
La versin ms avanzada requiere de un umbral mnimo para el tamao de los conglomerados,
para que solo los conglomerados que sean por lo menos tans grandes como el umbral se vuelvan
clases de salida. Esto permite una mayor variacin del color en el archivo de salida. Los pxeles
que no entran en cualquiera de los conglomerados restantes sern asignados al conglomerado
con la distancia city-block ms pequea al pxel. En este caso, ese tipo de distancia se calcula
como la suma de las distancias en la direcciones roja, verde y azul en el espacio tridimensional.
A lo largo de cada eje del diagrama de dispersin tridimensional, cada histograma de entrada es
escalado para que las particiones dividan los histogramas entre los lmites especificados - ya sea
un nmero especificado de desviaciones estndar antes y despus de la media, o entre el mnimo
y el mximo de los niveles digitales de cada banda.
Por defecto, el nmero de divisiones por bandas es:
228
ERDAS
Aglomeracin RGB
frequency
B
16
0
35
16
195
255
98
98
195
16
55
35
34 R
G
16
35
25
Field Guide
229
Clasificacin
Desventajas
Consejos
Algunos valores iniciales que usualmente producen buenos resultados con la aglomeracin
RGB son:
R
G
B
=
=
=
7
6
6
Archivos de
Firmas
Una firma es un conjunto de datos que define una muestra de entrenamiento, un objeto del
espacio caracterstico (AOI) o un conglomerado. La firma se usa en el proceso de clasificacin.
Cada regla de decisin de la clasificacin (algoritmo) requiere como entrada algunos atributos
de la firma que son almacenados en el archivo de firmas (.sig). En ERDAS IMAGINE las firmas
pueden ser paramtricas y no paramtricas.
Los siguientes atributos son estndar para todas las firmas (paramtricas y no paramtricas):
230
Colorel color para la firma y el color para la clase en la capa raster temtica de salida.
Este color tambin se usa con otras funciones de visualizacin de firmas como alarmas,
mscaras, elipses, etc.
ERDAS
Evaluacin de Firmas
Firma Paramtrica
Firmas No
Paramtricas
Ordenel orden para procesar las firmas en procesos que dependan del orden, tales como
alarmas de firmas y clasificaciones con el mtodo del paraleleppedo.
Una firma paramtrica est basada en parmetros estadsticos (p.e., media y matriz de
covarianza) de los pxeles que estn en la muestra de entrenamiento o conglomerado. Una firma
paramtrica incluye los siguientes atributos adems de los atributos estndar para las firmas:
el nivel digital mnimo y mximo de cada banda para cada muestra o conglomerado (vector
mnimo y mximo)
la media de los niveles digitales de cada banda para cada muestra o conglomerado (vector
medio)
Una firma no paramtrica est basada en un AIO que usted define en la imagen de espacio
caracterstico para el archivo imagen que est siendo clasificado. Un clasificador no
paramtrico usar un conjunto de firmas no paramtricas para asignar pxeles a una clase
basados en su localizacin, dentro o fuera del rea en la imagen del espacio caracterstico.
Evaluacin de
Firmas
Una vez creadas las firmas, estas pueden evaluarse, borrarse, renombrarse y fusionarse con otras
firmas de otros archivos. La fusin de firmas permite realizar clasificaciones complejas con
firmas derivadas con ms de un mtodo de entrenamiento (supervisado y/o no supervisado,
paramtrico y/o no paramtrico).
Use Signature Editor para ver los contenidos de cada firma, para manipularlas y realizar
sus propias pruebas matemticas de las estadsticas.
Uso de los Datos de
Firmas
Field Guide
Se pueden realizar pruebas que le pueden ayudar a determinar si los datos de una firma son una
verdadera representacin de los pxeles a ser clasificados para cada clase. Usted puede evaluar
las firmas que se crearon con entrenamiento supervisado o no supervisado. Los mtodos de
evaluacin de ERDAS IMAGINE incluyen:
231
Clasificacin
NOTA: Si la firma es no paramtrica ( p.e., una firma del espacio de caractersticas), usted solo
puede usar el mtodo de evaluacin de alarmas.
Despus de analizar las firmas, sera beneficioso unirlas o borrarlas, eliminar bandas
redundantes, adicionar nuevas bandas o realizar cualquier otra operacin para mejorar la
clasificacin.
Alarma
La evaluacin alarma permite comparar una clasificacin estimada de una o ms firmas con
respecto a los datos originales, como aparecen en el Visor. De acuerdo con la regla de decisin
de paraleleppedos, los pxeles que se ajustan al criterio de clasificacin son iluminados en la
imagen desplegada. Usted tiene la opcin de resaltar un traslapo hacindolo aparecer con un
color diferente.
Con esta prueba, usted puede usar sus propias habilidades en el reconocimiento de patrones, o
algunos datos de verdad de terreno, para determinar la exactitud de una firma.
Use la utilidad Signature Alarm de Signature Editor para realizar alarmas de ndimensiones en la imagen en el Visor, empleando la regla de decisin del paraleleppedo.
La utilidad de alarma crea una capa funcional y el Visor le permite alternar la capa
imagen y la capa funcional.
Elipse
En esta evaluacin, se calculan las elipses de concentracin a partir de las medias y las
desviaciones estndar almacenadas en el archivo de firmas. Tambin es posible generar
rectngulos o paraleleppedos, medias y etiquetas.
En esta evaluacin, se usa la media y la desviacin estndar de cada firma para representar la
elipse en dos dimensiones en el espacio de caractersticas. La elipse es desplegada en una
imagen del espacio caracterstico.
232
ERDAS
Evaluacin de Firmas
La Figura 6-7 en la pgina 233 muestra como se trazan las elipses y como pueden traslaparse.
El primer grfico muestra como se trazan las elipses en el rango de dos desviaciones estndar
alrededor de la media. Este rango puede variarse, cambiando los grficos de la elipse. El anlisis
de los grficos con diferentes nmeros de desviacin estndar, es til para determinar los lmites
de una clasificacin por paraleleppedos.
signature 1
B2
+2 s
B2+2s
signature 2
B2
B2
Distinct Signatures
Band D
data file values
Signature Overlap
D1
D1
signature 1
signature 2
D2
D2
s
B2B2-2-2s
A2+2s
A2
A2-2s
A2 +2s
A2
A2 -2 s
Band A
data file values
C2
C1
C1
Band C
data file values
Use Signature Editor para crear una imagen del espacio caracterstico y ver una(s)
elipse(s) de los datos de una firma.
Matriz de
Contingencia
NOTA: Esta evaluacin clasifica todos los pxeles en las AIOs seleccionadas y compara los
resultados con los pxeles de una muestra de entrenamiento.
Los pxeles de cada muestra de entrenamiento no siempre son tan homogneos como para que
cada pxel de la muestra se clasifica con su correspondiente clase. Cada pxel de la muestra
solamente da peso a las estadsticas que determinan las clases. Sin embargo, si las estadsticas
de cada muestra son distintas de las otras muestras, entonces un alto porcentaje de los pxeles
de cada muestra ser clasificado como se esperaba.
En esta evaluacin, se realiza una clasificacin rpida de los pxeles de la muestra usando las
reglas de decisin de mnima distancia, mxima probabilidad o distancia de Mahalanobis.
Luego, se presenta una matriz de contingencia que contiene el nmero y el porcentaje de los
pxeles que fueron clasificados como se esperaba.
Field Guide
233
Clasificacin
Separabilidad
La separabilidad de las firmas es una medida estadstica de distancia entre dos firmas. La
separabilidad puede calcularse para cualquier combinacin de bandas que se usen en la
clasificacin, permitiendo que usted decida cules bandas no son tiles en los resultados de la
clasificacin.
Para evaluar la distancia (Euclidiana), se calcula la distancia espectral entre los vectores media
(promedio) de cada par de firmas. Si la distancia espectral entre dos muestras no es significativa
para cualquier par de bandas, entonces ellas no pueden ser lo suficientemente distintas para
producir una clasificacin exitosa.
La distancia espectral tambin es la base de la clasificacin por mnima distancia (como se
explica posteriormente). Por consiguiente, calcular la distancia entre firmas le ayuda a predecir
los resultados de una clasificacin por mnima distancia.
Use Signature Editor para calcular la separabilidad y la distancia entre firmas y generar
el reporte automticamente.
Las formulas usadas para calcular la separabilidad estn relacionadas con la regla de decisin
de mxima probabilidad. As que, la evaluacin de la separabilidad de las firmas le ayuda a
predecir el resultado de la clasificacin por mxima probabilidad. La regla de mxima
probabilidad se explica posteriormente.
Hay tres opciones para calcular la separabilidad. Todas stas formulas tienen en cuenta las
covarianzas de las firmas de las bandas a compararse, como tambin los vectores de las medias
de las firmas.
1
1
T
1
1
1
1
D ij = --- tr ( ( C i C j ) ( C i C j ) ) + --- tr ( ( C i C j ) ( i j ) ( i j ) )
2
2
Donde:
iyj
Ci
=
=
tr
T
=
=
=
234
ERDAS
Evaluacin de Firmas
Divergencia Transformada
La frmula para calcular la divergencia transformada (DT) es:
1
1
1
1
1
1
T
D ij = --- tr ( ( C i C j ) ( C i C j ) ) + --- tr ( ( C i C j ) ( i j ) ( i j ) )
2
2
Donde:
iyj
Ci
mi
tr
T
=
=
=
=
=
JM ij =
2( 1 e )
Donde:
iyj
Ci
=
=
ln
|Ci|
=
=
=
Field Guide
235
Clasificacin
Separabilidad
Tanto la transformada de divergencia como la distancia de Jeffries-Matusita poseen lmites
superiores e inferiores. Si la divergencia calculada es igual a la cota superior apropiada, se puede
decir entonces que las firmas son totalmente separables en las bandas en estudio. Si la
divergencia es cero (0) significa que las firmas no se puedan separar.
c 1
fi fj Uij
i = 1 j = i + 1
W ij = ---------------------------------------------------2
c
c
1---
f fi 2
2 i
i = 1
i=1
Donde:
iyj
Uij
Wij
c
fi
236
=
=
=
=
=
ERDAS
Probabilidad de Error
La distancia de Jeffries-Matusita est relacionada con la probabilidad de error apareada, que es
la probabilidad que un pxel asignado a la clase i est realmente en la clase j. Dentro de un rango,
esta probabilidad puede ser estimada de acuerdo con la siguiente expresin:
2
1
------ ( 2 JM 2ij ) P e 1 1
--- 1 + 1
--- JM 2ij
16
2
2
Donde:
iyj =
JMij =
Pe
=
En muchos casos, debe repetirse el entrenamiento varias veces antes de producir las firmas
deseadas. Las firmas pueden obtenerse de diferentes fuentesdiferentes muestras de
entrenamiento, imgenes de espacios de caractersticas y diferentes programas de
agrupamientoutilizando en todas diferentes tcnicas. Despus de evaluar cada archivo de
firmas, uno puede unir, suprimir o crear nuevas firmas. Las firmas deseadas pueden moverse
finalmente a un archivo de firmas para ser usado en la clasificacin.
Las siguientes operaciones sobre firmas y archivos de firmas son posibles con ERDAS
IMAGINE:
Observar los histogramas de las muestras o de los conglomerados usados para derivar las
firmas.
Unir firmas para que formen una sola clase ms grande en el momento de la clasificacin.
Aadir firmas desde otros archivos. Puede combinar firmas derivadas de diferentes
mtodos de entrenamiento para uso en una clasificacin.
Use Signature Editor para observar las estadsticas y los listados de histogramas, o para
borrar, unir, agregar y renombrar firmas dentro de un archivo de firmas.
Reglas de
Decisin de
Clasificacin
Field Guide
Una vez que un nmero considerable de firmas ha sido creado y evaluado, el siguiente paso es
realizar la clasificacin de los datos. Cada pxel es analizado independientemente. El vector de
medidas para cada pxel es comparado con cada firma, de acuerdo con la regla de decisin o el
algoritmo. Los pxeles que cumplen el criterio establecido por la regla de decisin son asignados
a la clase de la firma. ERDAS IMAGINE permite clasificar los datos ya sea paramtricamente
con representaciones estadsticas o no paramtricamente como objetos en el espacio de
caractersticas. La Figura 6-8 en la pgina 239 muestra el flujo de un pxel en el proceso de
clasificacin de una imagen en ERDAS IMAGINE (Kloer 1994).
237
Clasificacin
Si no existe una regla no paramtrica, el pxel es clasificado utilizando nicamente la regla de
decisin paramtrica. Todas las firmas paramtricas son examinadas. Si una regla no
paramtrica est definida, entonces se evalan todas las firmas con las definiciones no
paramtricas. Estas reglas tienen las siguientes condiciones:
Reglas No
Paramtricas
Si la evaluacin no paramtrica resulta en una sola clase, el pxel es asignado a dicha clase.
Si la evaluacin no paramtrica resulta en clases cero (0), (es decir, el pxel est por fuera
de todas las reglas de decisin no paramtricas) entonces se aplica la regla sin clasificacin.
Con esta regla, el pxel es clasificado por la regla paramtrica o se queda sin clasificar.
paraleleppedo
espacio de caractersticas
regla paramtrica
sin clasificar
Opcin de Superposicin
ERDAS IMAGINE ofrece estas opciones si el pxel cae en ms de uno de los espacios de
caractersticas:
Reglas Paramtricas
238
regla paramtrica
por orden
sin clasificar
distancia mnima
distancia Mahalanobis
ERDAS
Candidate Pixel
Nonparametric Rule
No
Yes
>1
Unclassified
Options
Parametric
Unclassified
Overlap Options
By Order
Parametric
Unclassified
Parametric Rule
Unclassified
Assignment
Class
Assignment
Field Guide
En la regla de decisin del paraleleppedo los niveles digitales del pxel candidato se comparan
con los lmites superior e inferior. Estos lmites pueden ser:
El mnimo y el mximo valor de los niveles digitales para cada banda en la firma.
Cualquier lmite que usted especifique, basado en el conocimiento que tenga de los datos y
firmas. Este conocimiento puede provenir de las tcnicas de evaluacin de firmas
discutidas anteriormente.
239
Clasificacin
class 3
? ?
? ?
?
?
? ?
? ?
? ?
?
?
?
? ?
? ?
? ? ?
?
? ?
class 1
?
? ?
?
?
= pixels in class 1
= pixels in class 2
= pixels in class 3
= unclassified pixels
A2 = mean of Band A,
class 2
B2 = mean of Band B,
class 2
class 2
A2+2s
B2-2s
A2-2s
B2
A2
Band B
data file values
B2+2s
Band A
data file values
240
El pxel puede ser clasificado por el orden de las firmas. Si una de las firmas es la primera
y la otra es la cuarta, el pxel es asignado a la clase de la primera firma. Este orden puede
ser programado desde Signature Editor.
El pxel puede ser clasificado por la regla de decisin paramtrica definida. El pxel es
evaluado nuevamente con las firmas sobrepuestas nicamente. Si ninguna de estas firmas
es paramtrica, el pxel se deja sin clasificar entonces. Si slo una de las firmas es
paramtrica, entonces el pxel es asignado automticamente a la clase de esa firma.
ERDAS
El pxel puede ser clasificado por la regla de decisin paramtrica definida. El pxel es
evaluado nuevamente con todas las firmas paramtricas. Si ninguna de las firmas es
paramtrica, el pxel se deja sin clasificar.
Desventajas
Es rpido y simple, puesto que los niveles digitales Puesto que los paraleleppedos tienen esquinas,
son comparados con los lmites que permanecen algunos pxeles que estn bastante lejanos,
constantes para cada banda en cada firma.
espectralmente, de la media de la firma, puede ser
clasificados. Unejemplo de esto se muestra en la
Figura 6-10 en la pgina 241.
til como una clasificacin general, de primer
paso. Esta regla de decisin reduce rpidamente el
nmero de posibles clases a las que cada pxel
puede asignarse, antes de gastar tiempo en
elaborar clculos, ahorrando tiempo de
procesamiento (p.e., mnima distancia, distancia
de Mahalanobis, o mxima probabilidad).
Band B
data file values
Signature Ellipse
Parallelepiped
boundary
*
candidate pixel
A
Band A
data file values
Field Guide
241
Clasificacin
Espacio de
Caractersticas
El espacio de caractersticas es una regla de decisin que determina si un pxel est o no dentro
de una firma no paramtrica en la imagen del espacio de caractersticas. Cuando los niveles
digitales de los pxeles estn en la firma del espacio de caractersticas, el pxel es asignado a la
clase de esa firma. La Figura 6-11 en la pgina 242 es un ejemplo bidimensional de una
clasificacin por el espacio de caractersticas. Los polgonos en la figura son usados por las
AOIs (reas de Inters) para definir las firmas del espacio de caractersticas.
class 3
Band B
data file values
?? ?
class 2
?
??
?
?
? ?
?
?
?
?
?
?
?
?
class 1
= pixels in class 1
= pixels in class 2
= pixels in class 3
= unclassified pixels
?
?
Band A
data file values
El pxel puede ser clasificado por el orden de las firmas del espacio de caractersticas. Si
una de las firmas es la primera y la otra es la cuarta, el pxel es asignado a la clase de la
primera firma. Este orden puede ser programado desde el Signature Editor.
El pxel puede ser clasificado por la regla de decisin paramtrica definida. El pxel es
evaluado nuevamente con las firmas traslapadas nicamente. Si ninguna de estas firmas del
espacio de caractersticas es paramtrica, el pxel se deja sin clasificar entonces. Si slo una
de las firmas es paramtrica, entonces el pxel es asignando automticamente a la clase de
esa firma.
242
El pxel puede ser clasificado por la regla de decisin paramtrica definida. El pxel es
evaluado de nuevo en todas las firmas paramtricas. Si ninguna de las firmas es
paramtrica, el pxel se deja sin clasificar.
Desventajas
Use la utilidad Decision Rules en Signature Editor para realizar una clasificacin en el
espacio de caractersticas.
Mnima Distancia
Band B
data file values
candidate pixel
B3
B2
B1
o
A1
A2 A3
Band A
data file values
Field Guide
243
Clasificacin
SD xyc =
( ci Xxyi )
i=1
Donde:
n
i
c
Xxyi
ci
=
=
=
=
=
SDxyc =
Disadvantages
Since every pixel is spectrally closer to either Pixels that should be unclassified (i.e., they are not
one sample mean or another, there are no
spectrally close to the mean of any sample, within limits
unclassified pixels.
that are reasonable to you) become classified. However,
this problem is alleviated by thresholding out the pixels
that are farthest from the means of their classes. (See the
discussion of Thresholding on pgina 252.)
The fastest decision rule to compute, except
for parallelepiped.
Distancia
Mahalanobis
El algoritmo de la distancia Mahalanobis asume que los histogramas de las bandas tienen
distribuciones normales. Si este no es el caso, usted puede obtener mejores resultados con
las reglas de decisin del paraleleppedo o mnima distancia o mediante la ejecucin de
la clasificacin por paraleleppedo como un primer paso.
244
ERDAS
=
=
=
=
=
Covc-1 =
T
=
distancia de Mahalanobis
una clase particular
el vector de medidas del pxel candidato
el vector media de la firma de la clase c
matriz de covarianza de los pxeles en la firma de la clase c
inversa de la matriz de covarianza
funcin traspuesta
Disadvantages
Mxima
Probabilidad
/Bayesiano
El algoritmo de mxima probabilidad asume que los histogramas de las bandas tienen
distribuciones normales. Si este no es el caso, usted puede obtener mejores resultados con
las reglas de decisin del paraleleppedo o de la mnima distancia, o clasificando por el
mtodo del paraleleppedo como un primer paso.
Field Guide
245
Clasificacin
La regla de decisin de la mxima probabilidad est basada en la probabilidad que un pxel
pertenezca a una clase particular. La ecuacin bsica asume que estas probabilidades son
iguales para todas las clases y que las bandas de entrada tienen distribuciones normales.
Clasificacin Bayesiano
Si usted tiene un conocimiento a priori que las probabilidades no son iguales para todas las
clases, usted puede especificar factores de peso para clases particulares. Esta variante de la regla
de decisin de la mxima probabilidad se conoce como regla de decisin Bayesiana (Hord
1982). A menos que usted tenga conocimiento a priori de las probabilidades, se recomienda no
especificarlas. En este caso, los pesos predefinidos en la ecuacin son 1.0.
La ecuacin para el clasificador mxima probabilidad/Bayesiano es:
D = ln(ac) - [0.5 ln(|Covc|)] - [0.5 (X-Mc)T (Covc-1) (X-Mc)]
Donde:
D
c
X
Mc
ac
=
=
=
=
=
Covc =
|Covc| =
Covc-1=
ln
=
T
=
Desventajas
246
ERDAS
Metodologa Fuzzy
Metodologa
Fuzzy
Clasificacin Difusa
(Fuzzy)
El mtodo de la clasificacin Fuzzy tiene en cuenta que hay pxeles entremezclados, esto es, que
un pxel no puede ser definitivamente asignado a una categora. Jensen menciona que,
"Claramente, debe existir una forma para que los algoritmos de clasificacin sean ms
sensitivos a la imprecisin (Fuzzy) de la naturaleza del mundo real" (Jensen 1996).
La clasificacin Fuzzy est diseada para ayudarle a trabajar con datos que no estn en una
categora o en otra exactamente. La clasificacin Fuzzy trabaja utilizando una funcin de
membresa, en donde el valor de un pxel es determinado por su mayor cercana a una clase que
a otra. Una clasificacin fuzzy no tiene lmites definidos y cada pxel puede pertenecer a
diferentes clases (Jensen 1996).
Igual que la clasificacin tradicional, la clasificacin fuzzy usa entrenamiento, pero la mayor
diferencia es que "tambin es posible obtener informacin sobre las diferentes clases
encontradas en un pxel mixto..." (Jensen 1996). Jensen contina explicando que el proceso de
recolectar sitios de entrenamiento en una clasificacin fuzzy no es tan estricto como en la
clasificacin normal. En el mtodo fuzzy, los sitios de entrenamiento no deben tener los mismo
pxeles exactamente.
Una vez se tiene la clasificacin fuzzy, la utilidad Fuzzy Convolution nos permite obtener una
ventana de convolucin mvil en una clasificacin fuzzy con mltiples clases. Usando la
clasificacin multicapas y el archivo de distancia, el computador crea una nica clase de archivo
de salida, calculando un total de distancias ponderadas con las clases en la ventana.
Convolucin Fuzzy
La operacin Fuzzy Convolution crea una sola capa de clasificacin calculando la distancia
inversa ponderada de todas clases en la ventana de pxeles. Luego, asigna el pxel central a la
clase con la mayor distancia inversa total sumada sobre todos los conjuntos de capas de
clasificacin fuzzy.
Esto tiene el efecto de crear una clasificacin basada en el contexto con el fin de reducir el
moteado y efecto pimienta en la clasificacin. Las capas con un valor de distancia muy pequeo
no cambian mientras que las clases con mayores valores de distancias pueden cambiar a un valor
cercano siempre y cuando exista un nmero suficiente de pxeles vecinos con valores de clase
y valores de distancia correspondientes. La siguiente ecuacin es utilizada en el clculo:
s
T[k] =
w ij
------------D ijl [ k ]
i = 0j = 0l = 0
Field Guide
247
Clasificacin
Donde:
i
j
s
l
n
W
k
D[k]
T[k]
=
=
=
=
=
=
=
=
=
Clasificacin
Experta
Ingeniera del
Conocimiento
248
Con la Ingeniera del Conocimiento, usted puede abrir bases de conocimiento, que son
representadas como rboles de decisin en las ventanas de edicin.
ERDAS
Clasificacin Experta
Field Guide
249
Clasificacin
Conditions
Hypothesis
Rule
Southern Slope
Gentle Slope
Slope < 12
Slope > 0
250
ERDAS
Evaluacin de la Clasificacin
El Clasificador de Conocimiento est compuesto por dos partes: una aplicacin con una
interfase de usuario y una lnea de comandos ejecutables. La aplicacin con interfase de usuario
permite un conjunto limitado de entradas de parmetros para controlar el uso de la base del
conocimiento. La interfase de usuario est diseada como un mago para guiarnos a travs de las
pginas de los parmetros de entrada.
Despus de seleccionar una base de conocimiento, se permite seleccionar las clases. El siguiente
es un ejemplo del dilogo para clases:
Evaluacin de la
Clasificacin
Field Guide
Despus de realizar una clasificacin, los siguientes mtodos estn disponibles para evaluar la
veracidad de la clasificacin:
Clasificacin
Umbral
Umbral es el proceso de identificacin de los pxeles en una imagen clasificada que son los ms
probables de ser clasificados incorrectamente. Estos pxeles son puestos en otra clase
(usualmente, la clase 0). Estos pxeles son identificados estadsticamente, basados en la
medicin de distancias utilizadas en la regla de decisin de la clasificacin.
Archivos de Distancia
Cuando se realiza una clasificacin con distancia mnima, la distancia Mahalanobis o la de
mxima probabilidad, se produce un archivo de imagen de distancia en edicin a la capa raster
temtica de salida. El archivo de imagen de distancia es una capa raster continua de una banda,
de 32-bits, en donde cada nivel digital representa el resultado de una ecuacin de distancia
espectral, dependiendo de la regla de decisin utilizada:
Los pxeles ms brillantes (con los mayores valores de distancia) est espectralmente ms lejos
de las medias de las firmas para las clases en las cuales son asignados. Hay ms probabilidad de
estar clasificados incorrectamente.
number of pixels
Los pxeles ms oscuros estn espectralmente ms cercanos y tienen mayor probabilidad de ser
clasificados correctamente. Si fue utilizado el entrenamiento supervisado, los pxeles ms
oscuros son usualmente las muestras de entrenamiento.
0
0
distance value
252
ERDAS
Evaluacin de la Clasificacin
Cambie interactivamente el umbral con el ratn, cuando la distancia del histograma est
desplegada mientras utiliza la funcin umbral. Esta opcin permite seleccionar un valor
chi-cuadrado seleccionando el valor de corte en el histograma.
Entre un parmetro chi-cuadrado o una medida de distancia, para que sea posible calcular
estadsticamente el umbral.
En ambos casos, el umbral tiene el efecto de cortar la cola del histograma del archivo de imagen
de distancias, representando los pxeles con los valores de distancia ms altos.
Field Guide
253
Clasificacin
Estadsticas Chi-Cuadrado
Si se usa el clasificador de distancia mnima, el umbral es simplemente una distancia espectral.
Sin embargo, si se usan Mahalanobis o la Mxima Probabilidad, se emplean las estadsticas Chicuadrado para comparar probabilidades (Swain y Davis 1978).
Cuando las estadsticas se utilizan para calcular el umbral, este es ms claramente definido
como sigue:
T es el valor de la distancia en donde el C% de los pxeles en una clase tienen un valor de
distancia mayor o igual a T:
Donde:
T
C%
=
=
T est relacionado con los valores de distancia por medio de estadsticas chi-cuadrado. El valor
X2 es usado en la ecuacin. X2 es funcin de:
el nivel de confianza
254
ERDAS
Evaluacin de la Clasificacin
No resulta prctico realizar el reconocimiento de campo o la prueba de cada uno de los pxeles
de una imagen clasificada. Por consiguiente, se utiliza un conjunto de pxeles de referencia. Los
pxeles de referencia son puntos de la imagen clasificada para los cuales los datos reales son (o
sern) conocidos. Los pxeles de referencia son seleccionados al azar (Congalton 1991).
NOTA: Usted puede utilizar la utilidad Accuracy Assessment de ERDAS IMAGINE para
realizar una evaluacin de la exactitud de una capa temtica. Esta capa puede no haber sido
clasificada por ERDAS IMAGINE (p.e., usted puede ejecutar una evaluacin de la exactitud
sobre una capa temtica que haya sido clasificada con ERDAS versin 7.5 e importada a
ERDAS IMAGINE).
Pxeles de Referencia al Azar
Cuando los pxeles de referencia son seleccionados por el analista, es una tentacin elegir para
las pruebas de la clasificacin los mismos pixeles que fueron usados como muestras de
entrenamiento. Esto perjudica el examen, ya que las muestras de entrenamiento son la base de
la clasificacin. Al permitir que los pxeles referencia sean seleccionados al azar, la posibilidad
de perjudicar el proceso se reduce o se elimina por completo (Congalton 1991).
El nmero de pxeles de referencia es un factor importante para determinar la exactitud de la
clasificacin. Se ha demostrado que ms de 250 pxeles de referencia son necesarios para
estimar la media de una clase con un error de ms o menos cinco por ciento (Congalton 1991).
ERDAS IMAGINE utiliza una ventana cuadrada para seleccionar los pxeles de referencia. El
tamao de la ventana lo puede definir usted. Se ofrecen tres tipos de distribucin para
seleccionar los pxeles al azar:
Use Accuracy Assesment CellArray para ingresar los pxeles de referencia para los
valores de clase.
Reportes de Error
De la matriz de evaluacin de la exactitud pueden derivarse dos clases de reportes:
Field Guide
255
Clasificacin
La matriz de error simplemente compara los puntos de referencia con los puntos
clasificados en una matriz c c, donde c es el nmero de clases (incluyendo la clase 0).
Use la utilidad Accuracy Assesment para generar la matriz de error y los reportes de
exactitud.
Coeficiente Kappa
El coeficiente Kappa expresa la reduccin proporcional en el error generada por un proceso de
clasificacin comparado con el error de una clasificacin completamente al azar. Por ejemplo,
un valor de 0.82 implica que el proceso de clasificacin est evitando 82 por ciento de los
errores que genera una clasificacin completamente al azar (Congalton 1991).
Archivo de
Salida
Cuando se clasifica un archivo imagen, el archivo de salida es un archivo imagen con una capa
raster temtica. Este archivo automticamente contiene los siguientes valores:
tablas de color
estadsticas
histogramas
El archivo imagen contiene adems cualquier atributo de la firma que fue seleccionada con la
utilidad Supervised Classification de ERDAS IMAGINE.
Los nombres de las clases, valores y colores pueden definirse con Signature Editor o con
Raster Attribute Editor.
256
ERDAS