You are on page 1of 68

Tema 10 Introduccin a las tcnicas de clasificacin.

Generacin de clases
La elaboracin de una clasificacin del rea de estudio en una serie de clases relativas a litologa, tipos de vegetacin, usos del suelo, etc., es uno de los objetivos fundamentales en teledeteccin. La clasificacin en teledeteccin es un caso particular del problema general de clasificar N individuos en un conjunto de K clases en funcin de una serie de variables (X1, X2,...,Xn). Para resolver este problema se necesita una medida de la semejanza o diferencia entre los diferentes individuos y entre los individuos y las clases. Dos individuos muy parecidos pertenecern con toda seguridad a la misma clase, mientras que dos individuos distintos pertenecern a diferentes clases. La medida ms utilizada es la distancia euclidiana:

(20) aunque pueden utilizarse otro tipo de distancias. Para estimar los valores de X1, X2,...,Xn para las diferentes clases se utiliza la media aritmtica de los valores de los pixels incluidos en la clase. Puesto que en la prctica no podemos saber con certeza a que clase corresponde cada uno de los pixels, el problema de la clasificacin se convierte en un problema de probabilidad de pertenencia a cada una de las clases de un conjunto, por tanto se suelen usar mtodos estadsticos. La clasificacin conlleva dos pasos fundamentales:

Generacin de un conjunto de clases y sus respuestas espectrales caractersticas (generalmente a partir de una mustra de pixels) Adjudicacin de todos los pixels a alguna de las clases

Suponiendo que los datos han pasado ya todo tipo de correcciones de tipo geomtrico o atmosfrico, existen dos mtodos complementarios para afrontar el problema de la generacin de clases, estos son vlidos tanto en imgenes de satlite como en cualquier otro campo.

Partir de una serie de clases previamente definidas y obtener sus signaturas espectrales (clasificacin supervisada)

No establecer ninguna clase a priori, aunque es necesario determinar el nmero de clases que queremos establecer, y dejar que las defina un procedimiento automtico (clasificacin no supervisada)

En realidad suelen utilizarse ambos procedimientos ya que son complementarios. La clasificacin supervisada utiliza nuestro conocimiento del terreno pero si este conocimiento no es perfecto pueden escaparse cosas que una clasificacin no supervisada detectara. Generalmente el proceso de clasificacin conlleva las siguientes etapas:

Anlisis de Componentes Principales para resumir la informacin contenida en las bandas e incluso eliminar alguna del anlisis. Generacin de clases y signaturas espectrales caractersticas. o Clasificacin no supervisada. Se utilizan algoritmos matemticos de clasificacn automtica. Los ms comunes son los algoritmos de clustering que divide el espacio de las variables en una serie de regiones de manera que se minimice la varianza interna de los pixeles incluidos en cada regin. Cada regin define de este modo una clase espectral. o Seleccin de areas de entrenamiento para clasificacin supervisada. Se trata de reas de las que se conoce a priori la clase a la que pertenecen y que servirn para generar una signatura espectral caracterstica de cada una de las clases. Se denominan clases informacionales. o Comparacin de las signaturas espectrales caractersticas de las clases informacionales con las clases espectrales. Determinacin de las clases con las que se trabajar finalmente. En general se prefiere trabajar con clases espectrales que con clases informacionales. Clasificacin propiamente dicha. Existen mltiples mtodos: o No estadsticos (mnima distancia, paraleleppedos) o Estadsticos clsicos (mxima probabilidad) o Algortmos basados en inteligencia artificial (lgica borrosa, redes neuronales) Evaluacin de la precisin de la clasificacin

Clasificacin no supervisada
Se utilizan algortmos de clasificacin automtica multivariante como el clustering. Este consta de N pasos siendo N el nmero total de individuos a clasificar. Figura 1: Dendrograma obtenido a partir de los pixels de las reas de entrenamiento

En cada paso se identifican los dos individuos ms prximos, se hace una clase con ellos y se sustituyen por el centroide de la clase resultante. De este modo cada paso analiza un individuo menos que el anterior ya que los individuos van siendo sustituidos por clases. El proceso se detiene cuando se ha alcanzado un nmero de clases igual al nmero de clases que habia sido establecido a priori. El resultado final de un proceso de clustering suele ser un dendrograma (figura 1) en el que puede verse como los diversos individuos se aglutinan en clases, primero los que estan a un menor distancia (los mas parecidos), y como posteriormente las clases se unen entre si. A partir de un dendrograma podemos elegir el nmero de clases que queremos mantener en funcin de diferentes criterios. El dendrograma de la figura 1 se ha construido con los valores que aparecen en la figura 2. Pueden verse claramente los 3 grupos que se han identificado en aquella figura. Cuando se utiliza en teledeteccin se clasifican todos los pixels, por tanto la salida no puede ser un dendrograma por razones prcticas. La salida es un mapa en el que los pixels aparecen adjudicados a las diferentes clases. Por tanto debemos elegir a priori el nmero de clases que queremos, este nmero debe ser elevado ya que siempre podremos a posteriori unir aquellas clases que no tenga sentido mantener separadas. Un anlisis de cluster tampoco nos da las signaturas espectrales de las clases que se han creado, para ello deben utilizarse otras herramientas de SIG. Si se obtienen las medias de las distintas clases para las distintas bandas espectrales, podran introducirse en un programa de estadstica para reconstruir el dendrogama y poder unificar clases.

Clasificacin no supervisada con GRASS


El mdulo de GRASS que permite realizar un algortmo de clustering es i.cluster. Como parmetros, hay que intrroducir los nombres del grupo y subgrupo de imgenes, el fichero donde se van a guardar las signaturas espectrales para que otros programas los puedan leer posteriormente (sigfile) y el nmero de clases que queremos discriminar (classes). Tambien es posible generar un fichero de texto con un informe sobre los resultados del proceso de clasificacin (reportfile). Ejemplo: i.cluster group=imagen subgroup=imagenclas sigfile=signaturasnosup classes=20 reportfile=informe Una vez que se ha ejecutado este comando podemos ver sus resultados editando el fichero que contiene el informe: emacs informe

Clasificacin supervisada
La clasificacin supervisada se basa en la disponibilidad de areas de entrenamiento. Estas deben ser areas lo ms homogeneas posibles y en las que sepamos lo que haba el da que se tom la imagen. Por ello esta opracin se realiza el mismo da en el que el satlite toma la imagen y luego se compra esta. Otra posibilidad es utilizar fotografa aerea o informacin de otro tipo. Para entender mejor los conceptos bsicos de la clasificacin y los diferentes mtodos, vamos a suponer que disponemos slo de dos bandas de landsat (TM3 y TM4) para realizar la clasificacin. Esto permite la representacin grfica de los diferentes procedimientos, con lo que la distancia euclidiana pasa a ser simplemente la distancia sobre el plano, figura 2. Los pixels representados con tres colores diferentes corresponden a tres clases diferentes obtenidas a partir de las areas de entrenamiento. La respuesta espectral de una clase ser la respuesta espectral media de sus pixels.

Figura 2: Distribucin de los pixels de las diferentes reas de entrenamiento. Sin embargo, puesto que hemos creado las signaturas espectrales con varios pixels de una misma clase, lo que obtenemos no es una signatura en la que a cada banda se asigna un valor de reflectividad, sino una distribucin de reflectividades para cada banda con una serie de estadsticos, los ms relevantes para el anlisis posterior son:

media desviacin tpica mximo mnimo.

Clasificacin supervisada con GRASS


Evidentemente el primer paso sera la bsqueda de areas de entrenamiento. Disponemos de un mapa en el que aparecen algunas areas de entrenamiento ya seleccionadas. El fichero se llama training y lo podemos ver y consultar con: d.rast training d.what.rast El mdulo de GRASS que nos va a permitir hace clasificacin supervisada es i.gensig. Requiere los mismos parmetros que i.cluster salvo el nmero de clases, que ahora se

sustituye por el mapa que contiene las areas de entrenamiento (trainingmap). No se generan informes. i.gensig trainingmap=training group=imagen subgroup=imagenclas signaturefile=signaturasup http://www.um.es/~geograf/sig/teledet/clasific.html
PROGRAMA DEL CURSO INTRODUCCION A LOS SISTEMAS DE INFORMACION GEOGRAFICA A distancia Sistemas de Informacion Geografico Concepto de bases de datos geograficos MANUAL DE INSTRUCCIN DE IDRISI El Ambiente IDRISI Visualizacin:Capas y Colecciones Visualizacin: Consulta de Mapas Paletas, Smbolos y Creacin de Capas de Textos Estructura de Datos y Escalas Colecciones Vectoriales y SQL INTRODUCCION A LOS EJERCICIOS GIS Modelacin Cartogrfica Consulta de Base de Datos Operadores de Distancia y de Contexto Algebra de Mapas Costos de Distancia y Rutas de menor costo Evaluacin por Criterios Mltiples: Desarrollo de Criterios y Algebra Buliana Evaluacin por Criterios Mltiples: Estandarizacin No Buliana y Combinacin Lineal Ponderada ELEMENTOS DE INTERPRETACION DE IMGENES Imagen, concepto, significado. Resolucin. Imgenes analgicas y digitales. Percepcin visual. Discriminacin digital. Lectura. Interpretacin. Anlisis visual y anlisis asistido por computadora. SISTEMAS DE RELEVAMIENTO Aerofotografa. Sistemas satelitales: LANDSAT, SPOT, SAC-C, ERS, NOAA-AVHRR, GOES, RADARSAT MANEJO DE IMGENES Las imgenes en un sistema de anlisis digital y en un sistema de informacin geogrfica. Ambiente de manejo de imgenes en Idrisi, mantenimiento. Despliegue y aproximaciones en zoom. Referencias. Generacin de subimgenes. Modificaciones de resolucin. PROCESAMIENTO DE IMGENES Estadstica de una imagen: histograma. Clculo de histogramas. Realces generales: bordes, filtrados, componentes principales. Correcciones: radiancia, bruma, efecto barrido, correccin geomtrica. Colores compuestos: generacin de capas temticas, composicin de bandas, lgebra de imgenes. INCORPORACION DE DATOS Software de manejo de imgenes: Corel Draw!. Adobe Photoshop. Formatos de imgenes. Scanning. Exportacin e incorporacin de documentacin grfica a Idrisi. ANALISIS DE IMGENES Anlisis temtico. Anlisis monobanda y multibanda. Comparaciones espectrales. Comparacin de resoluciones. Anlisis espectral en transecta. Mediciones. Anlisis textural. Escalado de la imagen. Clasificacin espectral y multiespectral. Digitalizacin en

pantalla. Manejo de capas vectoriales. Mscaras. Generacin de imgenes de base Rasterizacin y vectorizacin. Clculo de reas. Combinacin de caractersticas y variables. Clasificacin. Slicing.

http://crean.org.ar/Idrisi/cursos/programa_distancia.htmI NTRODUCCIN GENERAL


Desde el lanzamiento del primer satlite dedicado a la observacin de los recursos terrestres (LANDSAT-1, 1972) se ha abierto una gran va de investigacin multidisciplinar que ha posibilitado un conocimiento profundo de la Tierra. Sin embargo, la informacin registrada por la mayora de los satlites hoy en da operativos no es lo suficientemente detallada ni numerosa para cubrir los objetivos de muchos investigadores. El desarrollo tecnolgico permite hoy da el planteamiento de numerosos proyectos de investigacin para desarrollar sensores de muy alta resolucin, tanto espacial como espectral, que permitan obtener una gran cantidad de informacin sobre la superficie terrestre y abordar proyectos sobre recursos naturales con menor margen de error. En la prxima dcada se espera el lanzamiento de numerosos satlites con estas caractersticas. Ante datos de tan alta dimensionalidad nos hemos planteado si son aplicables los mtodos de clasificacin empleados hoy da y el estudio de las condiciones en las que unos mtodos proporcionan mejores resultados que otros, estudiando su aplicabilidad bajo un doble prisma: su tasa de acierto y su coste computacional. Consideramos necesaria la incorporacin de informacin del contexto a la clasificacin ya que de esta forma se obtienen clasificaciones de calidad que consideran dos tipos de informacin: los valores espectrales de las observaciones y las etiquetas presentes en una determinada vecindad espacial de la observacin a clasificar. Los clasificadores contextuales se estudian en la parte IV de esta memoria. En trminos generales puede entenderse una clasificacin de este tipo como una clasificacin por mxima verosimilitud penalizada en la que la penalizacin viene impuesta por las posibles configuraciones de etiquetas en un entorno de la observacin a clasificar. As, los mtodos de clasificacin basados en el contexto necesitan una imagen de etiquetas inicial (una clasificacin previa) de forma que la clasificacin final es el resultado de la integracin de la informacin espectral y de la informacin presente en la imagen de etiquetas inicial. Es bien conocido que el punto de partida determina la imagen de etiquetas final

[8] por lo que la estimacin de este punto de partida es muy importante. La obtencin del punto de partida puede realizarse con un mtodo de clasificacin espectral. En las partes II y III de esta memoria estudiamos algunos mtodos de clasificacin que pueden servir como punto de arranque para la clasificacin contextual. Considerando la dimensionalidad potencial de los datos, la obtencin de la clasificacin inicial puede ser sumamente costosa para datos de alta dimensionalidad. As, nos hemos planteado la posibilidad de obtener una clasificacin inicial con un bajo coste computacional y utilizar esta imagen de etiquetas como punto de partida de la clasificacin contextual. Hemos estudiado diferentes clasificadores y hemos conseguido establecer una metodologa global que obtiene unos resultados excelentes (medidos en relacin a la tasa de acierto) a un costo computacional razonable. Este estudio se realiza en la parte V de esta memoria. Nuestro objetivo en esta memoria es realizar un estudio comparativo de mtodos supervisados de clasificacin de imgenes multibanda. Estudiaremos el coste computacional y la bondad conseguida por diferentes mtodos de clasificacin y mostraremos cmo es posible conseguir altas tasas de acierto en condiciones de alta dimensionalidad mediante la utilizacin de diferentes mtodos, e incluso combinaciones de stos. En todos los casos suponemos la existencia de un conjunto de entrenamiento finito y de un tamao suficiente que garantiza la aplicabilidad terica de los mtodos utilizados. La clasificacin supervisada de imgenes multiespectrales de muy alta dimensionalidad lleva aparejada serios problemas tanto metodolgicos como prcticos. Considerando los mtodos de clasificacin paramtricos, stos proporcionan un modelo robusto ya que suponen una distribucin de probabilidad subyacente conocida para las clases y tan solo hay que estimar los parmetros de la distribucin de probabilidad. Generalmente se adopta una distribucin normal para modelizar cada una de las clases, por lo que en este caso hay que estimar las matrices de covarianza y los vectores de media. Sin embargo, si la dimensionalidad de los datos es alta se requieren numerosas muestras de aprendizaje para que los estimadores sean estables ([7], [11]). La restriccin ms seria en la prctica de los mtodos supervisados de clasificacin es que se dispone de un conjunto finito y en muchas ocasiones muy reducido de muestras de aprendizaje. Con estas restricciones los

clasificadores construidos en base a estos conjuntos de muestras no pueden ser fiables ya que los estimadores conseguidos son muy inestables. La presencia de autocorrelacin espacial en las imgenes hace que los estimadores conseguidos sean todava peores [15]. Diferentes soluciones se han propuesto en la literatura, como la seleccin de un conjunto de variables del conjunto original [12], de forma que optimicen conjuntamente algn criterio (por ejemplo, separabilidad estadstica entre clases). La simplificacin del clasificador adoptando la forma de un clasificador lineal reduce el nmero de parmetros a estimar aunque los resultados no son, en general, tan acertados. Otra aproximacin paramtrica para conjuntos reducidos de muestras consiste en mtodos de regularizacin y el objetivo es que a partir de los datos de entrenamiento se calcule de manera automtica la ``forma'' del clasificador, permitiendo la construccin de una amplia familia de clasificadores que van desde el cuadrtico al lineal, segn el grado de regularizacin estimado. Entre estos mtodos citaremos el anlisis discriminante regularizado propuesto por Friedman ([6]). Los parmetros de la regularizacin se estiman por validacin cruzada por lo que se aprovecha al mximo la informacin disponible en el conjunto de entrenamiento. Estos mtodos, sin embargo, llevan asociado un altsimo coste temporal para el aprendizaje. El uso de clasificadores de distribucin libre (no paramtricos) no presupone la forma de la distribucin de probabilidad por lo que no requieren la estimacin de los parmetros. A cambio, necesitan estimar la densidad de probabilidad de cada observacin usando las muestras disponibles en el conjunto de entrenamiento. Los clasificadores basados en rboles son una interesante aproximacin desde el punto de vista terico y computacional y no estn restringidos por el nmero de variables de los datos [1]. Entre los mtodos de distribucin libre, los llamados ``del vecino ms prximo'' (1NNR, k-NNR) estiman directamente la probabilidad a posteriori tomando como base el conjunto de entrenamiento [4]. El comportamiento asinttico de estos mtodos es ptimo en el sentido de Bayes cuando el nmero de muestras de entrenamiento tiende a infinito y cuando el nmero de muestras que intervienen en la decisin (k) aumenta ([5]). En ningn caso la dimensionalidad de los datos supone una restriccin terica, aunque s computacional ya que se deben calcular distancias y esta operacin se realiza para todas las muestras del conjunto de entrenamiento, en el peor de los casos. Sin embargo, esta condicin est limitada en la prctica y se han desarrollado mtodos que permiten utilizar un conjunto reducido de muestras con un comportamiento asinttico conocido ([3],[5]). Otros mtodos ms novedosos hacen uso de un conjunto reducido de muestras

para aproximar la densidad de probabilidad de las clases o incluso directamente las fronteras de decisin mediante un procedimiento de aprendizaje adaptativo con un costo computacional muy aceptable para altas dimensionalidades ([13],[9]). Los problemas prcticos derivados de la alta dimensionalidad de los datos inciden en el espacio de almacenamiento y el tiempo requerido para realizar el aprendizaje y clasificacin una vez salvadas las restricciones tericas que garantizan la aplicabilidad de los mtodos de clasificacin. En este sentido cabe plantearse si es posible la utilizacin de alguna combinacin de clasificadores que proporcione una alta bondad de la clasificacin a un coste razonable. En esta memoria hemos abordado una amplia familia de clasificadores de muy diversa naturaleza. Dentro de los clasificadores paramtricos hemos estudiado el clasificador por mxima verosimilitud y el clasificador por regularizacin propuesto por Friedman [6]. Entre los clasificadores de distribucin libre hemos empleado CART ([1]) como representante de los clasificadores basados en rbol y el clasificador 1-NNR utilizando el conjunto de entrenamiento original y utilizando un conjunto de entrenamiento reducido y representativo construido mediante el algoritmo Multiedit [2] y por el condensado de Hart [10]. Entre los mtodos adaptativos de aprendizaje hemos seleccionado el LVQ-1 [13] y condensado mediante DSM [9]. No hemos considerado el uso de otro tipo de redes neuronales en este estudio ya que el coste computacional del aprendizaje es sumamente alto ([9]) y los resultados esperados son comparables [14] a los de los mtodos no paramtricos utilizados. En nuestro estudio no hemos considerado el estudio de tcnicas de extraccin de caractersticas ([7],[3]) ya que stas son muy dependientes del problema y en algunos casos todo un ``arte''. En todos los casos suponemos que las probabilidades a priori de las clases son iguales. Hemos utilizado tres imgenes reales en esta memoria. Una de ellas es una imagen astronmica y las otras dos son imgenes captadas por Teledeteccin. Aunque es fcil encontrar imgenes de Teledeteccin de libre disposicin, resulta bastante difcil su utilizacin con fines cientficos, dado que las escenas que representan son desconocidas o no se dispone de la suficiente informacin sobre esa escena para realizar una clasificacin supervisada; en estas condiciones no se puede medir de forma objetiva el resultado obtenido. Hemos tenido la oportunidad de trabajar sobre escenas acerca de las cuales existe informacin muy precisa, incluyendo unos objetivos muy bien definidos. Puede decirse que el conocimiento es tan

exhaustivo que podran considerarse como imgenes para las que se conoce la clase cierta. Estas imgenes corresponden a escenas de Groenlandia y han sido cedidas para este trabajo por el IMM (Universidad Tcnica de Dinamarca). El estudio comparativo para altas dimensionalidades se realiza sobre dos bases de datos de imgenes sintticas generadas mediante un mecanismo similar al de la formacin de imgenes captadas por Teledeteccin.

Objetivos
Los objetivos generales que nos planteamos en esta memoria son los siguientes: 1. Hacer un estudio comparativo de distintas metodologas existentes hoy en da dentro del mbito de la clasificacin de imgenes multibanda. 2. Realizar un estudio exhaustivo acerca de la aplicabilidad de los mtodos de clasificacin sobre imgenes de muy alta dimensionalidad. 3. Estudiar la conveniencia y aplicabilidad de mtodos contextuales de alisamiento a las clasificaciones obtenidas por los mtodos espectrales de clasificacin, tanto paramtricos como no paramtricos.

Plan de la Memoria
La memoria se ha dividido en cinco partes, algunas de las cuales se estructuran en captulos. La parte i, Preliminares y notacin, consta de un solo captulo (captulo 1). En ste fijaremos los conceptos sobre los que discutiremos a lo largo de la memoria. Se definen las imgenes vectoriales y se describen los principios fsicos y objetivos de la Teledeteccin. Se presenta el problema de la clasificacin de imgenes vectoriales, centrndose en las tcnicas de clasificacin supervisada para terminar englobando este problema en el marco del reconocimiento estadstico de patrones y fijando las bases tericas de los clasificadores que investigamos desde el punto de vista de la teora estadstica de la decisin. La parte ii, Clasificadores estadsticos paramtricos, consta de un solo captulo (captulo 2). En ste se presentan y analizan los clasificadores estadsticos paramtricos clsicos: la regla de clasificacin de mxima verosimilitud paramtrica y sus variantes, que conducen a los clasificadores

lineales. A continuacin se examina el clasificador por regularizacin, donde se discute acerca de los clasificadores cuadrticos y lineales y se concluye extendiendo las reglas de clasificacin que incluyen la clase de rechazo en el resultado de la clasificacin. La parte iii, Clasificadores de distribucin libre, consta de tres captulos. En el captulo 3 estudiamos algunos mtodos no paramtricos: los clasificadores basados en rbol y los mtodos del vecino ms prximo. En el captulo 4 estudiamos algunos los mtodos de edicin del conjunto de entrenamiento y en el captulo 5 estudiamos algunos de los mtodos de condensado del conjunto de entrenamiento, centrndonos especialmente en los mtodos adaptativos de condensado. La parte iv, Clasificadores contextuales, consta de un captulo (captulo 6). En l planteamos la necesidad de aplicar correcciones contextuales sobre las clasificaciones obtenidas por los mtodos de clasificacin espectrales. Estudiamos diferentes tcnicas de correccin contextual y su aplicabilidad. En la parte v, Experimentos sobre imgenes multibanda sintticas, aplicamos las tcnicas estudiadas en esta memoria sobre dos bases de datos de imgenes multibanda sintticas. Esta parte consta de dos captulos. En el captulo 7 describimos cmo se generan las bases de datos y las condiciones de los experimentos realizados. En el captulo 8 mostramos los resultados obtenidos, realizamos una discusin sobre stos y mostramos las conclusiones alcanzadas. En los apndices 1 y 2 se describen las imgenes reales utilizadas en esta memoria y los objetivos propuestos para la clasificacin de stas. El apndice 3 es una extensin del captulo 6 en el que describimos cmo se estiman los parmetros de los mtodos de correccin contextual empleados en esta memoria.

CONCLUSIONES Y TRABAJOS FUTUROS


En esta memoria se ha realizado un estudio comparativo de diferentes mtodos de clasificacin aplicados a imgenes multibanda. Este estudio se ha realizado sobre imgenes de distinta procedencia: imgenes reales captadas por Teledeteccin, una imagen astronmica captada en diferentes longitudes de onda y dos bases de datos de imgenes sintticas generadas por un procedimiento similar al proceso natural de la Teledeteccin.

Se han estudiado diferentes mtodos de clasificacin, tanto paramtricos como no paramtricos y se ha estudiado la aplicabilidad de las correcciones contextuales a los resultados obtenidos con stos. Los puntos de inters en los que nos hemos centrado han sido:

Estudiar qu mtodos proporcionan mejores resultados, midindose en relacin a la tasa de acierto y al coste computacional de su aplicacin. Estudiar la aplicabilidad de los mtodos de correccin contextual como un segundo paso tras una clasificacin realizada por un mtodo basado en medidas espectrales. Estudiar el efecto de la autocorrelacin espacial entre pxeles vecinos en el resultado de la clasificacin. Estudiar en qu grado afecta la dimensionalidad de los datos al resultado de la clasificacin y de las correcciones contextuales realizadas sobre stas en presencia o ausencia de autocorrelacin espacial.

Resultados
Los resultados y conclusiones ms interesantes que pueden obtenerse tras la realizacin de este trabajo pueden resumirse en los siguientes puntos: 1. Hemos aplicado el anlisis discriminante regularizado con xito a la clasificacin de imgenes mutibanda de alta dimensionalidad, obteniendo muy buenos resultados en todos los casos. Sin embargo, su coste espacial y temporal es muy alto. 2. Hemos desarrollado un procedimiento sistemtico para la estimacin de los parmetros que gobiernan el mtodo LVQ-1 y hemos obtenido excelentes resultados con su aplicacin. 3. Hemos mostrado cmo la aplicacin de la correccin contextual sobre una clasificacin, independientemente del tipo de clasificador utilizado mejora los resultados previos. En el caso de presencia de autocorrelacin espacial los resultados obtenidos para altas dimensionalidades son inferiores a los iniciales. 4. La utilizacin de un conjunto reducido y representativo de muestras seleccionadas del conjunto de entrenamiento original reduce el error cometido en la clasificacin y acelera la clasificacin utilizando el

mtodo del vecino ms prximo, aunque hemos puesto de manifiesto que en determinadas circunstancias algunas clases pueden desaparecer, lo que se traduce en una disminucin de la tasa de acierto en la clasificacin. Sin embargo, este efecto puede contrarrestarse en algunos casos mediante la correccin contextual por ICM. 5. En imgenes de muy alta dimensionalidad, si no existe autocorrelacin espacial o esta es muy baja, la utilizacin de todos los datos disponibles implica un aumento en la bondad de la clasificacin, siempre que se disponga de suficientes muestras de aprendizaje. Sin embargo, si existe autocorrelacin, la utilizacin de ms datos no se traduce en un incremento de la tasa de acierto para altas dimensionalidades debido a la creacin de artificios en las fronteras espaciales entre zonas de diferentes clases. 6. La utilizacin del clasificador del vecino ms prximo utilizando un conjunto reducido y representativo de muestras para imgenes de muy alta dimensionalidad se muestra como un mtodo muy atractivo, ya que es posible caracterizar cada clase por muy pocas muestras por lo que la eficiencia del mtodo se incrementa notablemente. 7. Hemos demostrado empricamente que la aplicacin del ICM sobre las clasificaciones:
o

1-NNR sobre un conjunto de entrenamiento aprendido por LVQ-1, y CART

proporciona unos resultados excelentes (en tasa de acierto) para cualquier dimensionalidad a un costo espacial y temporal muy razonable.

Trabajos Futuros
De los resultados obtenidos se abren sin lugar a dudas un conjunto amplio de posibles lneas de investigacin. Entre ellas citaremos las que nos parecen de mayor inters y relacin con el presente trabajo:

Justificar de forma terica los resultados experimentales obtenidos.

Ampliar el procedimiento de estimacin de parmetros realizado sobre el mtodo LVQ-1 a otras variantes LVQ. Estudiar tcnicas de optimizacin para reducir el espacio de bsqueda en la estimacin de los parmetros de regularizacin (ADR) y de los parmetros de aprendizaje mediante LVQ-1. Emplear tcnicas de bsqueda rpida del vecino ms prximo y de reduccin de clculos para el ADR. Aplicar el estudio realizado sobre imgenes reales de muy alta dimensionalidad. Estudiar la aplicabilidad de estos mtodos a diferentes tipos de imgenes vectoriales, como pueden ser las imgenes biomdicas. El estudio acerca de la combinacin de diferentes tipos de imgenes (obtenidas de diversas fuentes) sobre la misma escena. Ampliar este estudio comparativo a otras tcnicas existentes y no contempladas en esta memoria.

http://decsai.ugr.es/~cb/el_prologo.html
Clasificacin espectral automtica vs. clasificacin visual: Un ejemplo al sur de la ciudad de Mxico Jos Luis Palacio Prieto y Laura Luna Gonzlez Se realizaron dos clasificaciones multiespectrales, una supervisada y una no supervisada, con base en una imagen Landsat TM utilizando para ello un algoritmo de mxima similitud. En el primer caso se obtuvieron 29 clases a partir de unas 41 muestras y en el caso de la clasificacin no supervisada se obtuvieron 27 clases. En ambos casos, el nmero final de clases se redujo una vez agrupadas las clases espectrales en clases de informacin, resultando seis en total. Por otra parte, se elaboraron diferentes compuestos en color para realizar una interpretacin visual. Los tres productos fueron comparados en un ambiente SIG contra una base de referencia de verdad en campo, consistente en una malla de puntos equidistantes a 1 km2, totalizando 560 sitios de control. Los resultados de la comparacin permiten apreciar que los mejores valores de exactitud corresponden a la clasificacin supervisada (82.32%) seguidos de la clasificacin visual (78.72%) y la no supervisada (73.18%). Estos valores fueron obtenidos una vez agrupadas las clases afines.

http://www.igeograf.unam.mx/instituto/bol29_94.html

PANORAMA ACTUAL DE LAS TCNICAS

MIXTAS DE CLASIFICACIN DE IMGENES MEDIANTE SEGMENTACIN ESPECTRAL Y POR TEXTURAS.APLICACIN A LAS IMAGENES DE ALTA RESOLUCIN ESPACIAL
Septiembre de 2003
Nilda Snchez Martn Departamento de Ingeniera Cartogrfica y del Terreno Universidad de Salamanca

1. Introduccin Desde hace algunos aos, con la llegada al mercado de imgenes de una altsima resolucin espacial procedente de nuevos sensores como IKONOS o Quick Bird, as como las procedentes de sensores aerotransportados, asistimos a nuevos retos en la aplicacin y tratamiento de la teledeteccin. Por lo que respecta al tratamiento, el anlisis basado en el pxel pierde validez pues en estas imgenes cada pxel no hace referencia a un objeto, carcter o rea en conjunto, sino a una pequea porcin de alguno de sus componentes. En cuanto a las aplicaciones, se han abierto vas de trabajo en reas inusuales en teledeteccin como las zonas urbanas, la actualizacin cartogrfica a escalas medias o grandes. No es extrao, por tanto, que las tcnicas de teledeteccin confluyan con las de la fotogrametra digital y a la inversa. Es entonces cuando las tcnicas de clasificacin basadas en el anlisis de la textura de la imagen cobran mayor importancia. Los sensores de mayor resolucin espacial proporcionan imgenes fuertemente texturadas, lo que se hace especialmente evidente en el medio agrcola y vegetal: las cubiertas vegetales son fcilmente reconocidas en un mero anlisis visual. Tambin en zonas urbanas este tipo de imgenes resultan adecuadas para un anlisis de contexto (Shaban y Dikshit, 2001, Karathanasi et al. 2000, Zang, 1999). Diferentes estudios corroboran que, si aadimos esta informacin adicional de la textura a la clasificacin pxel a pxel, utilizando la informacin espectral de cada uno en cada banda, los resultados de la clasificacin mejoran visiblemente. En este trabajo vamos a recoger algunos de estos experimentos de los ltimos tiempos. 2. Panorama actual de los sensores de media-alta resolucin espacial El programa Early Bird (Earth Watch Inc.), lanzado en 1997, con 3 m de resolucin espacial en la banda pancromtica, inaugura la era de los satlites de alta resolucin espacial (Zhou, 2001). Una visin de conjunto acerca de los sensores de alta resolucin espacial y su integracin en los SIG podemos encontrarla en Fritz (1999), as como una aproximacin a su tratamiento geomtrico previo en Fraser (2002). Para clasificar los sensores hemos seguido la clasificacin de Zhou (2002), actualizada por Snchez (2003), agrupando la familia de los sensores de media-alta resolucin en:

a) Resolucin intermedia y banda ancha espectral

b) Alta resolucin y banda media

c) Sensores hiperespectrales con resolucin espacial entre 8 y 30 m Existen muchos sensores tales como HSI, ASTER, AVIRIS, CASI, HYDICE, de diferentes programas, que trabajan con entre 100 y 200 bandas con longitudes de onda a partir de los 0.4 micrmetros hasta los 20.

d) Radar con resolucin entre 3 y 30 m Tambin existen diferentes sensores: RADARSAT, ERS, JERS, ALOS, ENVISAT, TOPSAT, etc.

e) Sensores digitales aerotransportados de alta resolucin Son una plataforma intermedia entre los sensores espaciales (con una informacin espectral muy completa pero una resolucin espacial mxima en torno a 1 m) y las cmaras

fotogramtricas (a la inversa, escasa resolucin espectral: visible e infrarrojo como mximo pero espacial del orden de decmetros o centmetros). En la actualidad conviven las clsicas cmaras mtricas analgicas (cuyas imgenes se digitalizan en escneres fotogramtricos para su tratamiento digital) con las cmaras digitales, con unas aplicaciones en las que confluyen las tcnicas de Fotogrametra y las de Teledeteccin (Flicker et al., 2000). Estos sensores, cuya fabricacin lideran las marcas LI Systems y ZI Imaging pueden ser electropticos, lser o radar. Adems, algunas son estereocmaras, es decir, capaces de extraer imgenes estereoscpicas. 3. Clasificacin pxel a pxel y tcnicas de contexto Las imgenes son complejas composiciones de pxeles, no de objetos, que producen patrones caractersticos variables aparentemente segn la escala de observacin (Allen y Starr, 1982). Por tanto, son fundamentales tanto el observador como la escala de observacin para reconocer dichos patrones. Anlogamente a la habilidad humana en esta tarea, diferentes tcnicas automticas se han desarrollado para discriminar objetos y cubiertas (Hay et al., 2003): - Detectores de eje (Canny, 1986) - Morfologa matemtica (Haralick et al., 1987) - Anlisis de texturas (Haralick et al.,1973) - Redes bayesianas (Robert, 2001) - Tcnicas piramidales y multiescala (Jhne, 1999) - Wavelets (Salari y Ling, 1995) - Fractales (Chaudhuri y Sarkar, 1995) - Metodos paramtricos (Hubert-Moy et al., 2001) En diversos estudios (Hubert-Moy et al., 2001) se concluye que la eleccin de un mtodo de clasificacin puede influir significativamente en los resultados, y que esta eleccin debe hacerse siempre teniendo en cuenta la estructura del uso del territorio y sus unidades. Tambin diferentes autores insisten en la aproximacin multicriterio en la clasificacin y segmentacin de una imagen de alta resolucin espacial: mtodos basados en el anlisis pxel a pxel (patrn espectral) junto con mtodos que extraigan informacin de contexto (en este caso un patrn de textura). Esta combinacin es especialmente relevante cuando la resolucin es alta y las imgenes, al ofrecer un mayor nivel de detalle, ofrecen un aspecto muy texturado. 3.1. Texturas Cuando se trabaja con imgenes de alta resolucin se hace imprescindible recurrir otras tcnicas que integren SIG e informacin de contexto (Ehlers et al., 2003). En este estudio veremos cmo se trata de incorporar la textura, es decir, la informacin espectral de contexto de los pxeles, no individualmente como hacen los mtodos de clasificacin. Puede definirse la textura como la variacin del contraste entre pxeles vecinos, o, dicho de otra forma, la variabilidad local de la reflectancia dentro de una unidad que a mayor escala se puede considerar como homognea. La interpretacin y tratamiento de la textura tiene dos etapas: el reconocimiento de las regiones homogneas que queremos que sirvan de patrn y la clasificacin de toda la imagen segn esas clases. Para aplicar el algoritmo de reconocimiento, Haralick et al. (1973) propone el clculo de parmetros texturales a partir de matrices de co-ocurrencia de dependencia espacial de los niveles de gris, a las cuales se le aplican parmetros estadsticos

(media, correlacin, varianza, entropa, etc.). Otras formas recientes de estudio de la textura podemos encontrarlas resumidamente en Arivazhagan y Ganesan (2003): estadsticos de primer y segundo orden, campos Gaussianos aleatorios de Markov, transformada de Fourier, filtros de energa, wavelets, aproximaciones multirresolucin, etc. En Zhang y Tan (2002) tenemos una actualsima revisin de los mtodos de anlisis de textura, en este caso de las texturas invariantes (no afectadas por la traslacin, rotacin, perspectiva, punto de vista, etc.). Estos autores clasifican los mtodos y aportan ejemplos de cada uno: = Estadsticos Polar plots Expansin armnica Dominio del espectro de Fourier Estadsticos de orden alto Momentos invariantes = Mtodos basados en modelos Campos de Markov, Gibbs o Wold Modelos autorregresivos Filtros multicanal de Gabor Wavelets = Mtodos estructurales Histograma invariante Descriptores topolgicos Descomposicin morfolgica

Otras recientes aportaciones al anlisis de texturas en imgenes de satlite podemos encontrarlas en: Smith et al.(2002) y Debeir et al. (2002). Matriz de coocurrencias Snchez-Yez et al. (2003), Paschos y Petrou (2003) y Ojala et al. (2001). Histogramas Myint (2000) y Arivazhagan y Ganesan (2003). Wavelets Stan et al. (2002) y Schaale et al. (2000). Redes neuronales

3.2. Tcnicas hbridas Muchos autores entre los citados en este trabajo coinciden en la idea de que una frecuente va de mejora de los resultados de la clasificacin de la imagen parece derivarse del uso hbrido entre clasificacin espectral basada en el pxel e informacin espacial de textura. Ello cobra mayor relevancia cuando se trata de imgenes de alta resolucin espacial ya que la informacin de la vecindad del pxel es ms evidente y significativa. A continuacin vamos a resumir algunos de las ms recientes lneas de investigacin bajo esta perspectiva y con la aplicacin a imgenes de alta resolucin espacial: Autor: Zhang, 2001.

Mtodo de contexto: deteccin de la varianza direccional en un entorno local del pxel. Algoritmo propio Mtodo de clasificacin espectral: algoritmo ISODATA Imagen: IKONOS Aplicacin: deteccin de zonas arboladas en entornos urbanos Autor: Schrder et al., 2002 Mtodo de contexto: aplicacin de redes neuronales con reas de entrenamiento previas Mtodo de clasificacin espectral: redes neuronales Imagen: sensor aerotransportado CASI de 3.9 m de resolucin Aplicacin: generacin de mscaras nubosas para la deteccin de nubes Autor: Zhang, 1999 Mtodo de contexto: matriz de co-ocurrencia y filtrado Mtodo de clasificacin espectral: algoritmo ISODATA Imagen: fusin de Landsat TM y SPOT pancromtico Aplicacin: deteccin de construcciones urbanas Otros trabajos afines: Shaban y Dikshit (2001) (con SPOT solamente), en el que adems se estudia el efecto de factores procedimentales como el tamao de la ventana, el umbral de distancia, las bandas elegidas, la direccin, el algoritmo, etc. En Ferro y Warner (2002) encontramos unas discusin acerca de la seleccin del estadstico y la ventana de paso. Otros trabajos que siguen esta lnea hbrida, pero en aplicaciones forestales y agrcolas, los encontramos en Hui et al (2000), ste con IKONOS, Franklin et al (2001), con CASI, y Pekkarinen (2002), con el espectrmetro aerotransportado AISA (1.6 m de resolucin) Autor: Fernndez Prieto, 2002 Mtodo de contexto: aplicacin de campos aleatorios de Markov Mtodo de clasificacin espectral: conjuntamente con la contextual en un algoritmo propio basado en la Radial Basis Function Imagen: sensor aerotransportado multiespectral Daedalus 1268 (no consta la resolucin, alrededor de 2.5 m a 1000 m de altura de vuelo) Aplicacin: usos agrcolas del suelo Autor: Mumby y Edwards, 2002 Mtodo de contexto: filtrado de bandas Mtodo de clasificacin espectral: algoritmo de mxima verosimilitud Imagen: IKONOS Aplicacin: cartografa de fondos marinos Autor: Guindon, 2000 Mtodo de contexto: Teora de la evidencia mediante atributos semnticos de contexto Mtodo de clasificacin espectral: algoritmo de mxima verosimilitud Imagen: es un planteamiento terico para cualquier tipo de imagen de resolucin por debajo de 4 m Aplicacin: se propone como mtodo para la deteccin de carreteras y elementos urbanos Autor: Widayati et al, 2002 Mtodo de contexto: Merge Using Moments Mtodo de clasificacin espectral: algoritmo de mxima verosimilitud Imagen: IKONOS Aplicacin: discriminacin de cultivos de caf Otros trabajos afines: Cook et al., 1994

4. Tcnicas de fusin de imgenes de distintos sensores Las tcnicas de fusin de imgenes de distinta resolucin espacial y espectral, para mejorar aqulla sin perder sta, llevan utilizndose en teledeteccin desde los aos ochenta. Con la irrupcin de los nuevos sensores de mayor resolucin espacial esta metodologa est en proceso de revisin, ya que, por un lado, los sensores alcanzan un nivel de detalle altsimo junto con un nmero de bandas ms que aceptable; y por otro, porque se ha de estudiar la correlacin de la banda de mayor resolucin del nuevo sensor con el componente IHS al que se vaya a transformar. La forma ms frecuente de fusin es, por tanto, la transformacin IHS, previa reproyeccin de la banda cuya resolucin se va a aumentar. Pero otras tcnicas se estn investigando, como el ARSIS (Ranchin et al., 2003), mtodo que consiste en inyectar altas frecuencias en las bandas multiespectrales; mtodos hbridos, etc. En Fernndez-Prieto y Arino (2001) y Srivastava et al.(2000) encontramos dos casos de fusin de datos, el primero procedentes de dos sensores aerotransportados de altas resoluciones (que se aplica para clasificar cultivos) y el segundo del la banda pancromtica con la multiespectral del sensor IRS, para el estudio de zonas de inundacin. Por ltimo, un interesante trabajo (Kiema, 2002) realizado con la fusin clsica de SPOT y Landsat TM, aporta la interesante novedad de realizar una transformacin de la imagen pancromtica mediante un estudio de texturas previa a la fusin. 6. Bibliografa Allen, T.F.H., Starr, T.B., 1982. Hierarchy Perspective for Ecologycal complexitiy. University of Chicago Press, Chicago. 310 pp Arivazhagan, S., Ganesan, L., 2003. Texture classification using wavelet transform. Pattern Recognition Letters 24, 1513-1521. Canny, J., 1986. A computational approach to edge detection. IEEE Transaction on Pattern Analysis and Machine Intelligence 8 (6), 679-697 Chaudhuri, B., Sarkar, N., 1995. Texture segmentation using fractal dimension. IEEE Transactions on Pattern Analysis and Machine Intelligence 17 (1), 72-77 Cook, R., McConnell, I., Oliver, C., 1994. MUM (Merging Using Moments) Segmentation for SAR images. SPIE, vol 2316, 92-103. Debeir, O., Van den Steen, I., Latinne, P., Van Ham, P, Wolff, E., 2002. Textural and contextual Land-cover Classification using single and multiple classifier systems. Photogrammetric Engineering & Remote Sensing 68 (6), 597-605 Ehlers, M., Ghler, M., Janowsky, R., 2003. Automated analysis of ultra high resolution remote sensing data for biotope type mapping: new possibilities and challenges. ISPRS Journal of Photogrammetry & Remote Sensing 57, 315-326 Fernndez-Prieto, D., 2002. An iterative approach to partially supervised classification problems. International Journal of Remote Sensing, 23 (18), 3887-3892

Fernndez Prieto, D. and Arino, O., 2001. A Data Fusion Approach to Partially Supervised Classification, Proceedings of the 2001 Int. Geoscience and Remote Sensing Symposium (IGARSS2001), Sidney, Australia, July, Vol. 2, pp. 858-860. Ferro, C.J.S., Warner, T., 2002. Scale and texture in digital image classification. Photogrammetric Engineeering & Remote Sensing 68 (1), 51-63. Franklin, S.E., Maudie, A.J., Lavigne, M.B., 2001. Using spatial co-occurrence texture to increase forest structure and species composition classification accuracy. Photogrammetric Engineeering & Remote Sensing 67 (7), 849-855. Fraser, C., 2002. Prospects for mapping from high resolution satellite imagery. 23rd Asian Conference on Remote Sensing, Kathmandu, Nepal. Flicker, P., Sandau, R., Llorens, P., Caracuel, J.E., Cardenal, J., Delgado, J., 2000. Sensores Aerotransportados Digitales (ADS): situacin actual y perspectivas futuras. Topografa y Cartografa, 101 (noviembre-diciembre 2000), 50-62 . Fritz, L.W., 1999. High resolution commercial Remote Sensing Satellites and Spatial Information Systems. ISPRS Highigths Vol 4 No.2 Guindon, B., 2000. Combining diverse spectral, spatial and contextual attributes in segmentbased image classification. Proceedings of ASPRS 2000 Annual Conference. Washington D.C. Haralick, R. M., Shanmugan, K., and Dinstein, I., 1973. Textural Features for Image Classification. IEEE Transactions on Systems, Man and Cybernetics, 3 (6), 610-621 Haralick, R.M., Sternberg, S.R., Zhuang, X., 1987. Image analysis using mathematical morphology. IEEE Transactions on Pattern Analysis and Machine Intelligence 9 (4), 532-550 Hay, J.G., Blaschke, T., Marceau, D.J., Bouchard, A., 2003. A comparison of three imageobject methods for the multiscale anlisis of landscape structure. ISPRS Journal of Photogrammetry & Remote Sensing 57, 327-345 Hubert-Moy, L., Cotonnec, A., Le Du, L., Chardin, A. y Prez, P., 2001. A comparison of parametric classification procedures of remotely sensed data applied on different landscape units. Remote Sensing of Environment, 75 (2), 174-187. Hui, A., Liew, S. C., Kwoh, L. K., Lim, H., 2000. Extraction and Utilization of Geometrical and Contextual Information in Very High Resolution IKONOS Satellite Imagery. Proceedings of the 21st Asian Conference on Remote Sensing, 4-8 Dec 2000, Taipei, Taiwan, Vol. 1, 158-163. Jhne, B., 1999. A multiresolution signal representation. In Jhne, B., Haubecker, H., Geibler, P. (Eds), handbook on Computer Vision and Applications. Academic Press, boston, USA, pp 67-90 Karathanassi, V., Iossifidis, Ch. and Rokos, D., 2000. A texture-based classification method for classifying built areas according to their density. International Journal of Remote Sensing, 21 (9), 1807-1823. Kiema, J.B.K., 2002. Texture analisis and data fusion in the extraction of topographic objects from salellite imagery. International Journal of Remote Sensing, 23 (4), 767-776. Myint, S. W., 2000. Image texture analysis with high-resolution multispectral image data using wavelet transforms. Paper presented at the 2000 University Consortium for Geographic

Information Science (UCGIS) Annual Assembly and Summer Retreat, , Portland, Oregon (21 24 June, 2000). Mumby, P.J. and Edwards, A.J., 2002. Mapping marine environments with IKONOS imagery: enhanced spatial resolution can deliver greater thematic accuracy. Remote Sensing of environment, 82, 248-257. Ojala, T., Valkealahti, K., Oja, E., Pietikinen, M., 2001. Texture discrimination with multidimensional distribution of signed gray-level differences. Pattern Reconigtion, 34(3), 727739. Paschos, G. and Petrou, M., 2003. Histograms ratio features for colour texture classification. Pattern Recognition Letters, 24, 309-314. Pekkarinen, A., 2002. A method for the segmentation of very high spatial resolution images of forest landscapes. International Journal of Remote Sensing, 23 (14), 2817-2836 Ranchin, T., Aiazzi, B., Alparone, L., Baronti, S., Wald, L., 2003. Image fusion-the ARSIS concept and some successful implementation schemes. ISPRS Journal of Photogrammetry & Remote Sensing 58, 4-18 Robert, C.P., 2001. The Bayesian Choice: From Decision-Theoretic Foundations to Computational Implementation. Springer Verlag. New York. 624 pp Salari, E., Ling, Z., 1995. Texture segmentation using hierarchical wavelet decomposition. Pattern Recognition 28 (12), 1819-1824 Snchez, N., 2003. Imgenes de alta resolucin aplicadas al medio agrcola. En Teledeteccin, Conceptos y Aplicaciones. Prez, C. y Muoz-Nieto, A.L., eds. pp 119-143 Snchez-Yez, R.E., Kurmyshev, E.V, Cuevas, F.J., 2003. A framework for texture classification using the coordinates clusters representation. Pattern Recognition Letters 24, 2123 Schaale, K., Keller, I., Fisher, J., 2000. Land Cover Texture Information Extraction from Remote Sensing Image Data. In Proceedings of the ASPRS-RTI, 2000, Annual Conference, Washington, DC. USA, May 22 - 26 2000. Published by the American Society for Photogrammetry and Remote Sensing Schrder, M., Bennartz, R., Schller, R., Preusker, R., Albert, P., Fischer, J., 2002. Generating cloudmask in spatial high resolution observations of clouds using using texture and radiance information. International Journal of Remote Sensing, 23 (20), 4247-4261. Shaban, M.A. and Dikshit, O., 2001. Improvement of classification in urban areas by the use of textural features: the case of study of Lucknow city, Uttar Pradesh. International Journal of Remote Sensing, 22 (4), 565-593 Smith, A.M.S., Wooster, M.J., Powell, A.K., Usher, D., 2002, Texture based feature extraction: application to burn scar detection in Earth observation satellite sensor imagery. International Journal of Remote Sensing, 23 (8), 1733-1739. Srivastava, Y., Doley, B., Pal, D.K., Das, R.K., Sudhakar, S., Adiga, S., Venkatachary, K.V.,

Srivastava, S.K., 2000, High resolution remote sensing data&GIS techniques in updation infrastructure details for flood damge assessment- A case study. Papers of ACRS, 2000 Stan, S., Palubinskas, G., Dactu, M., (2002). Bayesian selection of the neigbourhood order for Gauss-Markov texture models. Pattern Recognition Letters. En trmite de publicacin. Widayati, A., Verbist, B., Meijerink, A., 2002. Application of Combined Pixel-based and Spatialbased Approaches for Improved Mixed Vegetation Classification using Ikonos. 23rd Asian Conference on Remote Sensing, Kathmandu, Nepal. Zhang, J. and Tan, T., 2002. Brief Review of invariant texture analysis methods. Pattern Recognition., 35 (3), 735-747 Zhang, Y., 1999. Optimisation of building detection in satellite images by combining multispectral classification and texture filtering. ISPRS Journal of Photogrammetry & Remote Sensing 54, 50-60 Zhang, Y., 2001. Texture-integrated classification of urban treed areas in high-resolution colorinfrared imagery. Photogrammetric Engineering & Remote Sensing 67 (12), 1359-1365. Zhou, G., 2001. Future Intelligent Observing Satellites in 2010 and beyond, Technical Report to NASA/NIAC, Old Dominion University, December 2001 Zhou, G., 2002. Current status and future tendency of sensors in earth observing satellites. FIEOS 2002 Conference Proccedings

http://www.mappinginteractivo.com/plantilla-ante.asp?id_articulo=288

METODOLOGIAS EMPLEADAS PARA LA CUANTIFICACION DE CULTIVOS EN LA ZONA EXCEDENTARIA Y FUNCIONAMIENTO DEL SISTEMA IMPLEMENTADO
* Descripcin General de la Metodologa Aplicada para Sensores Remotos 1. Descripcin de los Insumos Utilizados 2. Tratamiento Digital de la Imagen 2.1. Correccin Geomtrica 2.2. Algoritmos de Pre-proceso 2.3. Ajustes y Mejoras para la Clasificacin 2.4. Clasificacin Previa e Identificacin de la Hoja de Coca 2.5. Metodologa de Mnimos Extremos 2.6. Aplicacin del SubPixel Classifier 2.7. Pre-Clasificacin de Cultivos

2.8. Trabajo de Campo 2.9 Re-Clasificacin de Cultivos * Descripcin General de la Metodologa Aplicada para Sistemas de Informacin Geogrfica Poligonizacin y Cuantificacin de Cultivos Presentacin Cartogrfica Medicin del Error Probable * Flujograma Metodolgico del Procedimiento de Clasificacin de Imgenes * Flujograma Metodolgico de la Implementacin de SIG

DESCRIPCION GENERAL DE LA METODOLOGIA APLICADA PARA SENSORES REMOTOS


1. DESCRIPCIN DE LOS INSUMOS UTILIZADOS: Como insumo principal para ste trabajo, se utiliz la imagen LandSat 7 ETM+ 233/071 (Enhanced Thematic Mapper Plus) de Fecha 20 de Agosto de 1999; proporcionada por el ICMP Illicit Crop Monitoring Programme del UNDCP en Viena. Dicha imagen fue procesada, corregida y analizada utilizando Software ERDAS v 8.5, con aplicacin de la extensin Sub-PIxel Classifier. El rea de cobertura de esta imagen es de 180 Km X 180 Km. La resolucin espacial de esta imagen es de 30 m en las bandas multiespectrales y de 15 m en la banda pancromtica. 2. TRATAMIENTO DIGITAL DE LA IMAGEN: 2.1. Correccin Geomtrica.- La imagen proviene de origen con correccin geomtrica, sin embargo, para mejorar esta correccin y minimizar el error, por este efecto, se ha realizado una nueva correccin geomtrica usando apoyo de campo con puntos GPS y algunas cartas escala 1:100.000 del NIMA. 2.2. Algoritmos de Pre-proceso.- Algunos algoritmos fueron utilizados para extraer efectos de distorsin en la imagen por la atmsfera, donde los datos originales de radiancia de la imagen fueron convertidos en reflectancia, con valores espectrales a ser determinados por los procesos posteriores de clasificacin. 2.3. Ajustes y Mejoras para la Clasificacin.- Para determinar y reconocer los cultivos se han realizado diferentes tipos de ajustes y mejoras preliminares a la

imagen, por ejemplo filtros de paso bajo y el mtodo de convulsin cbica, para resaltar los elementos de vegetacin. 2.4. Clasificacin Previa e Identificacin de la Hoja de Coca.- Para generar la identificacin de cultivos de coca, se utiliz inicialmente una Clasificacin Supervisada, dicha seleccin fue establecida gracias a contar con informacin obtenida en misiones anteriores de puntos de control (puntos GPS) sobre varios tipos de cultivos, entre ellos la hoja de coca. La clasificacin inicial resultante presentaba una serie de confusiones, derivadas de la resolucin espacial principalmente, ya que la imagen tiene valores reales de pxel mayores a los 25X25 m, por lo tanto, se opt por utilizar nuevos anlisis y transformaciones que permitan fundamentalmente mejorar la resolucin espacial. 2.5. Metodologa de Mnimos Extremos.- Metodologa adaptada en la intencin de buscar valores mnimos de reflectancia que indiquen alta probabilidad de presencia de cultivos de coca, a travs de la introduccin de clculos tales como la diferencia comparativa del ndice de Vegetacin y el ndice Normalizado de Vegetacin (NDVI) menos los ndices de Humedad. Este mtodo de clasificacin de imagen permite encontrar con precisin elementos de por lo menos 15m En banda pancromtica con alta probabilidad de ser cultivo de coca. 2.6. Aplicacin del SubPixel Classifier: Sub-Pixel Classifier es un mdulo adicional de ERDAS que permite reconocer hasta un 20 % de un determinado valor de reflectancia a un intervalo determinado de longitud de onda identificado (o sea la firma espectral); adems de aplicar nuevas correcciones como atmosfrica (p.e. la presencia de nubes), correccin medioambiental (ndices de humedad elevados), deriva espectral (variaciones y posibles confusiones entre firmas espectrales). Con sub-pxel Classifier es posible "achicar" el valor del pxel a aproximadamente 12m en condiciones ideales de reflectancia, por lo tanto se podrn reconocer cultivos de 12x12 m. Si bien Sub-Pxel Classifier es un mdulo que funciona en base a aplicacin probabilstica y por lo tanto est sujeta a errores, se constituye en una herramienta muy importante para afinar la precisin de un estudio de cuantificacin de cultivos. 2.7. Pre-Clasificacin de Cultivos.- A travs de los nuevos anlisis y la metodologa de mnimos empleada, se gener una clasificacin preliminar de Cultivos de Coca, donde en forma digital y Visual se pudo establecer probabilidades de ubicacin espacial en funcin a lmites de reflectancia, con una resolucin espacial aproximada de 12 X 12 m en color verdadero.

2.8. Trabajo de Campo.- Validacin del Clasificacin inicial En base a la clasificacin realizada en gabinete y de acuerdo a la ubicacin espacial de un cultivo y su probabilidad de ser cultivo de coca, (diferenciada por colores), se establecieron verificaciones en el terreno, en donde se evidenci diferencias entre el cultivo de coca, suelo y/o pastos y arbustos, de acuerdo a la respuesta espectral captada por la imagen. Adems se colectaron puntos GPS, de inters, tanto para control o patrones (ubicacin de un tipo de cultivo estado -estados- del cultivo) como informacin de apoyo (errores susceptibles en reflectancia, cultivos mixtos, etc., cruces de caminos, poblaciones u otros). La verificacin de campo ha sido extensa y detallada, cubriendo la zona del estudio en vehculo y caminando. Este trabajo ha permitido comprobar y mejorar los resultados obtenidos en la clasificacin inicial. El detalle de esta misin se encuentra explicado en el Anexo I. 2.9 Re-Clasificacin de Cultivos.- Posteriormente y con la informacin colectada o recogida en campo (la misma que fue nuevamente introducida en el computador), se aplicaron nuevamente tcnicas de clasificacin que han permitido mejorar la clasificacin preliminar, y de esta manera optimizar la identificacin de los cultivos de coca con mayor precisin. Adicionalmente, las transformaciones utilizadas en textura, permitieron realzar o enfatizar las caractersticas propias de cada cuerpo, mejorando principalmente la identificacin del cultivo. As tambin, las transformaciones por patrones, lograron diferenciar a cultivos o cuerpos que poseen parecida respuesta espectral y/o textura pero que tienen patrones espaciales diferentes. Finalmente se obtuvo una clasificacin mejorada con reas cubiertas por pxeles similares o firma espectral afn. Estre resultado es el final del proceso de clasificacin y es transferido al SIG para su poligonizacin y procesamiento.

DESCRIPCIN GENERAL DE LA METODOLOGA APLICADA PARA SISTEMAS DE INFORMACION GEOGRAFICA


POLIGONIZACION Y CUANTIFICACION DE CULTIVOS Una vez que la imagen ha sido clasificada, se ha obtenido como resultado pxeles que representan la existencia de cultivos de coca. El siguiente paso es convertir estos pxeles en polgonos. Para lograr este objetivo, se utiliza un procedimiento de conversin raster-vector semi-automtico, es decir supervisado por el operador, de manera de evitar extrapolaciones inadecuadas. El proceso de poligonizacin da como resultado las entidades geogrficas que representan los cultivos de coca. Una vez definida esta entidad, ya es sencillo calcular en forma automtica el rea del

polgono e introducirla a la base de datos. La suma de todas las reas obtenidas a travs de poligonizacin semi-automtica, proporciona el rea total cuantificada en la zona de La Asunta. PRESENTACION CARTOGRAFICA Para la representacin cartogrfica, es muy importante conservar los estndares nacionales, de manera que los productos obtenidos mantengan compatibilidad con las cartas topogrficas del IGM. En este sentido, se ha utilizado la divisin de hojas a escala 1:50.000 del IGM como base para la representacin cartogrfica, sub-dividiendo cada hoja al 50.000 en cuatro hojas, y manteniendo la numeracin estndar del IGM. Por ejemplo, para la hoja IGM No 6047-I, se subdivide en cuatro hojas de acuerdo a lo siguiente: 6047-I NE (Nor-Este - Superior derecha) 6047-I SE (Sur-Este - Inferior derecha) 6047-I SW (Sur-Oeste - Inferior izquierda) 6047-I NW (Nor-Oeste - Superior izquierda) Esta forma de numeracin de hojas es acorde con las normas del IPGH (Instituto Panamericano de Geografa e Historia). Utilizadas por el Instituto geogrfico Militar. MEDICION DEL ERROR PROBABLE Cualquier estudio de este tipo, tiene diversas fuentes de error, por lo tanto es necesario medir el posible error obtenido en la cuantificacin de cultivos. FLUJOGRAMA METODOLOGICO DEL PROCEDIMIENTO DE CLASIFICACION DE IMAGENES

FLUJOGRAMA METODOLOGICO DE LA IMPLEMENTACION DE SIG

http://sinaltid.rree.gov.bo/f57/Metodologia1.htm

ALTERNATIVAS A LOS PROBLEMAS PRESENTADOS EN UN PROCESO DE CLASIFICACIN BASADO EN EL RECONOCIMIENTO ESPECTRAL DE PATRONES
Enero de 2002 R.M. Ayala (*) y M. Meneti (**) (*) Dept. Lenguajes y Computacin. Universidad de Almera. (**) DLO Winand Staring Centrum for Integrated Land, Soil and Water Research (SC-DLO). Netherlands.
Resumen En el campo del tratamiento digital de imgenes existe hoy da un gran inters por el desarrollo de nuevos algoritmos de clasificacin. La mayora de los algoritmos existentes persiguen el mismo objetivo final, usando mtodos de asignacin diferentes que se comportan correctamente para imgenes de satlite concretas, en funcin del tipo y de las caractersticas de la imagen objeto de estudio. Estos algoritmos de clasificacin tambin reciben el nombre de clasificadores. A pesar del gran nmero de clasificadores existentes, ninguno de ellos presenta unos resultados totalmente ptimos para una imagen objeto de estudio, y mucho menos se conoce a priori cual es el algoritmo que proporcionar los mejores resultados una vez aplicado a una imagen concreta. Ante tal situacin, surge la necesidad de desarrollar una metodologa que de forma automtica permita obtener el mejor clasificador para una imagen de satlite con unas caractersticas determinadas. Este trabajo aborda el anlisis y desarrollo de dicha metodologa. Palabras claves: Clasificacin, Conjunto de Entrenamiento, Imagen de satlite, Reconocimiento Espectral de Patrones.

1. Introduccin En teledeteccin, el sensor del satlite explora linealmente la superficie terrestre, adquiriendo a intervalos regulares la radiacin que proviene de los objetos situados en ella. El sensor detecta la radiacin media de una parcela de terreno equivalente al tamao del pxel. Este valor medio se traduce a valor numrico, denominado valor espectral, que debe ser

interpretado. El proceso de interpretacin de las diferentes firmas espectrales que componen la imagen es conocido como reconocimiento espectral de patrones [5].

En el reconocimiento espectral de patrones se pueden distinguir dos aproximaciones bien diferenciadas, clasificacin supervisada y no supervisada, segn el nivel de participacin del usuario en el proceso de clasificacin. En la clasificacin supervisada para la interpretacin de las firmas espectrales que componen una imagen de satlite es necesaria la incorporacin de un conjunto de muestras donde se defina cada una de las categoras que pretenden discriminarse en la imagen. Existen dos formas para obtener este conjunto de muestras inicial [6], tambin denominado conjunto de entrenamiento: Entrenamiento supervisado, el usuario es el encargado de escoger manualmente el conjunto de muestras inicial. Para ello es necesario un conocimiento previo por parte del usuario del rea objeto de estudio. Entrenamiento no supervisado, la mquina es la encargada de escoger el conjunto de muestras a travs de un procedimiento de clasificacin no supervisado, de forma que el usuario solamente tiene que indicar el nmero de clases que pretende distinguir en la clasificacin, y es la computadora la encargada de generar grupos de cluster homogneos, sin necesidad de un conocimiento previo sobre las diferentes clases que se desea generar. En las ltimas dcadas se han desarrollado un gran nmero de algoritmos de clasificacin, tanto supervisados como no supervisados, con el propsito de obtener diferentes mtodos para asignar cada uno de los pxeles de la imagen a una categora determinada, en funcin del valor espectral. Estos algoritmos son conocidos como algoritmos de clasificacin basados en el reconocimiento espectral de patrones. Los resultados obtenidos por estos algoritmos de clasificacin difieren unos de otros,

dependiendo fundamentalmente de: a) las caractersticas de la imagen objeto de estudio, b) el conjunto de muestras utilizado para entrenar al clasificador y c) los valores asignados a los diferentes parmetros que forman parte del proceso de clasificacin. Por tanto, resulta prcticamente imposible conocer a priori cual de todos los mtodos es el ms adecuado para obtener los mejores resultados en el proceso de clasificacin de una imagen determinada, y cuales son los valores que deben ser asignados a los diferentes parmetros para obtener dichos resultados. La misin del presente trabajo es estudiar los problemas que se plantean en un proceso de clasificacin y presentar una nueva metodologa que permita la obtencin automtica del mejor clasificador, junto con los diferentes parmetros utilizados para su evaluacin [3]. Este trabajo est estructurado en 5 secciones, la primera de ellas se corresponde con esta introduccin. En la seccin 2 se propone una metodologa para la obtencin de la combinacin que genere el mejor resultado final en un proceso de clasificacin. Nuestra propuesta consiste en la incorporacin de un proceso iterativo, donde se van aplicando y validando los distintos clasificadores con sus respectivas combinaciones de parmetros, y el conjunto de muestras para entrenar al clasificador. Como resultado final se obtiene la combinacin (clasificador, conjunto de entrenamiento y valores asignados a los diferentes parmetros) que genera la imagen mejor clasificada. En este apartado se realiza una descripcin exhaustiva del algoritmo propuesto, comentando los parmetros ms representativos que se han tratado, as como los diferentes valores que han sido asignados a dichos parmetros. En esta misma seccin se van a interpretar los parmetros utilizados para calcular el indicador de rendimiento. Seguidamente en la seccin 3 se estudia el resultado obtenido en un ejemplo concreto, y se analiza la combinacin de parmetros que ha generado la mejor clasificacin. Terminaremos con un resumen de las conclusiones obtenidas y de los trabajos futuros planteados, as como una relacin de la bibliografa ms interesante que ha sido utilizada para el desarrollo del trabajo. 2. Metodologa de la propuesta En este trabajo se propone una tcnica para la obtencin del clasificador de mayor rendimiento basado en el reconocimiento espectral de patrones [1]. El proceso consiste en la realizacin de una clasificacin supervisada utilizando los dos tipos de entrenamiento, supervisado y no supervisado. Primero se realiza la clasificacin con el conjunto de muestras no supervisado, y una vez concluido el proceso de clasificacin se procede a la evaluacin del clasificador, basndose en tres medidas: separabilidad de las muestras del conjunto de entrenamiento, calidad de la imagen clasificada y cantidad de pxeles clasificados correctamente segn diferentes niveles de confianza. De igual forma se procede con el conjunto de muestras supervisado. Este proceso se repite hasta evaluar los diferentes tipos de clasificadores que lleva incorporado el paquete comercial de tratamiento de imgenes Erdas Imagine, y las diferentes combinaciones de parmetros para cada uno de estos clasificadores. En el grfico se puede apreciar un esquema del algoritmo propuesto. 2.1. Parmetros susceptibles de modificar en el proceso de clasificacin El paso previo a la clasificacin supervisada es la obtencin del conjunto de entrenamiento. En el algoritmo propuesto, este conjunto de muestras lo vamos a obtener utilizando los dos

tipos de entrenamiento existentes: supervisado y no supervisado. En el entrenamiento supervisado el usuario se encarga de escoger manualmente las diferentes muestras, y en el entrenamiento no supervisado el usuario simplemente va a indicar el nmero de clases diferentes que desea distinguir en la imagen clasificada, y de forma automtica, mediante la utilizacin de un algoritmo se obtendr el conjunto de muestras. El algoritmo utilizado en el entrenamiento no supervisado ha sido Isodata [7]. Isodata es un algoritmo iterativo, donde inicialmente se sealan arbitrariamente los centros de las clases, de acuerdo a un nmero de clases indicadas por el usuario. Los pxeles se asignan al centro ms cercano, y se vuelven a calcular los nuevos centros. Este proceso se repite hasta alcanzar un nmero mximo de iteraciones, o hasta que un porcentaje de pxeles queden sin modificar entre dos iteraciones. Este mtodo utiliza la distancia espectral mnima para asignar cada pxel a un centro candidato. En este algoritmo los parmetros susceptibles de cambio son: ConvergenceThreshold, es el porcentaje mximo de pxeles cuyas asignaciones al cluster pueden permanecer inalterados entre dos iteraciones. Puede tomar valores entre 0 y 1. Maximum Iterations, es el nmero de veces mximo que Isodata se va a ejecutar. Nclassess, es el nmero de clases que se pretende distinguir en el proceso de clasificacin. En la Clasificacin Supervisada cada uno de los pxeles de la imagen a clasificar se compara con cada una de las muestras del conjunto de entrenamiento, segn una regla de decisin o algoritmo. Las reglas de decisin para la clasificacin supervisada pueden ser: Paramtricas, se utiliza esta regla de decisin cuando las muestras se basan en parmetros estadsticos. No Paramtricas, esta regla se utiliza cuando no se tiene un conocimiento a priori de la estructura estadstica de las clases. Esta regla se basa en reas definidas en el espacio de muestras. En caso de las aproximaciones no paramtricas podemos escoger: Paraleleppedos, se fija un rea de dominio para cada categora, teniendo en cuenta sus valores de centralidad y dispersin. Un pxel se asigna a una clase si sus valores espectrales estn dentro del rea de dominio. Espacio de muestras, esta regla de decisin determina si el pxel candidato se encuentra o no dentro de la muestra no paramtrica en la imagen del espacio de muestras. Para muestras paramtricas, las opciones posibles son las siguientes: Mnima distancia, este algoritmo calcula la distancia espectral entre cada pxel de la imagen y cada uno de los pxeles candidatos dentro del conjunto de muestras. El pxel se asigna a la clase cuya distancia espectral sea mnima. Distancia de Mahalanobis, es similar a la mnima distancia, con la salvedad de la incorporacin de la matriz de covarianza. Mxima probabilidad o regla de decisin de Bayes, se basa en la probabilidad de que un pxel pertenezca a una clase en particular. Toda las alternativas son contempladas y evaluadas por el algoritmo propuesto, para finalmente obtener la combinacin que presente la mejor clasificacin. 2.2. Parmetros utilizados para la evaluacin del rendimiento global Una vez obtenida la imagen clasificada, se evala la clasificacin obtenida, para ello se utiliza un indicador de rendimiento. El rendimiento global del clasificador se calcula en base a tres parmetros [2]: la separabilidad, la calidad y la confiabilidad.

En primer lugar la separabilidad [8] es la medida de distancia entre las muestras del conjunto que vamos a utilizar para entrenar al clasificador. Nos informa de la similitud existente entre las diferentes muestras de partida. Para su clculo se ha utilizado la distancia de JeffriesMatusita. El rango de valores para la separabilidad oscila entre 0 y 1.414. En segundo lugar la calidad, nos muestra la relacin existente entre la fraccin de pxeles asignados a cada clase del conjunto de entrenamiento y la fraccin de pxeles que corresponde a cada clase en la clasificacin final. El rango de valores para la calidad oscila entre 0 y 1. En tercer y ltimo lugar la confiabilidad [4] determina la probabilidad de que un pxel pertenezca a la clase a la que ha sido asignado, en funcin de un umbral de confianza. Hemos utilizado umbrales desde 0 hasta 1, con un intervalo de 0'1. La confiabilidad puede tomar valores entre 0 y 1. A partir de estas tres medidas (separabilidad, calidad y confiabilidad) se puede calcular el rendimiento global del clasificador (IP). Para la obtencin del rendimiento utilizamos la siguiente frmula, en la que intervienen la separabilidad (Sep), la calidad (Cali) y la confiabilidad (Confl):

Donde, es la separabilidad mxima (= 1.414). es la calidad mxima (= 1). es la confiabilidad mxima (= 1). Este indicador de rendimiento se calcula de forma iterativa para cada una de las alternativas presentadas en el apartado anterior, hasta obtener como resultado final los valores que hagan mximo el indicador y por tanto, que presente la mejor clasificacin para la imagen objeto de estudio. 3. Resultados experimentales Para las pruebas experimentales se ha utilizado el programa de tratamiento de imgenes Erdas Imagine [9] bajo plataforma Sun/OS-5.6. La implementacin se ha llevado acabo en C, junto con una serie de libreras de herramientas C que lleva incorporado Erdas Imagine. El algoritmo aqu descrito puede ser aplicado a cualquier imagen susceptible de ser clasificada con el paquete de tratamiento de imgenes Erdas Imagine. Las pruebas han sido realizadas con una imagen Landsat TM de la provincia de Almera. Una vez aplicado el algoritmo propuesto a dicha imagen, se ha obtenido el indicador de rendimiento mximo con un valor de 0.946919. En la clasificacin supervisada, la eleccin del conjunto de entrenamiento para el indicador de rendimiento mximo, ha sido no supervisado (la mquina ha sido la encargada de escoger el

conjunto de entrenamiento). Para el proceso de clasificacin donde se obtiene el IP mximo se utiliz la siguiente combinacin de parmetros: a. Regla no paramtrica: paraleleppedos. b. Regla paramtrica: mnima distancia. Para esta combinacin de parmetros se han obtenido los siguientes resultados en el ejemplo estudio: Separabilidad: 1.380821 El valor ideal de la separabilidad corresponde a 1.414. En la grfica siguiente se muestran los valores obtenidos para la separabilidad con las diferentes combinaciones posibles. En la grfica se ha marcado con una X valor de la separabilidad que corresponde al valor asignado a la separabilidad para el indicador de rendimiento mximo.

Figura1. Valores obtenidos en nuestra imagen ejemplo para la separabilidad

Confiabilidad: 0.882750 La confiabilidad se ha calculado como la integral de la curva obtenida dibujando la fraccin de pxeles clasificados en un nivel de confianza dado versus el nivel de confianza. A continuacin se muestra una grfica donde se puede observar la curva obtenida para un valor ideal, y la curva obtenida en el ejemplo que estamos siguiendo del mayor indicador de rendimiento. Segn se puede apreciar en el dibujo el rea bajo la curva para la confiabilidad ideal sera 1.

Figura2. Comparativa de un resultado ideal para la confiabilidad (color rosa, con valor 1) y el resultado obtenido en nuestro ejemplo (color azul, con valor 0.882750)

Calidad: 0.951874 En la grfica siguiente se muestran todos los valores obtenidos para la calidad para todas las combinaciones de parmetros posibles. Se ha marcado con una X la calidad correspondiente al indicador de rendimiento mximo.

Figura3. Valores obtenidos en nuestra imagen ejemplo de calidad

Para apreciar visualmente los resultados obtenidos y la importancia del mtodo propuesto, se ha mostrado un ejemplo de una imagen Landsat sin clasificar (Figura 4), junto con dos imgenes clasificadas, una con el mejor clasificador (Figura 5) y otra con un clasificador de bajo rendimiento (Figura 6).

Figura 4. Imagen Landsat TM antes de aplicar la metodologa propuesta

Figura 5. Imagen casificada con el clasificador y el conjunto de parmetros de mayor rendimiento

Figura 6. imagen clasificada con un clasificador y un conjunto de parmetros de bajo rendimiento

En las figuras anteriores se puede apreciar las diferencias existentes entre la imagen obtenida con un clasificador de mayor rendimiento y la obtenida con otro clasificador con un rendimiento bastante ms bajo. Entre las diferencias que se pueden preciar est la cantidad de vegetacin (color rojo) que se obtiene en las dos imgenes clasificadas. Se aprecia que la primera se corresponde mucho ms con la imagen original. Tambin hay que destacar la distincin entre invernaderos (color lila) que en la primera se discrimina mucho mejor que en la segunda, siendo ms acorde con la realidad. 4. Conclusiones y trabajos futuros Los resultados mostrados en el epgrafe anterior demuestran la importancia que tiene la utilizacin de un mtodo que permita la obtencin del mejor clasificador y del mejor conjunto de asociados a ese clasificador para una imagen de satlite determinada. Despus de analizar los resultados obtenidos, pensamos que sera de gran utilidad la

incorporacin de un mtodo similar al planteado dentro de los paquetes comerciales de tratamiento digital de imgenes. Este mtodo podra ahorrar tiempo y esfuerzo al analista encargado de realizar la clasificacin. Adems, este mtodo asegura que el clasificador seleccionado y los parmetros escogidos son los que generarn los mejores resultados para el analista. Como trabajo futuro, estamos experimentando con nuevos factores para la evaluacin del rendimiento, de forma que lo que se pretende es analizar con todo detalle cada uno de los clasificadores. Tambin pretendemos extender la metodologa a mtodos de clasificacin basados en conjuntos difusos. 5. Referencia [1] Ayala A, Menenti M. Metodologa para la bsqueda del mejor clasificador de imgenes de satlite. IX Congreso Nacional de Teledeteccin. 19-21 Sep. 2001. Lleida, Espaa. ISBN: 849743-001-8. Pginas: 469-472. [2] Azzali S, Menenti M. Classification performance of methods for mapping vegetation-soilclimate complexes. Report 108. DLO Winand Staring Centre, Wageningen (The Netherlands), 1996. [3] Congalton Aussell, Green Kass. Assessing the Accuracy of Remotely Sensed Data: Principies and Practices. Editorial Lewis Publishers,1999. [4] D'Urso Guido, Menenti Massimo. Performance indicators for the statistical evaluation of digital image classifications. ISPRS Journal of Photogrammetry & Remote Sensing 51/78-90, 1996. [5] Fukunaga K. Introduction to Statistical Patter Recognition. Academic Press, 1990. [6] Jain Anil K. Fundamentals of Digital lmage Processing. Prentice-Hall, 1989. [7] Schowengerdt, Robert A. Techniques for Image Processing and Classification in Remote Sensing. Academia Press, INC, 1983. [8] Swain, P.H. Fundamentals of pattern recognition in remote sensing. In: PH. Swain and S.M. Davis (Editor), Remote Sensing: The Quantitative Approach.

Tema 12. Clasificacin de imgenes.Tcnicas avanzadas


Recientemente el desarrollo de los ordenadores ha permitido implementar tcnicas de clasificacin ms sofisticadas que los mtodos de mnima distancia o pareleppedos y ms robustas que la clasificacin de mxima verosimilitud (en el sentido de que no necesitan que los datos cumplan una determinada condicin como la de seguir una distribucin normal). En general si los datos cumplen estas condiciones es preferible utilizar mxima verosimilitud. El problema es que en muchos casos ni siquiera es posible saber si los datos cumplen esta condicin o no.

Clasificacin de contexto

Todos los mtodos estudiados hasta ahora utilizan, para clasificar un pixel, slo los valores de reflectividad recogidos en dicho pixel. Este hecho no es demasiado problemtico si el tamao de pixel es mayor que los elementos que los diferentes elementos fsicos que componen el paisaje. Sin embargo si el tamao del pixel es ms pequeo que las unidades de paisaje podra utilizarse la informacin de los pixels de alrededor para estimar la pertenencia a una clase o confirmar la estimacin. Puede resultar un mtodo til en combinacin con el de mxima probabilidad ya que permite incluir la informacin de los pixels circundantes para tomar una decisin en caso de que las probabilidades para dos clases sean similares o no exista una clase con probailidades de pertenencia suficientemente altas.

Contexto espacial
Se trata de incorporar otras fuentes de informacin distintas a las bandas para la clasificacin. Entre esta informacin estara la altitud, pendiente, litologa, etc. Las distintas formaciones vegetales tienen mayor capacidad para desarrollarse en determinados entornos definidos en parte por estas variables. Por tanto puede ser til establecer cual es la formacin vegetal con mayor probabilidad de desarrollarse en un determinado pixel (en funcin de topografa y litologa) y combinar esta informacin con la de las bandas.

Clasificaciones multitemporales
Si lo que se pretende es distinguir entre clases cuya respuesta espectral varan con el tiempo, por ejemplo entre diferentes usos del suelo, puede ser interesante integrar imgenes obtenidas en diferentes fechas. Imgenes de primavera y otoo tienen un gran valor discriminante ya que las superficies vegetales, especialmente las de cultivo muestran grandes diferencias. Si se utiliza esta tcnica, resulta imprescindible realizar una buena coreeccin atmosfrica de las imgenes. Si todas son de la misma fecha, la influencia de la atmsfera es la misma para todas por tanto podemos asumir que no influye demasiado en la clasificacin. Sin embargo si las imgenes proceden de diferentes fechas, la diferente influencia de la atmsfera puede enmascarar y distorsionar los cambios en la respuesta espectral.

Clasificacin por redes neuronales


Se basan en el uso de redes neuronales artificiales que, se supone, imitan a las redes neuronales reales en el desarrollo de tareas de aprendizaje. Una neurona artificial es un objeto lgico (se trata de software no de hardware) que recibe diversas entradas, hace una suma ponderada de las mismas y produce una salida a partir de la aplicacin de una funcin umbral a la media ponderada.

Si conectamos las asalidas de unas neuronas como entradas de otras obtenemos una red neuronal. Uno de los ejemplos ms tpicos de red neuronal es el la Back Propagation Neural Network que aparece en el siguiente grfico.

Consta de una capa de entrada con tantos neuronas como variables de entrada se vayan a introducir en el modelo (en el caso de la teledeteccin sera una por cada banda utilizada para clasificar), una capa oculta que realiza la mayor parte del clculo y una capa de salida

con tantas neuronas como posibles clases existan. En teledeteccin esta salida suele consistir en un valor numrico entre 0 y 1 para cada clase, cuanto mayor sea este valor ms verosimil resulta que el pixel pertenezca a la clase en cuestin Para trabajar con una red neuronal existen varias fases:

Entrenamiento. Se le introducen a la red la respuesta espectral de pixeles cuya clase se conoce y se compara la salida con la realidad. A partir de esta comparacin se modifican los coeficientes de ponderacin de todas las neuronas para que se obtenga la respuesta adecuada (se trata de un procedimiento automtico) es decir un 1 en la clase correcta y ceros en las incorrectas Estabilizacin. Al principio del entrenamiento, los factores de ponderacin cambian muy deprisa, pero conforme este se desarrolla (y si las areas de entrenamiento se han seleccionado correctamente) se estabilizan (no se modifican aunque se vuelvan a introducir los pixels de entrenamiento). En este momento finaliza la fase de entrenamiento Clasificacin Se introducen las respuestas espectrales de los pixels cuya clase no se conoce y se adjudican a la clase que de una respuesta ms alta (que no va a ser necesariamente 1).

Se trata en definitiva de un mtodo de clasificacin no paramtrico robusto que da buenos resultados cuando las respuestas espectrales de las clases no siguen una distribucin normal. La clave est en el conjunto de coeficientes de ponderacin que constituyen un conjunto de parmetros que deben ajustarse a unos datos de entrada y salida. Por tanto en cierto modo es equivalente a una regresin.

Arboles de clasificacin
Suponen un anlisis exhaustivo de las respuestas espectrales de las clases y del conjunto de datos disponibles, consiste en ir haciendo preguntas a cada pixel cuya respuesta positiva o negativa conducir a otra pregunta y asi sucesivamente hasta obtener la clase a la que pertenece. Se basa en los mismos principios que los sistemas expertos.

Clasificadores borrosos
Sea cual sea el procedimiento de clasificacin utilizado, surge el problema de que algunos pixels resultan inclasificables, bien porque sus probabilidades de pertenencia a cualquier clase sean muy bajas (mxima verosimilitud, salidas de un mtodo de redes neuronales, etc.) o porque aparezcan dos o ms clases con muy alta probabilidad que se disputen el pixel. En estos casos tiene ms sentido no clasificar los pixels de forma unvoca sino establecer cual es su posibilidad de pertenencia a cada una de las clases (el concepto de posibilidad no es exactamente igual al de probabilidad).

Martn del Bro,B. y Sanz Molina,A. (1997) Redes Neuronales y Sistemas Borrosos Ed. RaMa, 387 pp. http://www.um.es/~geograf/sig/teledet/clasific2.html

Interferencia atmosfrica Introduccin


La teledeteccin es la medicin de un objeto a distancia, sin necesidad de contacto fsico con l. La vista es un modo de teledeteccin. Cuando el ojo ve un objeto, registra la radiacin electromagntica (la luz reflejada) de la superficie del objeto. La radiacin contiene informacin sobre la superficie, y vemos el color y la forma. Un escner en un satlite tambin registra radiacin electromagntica. Una superficie blanca refleja cantidades iguales de radiacin de todas las longitudes de onda de luz visible, mientras que una hoja verde refleja menos radiacin en las partes roja y azul del espectro en la parte verde. Ello ofrece un exceso de luz verde (en comparacin con la azul y la roja), por lo que la hoja parece verde. La composicin de la reflexin electromagntica, la firma espectral, nos ofrece informacin sobre la superficie que emite o refleja la radiacin. La capacidad de los satlites de distinguir entre varias firmas espectrales es vital para su uso en cartografa, donde es esencial la distincin entre los distintos tipos de superficie y de rea. El ojo humano slo puede percibir radiaciones de una gama limitada del espectro electromagntico. Por eso, los instrumentos para teledeteccin fuera de las longitudes de onda visibles representan realmente una extensin de nuestro campo visual y proporcionan acceso a informacin adicional sobre el mundo fsico que nos rodea. La radiacin electromagntica de una superficie es una reflexin (luz reflejada) o una emisin (radiacin emitida desde la misma superficie). La luz solar reflejada slo puede ser medida, obviamente, durante el da, mientras que la emisin puede medirse en

El espectro electromagntico. El ojo humano slo puede ver una gama limitada del espectro, mientras que los satlites pueden registrar longitudes de onda visibles, infrarrojas y muchsimas otras.

cualquier momento. La temperatura de la superficie es un factor clave de la emisin. El sol tiene una temperatura superficial de 6.000 grados Kelvin (K) y una emisin mxima de la gama de luz visible. Una superficie con una temperatura de unos 1.000 K, por ejemplo, un incendio en el Amazonas, tiene su emisin mxima en el espectro infrarrojo medio. La temperatura superficial de la Tierra es de unos 290 K y tiene una emisin mxima de unos 14 micrmetros, tambin llamada gama trmica de infrarrojos. Existe una correlacin directa entre la temperatura superficial y el grado de emisiones de una longitud de onda determinada. La temperatura superficial puede calcularse sobre la base de teledeteccin de emisiones trmicas de infrarrojos.

Radiacin y temperatura. Las superficies de distintas temperaturas tienen sus emisiones mximas a diferentes longitudes de onda. La emisin mxima del sol est en la longitud de onda de 0,483 micrmetros, mientras que la de la tierra est en 14 micrmetros. La emisin de una superficie est en funcin de su temperatura superficial, lo que significa que la temperatura superficial puede calcularse en base de la teledeteccin de la emisin. . Como la Tierra slo irradia pequeas cantidades de energa en luz visible, slo puede verse porque refleja la luz visible del sol. Los rayos del sol que inciden sobre la Tierra pueden ser absorbidos, y as contribuir al calentamiento del planeta, o ser reflejados, y ser vistos por el ojo humano o detectados por un satlite. El albedo de una superficie indica el porcentaje de luz solar reflejada.

Firmas espectrales

Diferentes tipos de superficies, como el agua, la tierra desnuda o la vegetacin, reflejan la radiacin de manera distinta en varios canales. La radiacin reflejada en funcin de la longitud de onda se llama firma espectral de la superficie. A. Grficos de firmas espectrales del agua, la tierra y la vegetacin. La vegetacin presenta una reflexin considerablemente elevada en el canal infrarrojo cercano 4 y una baja reflexin en el canal visible rojo 3. De esta manera podemos distinguir las reas cubiertas de vegetacin de la tierra desnuda. La diferencia de reflexin en los canales 3 y 4 es mayor para las reas cubiertas de vegetacin e insignificante para la tierra desnuda. B. Las firmas espectrales se procesan como valores digitales en el escner por satlite. He aqu un ejemplo hipottico de cmo el satlite LANDSAT puede registrar agua, vegetacin verde y suelo desnudo.

La reflexin del suelo desnudo aumenta ligeramente de la gama visible a la infrarroja del espectro. Existen grandes diferencias entre los distintos tipos de suelo, de tierra seca y hmeda. Las distintas composiciones minerales de la superficie tambin se reflejan en la firma espectral. En la ilustracin slo se muestra una curva media para el suelo desnudo (tierra). En trminos generales, el agua slo refleja la gama de luz visible. Como el agua casi no se refleja en la gama cercana al infrarrojo, se distingue muy bien de otras superficies. Estas superficies acuticas aparecern claramente delimitadas como reas oscuras (valores de pxel bajos) en imgenes registradas en la gama cercana al infrarrojo. La firma espectral de las plantas verdes es muy caracterstica. La clorofila de una planta en crecimiento absorbe la luz visible y especialmente la luz roja para usarla en la fotosntesis, mientras que la luz cercana al infrarrojo es reflejada de manera muy eficaz ya que a la planta no le sirve. Mira la ilustracin. De esta manera, las plantas evitan

Mira el ejemplo de imagen del Landsat imagen del Landsat canal por canal.

calentarse innecesariamente y perder jugos a travs de la evaporacin. Por tanto, la reflexin de la vegetacin en las gamas cercana al infrarrojo y visual del espectro vara considerablemente. El grado de diferencia revela cunta rea est cubierta de hojas en crecimiento (ndice de hojas verdes).

Cartografa de la vegetacin
Cuando un satlite distingue entre varias superficies, detecta la radiacin o reflexin de diferentes longitudes de onda, tambin llamadas canales, que son tpicas de las firmas espectrales de estas superficies. La ilustracin de arriba muestra, por ejemplo, que si quieres distinguir entre el suelo desnudo y la vegetacin, debers escanear en las reas de 0,6 0,7 micrmetros y 0,7 0,9 micrmetros. La vegetacin ofrecer una fuerte reflexin en el rea de 0,7 0,9 micrmetros, mientras que ofrecer una reflexin muy ligera en el rea de 0,6 0,7. Como la firma espectral de la vegetacin es tan caracterstica, la distincin entre suelo desnudo y vegetacin verde no suele presentar problemas. La diferencia entre la reflexin de las gamas visible y cercana al infrarrojo puede, como ya hemos mencionado, emplearse para determinar la fotosntesis y el crecimiento de las plantas. El ndice de Diferencia Normalizada de Vegetacin (Normalized Difference Vegetation Index o NDVI) se suele calcular de este modo,

NDVI =

cercano al infrarrojo rojo cercano al infrarrojo + rojo

La cartografa de la vegetacin se realiza actualmente basndose en esta simple frmula. La imagen de la izquierda muestra un mapa de vegetacin global del mes de julio basado en un mosaico de datos del NOAA. Compara los mapas de los climas y la vegetacin en el atlas.

Fuente: Global Change

Database, vol.1, National Geophysical Data Center, Colorado, 1992.

Debido a los constantes problemas de sequa en el rea del Sahel, al sur del Sahara, se ha prestado especial atencin en la realizacin de un mapa de la vegetacin con gran detalle. Una serie de mapas de vegetacin que cubren toda la estacin proporcionar una impresin de la produccin total de biomasa en el periodo de crecimiento. Los datos del satlite pueden transformarse en kilos (Kg) de biomasa por hectrea (ha) con gran precisin midiendo las reas de control seleccionadas y ajustando los resultados de la teledeteccin. De esta manera se pueden realizar mapas de reas geogrficas muy extensas con frecuencia y detectarse los problemas de sequa en sus etapas iniciales. Visita, por ejemplo : El sistema de informacin HAPEX SAHEL Mapa de la vegetacin de Europa y frica en julio y enero. El verde claro indica crecimiento vigoroso, mientras que el marrn indica ausencia de crecimiento. Compralos con los mapas de temperatura y precipitaciones de julio y enero del atlas. Mira tambin una pelcula en Quicktime de las variaciones mensuales (342Kb a la izquierda)

Fuente: Global Change Database, vol.1, National Geophysical Data Center, Colorado, 1992.

Clasificacin de reas
La cartografa del aprovechamiento de la tierra realizada por satlite necesita la capacidad de separar agua, suelo desnudo, reas edificadas, bosques de rboles de madera dura, bosques de rboles de madera blanda, reas cultivadas, etc. Si la firma espectral de una superficie determinada puede diferenciarse en los canales de deteccin, un ordenador podr realizar la clasificacin de las reas. No obstante, las clases pueden no separarse en un momento determinado, aunque slo cuando se ven en

distintos momentos de la temporada de crecimiento (es decir, clasificacin multitemporal). Durante la clasificacin de las imgenes se puede identificar un tipo de rea especfico en la pantalla (y usarlo como rea de entrenamiento), determinar la firma espectral y, posteriormente, dejar al ordenador que identifique todos los pxeles que tengan la misma firma espectral. De esta manera se pueden representar cartogrficamente regiones muy grandes de manera muy rpida y fcil gracias a los datos del satlite. Por otra parte, todava hay problemas sin resolver. Es especialmente difcil distinguir entre diferentes tipos de vegetacin, ya que sus firmas espectrales pueden ser muy parecidas. Adems, el mismo tipo de vegetacin tiene firmas distintas segn el momento de la temporada de crecimiento y otros factores, como la humedad del suelo y las condiciones atmosfricas. Por eso, la investigacin se centra en el refinado potencial de la clasificacin de reas basndose en los datos procedentes del satlite. Una manera de hacerlo es intentar optimizar el alcance de los sensores que cubren canales especficos en las gamas visible y cercana a infrarroja del espectro. Se cree que un satlite con muchos canales estrechos tiene un elevado grado de resolucin espectral. En el futuro, con satlites de elevada resolucin espectral se podr confeccionar mapas de los cambios de la vegetacin provocados por la contaminacin o la sequa. Se espera que la teledeteccin va a convertirse en una herramienta cada vez ms importante para la cartografa del medio ambiente.

Interferencia atmosfrica
La radiacin del Sol y la reflexin de la superficie de la Tierra atraviesan la atmsfera antes de llegar al sensor del satlite. El contenido atmosfrico de los gases de invernadero absorbe parte de la radiacin terrestre. El ozono acta como una barrera casi completa a la radiacin ultravioleta, y casi toda la

radiacin de la gama de 9.5 - 10 micrmetros queda absorbida. El vapor de agua y el dixido de carbono son gases de invernadero muy eficaces que absorben la radiacin en muchas longitudes de onda distintas. Las longitudes de onda donde la mayora de la radiacin puede atravesar se llaman ventanas atmosfricas". Afortunadamente, tambin puede pasar "La ventana atmosfrica" es el una gran cantidad de luz visible (de lo contrario, la luz nombre de las longitudes de del da nunca llegara a la superficie terrestre). La onda en las que la atmsfera es atmsfera tambin es casi un 100% translcida para "translcida" y a travs de las ciertas gamas del espectro cercano al infrarrojo, lo cuales la emisin y la reflexin pasan con mayor facilidad. En que posibilita la observacin por satlite con un mnimo de distorsin atmosfrica. La gama trmica otras longitudes de onda, la radiacin es absorbida por infrarroja de 10 - 12 micrmetros se usa para medir varios gases de invernadero. las temperaturas superficiales del suelo, el agua y las nubes. Incluso si la teledeteccin se realiza en ventanas atmosfricas, sta se ve interferida hasta cierto punto por la difusin y la absorcin de la atmsfera. Por eso, la teledeteccin a menudo queda ligeramente distorsionada y debe ajustarse mediante una posterior manipulacin digital de la imagen. http://www.eduspace.esa.int/eduspace/subtopic/default.asp? document=295&language=es#inter

BASE DE LA FOTOINTERPRETACIN DE IMAGENES 1 INTRODUCCION

La fotointerpretacin y la identificacin de los blancos en teledeteccin estn hechas de manera visual, con un fotointerpretador. En muchos casos, la imagen esta presentada en formato fotogrfico, independientemente del tipo de sensores y de la manera en la que los datos son adquiridos. En este caso, los datos estn en formato analgico. Las imgenes de teledeteccin pueden ser representadas con un ordenador por un matiz de pixeles, donde cada pixel corresponde a un numero representando el nivel de intensidad del

pixel. En este caso, los datos estn en formato numrico. La interpretacin visual se puede hacer examinando la imagen numrica sobre una plantilla. Las imgenes analgicas y numricas pueden estar en blanco y negro (imgenes monocromticas) o en color combinando los diferentes canales o bandas que representan las diferentes longitudes de onda. Cuando los datos de teledeteccin son disponibles en formatos numricos, el procesamiento y el anlisis numrico pueden ser hechos con un ordenador. El procesamiento puede servir para mejorar los datos en previsin de una interpretacin visual. Los procesamientos y anlisis pueden hacerse automticamente con fin de identificar los blancos y extraer la informacin sin la intervencin de un interprete humano. Sin embargo, el procesamiento y el anlisis numrico siempre son utilizados con un complemento a la interpretacin humana. La interpretacin y anlisis visuales datan del principio de la teledeteccin, con la interpretacin de fotos areas. El procesamiento y anlisis numricos son mas recientes, con la llegada de registros numricos de datos de teledeteccin y el desarrollo de los ordenadores. Las tcnicas analgicas y numricas para la interpretacin de datos de teledeteccin tienen sus ventajas y desventajas respectivas. En general, la interpretacin visual requiere poco material mientras que el anlisis numrico requiere un equipo especifico y costoso. La interpretacin visual es normalmente limitada a un solo canal de datos o una sola imagen a la vez, debido a la dificultad de efectuar una interpretacin visual con muchas imgenes. Los ordenadores, siendo capaces de procesamientos ms complejos, pueden calcular el anlisis numrico con datos de varios canales. En esta ptica, el anlisis numrico es til para el anlisis simultaneo de varias bandas espectrales y puede tratar bancos de datos mas rpidamente que un fotointerpretador humano. La interpretacin humana es un procesamiento subjetivo, lo que quiere decir que los resultados pueden variar de un fotointerpretador a otro. El anlisis numrico, basado en la manipulacin de nmeros por un ordenador es mas objetivo, lo que da resultados reproducibles. Sin embargo, la precisin de los resultados provenientes de procesamientos numricos puede ser difcil, pues deben ser validados por los analistas. Los anlisis visuales y numricos de la imagen de teledeteccin no se excluyen mutuamente. Las dos metodolgicas tienen sus mritos y es combinando ambas como podemos hacer los anlisis de las imgenes. La decisin final de la importancia y la utilidad de la informacin obtenida tras los procesos de anlisis, siempre recae sobre los analistas

2 Clasificacion y analisis NUMERICOS


Un analista que intenta clasificar las caractersticas de una imagen utiliza los elementos de la fotointerpretacin visual para identificar los grupos homogneos de pixeles que

representan las clases que interesan de reas. La clasificacin numrica de imgenes utiliza la informacin espectral contenida en los valores de una o de varias bandas espectrales para clasificar cada pixel individualmente.

Las dos maneras de procesar (manual y automticamente) tienen como propsito el de asignar una clase particular o tema (por ejemplo: agua, bosques, maz, trigo, etc..) a cada pixel de la imagen. La nueva imagen que representa la clasificacin esta constituida de un mosaico de pixeles que pertenecen cada uno a un tema particular. Esta imagen es esencialmente una representacin temtica de la imagen original.

Cuando se habla de clases, es necesario hacer una distincin entre las clases de informacin y las clases espectrales. Las clases de informacin son categoras de inters que el analista intenta identificar en las imgenes, como los diferentes tipos de cultivos, de bosques, o especies de arboles, diferentes tipos de caractersticas geolgicas o de rocas. Las clases espectrales son grupos de pixeles que tienen las mismas caractersticas (o casi) concernientes a los valores de intensidades en las bandas espectrales y las clases de informacin. Es raro que una correspondencia directa sea posible entre estos dos tipos de clases. Clases espectrales bien definidas pueden aparecer a veces sin que correspondan necesariamente a clases de informacin interesantes para el anlisis. Por otro lado, una clase de informacin muy ancha (por ejemplo el bosque) puede contener varias subclases espectrales con variaciones espectrales definidas. Usando el ejemplo del bosque, las subclases espectrales pueden ser a causa de variaciones en la edad, la especie, la densidad de arboles o simplemente por los efectos de la sombra o las variaciones de iluminacin. El analista debe determinar la utilidad de las diferentes clases espectrales y de corroborar su correspondencia con las clases de informacin tiles.

Las metodolgicas de clasificacin mas comunes pueden separarse en 2 grandes categoras. Los mtodos de clasificacin supervisada y no supervisada. Cuando se utiliza una metodologa de clasificacin supervisada, el analista identifica las muestras homogneas de la imagen que son representativas de diferentes tipos de reas (clases de informacin). Estas muestras forman un conjunto de datos test. La seleccin de estos datos test esta basada en los conocimientos del analista, su familiaridad con regiones geogrficas y los tipos de reas presentes en la imagen. El analista supervisa la clasificacin de un conjunto especifico de clases. Las informaciones numricas para cada banda y para cada pixel de estos conjuntos se utilizan para que el ordenador pueda definir las clases y adems reconocer las regiones con propiedades similares a cada clase. El ordenador utiliza un programa especial o algoritmo con el fin de determinar la "firma" numrica de cada clase. Varios algoritmos diferentes son posibles. Una clasificacin supervisada empieza entonces para una identificacin de clases de informacin que son utilizadas para definir las clases espectrales que las representan. La clasificacin no supervisada procede de la manera contraria. Las clases espectrales son formadas en primer lugar, basadas sobre la informacin numrica de datos existentes. Estas clases son asociadas, por un analista, a clases de informacin tiles (si es posible). Programas llamados algoritmos de clasificacin son usados para determinar los grupos estadsticos naturales o estructuras de datos. El analista especifica el numero de grupos o clases que sern formados con los datos. Adems, el analista puede especificar parmetros relativos a la distancia entre las clases y la variacin en el interior de una clase. El resultado final de este procesamiento de clasificacin iterativo puede crear clases que el analista quisiera combinar, o clases que deberan estar separadas de nuevo. Cada una de estas etapas necesita una nueva aplicacin de algoritmo. La intervencin humana no esta totalmente exenta de la clasificacin no supervisada. Sin embargo, esta metodologa no empieza con un conjunto predeterminado de clases como en la clasificacin supervisada.

las

clasificaciones automticas supervisadas o nosupervisadas ofrecen une grande variedad de mtodos de

clasificacin y de anlisis de los resultados de las clasificaciones. Veremos algunas en los prrafos 3 y 4.
3 LAS CLASIFICACIONES NO-SUPERVISADAS Una clasificacin no-supervisada utiliza una base de reglas para identificar automticamente el numero de clases que se desea. Estas reglas cambian segn el mtodo de clasificacin que quieres utilizar. El clustering por ejemplo calcula el centro de las clases y afecta los pixeles en estas clases calculando la distancia espectral de cada pixel. Cada pixel es afectado a la clase la mas cerca. Un pixel demasiado lejos de una clase llega a ser el centro de una nueva clase. As la clasificacin no-supervisada afecta cdigos de clases a cada pixel en el orden de su creacin, y colores son afectadas a estos cdigos de clases.

A veces, es posible crear una imagen de las distancias que ensea el nivel de calidad de la clasificacin de los pixeles. La distancia representa la distancia entre el pixel y el centro de la clase espectral. Con la imagen que sigue, mas claro es el gris, mas grande es la distancia. Para interpretar los resultados de una clasificacin no-supervisada, es til de compara la imagen de las clases espectrales a une verdad de campo . En el caso siguiente, observar los campos de trigo. En el rincn norte-este, incluya la clases 1,3 (azul) y 6/ En el centro, las clases 4 y 6 (rojo). En el sur-este, las clases 4 y 5 (violeta). Estas variaciones espectrales pueden venir de diferencias en el tamao de la vegetacin, en la cuvertura de las hojas, en los pendientes o en otros factores. Esta variabilidad es frecuenta cuando tienes que identificar ocupacin de los suelos.

Estos mtodos de clasificacin no-supervisada se utilizan generalmente de manera iterativa, con varios procesamientos. Los resultados pueden ser visualizados con estadsticas o con dendrogramos.

Muchas veces, se debe despus esta clasificacin fusionar clases que no dan satisfaccin.

6.4 LAS CLASIFICACIONES SUPERVISADAS Para utilizar une clasificacin supervisada, tiene que haber un conocimiento preciso de une parte de esta rea para caracterizar muestras de cada una de la clases. Estas muestras son luego utilizados para guiar un algoritmo de clasificacin. Estas muestras deben ser el mas representativo de la variabilidad de la imagen. Primero el proceso va calcular las propiedades estadsticas de cada una de las clases de la muestra. Luego va utilizar estas propiedades para clasificar toda la imagen.

Con el mtodo de distancia mnima a la media, para cada clase del muestra, y por cada banda espectral, el valor promedio es calculado. Este valor define la posicin del centro de la clase en el espacio espectral. El algoritmo afecta luego cada pixel de la imagen a la clase la mas cerca. El mtodo de clasificacin linear etapa por etapa calcula funciones discriminantes que son combinaciones lineares de las bandas de la muestra. El algoritmo va elegir la funciones que producen la mejora separacin entre clases de la muestra. Estas funciones son elegidas etapa por etapa. El mtodo del mximo de verosimilitud es una de las mas utilizadas. Con la muestra, calcula el centro de las clases y la variabilidad en cada clase y cada banda. Luego calcula la probabilidad que un pixel pertenece a una clase particular. Esta probabilidad depende de la distancia del pixel al centro de la clase, pero tambin del tamao y de la forma de la clase en el espacio espectral. El algoritmo calcula para cada pixel las probabilidades de

pertenecer a cada clase y afecta el pixel a al clase que tiene la probabilidad la mas alta. Ese mtodo da mejores resultados que el mtodo de distancia mnima a la media. Cualquiera el mtodo utilizado, tiene que analizar la matriz de las errores o matriz de confusin. La clase de cada muestra es comprada a los clases calculados con el algoritmo. En esta matriz, cada lnea figura las clases calculadas, y cada columna figura las clases de la muestra de referencia. Las valores de la diagonal representan las valores bien clasificadas.

3 LA FOTOinterpretacin visual

La fotointerpretacin es el hecho de examinar fotos reas o imgenes de satlites con el propsito de identificar objetos. Esta identificacin esta expresado a veces en trminos de posible, probable o segura. Los fotointerpretadores identifican los objetos a partir de otros objetos que les son asociados o a partir de componentes de estos objetos. Que hace que la interpretacin de imgenes sea una tarea mas difcil que la interpretacin de lo que nos rodea en nuestra vida cotidiana? Para empezar, perdemos nuestro sentido de la perspectiva mirando una imagen en dos dimensiones, a menos que la veamos en estereoscopia para simular una tercera dimensin. En efecto, en varias aplicaciones, la visualizacin estreo es un plus importante para la interpretacin pues el reconocimiento de un blanco es resaltado de manera espectacular. A vuelo de pjaro, los objetos pueden tener una apariencia muy diferente a la que estamos habituados. La combinacin de una perspectiva inhabitual, de una escala diferente y con pocos detalles hace que los objetos mas familiares sean irreconocibles sobre una imagen. Por ultimo, tenemos la costumbre de ver solamente las longitudes de onda de la zona del visible del espectro electromagntico. Es mas difcil comprender las imgenes de las longitudes de onda de otras zonas del espectro. El reconocimiento de los blancos es la clave de la interpretacin y de la extraccin de informacin. La observacin de las diferencias entre los blancos y del plano de fondo implica la comparacin entre los diferentes blancos basndose en la combinacin de las caractersticas siguientes: tono, forma, tamao, patrn, textura, sombra y asociacin. Utilizamos regularmente estas caractersticas para las interpretaciones visuales que efectuamos cotidianamente. La identificacin de los blancos en teledeteccin se basa en las siete caractersticas visuales nos permiten interpretar mejor. Cada de estas caractersticas de la interpretacin es descrita abajo: 6.3.1 Elementos de 1er orden Tono y color : el tono puede ser definido como una variacin visible entre el blanco y el negro. El color se definido como cada variacin visible de tinta, intensidad, saturacin. Una persona puede distinguir como mximo entre 10 y 20 niveles de gris, pero podemos distinguir hasta 100 veces mas de colores. El tono se refiere a la claridad relativa o el color (tinta) de los objetos de una imagen. Generalmente, el matiz de tono es un elemento fundamental para diferenciar los blancos y las estructuras. Las variaciones de tono permiten la diferenciacin de formas, texturas, y patrn.

Ejemplo de imagen Ikonos en blanco y negro y en color

Resolucin: la resolucin es un concepto difcil de explicar en anlisis de imagen. La resolucin puede ser descrita como el objeto mas pequeo que podemos identificar sobre una imagen. 6.3.2 Elementos de 2 orden Tamao de los objetos. El tamao de un objeto sobre una imagen esta en funcin de la escala. Es importante evaluar el tamao de un blanco en relacin con otros objetos de la imagen (tamao relativo), adems del tamao absoluto, con el fin de ayudar a la interpretacin de este blanco. Una evaluacin rpida del tamao aproximado de un blanco facilita la interpretacin. Por ejemplo, si es necesario distinguir diferentes zonas de uso del suelo e identificar una rea compuesta de edificios, las grandes estructuras como fabricas, sugieren zonas comerciales y los pequeos elementos, zonas residenciales. Forma de los objetos: la forma se refiere al aspecto general, la estructura o el contorno de los objetos tomados individualmente. La forma puede ser un ndice muy importante para la interpretacin: las formas con bordes rectilneos se encuentran generalmente en las regiones urbanas donde estn los campos agrcolas, mientras que las estructuras naturales, como los bordes de bosques, son generalmente mas irregulares, excepto en los lugares donde el hombre ha construido una va..

El patrn: se refiere a la disposicin espacial de objetos visiblemente discernibles. Una repeticin ordenada de tonos similares y de texturas produce un patrn distintivo y fcilmente reconocible. Los huertos con sus arboles, o las vas bordeadas de casas son buenos ejemplos de patrones. La textura: se refiere a la disposicin y a la frecuencia de variaciones de tintas en las regiones particulares de una imagen. Texturas rugosas consistiran en tonos con rayas donde los niveles de gris cambian bruscamente en una pequea regin, mientras que las texturas lisas podran tener poca o ninguna variacin de tonos. Las texturas lisas son el resultado de una rea uniforme como los campos, o los terrenos de csped. Un blanco con una superficie rugosa y una estructura irregular, como el bosque aparece con una textura de apariencia rugosa.

6.3.3 Elementos de 3r orden El lugar: la manera como los objetos estn arreglados con respecto a otros o al terreno puede ayudar a la interpretacin. El aspecto, la topografa, la geologa, el suelo, la vegetacin, los factores culturales son factores a tomar en cuenta. Las sombras: son mas tiles para la interpretacin pues dan una idea del perfil y de la altura relativa de los blancos pudiendo ser identificadas fcilmente. Las sombras pueden reducir,

incluso eliminar la interpretacin de su ambiente, pues los blancos situados en las sombras son menos o nada discernibles. La asociacin: tiene en cuenta la relacin entre el blanco que interesa y otros objetos o estructuras reconocibles que estn prximas. La identificacin de elementos que se espera encontrar normalmente a proximidad de otras estructuras puede dar informacin facilitando la identificacin. En nuestro ejemplo, un lago esta asociado a barcos, a una marina y a un parque recreativo cerca.

6.4 LOS COLORES En teledeteccin, un buen conocimiento de los colores es necesario para: Interpretar las imgenes impresas sobre papel Interpretar los colores sobre la pantalla Componer los colores de imgenes Escoger los colores de impresin.

6.4.1 EL SISTEMA RVB Las pantallas utilizan los tres colores rojo, verde, azul. La mezcla de estos tres colores permite reproducir una gama de colores. Estos colores se llaman colores primarios aditivos. La combinacin por parejas de estos colores permite generar los colores secundarios. Azul y verde = cyan Verde y rojo = amarillo Rojo y azul = magenta Si se mezclan los tres colores primarios, obtenemos el blanco. El negro se obtiene de la ausencia de colores.

Rojo

Azul Verde Blanco Amarillo Cyan Magenta

6.4.2 EL SISTEMA Munsell El sistema Munsell esta representado sobre un cilindro. El eje del cilindro es un eje acromtico que va del negro al blanco, pasando por todos los grises. Se utiliza el termino intensidad. Para un valor dado del eje acromtico, se puede definir un plano perpendicular cuyo ngulo de rotacin corresponde a la tinta. En este plano, podemos definir un circulo cuyo radio caracteriza el valor de pureza, o saturacin. Cada color esta definido por tres coordenadas: intensidad, tinta, saturacin.

La conversin de la codificacin Munsell en codificacin RVA es compleja y no puede hacerse mas que por ordenador.

4.3 LAS CAPACIDADES HUMANAS La percepcin del ojo difiere segn la coloracin de la imagen. En blanco y negro, el ojo percibe hasta 16 niveles de gris. Pero es capaz de reconocer 10000 colores. Lo esencial de la interpretacin de la seal recibida por el ojo es elaborada por el cerebro: La percepcin de los colores, de los contrastes, y de las formas. La identificacin de los objetos o formas ya vistos La clasificacin de objetos en tipos El anlisis espacial de la distribucin de objetos en un espacio de dos dimensiones. La organizacin de objetos en este espacio y el reconocimiento de motivos.

http://samoullier.com/base_de_la_fotointerpretaci%C3%B3n.htm

VOLVER

LA TELEDETECCIN ESPACIAL EN LA CARACTERIZACIN DE REAS URBANAS


Marzo de 1999
Mara de Santiago Lpez de Uralde. Juan Carlos Escudero Achiaga. Jorge Ozcriz Salazar CENTRO DE ESTUDIOS AMBIENTALES ceasit@vitoria-gasteiz.org

1. INTRODUCCIN Son innumerables las citas bibliogrficas que hacen referencia a distintas aplicaciones de la Teledeteccin espacial en mbitos urbanos: estimacin de la poblacin, cuantificacin de cambios, estimacin de la densidad de edificacin, deteccin de asentamientos urbanos y rurales, evaluacin de impactos producidos por la actividad humana,... [Lillesams et al, 1.994; Henderson et al., 1.997; Pedran, C., 1.988; Corbley, 1.997] La Teledeteccin espacial puede suministrar informacin continuada y aetualizada sobre reas urbanas, complementando a la fotografia area, y sustituyndola en algunos casos concretos. As, hoy en da, los sensores pticos de uso civil llegan a proporcionar imgenes con gran nivel de detalle (IRS-1C), lo que las confiere una indudable utilidad de cara a la gestin y planificacin del desarrollo urbanstico. Por su parte, los sensores radar pueden Ilegar a constituir una fuente de datos de gran relevancia en el estudio de reas urbanas, proporcionando informacin acerca de la estructura urbana (densidad, materiales, orientacin). Por tanto, ambos tipos de sensores, pticos y radar, vienen a suministrar informacin complementaria y sinrgica, que puede ser de gran utilidd en el estudio de reas urbanas. Por otro lado, los mtodos habituales de generacin cartogrfica suelen caracterizarse por su elevado coste, lo que los hace dificilmente viables paza un seguimiento continuado de urbes de mayor tamao, y ms an si pensamos en megaciudades del estilo de Hong-Kong o El Cairo, por un rpido, y a veces incontrolado, crecimiento [Dekker et al., 1.997). As, la Teledeteccin espacial puede constituir una til herramienta para suministrar informacin, normalmente a menor detalle, durante aquellos periodos de tiempo comprendidos entre la finalizacin de una cartografa y su posterior revisin mediante fotografa area o topografia clsica. Sucede normalmente, que muchas de estas ciudades, por su localizacin geogrca, suelen caracterizarse por presentar una abundante cubierta nubosa durante gran parte del ao, lo que viene a dificultar especialmente la utilizacin de imgenes pticas en el seguimiento de estos espacis. Por el contrario, las imgenes radar, por su alta penetrabilidad, no sufren esta limitacin por lo que se presentan como especialmente idneas bajo condiciones tan adversas.

Fig 1:Imagen pancromtica IRS-!c de la ciudad de Vitoria - Gasteiz El presente estudio, bajo la financiacin de la Agencia Espacial Europea ESA (P4700195 /P), contempla evaluar las posibilidades de la Telediccin espacial, y de los sensores radar en particular, como apoyo a la planificacin urbana. Para ello se ha pretendido analizar la complementariedad de los sensores radar (ERS-1 y 2) y pticos en la caracterizacin de reas urbanas sobre un rea piloto correspondiente con la ciudad de Vitoria Gasteiz. Tal eleccin puede justificarse aun siendo una ciudad de tamao medio, por su avanzada configuracin urbana, as oomo por la existencia de un importante banco de datos territorial que puede ser de gran inters para la realizacin del estudio. De hecho, este banco de datos

http://www.mappinginteractivo.com/plantilla-ante.asp?id_articulo=382

Agricultura ENVI es el software que contiene la mayor gama de herramientas de anlisis de imgenes hiperespectrales que forman la fuente de datos ms fiable en el campo de la vigilancia agrcola, la salud de los cultivos y la prediccin de la produccin. Adems posee las herramientas necesarias para el tratamiento de fotos areas o imgenes de radar particularmente tiles en presencia de nubes.

Integra un gran nmero de formatos de imgenes areas, de satlite, radar o trmicas Planos de estado de superficies y reconocimiento de cultivos Superposicin/creacin de capas de informacin de la produccin, los cultivos o cualquier informacin en forma de vectores o ASCII Clculo instantneo de los ndices de vegetacin Herramientas de anlisis espectral con el objetivo de evaluar el estrs hdrico Creacin de datos interpolados a partir de datos adquiridos punto por punto Estudio topogrfico con el objetivo de extraer canales, pozos y otras propiedades de drenaje del terreno y muchas ms posibilidades Inicio

Bosques ENVI es el software ideal, de fcil manejo a pesar de que incluya herramientas sofisticadas para el proceso de datos de teledeteccin en la gestin de bosques y habitat. Ya sea en zonas desrticas con datos pticos o en zonas tropicales y con nubusidad con imgenes de radar, ENVI ofrece el abanico de herramientas necesarias para la extraccin de informacin sobre la cubierta vegetal o la morfologa del terreno.

Lectura fcil de todos los datos, pancromticos, multiespectrales, hiperespectrales, radar, modelos numricos de terreno y datos vectoriales SIG Deteccin de enfermedades o plagas de insectos antes de que los daos sean visibles Mapas de las especies forestales gracias a herramientas espectrales avanzadas Caracterizacin del terreno yendo ms all de las imgenes de pendiente u orientacin hacia una clasificacin de datos MDT Anlisis combinado raster-vector : campo de visibilidades, zonas buffer, digitalizacin, edicin, consulta, etc. y muchas ms posibilidades Inicio

Geologa/prospeccin minera y petrolera Necesita crear mapas geolgicos y de terreno, hacer prospeccin minera o petrolera, medir el impacto ambiental? ENVI les ofrece todas las herramientas necesarias para el tratamiento de las imgenes con el fin de extraer la informacin de sus datos, ya sea en el mbito ptico (pancromtico o multiespectral), radar o trmico. Acceder fcilmente a sus datos pticos o de radar Cruzar informacin de altura, geofsica o SIG con sus imgenes Mapa de ocupacin del suelo para evaluar impactos medioambientales Deteccin e identificacin de minerales especficos gracias a herramientas avanzadas de anlisis espectral Caracterizacin del terreno yendo ms all de las imgenes de pendiente u orientacin hacia una clasificacin de datos MDT Explotacin de imgenes SAR en la deteccin de manchas de petrleo y seguimiento de trafico marino

Anlisis combinado raster-vector : campo de visibilidades, zonas buffer, digitalizacin, edicin, consulta, etc. y muchas ms posibilidades Image courtesy Hyvista Corporation

Un gran nmero de sus colegas usan ENVI para optimizar su trabajo de prospeccin. Emparejando sus estudios sobre el terreno con el tratamiento de datos de teledeteccin gracias a ENVI, ganar tiempo y dinero. Inicio

Medioambiente Tiene que vigilar zonas cenagosas, la salud de la vegetacin, caracterizar efectos del terreno o detectar zonas de polucin? Un gran nmero de sus colegas usan ENVI para optimizar la bsqueda de informacin gracias al tratamiento de datos de teledeteccin. Con ENVI, ganar tiempo, dinero, etc.

Mapa del estado y la salud de la vegetacin Medida de la calidad del aire y el agua Mapa de mareas Vigilancia y medida de la extensin de manchas de polucin Deteccin e identificacin de materias peligrosas Anlisis topogrfico para evaluar los riesgos y muchas ms posibilidades

ENVI es la herramienta ideal para la extraccin de informacin pertinente de las imgenes, ya sean pancromticas, multiespectrales, hiperespectrales, infrarrojo o radar. Funcionalidades muy diversas estn integradas en ENVI a fin de optimizar la explotacin de datos multifuente. Adems, le sorprender su facilidad de manejo. Inicio

Oceanografa y entorno costero

ENVI combina las posibilidades de manipular una amplia gama de datos pticos y radar, frecuentemente utilizados para estudios oceanogrficos o costeros, con medios sofisticados para el anlisis y la integracin de fuentes diversas. Un arutina de clasificacin MDT le permitir igualmente hacer un estudio morfolgico a partir de batimetra o de datos LIDAR. Seguimiento de poluciones qumicas o petroleras Mapas de temperaturas y corrientes del agua Explotacin de la porcin espectral penetrante en el agua para extraccin de batimetra en zonas costeras Identificacin y mapas de vegetacin sumergida y corales Vigilancia de la erosion costera Evaluacion de daos en tempestades Deteccin de icebergs Y otras Inicio

Urbanismo ENVI provee de una gama de herramientas fciles de emplear, a la vez que sofisticadas, para la planificacin y el anlisis urbano a partir de imgenes aereas o de satlite. Ya sea para el estudio de perdidas de calor de edificios con datos trmicos, o para la planificacin de nuevos proyectos de construccin, ENVI ofrece las herramientas necesarias. Lectura y visualizacin de una amplia gama de imgenes aereas y de satlite Lectura sencilla de datos, DOQ's, USGS DEM, ArcView SHAPE, DLG's y otros Superposicin de informacin SIG o GPS Mapa de cubierta vegetal Identificacin de materiales: asfalto, cemento, metal...autre Deteccin y clasificacin de formas Y otras

Courtesy Spaceimaging.com Inicio

Defensa ENVI es el software ideal y completo para caracterizar el terreno as como detectar e identificar objetivos. ENVI es la solucin mejor adaptada a la interpretacin de imgenes pancromticas, multi o hiperespectrales, radar, infrarrojas y MDTs. Integracin rpida de datos pancromticos, multiespectrales, hiperespectrales, radar, MDT y SIG Creacin de mosaicos Extraccin de caractersticas de elementos de la escena Deteccin de objetivos mediante deteccin espectral Caracterizacin del terreno por clasificacin de MDT Anlisis raster-vector: campo de visibilidad, zonas de acumulacin, digitalizacin, edicin, consultas... Y otras

ENVI ha sido seleccionado por el NIMA como el software ms potente para la extraccin automtica y caracterizacin asistida de objetivos. Inicio Volver a ENVI 2003 Research Systems, Inc. Home | Privacy | Contact Us

http://www.rsinc.com/spain/envi/aplicaciones.asp

You might also like