Professional Documents
Culture Documents
Presentado por
Danilo Andrs Daz Montes
Alex David Guzman Yepes
Inteligencia Artificial
Fundacin Universitaria Unipanamericana
Bogot
2015
Qu es un Analizador Lxico?
Es la fase de rastreo, tiene las funciones de leer el programa fuente como un archivo de
caracteres y dividirlo en tokens. Los tokens son las palabras reservadas de un lenguaje,
secuencia de caracteres que representa una unidad de informacin en el programa fuente. En
cada caso un token representa un cierto patrn de caracteres que el analizador lxico
reconoce, o ajusta desde el inicio de los caracteres de entrada. De tal manera es
necesario generar un mecanismo computacional que nos permita identificar el patrn de
transicin entre los caracteres de entrada, generando tokens, que posteriormente sern
clasificados. Este mecanismo es posible crearlo a partir de un tipo especifico de maquina
de estados llamado autmata finito
Algunos aspectos generales que tiene un analizador lxico:
La principal funcin es leer los caracteres de entrada y elaborar como salida una
secuencia de componentes lxicos que se utilizaran.
Dgitos: En general nmeros no son buenos candidatos de palabras claves. Sin embargo,
la normalizacin de ciertos nmeros en el contexto de ciertas palabras pueden ser
relevantes para la recuperacin de informacin.
Tildes y caracteres especiales: Puede que sea o no sea relevante la eliminacin de tildes
y caracteres especiales. En general, se adopta una regla y se agregan excepciones.
En la fase de anlisis, los trminos componentes lxicos (tokens), patrn y lexema se emplean
con significados especficos. Un analizador lxico, inicialmente lee los lexemas y le asigna
un significado propio.
patrn es una regla que genera la secuencia de caracteres que puede representar
a un determinado componente lxico (expresin regular).
lexema es una cadena de caracteres que concuerda con un patrn que describe
un componente lxico (valor de cadena).
Un patrones una regla, la cual describe el conjunto de lexemas que pueden representar a
un determinado componente lxico en los archivos fuentes.
Las expresiones regulares son una notacin importante para especificar patrones. Cada
patrn concuerda con una serie de cadenas, de modo que las expresiones regulares
sirvan como nombres para conjuntos de cadenas.
Los trminos frase o palabra a menudo se utilizan como sinnimos del termino cadena
El analizador lxico recoge informacin sobre los componentes lxicos en sus atributos
asociados. Los tokens influyen en las decisiones del anlisis sintctico, y los atributos,
en la traduccin de los tokens. En la prctica los componentes lxicos suelen tener solo un
atributo. Para efectos de diagnstico, puede considerarse tanto el lexema para un identificador
como el nmero de lnea en el que se encontr por primera vez. Esta informacin puede
ser almacenada en la tabla de smbolos para el identificador (estructura de datos)
Bibliografia
http://es.slideshare.net/maryr_/actividad-2-analizador-lxico-sintctico-y-semntico [12-10-2015]
http://www.geocities.ws/itmina_web/lya/Auto_Archivos/proy/AL.htm [12-10-2015]
http://www.kramirez.net/RI/Material/Presentaciones/Analizador%20Lexico.pdf [12-10-2015]