You are on page 1of 16

CATOLICA DEL NORTE FUNDACION UNIVERSITARIA Facultad de Ingeniera Programa Ingeniera Informtica

Asignatura Electiva III Sistemas basados en Conocimiento


Anlisis de caso prctico 30%

Facilitador: Alejandro lvarez Crdoba

Preparado por: Jorge Hernn Aguirre Guarn Jos Germn Muoz Henao Julio Atanasio Linero Tern.

Manizales, Colombia 2013

Objetivo: Identificar el modelo de conocimiento y las caractersticas del sistema propuesto de forma clara y detallada. Caso: Sistema de traduccin en lnea basada en reglas (Translation Machine) Los sistemas de traduccin en lnea basado en reglas pertenece al grupo de aplicaciones de aprendizaje de maquinas (machine learning) que usan datos a gran escala y son muy usados en nuestro da a da. Se debe presentar: 1. Marco de Referencia: consulte acerca de los sistemas de traduccin en lnea. Sus inicios y evolucin. No dedique ms de 2 pginas. 2. Descripcin del sistema de conocimiento. Describa como es su funcionamiento y sus componentes. 3. Describir las caractersticas del motor de reglas o motor de inferencia de la solucin. 4. Defina el modelo de conocimiento que mejor se acomoda al sistema teniendo en cuenta los principios y caractersticas de los modelos de conocimiento contenidos en el curso y el documentoModelos para la creacin y gestin del conocimiento

1. Marco de Referencia: consulte acerca de los sistemas de traduccin en lnea. Sus inicios y evolucin. No dedique ms de 2 pginas.
1

El planteamiento bsico de esta problemtica pretende resaltar la importancia de la traduccin en lnea basado en reglas el cual se usa desde tiempo atrs y tiene un historial muy marcado y envuelto en un contexto de mucha aplicacin para el beneficio del ser humano. Si nos remontamos en la historia de estos sistemas, encontramos que fue en el siglo XVII ms propiamente en 1629 con la idea de Ren Descartes de crear un lenguaje universal con ideas equivalentes en lenguas diferentes que comparten un smbolo. Posteriormente a esta idea en el siglo xx aparecieron nuevos proyectos sobre el tema y con la creacin del memorando Warren Weaver en la traduccin hecha en 1949. Seguido a estos estudios aparece el primer investigador en este campo de la traduccin en lnea y fue el seor Yehosha Bar Hillel iniciando su investigacin en 1951 en el MIT, seguido enele mismo ao con un grupo de investigacin y una demostracin en Georgetown en 1954, otros grupos de investigacin se formaron en Rusia y Japn en 1955, para luego celebrar la primera conferencia en Londres en 1956. En el ao de 1962 en EE.UU se formo la Asociacin para la traduccin Automtica y Lingstica Computacional y en el ao 1964 la Academia Nacional de Ciencias formo el Procesamiento del Lenguaje automtica Advisory Commite(ALPAC Comit establecido en 1964 por el gobierno de los Estados Unidos para evaluar el progreso de la lingstica computacional y en general las Maquinas de traduccin) aunque no tuvo mucha eficiencia y productividad hasta diez aos depues. Debido a que No se haban cumplido las expectativas hasta el momento, el Instituto Francs textil es usado para hacer las traducciones del y hacia el francs, alemn y espaol en el ao 1970. Para seguir con los avances correspondientes en esta rea Brigham Young University inicia proyectos para traducir algunos textos mormones por medio de la traduccin automtica en 1971.La compaa Xerox hace su incursin en este tema con la traduccin de textos tcnicos con el uso de SYSTRAN (Sistema comercial de traduccin automtica, diseado en 1970 por el Dr. Peter Toma). A finales de la dcada de los ochenta con el aumento de la capacidad de procesamiento en los computadores y la disminucin de costo de los mismos se ha mostrado ms inters y se han lanzado nuevos traductores como Trados (proveedora de servicios de traduccin) en 1984 y las memorias de traduccin en
1

MACHINE TRASLATION. History [en lnea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: <http://en.wikipedia.org/wiki/Machine_translation>

1989. Para la dcada de los 90 se cre el primer sistema comercial Ruso/Ingles/Alemn se desarrollo en la Universidad Estatal de Kharkov en Ucrania en 1991.En 1996 en la web se comenz con SYSTRAN a traducir en forma gratuita textos pequeos seguido luego por AltaVista BabelFfish que ofrece un traductor en la web de ingles a espaol con un diccionario adicional, alcanzando una cantidad peticiones al da durante el ao de 1997. En 2003 Franz Josef Och Futuro jefe de desarrollo de traduccin de google gan la competencia promovida por DARPA (Defense Advanced Research Projects Agence,Agencia del Departamento de Estado de los Estados Unidos para proyectos avanzados de defensa).Otras traducciones en esta poca fueron Moiss o motor estadstico de cdigo abierto en 2007, SMS o servicio de traduccin para mviles en Japn en 2008 y luego un telfono mvil con funcionalidad de traduccin speech to speech para los idiomas Ingles, Japons y Chino en 2009. Recientemente en 2012 google anuncio que Google Translate (Traduce texto en ms de 64 lenguajes adems traduccin masiva de libros. 2. Descripcin del sistema de conocimiento. Describa como es su funcionamiento y sus componentes.
2

SISTEMAS INTELIENTES. T6: Sistemas Basados en Reglas [en lnea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: <http://www.aic.uniovi.es/ssii/SSII-T6-SistemasBasadosReglas.pdf>

Los sistemas basados en reglas tienen la siguiente estructura. Estructura de un SBR .Base de hechos. Son los datos relevantes relacionados con el problema concreto. Por ejemplo.

Conocimiento del dominio de sistema. Forma natural de almacenar el conocimiento. Base de conocimiento. Contiene las variables y el conjunto de reglas que definen el problema forma de representar el conocimiento de forma natural. Si Antecedente - (Entonces) Consecuente.

Antecedente: Conjunciones de atributos de un mismo dominio Consecuente: Atributos que pasaran a ser conocidos por el sistema. Se puede incluir tambin un campo de prioridad que indica el grado de importancia de la regla en el sistema. Se ve como condicin necesaria pero no suficiente cumplir el antecedente de una regla para generar el consecuente. Eso depende de la prioridad de la regla y del motor de inferencia. Inferencia en sistemas de reglas. Los sistemas basados en reglas usan modus ponens. Por ejemplo Si A es un hecho cierto y la implicacin A B es cierta, entonces se deduce que el hecho B es cierto. Los atributos que forman el consecuente pasan a ser conocidos (Hechos) para el sistema. El proceso de resolucin de un problema es obtener una secuencia de inferencias de los datos iniciales del objetivo. Usando tcnicas de bsqueda ms comparacin de patrones, los sistemas basados en reglas automatizan los mtodos de razonamiento o cadenas de inferencia. No es exactamente deduccin lgica, ya que acepta incertidumbre. Un hecho derivado puede ser posteriormente retractado. Dependencias reversibles / Irreversibles. La informacin que se retracta ha sido usada para obtener nuevas conclusiones. Por ejemplo: Si bombilla encendida entonces habitacin iluminada. Motor de Inferencia.
3

Obtiene las conclusiones aplicando la lgica clsica al conjunto de reglas. Se entiende por regla a una proposicin lgica que relaciona dos o mas objetos y la cual incluye dos partes la premisa y la conclusin. Las partes estn formadas por una expresin lgica con una oo mas afirmaciones objeto-valor conectadas mediante operadores lgicos y ,o,no. La regla se escribe normalmente como premisa entonces conclusin. Permite obtener nuevo conocimiento a partir del existente, para ello se utiliza un proceso de razonamiento, el cual es la reunin de un conjunto de datos de partida para llegar a una solucin o conclusin.

SISTEMAS EXPERTOS BASADOS EN REGLAS. Motor de Inferencia [en lnea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: < http://personales.unican.es/gutierjm/cursos/expertos/Reglas.pdf >

El proceso de razonamiento usa los mtodos encadenamiento hacia adelante (Forward chaining) para los casos: pocos datos y/o muchas posibles conclusiones, poco especfico o busca todas las reglas posibles. Tambin utiliza el encadenamiento hacia atrs (Backward chaining) con mucha informacin disponible pero poco relevante. Solo pregunta lo estrictamente necesario a diferencia del encadenamiento hacia adelante que no pregunta nada. Cuando hablamos de encadenamiento nos referimos al proceso de bsqueda y seleccin de reglas. Encadenamiento hacia adelante. Ejemplo:

Encadenamiento hacia atrs.

Ejemplo:

El motor de inferencia trabaja con dos tipos de elementos, los datos (hechos o evidencias) y el conocimiento (conjunto de reglas almacenadas en la base de conocimiento) con el uso de estas obtiene nueva conclusiones o hechos.

3. Describir las caractersticas del motor de reglas o motor de inferencia de la solucin. 4 El sistema experto modela el proceso de razonamiento humano con un mdulo conocido como el motor de inferencia. Dicho motor de inferencia trabaja con la informacin contenida en la base de conocimientos y la base de hechos para deducir nuevos hechos. Contrasta los hechos particulares de la base de hechos con el conocimiento contenido en la base de conocimientos para obtener conclusiones acerca del problema. Una caracterstica de los sistemas expertos es su habilidad para explicar su razonamiento. Usando el mdulo del subsistema de explicacin, un sistema experto puede proporcionar una explicacin al usuario de porqu est haciendo una pregunta y cmo ha llegado a una conclusin. Este mdulo proporciona beneficios tanto al diseador del sistema como al usuario. El diseador puede usarlo para detectar errores y el usuario se beneficia de la transparencia del sistema.
5

SISTEMAS EXPERTOS. Motor de Inferencia [en linea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: <http://www.docentes.unal.edu.co/besusernag/docs/Cursos/Programacion_Computadores_2015734_2011_02/Proyectos_2 011-01_2/Sistemas_Expertos_Automatizacion.pdf>
5

INGENIERIA DEL CONOCIMIENTO. Manejador de Comunicaciones [en lnea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en:

En el motor de inferencia existen dos tipos de datos (hechos o evidencia) y el conocimiento (el conjunto de reglas almacenado en la base de conocimiento)El motor usa ambos para obtener nuevas conclusiones o hechos. Por ejemplo: Si la premisa de una regla es cierta, entonces la conclusin de la regla debe ser cierta.

Una de las estrategias para obtener conclusiones compuestas es el encadenamiento de reglas, se utiliza cuando las premisas de ciertas reglas coinciden con las conclusiones de otras. Al encadenar las reglas, los hechos pueden ser utilizados para obtener nuevos hechos, repitiendo este proceso hasta no obtener ms conclusiones.

La siguiente grafica nos muestra el ejemplo de seis reglas que relacionan 13 elementos
<http://www.iidia.com.ar/rgm/CD-IC/Ingenieria-del-Conocimiento.pdf>

En la siguiente grafica se muestran las relaciones de la figura anterior

Otra estrategia es el encadenamiento de reglas Orientadas a un objetivo. En este caso se requiere que el usuario seleccione un objetivo, desde all el algoritmo navega a travs de las reglas en bsqueda de una conclusin para el objetivo. Si no se obtiene ninguna conclusin con la informacin existente, el algoritmo fuerza al usuario en bsqueda de nueva informacin sobre elementos que son importantes y tratar de obtener informacin sobre el objetivo. La siguiente figura muestra el comportamiento de este proceso

SISTEMAS EXPERTOS BASADOS EN REGLAS. Encadenamiento y Reglas [en lnea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: < http://personales.unican.es/gutierjm/cursos/expertos/Reglas.pdf >

Otra estrategia utilizada es la coherencia de reglas. Se dice que un conjunto de reglas es coherente si existe, al menos, un conjunto de valores de todos los objetos que producen conclusiones no contradictorias. Las dos tablas anexas muestran la coherencia y No coherencia de las reglas.

4. Defina el modelo de conocimiento que mejor se acomoda al sistema teniendo en cuenta los principios y caractersticas de los modelos de conocimiento contenidos en el curso y el documento Modelos para la creacin y gestin del conocimiento.

MODELO DE TRADUCCIN AUTOMTICA ESTADSTICA


7

La mayora de los sistemas de traduccin automtica de ltima generacin que se utilizan en la actualidad se basan en un conjunto de reglas y requieren un intenso trabajo de definicin de vocabularios y gramticas. El sistema traductor de Google funciona de otro modo: se introducen miles de millones de palabras en el sistema, compuestas tanto por texto monolinge en el idioma de destino como por texto alineado consistente en traducciones elaboradas por traductores profesionales en ambos idiomas. Ni siquiera el software ms sofisticado que existe en la actualidad ofrece la fluidez de un hablante nativo ni posee las habilidades de un traductor profesional. La traduccin automtica es muy compleja, ya que el significado de las palabras depende del contexto en el que se utilizan. A pesar del intenso trabajo realizado, es posible que pase algn tiempo antes de que se pueda ofrecer un sistema de traduccin de calidad similar a la de las traducciones realizadas por personas. Mientras tanto, esperamos que el servicio que ofrecemos te resulte til para la mayora de los casos.
8

La traduccin automtica estadstica utiliza modelos de traduccin estadsticos cuyos parmetros emanan del anlisis de corpus monolinges y bilinges. La creacin de modelos de traduccin estadsticos es un proceso rpido, pero la tecnologa depende enormemente de los corpus multilinges existentes. Se necesitan un mnimo de 2 millones de palabras para un dominio especfico y ms incluso para el idioma en general. Tericamente es posible alcanzar el umbral de calidad, pero la mayora de las compaas no tienen cantidades tan grandes de corpus multilinges para crear los modelos de traduccin necesarios. Adems, la traduccin automtica estadstica consume mucha CPU y requiere una configuracin de hardware amplia para ejecutar los modelos de traduccin para obtener niveles de rendimiento promedio.

Componentes de la Traduccin automtica estadstica:


7

TRADUCION AUTOMATICA. En qu consiste la traduccin automtica estadstica? [En lnea]. 2011. [Consultado 12 de Marzo 2013]. Disponible en: < http://www.google.com/intl/es/help/faq_translation.html#statmt>
8

SYSTRAN. Tecnologa de traduccin automtica estadstica [En lnea]. Marzo, 2013. [Consultado 12 de Marzo de 2013]. Disponible en: http://www.systran.es/systran/perfil-corporativo/tecnologia-de-traduccion/que-es-la-traduccion-automatica

Modelo de traduccin Modelo de lenguaje Decodificador

Texto paralelo en Ingls / forneo

Texto en ingls

Anlisis estadstico Modelo de Traduccin

Anlisis estadstico Modelo de Lenguaje

Algoritmo de Decodificacin

INTRODUCCION AL PROCESO DE LENGUAJE NATURA. Traduccin automtica estadstica [En lnea]. Marzo, 2013. [Consultado 13 de Marzo 2013]. Disponible en: < http://www.fing.edu.uy/inco/cursos/intropln/pres/2011%2018%20-%20Traduccion%20Automatica.pdf>

Cibergrafa

MACHINE TRASLATION. History [en lnea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: <http://en.wikipedia.org/wiki/Machine_translation>
2

SISTEMAS INTELIENTES. T6: Sistemas Basados en Reglas [en lnea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: http://www.aic.uniovi.es/ssii/SSII-T6-SistemasBasadosReglas.pdf
3

SISTEMAS EXPERTOS BASADOS EN REGLAS. Motor de Inferencia [en lnea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: < http://personales.unican.es/gutierjm/cursos/expertos/Reglas.pdf >
4

SISTEMAS EXPERTOS. Motor de Inferencia [en linea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: <http://www.docentes.unal.edu.co/besusernag/docs/Cursos/Programacion_Compu tadores_2015734_2011_02/Proyectos_201101_2/Sistemas_Expertos_Automatizacion.pdf>
5

INGENIERIA DEL CONOCIMIENTO. Manejador de Comunicaciones [en lnea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: <http://www.iidia.com.ar/rgm/CD-IC/Ingenieria-del-Conocimiento.pdf>
6

SISTEMAS EXPERTOS BASADOS EN REGLAS. Encadenamiento y Reglas [en lnea]. Marzo, 2013 [Consultado 10 de Marzo 2013]. Disponible en: < http://personales.unican.es/gutierjm/cursos/expertos/Reglas.pdf >
7

TRADUCION AUTOMATICA. En qu consiste la traduccin automtica estadstica? [En lnea]. 2011. [Consultado 12 de Marzo 2013]. Disponible en: < http://www.google.com/intl/es/help/faq_translation.html#statmt>
8

SYSTRAN. Tecnologa de traduccin automtica estadstica [En lnea]. Marzo, 2013. [Consultado 12 de Marzo de 2013]. Disponible en: http://www.systran.es/systran/perfil-corporativo/tecnologia-de-traduccion/que-es-latraduccion-automatica
10

INTRODUCCION AL PROCESO DE LENGUAJE NATURA. Traduccin automtica estadstica [En lnea]. Marzo, 2013. [Consultado 13 de Marzo 2013]. Disponible en: < http://www.fing.edu.uy/inco/cursos/intropln/pres/2011%2018%20%20Traduccion%20Automatica.pdf>

You might also like