You are on page 1of 10
Apertctade wee IS Joruader de binpwlihce Compote couc Agha, Dewule 1999 Um sistema de traducio automatica do inglés para 0 portugués Diana Santos ‘Grupo Cientifico IBM-INESC R.Alves Redo, 9, 1000 Lisbos, Portugal O ambiente Este artigo apresenta o sistema de tradugio automitica desenvolvido pelo Grupo Cientifico IBM-INESC, do inglés para 0 portugués. O trabalho descrito teve a duracio de dois anos, € uma ‘miédia de 3.25! pessoas colaborando a tempo intciro, provindo de Engenharia, Letras ¢ Matematica. Dados técnicos trabalho foi desenvolvido em méquinas IBM de médio porte, no sistema operative VM, num ambiente PLNLP, versio LISP/VM. A linguagem de programacio PLNLP|2] foi exclusivamente uitilizada, nao s6 por ter sido especialmente concebida para o processamento de linguagem natural ‘mas porque também a gramitica inglesa foi desenvolvida neste ambiente. Para a criagio de utilitaios para o sistema de tradugao, foi usada a linguagem de programacio do sistema operativo, REXX, Ponto de partida O sistema foi desenvolvido no ambito de um projecto interno da IBM reunindo as seguinteslinguas de destino: castelhano, finlandés, hebraico e portugués, ¢ tendo como lingua de origem o inglés Contudo cada grupo teve autonomia completa no seu trabalho, ¢ assim apenas a parte portuguesa sera descrita aqui. Os tinicos requisitos globais a que tivemos de nos cingir foram: * usar PEG ("PLNLP English Grammar”) para a analise do inglés ‘© seguir um modelo de transferéncia PEG Seguc-se uma breve descrigaio de PEG|3), remetendo os interessados para a bibliografia ‘© PEG € uma gramética de cobertura vaste do inglés americano (recorrendo a um dicionario que possui mais de 70000 termos ingleses nao inflectidos). © E.uma gramitica no normativa, que accita frases incorrectas ou meros fragmentos de texto, tenta produzir a melhor deserigdo do que quer que lhe tenha sido apresentado. 1 correspondendo a duas pessoas no inicio até cerca de vinte colaboradores com varios lipos de ligagio a tempo parcial durante 05 ulti + Produz como resultado, para cada “frase” que analisa, um (ou mais) grafos representando a sua descricéo sintictica. Podemos separar trés niveis conceptuais nessa analise, ainda que computacionalmente se encontrem representados na mesma estrutura de informagao - o grafo: + anilise sintictica de superficie (em termos de dominancia e modificagio) + anilise sintéctica profunda (em termos de relagdes gramaticais tais como sujeito ou ‘objecto) + anilise de discurso intrafrase (em termos de tépico) Esta gramética foi desenvolvida independentemente de quaisquer consideragdes relativas a tradugio automitica, e tem sido usada em virias aplicagdes, tais como critica de texto, indexagao automitica, consulta de dicionarios humanos, ctc.. Gostivamos portanto de salientar que PEG é uma gramitica de descrigio da Hingua inglesa, que nao foi desenhada tendo em vista uma aplicagao especifica, nem muito menos tendo entrado em conta com consideragdes provenientes de outras linguas. Transferéncia © facto anterior (PEG ser completamente independente em relagio a tradugio) determina implicitamente que, de entre as duas grandes classes de arquitectura cm tradugio automitica, nomeadamente 0 método de transferéncia ¢ a interlingua, 0 primeiro fosse escolhido. Resumidamente, um sistema de traduglo baseado num método de transferéncia produz/considera uma estrutura por cada lingua em presenga, sendo efectuada a tradugio pela passagem de uma estruture para outra, enquanto que o método da interlingua requer uma tinica estrutura para a qual ~ ou da qual - todas as linguas sto analisadas - ou geradas. Representagao Representagao / \ f \ Frase inglesa Frase portuguesa Figura 1. Método de transferéncia Descrigdo do sistema Podemos distinguir duss fireas distintas sobre as quais fizemos investigagao relevante no campo da tradugio automatica: © 20 nivel da arquitectura do sistema ‘© 20 nivel dos fenémenos linguisticos Arquitectura Em relagio ao primeiro ponto, consideramos de maior importancia os seguintes aspectos (veja-se também Figura 2 na pagina 3) © Distingo entre tradugo possivel e melhor traducio (esta diltima a ser tratada pelo médulo de estilo, escolhendo entre as varias tradugdes estilisticamente possiveis apenas uma), © Separaciio completa entre andlise, transferéncia e geragio, a todos os niveis, 0 que no nosso caso, e dado que j a gramética inglesa era completamente independente das fases que se Ihe segucm, sc resumiu a produzir uma estrutura portuguesa (ponto de partida da geracdo) valida por si s6, sem trago da estrutura inglesa a partir da qual € produzida (durante a fase de transferéncia) >| lexica v Analise inglesa >| estrutural >| estilo >| geracao (PEG) A >| tempos A caina maior representa a fase de transferéncia, Interligagao dos varios médulos de transferéncia, obtendo, além das vantagens de um sistema modular, um poder de tradugio méximo: Por exemplo, a escolha de uma determinada traduco pode implicaralteragies quer a0 nivel da estrutura resultante I like children Eu gosto de criangas quer ao nivel do tempo verbal though I like children embora eu goste de criancas Por outro lado, pode ser a estrutura ou o tempo/aspecto que decidam a escotha de uma dada tradugao: Returning home, he returned the book. Regressando a casa, ele devolveu o livro. I ve just eaten. Acabei de comer. Finalmente, muitas palavras no sio sequer traduzidas, desaparecendo ou sendo criadas em Fungo das diferengas entre as duas linguas I like that one you see there. Gosto daquele que vés ali. 0 algoritmo que permite conjugar as varias dependéncias encontra-se deserito em {7] ¢ [8], nfo sendo portanto apresentado aqui. Criago de um dicionario bilingue

You might also like