Professional Documents
Culture Documents
SANTOS – 2007
Banca Examinadora:
SANTOS – 2007
SILVA, Lívia Monteiro. The use of corpora in the translation process. Santos, 2007, 58
f. (Trabalho de Conclusão de Curso) Universidade Católica de Santos.
Abstract: This paper aims to demonstrate how online corpora and software programs
designed for translators can be used as tools that help in the search of translational
adequacy, in order to produce fluent translation for readers. According to the concepts of
Nida and Newmark, the focus of the text is either on the structure or on the reader.
Besides, three aspects must be taken into consideration: language functions, text type and
purpose. Each type of corpus, be it parallel or comparable, ready-to-use or manually
developed, has different functions, characteristics and advantages. By observing practical
examples, it is therefore possible to identify which corpus offers the most advantages to
each translation.
Sumário
Introdução ................................................................................................................................. 06
Conclusão................................................................................................................................... 54
Referências Bibliográficas....................................................................................................... 56
Eventos ....................................................................................................................................... 60
Introdução
Este trabalho visa apresentar um meio de pesquisa eletrônico que garante uma
melhor adequação tradutória aos textos produzidos por tradutores e otimiza nossas
traduções em qualidade, quantidade e tempo: o corpus lingüístico. Essa coleção de textos
transforma a investigação terminológica do tradutor em algo mais palpável, resultando
em uma tradução fluente.
Como a língua vive em constante mudança, pretendemos demonstrar, no presente
trabalho, que os meios de pesquisa utilizados pelo tradutor necessitam de atualização a
todo o momento. Com a Internet e a possibilidade de se armazenar textos, coletar
informações pertinentes ao objeto e otimizar, em tempo e qualidade, as traduções
produzidas, já existem websites e programas de software especializados em satisfazer as
necessidades dos tradutores.
No primeiro capítulo, abordaremos, de forma concisa, o desenvolvimento dos
estudos baseados em corpus desde suas origens. Os Estudos Descritivos da Tradução, de
Toury, aliados à Lingüística de Corpus, tiveram uma grande importância para o avanço
dos estudos tradutológicos e serviram como base para os Estudos da Tradução baseados
em Corpus, iniciados por Baker. Esses últimos são relativamente novos, pois tiveram
início nos anos noventa, e extremamente relevantes à compilação de dicionários
modernos. Neste trabalho, consideraremos somente as propostas dessas correntes
teóricas, não nos aprofundando em teoria, posto que demandaria um trabalho de pesquisa
à parte.
Em seguida, no segundo capítulo, analisaremos detalhadamente a tipologia dos
corpora, suas principais características e vantagens. Dentre seus tipos, discorreremos
sobre as memórias de tradução, como é o caso do programa de software Wordfast.
Optamos por investigar somente este por ser de fácil manuseio e de menor custo
comparado aos outros programas. Outros tipos de corpora como os prontos, por exemplo
WebCorp, e customizados, no caso do Corpógrafo, serão detalhadamente explorados.
Para fins de ampliação do trabalho de pesquisa, anexamos uma tabela com os diversos
tipos de corpora (apêndice 1) e também um glossário com os termos de maior relevância
mencionados no decorrer do trabalho (apêndice 2). Os sites de busca também podem ser
1. Definição e origem
1
“a collection of linguistic data, either written texts or a transcription of recorded speech, which can be
used as a starting point of linguistic description or as a means of verifying hypotheses about a language”.
2
“a collection of naturally occurring language text, chosen to characterize a state or variety of a language”.
3
“[…] any collection of running texts (as opposed to examples/sentences), held in electronic form and
analyzable automatically or semi-automatically (rather than manually)”.
4
Corpora é o plural de corpus. Corpi caiu em desuso e não consta nos dicionários modernos.
transcrita tal qual aparecia no texto original. Não se cogitava alguém ter 'intuição' da
palavra de Deus”.
Nos anos sessenta, lingüistas faziam suas pesquisas em pequenos corpora sem o
auxílio de um computador. Chomsky (apud MAIA, 2002, p. 222) julgou-os de natureza
restrita, distorcida, e que seria mais seguro confiar nas intuições de um falante nativo. É
fácil imaginar a dificuldade em se fazer uma busca entre 11 milhões de palavras usando
simplesmente os olhos. Naquela época, era justo pensar dessa forma; porém, com o
avanço da tecnologia e o maior acesso à Internet, os corpora atuais representam as
variedades da língua em tempo real e chegam a ser instrumentos de maior confiabilidade
do que um ser humano, já que na velocidade em que obtemos novas informações, torna-
se difícil para a intuição humana acompanhá-las, enfatiza Krishnamurthy (2003, p. 10).
5
Optamos por utilizar doravante a sigla de Lingüística de Corpus, LC, por já ser consagrada.
6
Optamos por utilizar doravante a sigla de Estudos Descritivos da Tradução, EDT, por já ser consagrada.
Por outro lado, em LC, o princípio idiomático de John Sinclair (1991 apud
LAVIOSA, 2004) trata da atração entre palavras e dos padrões colocacionais
determinados por ‘blocos’ correspondentes.
A proposta dos estudos baseados em corpus nos anos noventa teve como ponto de
partida os EDT. A partir de Toury (1995 apud LAVIOSA, 2004), os EDT exerceram um
papel primordial na evolução dos Estudos da Tradução como uma disciplina prática e
acabou por contribuir com os Estudos da Tradução baseados em Corpora de Mona Baker,
os ETC7, por meio dos universais, de modo que ambos salientavam a importância de se
desenvolver uma metodologia descritiva para a comparação de resultados.
7
Optamos por utilizar doravante a sigla de Estudos da Tradução baseados em Corpora, ETC, por já ser
consagrada.
Em termos gerais, consoante Basil Hatim (1999 apud LAVIOSA, 2004, p. 42,
tradução nossa)8, “ ‘os Estudos da Tradução baseados em Corpus são certamente uma
nova corrente de pesquisa’, que não se limita somente a estudar o que está ‘no’ texto
traduzido, mas também ‘sobre a natureza da’ tradução, isto é, seu impacto ideológico”.
Em 1993, Mona Baker (1993 apud LAVIOSA, 2004) publicou sua obra Corpus
Linguistics and Translation Studies: Implications and Applications. Dois anos depois,
Corpora in Translation Studies: An Overview and Some Suggestions for Future Research
já apresentava uma abordagem mais promissora do uso de corpus nos estudos da
tradução, sem distinguir a LC dos Estudos de Tradução. A partir dessa fusão, os ETC
começaram a se desenvolver.
Na Internet, foram compilados corpora imensos de língua inglesa como o BNC
(British National Corpus) com 100 milhões de palavras e o Bank of English com 500
milhões de palavras. Ambos incluem não somente textos escritos, mas também gravações
e transcrições de fala como o Corpus of Spoken American English.
3. Compilação de dicionários
8
“ ‘Corpus-Based Translation Studies is a truly new wave of research’ providing it did not limit itself to
studying only what is ‘in’ translated text but also is ‘of’ translation, that is its ideological impact”.
• Os trechos dos exemplos precisam ser mais longos, pois somente uma
palavra, duas ou três não são o bastante.
Corpora ... têm mais a oferecer aos tradutores do que pode parecer à primeira
vista. Os corpora não somente fornecem evidências no que tange à maneira
com que as palavras são usadas e as possibilidades tradutórias de uma palavra,
frase ou sentença, mas também fornecem um insight para a natureza e o
processo da tradução em si. (2002 apud SARDINHA, 2002, p. 15, tradução
nossa) 9
De acordo com Baker (1995 apud MAGALHÃES; BATISTA, 2002, p. 83), pode-
se dividir corpus em: comparável, compondo-se de textos originais e textos traduzidos,
ambos da mesma área de conhecimento, mas não necessariamente correlatos; e paralelo,
consistindo em texto original e sua respectiva tradução.
Tagnin (2004), em seu artigo Um corpus multilíngüe para ensino e tradução,
ressalta que o uso de corpus comparável permite ao tradutor observar o uso natural da
9
“Corpora … have more to offer translators than might at first sight be apparent. Not only can they provide
evidence for how words are used and what translations for a given word or phrase are possible, they also
provide an insight into the process and nature of translation itself”.
10
Acrônimo de Computer Assisted Translation tools traduzido como ferramentas de Tradução Assistida
por Computador. Nesse trabalho, optaremos por utilizar a sigla em inglês por questão de praticidade.
11
Os websites e programas de software mencionados neste trabalho servem tão somente de ilustração como
tipos de corpora, sem fins lucrativos.
12
Essas técnicas foram desenvolvidas a partir da prática de uso do site.
3. Corpus pronto
3.1. WebCorp
Criado originalmente para pessoas que têm interesse no idioma inglês e suas
particularidades, o site WebCorp, mantido pela Universidade de Birmingham, Inglaterra,
filtra os resultados da rede por meio de pesquisa em buscadores como o Google, mas sua
vantagem é trazer somente resultados de concepção lingüística. Seus usuários não são
somente tradutores, mas também lexicógrafos, lingüistas de corpus, professores e alunos,
publicitários, jornalistas e pesquisadores das mais diversas disciplinas. Podemos olhá-lo
como uma ferramenta que dá um tratamento diferencial e especial aos sites de busca.
Apesar de os resultados serem heterogêneos, isto é, a língua geral está mesclada
com línguas de especialidade, os resultados são apresentados ordenadamente e a palavra
de busca aparece realçada. Seguem outras vantagens de se pesquisar no WebCorp:
http://www.foreignword.com/
Document Dated: 2003/02/19 20:42:34 (server header)
Plain Text Word List 591 tokens, 277 types
the most interesting articles on language and translation that you can
at Foreignword: All our free language tools are now also available
35000 entries) New section for language and translation related articles. --
13
“A high type-token ratio, for instance, may be interpreted as a consequence of the process of lexical
simplification which has been reported as taking place in a variety of mediated communicative activities,
including translation”.
A maioria dos sites de busca não aceita asterisco no campo de pesquisa para a
substituição de termos, prefixos e sufixos. Já o WebCorp14 permite esse uso nas seguintes
situações:
Nesse último exemplo, ‘the ship had sank’, deparamo-nos com um erro
gramatical, pois o correto seria ‘the ship had sunk’. Isso serve como um alerta para os
pesquisadores, uma vez que a investigação lingüística na web não é infalível, isto é, está
vulnerável a erros.
No WebCorp, o tradutor ainda pode organizar a pesquisa depois de pronta, isto é,
pode-se determinar as linhas de concordância, à direita ou à esquerda da tela, em case
sensitive ou insentive, e também a data de publicação em ordem crescente ou decrescente.
Se for preciso fazer essas modificações, a tela do programa se altera ao se concluir a
pesquisa, tornando o processo muito mais rápido comparado à busca inicial.
14
Os exemplos dados foram retirados do próprio site na seção Guide.
http://www.renotahoeodyssey.com/
Document Dated: 2007/09/06 23:21:40 (server header)
Plain Text Word List 898 tokens, 466 types
next, until each runner has run 3 legs. A course that begins
Get close to history . You'll run along the trails where the emigrants
the Reno-Lake Tahoe area to run, hike, bicycle, swim, ski, golf and
2007100200:00:003 Health Half Marathon run, 10K run the 5K run and walk. Cross
2007100215:18:431 2006 bike total: 2776M 2006 run the : 713M My race calendar My
2007100215:18:431 Weekly bike done: 0M Weekly run under : 7.3M Food log days
2007100122:14:481 had planned to meet and run this 8 AM; no distance was
3.2. BNC
O corpus pronto mais tradicional é o BNC, British National Corpus, mantido pela
Universidade de Oxford, com 100 milhões de palavras distribuídas em textos escritos e
transcrições de fala. Trata-se de um corpus monolíngüe, somente em inglês britânico,
com amostras de textos desde o século XX aos dias atuais, de gêneros e registros
variados.
Os textos escritos compreendem 90% do conteúdo do site e foram retirados de
jornais, periódicos, livros acadêmicos, cartas e ensaios, entre outros. As transcrições de
fala gravada, 10%, abrangem desde conversas informais, entre pessoas de idades, raças e
regiões diferentes, a reuniões governamentais.
Uma das muitas vantagens de se pesquisar no BNC é a de ser um conjunto de
dados lingüísticos. O tradutor pode tomá-lo como um meio de verificação do registro da
fala transcrita e gravada, e analisar as situações enunciativas para a melhor aplicação no
texto a ser traduzido.
Os produtos provenientes desse grande corpus são: BNC XML Edition, BNC Baby,
BNC Sampler, Brown Corpus e BNC World. São corpora com um número limitado de
A6U 956 The reverential tone of Levin's text poses a problem which the movement's survivors, I
imagine, would be quick to condemn.
ACE 528 `;Why should you imagine you are of officer material.
ASN 863 That s as may be, but I can't imagine Elsie committing suicide.
AT4 1141 How and what with, Nutty could not imagine, but that wasn't her department.
B0P 1405 Slowly lower your head, slide back a yard or so, and then cast to the fish, or imagine you
are casting if you have no rod with you, without allowing the rod-tip to show over the edge of the
bank.
B21 457 In an extreme example, imagine you have been told you have an incurable disease.
BMC 2223 If you can accept the interpretative stance (and it is growing on me), I simply can't
imagine it being better realised than here.
BMS 3037 Imagine me up on stage, famous as Meryl Streep, getting my Oscar, saying `;Told you
so'; to old Dinwiddie and Mum and Dad.
15
Para se ter acesso ao conteúdo completo do corpus, é preciso adquirir uma licença.
Most pharmacies (there are over 11,00) display sheaths and spermicides and probably the
and the ability to take decisions and display initiative. Careers in Civil Engineering
controls combine to give a crystal clear display, usable even in poor lighting conditions.
the appliances, water supply, power points, display, style and, last but not least, your budget!
Many of these will now become available for display. [p] Beggard Badge belonging to William
able to return every call you missed. Caller Display will be available to most customers in areas
there will be a children's art and craft display, with prizes. Children should base their
22.05/16khz sampling, 2x24 character LCD display, parallel and rs232/422 serial remote
[/h] I found your article in May on how to display pictures very useful. [p] We recently
`Of Thick Thum', and in an unprecedented display of enthusiasm proceeded to play both sides
and can be exported; several statues on display have name tags of distant parishes in
the show are the Falcons free-fall parachute display team, the Red Arrows, Tornados, Jaguars,
singer's head. TH'FAITH HEALERS at least display some sheer yeeah for-the-hell-of-it abandon,
attractions with cars to be sold at auction on display. [p] Centre stage will be this elegant 1932
including tables, chairs, carvers and display cabinets - can be ordered in mahogany or
Indeed, looking at the gleaming model on the display, it was clear that the business jet owes a
nervous laugh. `Well, then!" He made a great display of looking at his watch. `Is it really that
achievements. During adolescence people often display remarkably grandiose thoughts: they
religious subjects are exploited `for the display of transparent shadows, skilful tints, and
Corpus Concordance Sampler. Fonte: www.collins.co.uk. Acesso em: 8 out. 2007.
3.4. COMPARA
16
A Linguateca é um centro português de recursos para o processamento computacional da língua
portuguesa.
113 ocorrências.
Concordância
Procura: “praça”.
EBDL1T1(1876): Actualmente existe em frente da biblioteca, A vast conference centre and a state-
do outro lado de uma praça com o pavimento of-the-art concert hall now face the
axadrezado, um centro de conferências Library from the other end of a
enorme e uma sala de espectáculos de tessellated piazza.
primeira qualidade.
EBDL1T2(1868): Foi construído no meio de uma praça vazia, It’s built in a hollow square around a
com um pátio ao redor, onde havia um central courtyard in which there was
laguinho com uma fonte que quase não once a shallow pond and a seldom-
funcionava, repositório de muita sujeira functioning fountain, the repository
indecente. for much unseemly garbage.
EBDL3T1(830): Lá em baixo, na margem da Baía, onde os Beneath him, where the foothills
sopés se aplanavam e uniam, ficava o flattened out to meet the Bay shore,
domínio universitário, com os edifícios was the campus, with its white
brancos e os caminhos frondosos, o buildings and bosky paths, its
campanário e a praça, as salas de campanile and plaza, its lecture
conferências, os estádios e os laboratórios, rooms, stadia and laboratories,
ladeados pelas ruas rectilíneas da parte baixa bordered by the rectilinear streets of
de Plotino. downtown Plotinus.
EBDL5(799): Formavam-se longas e ondulantes filas na There were long looping queues for
praça de táxis e nas bilheteiras do metro. taxis, and for tickets in the
Underground.
EBDL6(1056): Persse colocou uma generosa quantia, em Persse thrust a generous quantity of
francos, nas mãos da praça de táxis, em francs into the hand of his bewildered
frente da estação. landlady and ran down the hill to the
taxi-rank in front of the station.
Fonte: www.linguateca.pt/COMPARA. Acesso em: 8 out. 2007.
4. Corpus customizado
4.1. Corpógrafo
Por ser de fácil acesso e ter alta qualidade e praticidade, no que tange às fases de
inclusão dos textos para futura pesquisa, o programa atrai cada vez mais novos adeptos.
Uma das razões é a facilidade de seu uso. Ao todo, são quatro fases.
O primeiro passo é a coleta. O tradutor pode efetuá-la a partir dos próprios textos
ou em sites de busca, observando, todavia, a sua adequação e proveniência. Pode ainda
analisar certos aspectos, entre eles a área, o público-alvo, o registro, o idioma e o campo
semântico, de forma que haja uniformização e qualidade nos textos coletados.
O segundo passo é o arquivamento desses textos selecionados. O Corpógrafo
aceita qualquer extensão (.txt e .doc, entre outros), pois ele mesmo possui um conversor;
além disso, os arquivos podem conter nomes longos, já que não há limite de caracteres.
Uma opção, dada por Perrotti-Garcia, para uniformizar os nomes dos arquivos e
mantê-los por área de interesse é iniciar com a palavra ‘corpus’, pois o programa alinha
por ordem alfabética, indicar o idioma (e.g: PT = português do Brasil, PP = português de
Portugal), em seguida incluir a área de especialidade dos textos, e por último a data.
Como nos exemplos abaixo:
Corpus_PT_veterinária_jan/07
Corpus_EN_vehicles_nov/06
Com o exemplo exposto acima, percebemos que, à medida que o tradutor utiliza
seu corpus customizado, os resultados são mais precisos, rápidos e coerentes. Também
nos leva a crer que é preciso nos certificar a todo o momento, por mais insignificante que
a palavra ou expressão seja.
17
Por ser uma tabela extensa, optamos por anexar somente a primeira parte para fins de ilustração do
programa e seu funcionamento.
Perrotti-Garcia (2006, p. 78) deixa claro que “o tradutor não estará ‘perdendo
tempo’, mas sim ‘investindo sua atenção’ na coleta de textos selecionados” a fim de
customizar esse corpus inicial, podendo ser ampliado posteriormente e oferecendo ao
tradutor uma fonte de pesquisa confiável e livre de resultados indesejados.
No presente trabalho, cobriremos apenas os dois últimos itens citados, pois são
aqueles que se associam intimamente ao conceito de corpus.
18
Optamos por utilizar doravante a sigla de Memórias de Tradução, MT, por já ser consagrada.
armazenados. Se algum trecho for encontrado, o programa avisa ao tradutor, que, por sua
vez, poderá reutilizá-lo, modificá-lo ou rejeitá-lo.
É essencial frisar que não se trata de ferramentas de tradução automática19,
distinguindo-se em diversos fatores. A começar pelo fato de as memórias de tradução
serem, ao contrário das traduções automáticas, programas de software vazios que o
tradutor alimenta com seus originais e suas respectivas traduções, ainda no processo
tradutório.
Além disso, as memórias de tradução possuem comandos que dão suporte ao
tradutor, ao passo que os tradutores automáticos já trazem consigo um pacote básico de
termos e traduzem literal e automaticamente, como o próprio nome sugere. Em seguida, o
tradutor edita o texto fazendo as adaptações necessárias. Um tradutor automático,
traduziria save money como salvar dinheiro, enquanto que o correto é economizar
dinheiro. Por essa razão, o bom senso do tradutor encontra-se sempre em primeiro lugar.
As MT auxiliam principalmente nas traduções de manuais, listas de produtos, e
traduções de cunho técnico-financeiro-jurídico, dada a sua natureza repetitiva. São
utilizadas para traduções feitas individualmente e em grupo – nesse último em especial
pelo fato de possuírem um banco de dados. Assim, a uniformização da tradução torna-se
mais segura e acessível. Atualmente, muitas agências de tradução já exigem de seus
profissionais não só o conhecimento como também o uso desses programas de software.
Os comandos básicos do programa Wordfast, por exemplo, propiciam aos seus
usuários uma tradução mais produtiva e podem, assim, poupar-lhes tempo. Dentre tais
dispositivos, destaca-se a segmentação. Vejamos o que ela pode nos trazer em termos de
qualidade na tradução:
19
Tradução de machine translations. É também possível encontrar os termos tradução automática ou
tradutor automático para o mesmo produto.
20
Não foi encontrado termo consagrado em língua portuguesa.
Wordfast não há limite, e o tradutor pode optar por esse comando quantas vezes for
necessário. Além disso, na Auto Correção do Word, o tradutor tem de fazer esse processo
manualmente ao perceber que erra muitas vezes aquela mesma palavra.
Essas memórias de tradução são consideradas de extrema confiabilidade e eficiência,
já que o próprio tradutor cria o seu corpus, que futuramente lhe servirá para as próximas
traduções. Tomamos como exemplo as traduções jurídicas em que é muito comum o
segmento em inglês ‘I do hereby certify’. Ao começar a digitá-lo, o programa já avisa
sobre traduções anteriores. Basta o tradutor aceitar a sugestão, evitando assim a digitação
desnecessária do segmento e, conseqüentemente, poupando-lhe tempo. Vale lembrar que,
se o tradutor trabalha com esse software, ele não precisa lembrar expressões usadas há
muito tempo em outros textos parecidos, pois o programa lhe apresentará os termos antes
utilizados para aquele contexto.
Como o custo para a aquisição de um programa de memória de tradução ainda é alto,
é possível configurar o Microsoft Word de acordo com as suas necessidades. Evidente
que ele apresentará limitações, mas alguns comandos simples, porém muitas vezes
desconhecidos, podem otimizar a tradução. A diferença é que, no Word, é preciso fazer
tudo manualmente, enquanto que, no Wordfast, o processo é automático. É importante ter
em mente que o Word não desenvolverá um corpus e nem uma memória de tradução, pois
ele é somente um editor de textos. O Auto Texto do Word é um recurso que sugere
segmentos completos a partir da digitação das primeiras letras de um determinado termo.
Para aceitar a sugestão, o tradutor tem apenas de pressionar enter e ela é inserida no
texto.
Criado por Mike Scott, o WordSmith Tools é um outro tipo muito interessante de CAT
tools: os chamados concordancers, programas que também não deixam de ser um corpus
customizado.
Os concordancers são programas que mostram ocorrências de uma palavra ou
expressão dentro de um corpus monolíngüe, bilíngüe ou multilíngüe, para fins de
apreciação textual. O WordSmith Tools, tem como objetivo a análise de palavras-chave,
• Wordlist: cria uma lista dos textos em uso por ordem alfabética, de
freqüência e de estatística, a proporção type-token e a sentença ou
parágrafo por completo (não somente uma palavra), ambientando o
tradutor em sua procura;
• Keyword: cria uma lista com as palavras-chave do texto;
• Concord: cria linhas de concordância (concordancers) nos arquivos de
texto, ou seja, o tradutor especifica uma palavra e a função concord a
busca pelos textos trazendo-lhe a informação desejada e alinhando as
ocorrências;
7 Viewer & Aligner: alinha o texto original e a sua tradução, linha seguida de
linha, o que permite ao tradutor a análise completa de seu texto.
É possível que o tradutor se depare com um texto sobre moda em que apareça a
palavra ‘fabric’, e a sua dúvida transite entre ‘pano’ e ‘tecido’. Após ter carregado o
programa com textos que apresentem confiabilidade e que sejam da área e público-alvo
em questão, dá-se início à pesquisa. A escolha pode recair sobre um ou outro, e é essa
análise no WordSmith Tools que propiciará segurança ao profissional no ato tradutório, já
que o mesmo obteve a certeza de que escolheu termos situacionalmente adequados e
corretos.
Nida (ibidem21) concebe a tradução como uma etapa do ato comunicativo, assim
como o leitor e o tradutor podem ser elementos atuantes desse processo. O teórico afirma
que a tradução não é simplesmente um processo de “encontrar equivalentes”, mas é
também “um processo de reprodução do caráter dinâmico global da comunicação”.
21
Por motivos de clareza e padronização, optamos pelo uso de ibid. para indicar mesmo autor e mesma
publicação, e ibidem, para mesmo autor, mesma publicação e mesma(s) página(s).
Dessa maneira, Nida (1964 apud BARBOSA, 1990, p. 34) propõe que, antes de se
produzir uma tradução, existam três fatores que devem ser considerados: a natureza da
mensagem, a intenção do autor e o tipo de público visado pelo original e pela tradução.
Visto que na tradução deve-se buscar a maior equivalência possível entre a
mensagem da LT22 e a mensagem da LO, Nida (ibid., p. 33) separa dois tipos
fundamentais de equivalência: formal e dinâmica.
O primeiro tipo, a equivalência formal, visa ao conteúdo e à forma da mensagem
da LO, havendo uma preocupação em manter a correspondência estilística em cada frase
entre os dois textos.
No segundo tipo, a equivalência dinâmica, tem como objetivo atingir total
naturalidade na mensagem da LT, de forma que “o leitor encontre no texto modos de
comportamento e outros elementos extralingüísticos relevantes em sua própria cultura”
(ibidem), ou seja, o efeito sobre os leitores do texto original e os do texto traduzido seria
o mesmo.
Waltensir Dutra (1983, p. 82) chama esse tipo de equivalência, uma tradução
impressionista, em que o tradutor age como um intermediário, prezando o leitor. Dutra
(ibidem, p. 83) reforça que é preciso que ambas se combinem, a tradução impressionista,
ou seja, dinâmica, com a lingüística, que preza o autor e os elementos lingüísticos, de
modo que se alcance naturalidade e adequação tradutória.
O corpus de textos literários, COMPARA, serve-nos como ótimo exemplo de
investigação das equivalências formal e dinâmica. O tradutor aprendiz ou o profissional
poderá analisar as traduções de outros tradutores experientes de modo a encontrar nos
textos da LT o que mais se sobressai, a correspondência estilística ou o efeito semelhante
ao original sobre o leitor, servindo assim como um estudo para futuras traduções.
Newmark (1981 apud BARBOSA, 1990, p. 49) se debruça com uma atenção
especial no conceito de princípio do efeito equivalente exposto por Nida, que beneficia o
leitor, facilitando sua compreensão, aproximando-o do texto, caso em que a tradução
22
A nomenclatura utilizada nesse trabalho será LT para língua da tradução, e LO língua original.
23
“[...] every situation of oral exchange corresponds a set of relatively stable utterances, which allows the
realization of this communicative situation”.
1. Tradutores e aprendizes
profissional, que deve pautar por uma conduta de sempre se aperfeiçoar, seja no estudo
da língua em si ou debruçando-se em traduções produzidas por outros profissionais.
Baseando-se nas considerações acima, torna-se evidente que o uso do corpus
como objeto de estudo e referência se faz cada vez mais necessário e, atrelado a ele, sua
metodologia.
2. Metodologias de uso
línguas. É interessante que o tradutor visite sites brasileiros destinados a ou feitos por fãs
da série, e investigar se há algo parecido com a expressão em inglês. Fóruns de discussão
ou blogs também são uma opção em busca do termo que será aceito pelos fãs de
FRIENDS do Brasil. As expressões mais próximas são ‘FRIENDS é o máximo’,
‘FRIENDS é show’ ou ‘FRIENDS detona’.
Esse último caso nos remete à necessidade de familiarizar-nos com a
convencionalidade de cada língua de trabalho, seja ela LO ou LT.
Tagnin (2002, p. 193) deixa claro que o tradutor não pode ser “ingênuo”, isto é,
desconhecer as particularidades da língua materna e de trabalho. Determinados aspectos
precisam ser de total domínio do profissional, dentre os quais podemos citar, os binômios,
as fórmulas situacionais, discursivas ou de rotina, as expressões idiomáticas, as
colocações nominais, adjetivas ou verbais, e ainda as referências humorísticas. É preciso
que ele conheça as “convenções sociais da língua”.
Um corpus é concebido por Tagnin (2002, p. 192) como um instrumento de auto-
ajuda por ser capaz de ampliar o nosso conhecimento e de solucionar problemas relativos
à convencionalidade, uma vez que “[...] grande parte da língua é formada de partes pré-
fabricadas, de expressões prontas, das chamadas unidades fraseológicas [...]”.
Os binômios, muitas vezes, podem ser armadilhas para um tradutor apressado e
passar despercebidos. Existe uma ordem natural em cada idioma; por exemplo, ‘love and
peace’, em português inverte-se para ‘paz e amor’. O mesmo ocorre com ‘knife and fork’
que passa a ser ‘garfo e faca’. Já com o binômio ‘now and then’, os equivalentes em
português são bem diferentes, como ‘uma vez ou outra’ ou ‘de vez em quando’. Podem
ocorrer vezes em que até se perca o binômio, como é o caso de ‘each and every
somebody or something’, tornando-se ‘cada um’ ou ‘todos’.
Podemos buscar um termo mais apropriado em um corpus paralelo ou
comparável, ao nos depararmos com as fórmulas de rotina, por exemplo, ‘I am really
sorry’. Obviamente, dependemos do contexto em que ela está inserida – talvez uma
pessoa esteja pedindo desculpas a outra, ou reconfortando-a. Relembrando Newmark,
essa fórmula de rotina se encaixa na tradução comunicativa, uma vez que o objetivo é
reproduzir o mesmo efeito nos leitores da LT que aquele causado nos leitores da LO.
Muitas vezes, para esse tipo de fórmula, encontramo-na traduzida como ‘Sinto muito’,
mas será que usamos essa expressão normalmente dessa forma? Ou, na maioria das
vezes, empregamo-na em um sentido de deboche? Novamente, o teórico chama a atenção
para as funções da linguagem. É nesse momento que o tradutor atua com o seu bom
senso, podendo talvez perder a intensidade que a língua inglesa demonstra.
Para as fórmulas situacionais, um corpus monolíngüe nos apresentará exatamente
os momentos em que elas podem ser usadas, e, principalmente, habituará o tradutor a
saber que aquela é uma convenção da língua. ‘For the sake of argument’, pode ser
traduzido por ‘Hipoteticamente falando’, uma fórmula longe de ser literal. Na verdade,
trata-se de uma paráfrase, segundo Newmark.
‘Break a leg’ é uma fórmula que somente em textos sobre teatro o tradutor poderá
achar expressão equivalente na sua língua materna. Isso é possível por meio da aplicação
de uma das metodologias vistas acima. Ao compararmos os contextos teatrais de
referência em ambas as culturas, observamos que o equivalente em português para a
expressão em inglês é ‘merda’. No momento em que atores dizem tal termo uns aos
outros, no sentido de ‘boa sorte’, evidencia-se um caso de compensação, ou, conforme
Nida equivalência dinâmica.
A análise do corpus lingüístico serve perfeitamente a essa modalidade ou, como
propõe Newmark, à tradução comunicativa. Muitas vezes, por exemplo, os próprios
nativos do idioma fazem brincadeiras com ‘Tell me about it’, nosso equivalente a ‘Eu que
o diga’. Ao se dizer essa expressão, o interlocutor simplesmente balança a cabeça
consentindo, mas em seguida repete no sentido de querer mais informações.
As expressões idiomáticas são a causa freqüente de um texto se tornar
incompreensível. Há situações em que podem até ser engraçadas, como seria uma
tradução literal de ‘dumb waiter’, quando se trata de um elevador de cozinha e não de um
garçom idiota. Esse tipo de informação já consta em dicionários baseados em corpus.
Além disso, ao digitar a expressão no Google Imagens, que age como um corpus visual,
todas as figuras são de elevadores de cozinha, e somente uma satiriza um garçom com
uma fita isolante na boca. Ao querermos comparar pessoas, por exemplo, é possível
encontrarmos a correta expressão ‘hold a candle to somebody’ para ‘não chega aos pés de
alguém’.
Sempre ler e estar atualizado a respeito do que acontece em seu país e no mundo
são hábitos que ajudam o tradutor a produzir um texto que contenha, por exemplo, uma
referência humorística, pois ao compreender que se trata de ironia, o profissional
naturalmente busca subsídios para manter a mesma intenção.
De outro modo, seria muito difícil encontrar equivalências em dicionários ou
qualquer outro recurso. Além disso, Rónai (1983, p. 13) lembra que nomes de ruas,
topônimos (nomes próprios de lugar) e designativos de instituições não são o tipo de
informação que encontramos em dicionários e o tradutor precisa identificá-los de modo
que não comprometa seu texto. O autor dá exemplos que são facilmente encontrados em
textos, como é o caso da diferença entre ‘Time’, revista semanal, e ‘Times’, jornal. Assim
como, o ‘Piccadilly Circus’, em Londres, que na verdade não é um circo, mas uma praça
na qual se cruzam diversas ruas. Nesse exemplo, seria estranho aplicar o procedimento de
naturalização – dessa forma, o tradutor se valeria de um equivalente descritivo ou
empréstimo. Por essas e outras razões, lembramos o quão importante é a análise de
corpora lingüísticos autênticos.
De acordo com Tagnin (2002, p. 193), apesar de todo o conhecimento que possa
ter, o tradutor, ainda assim, “pode ter problemas no nível da produção para conseguir
soluções naturais, caso se atenha ao texto original a ponto de não perceber que, entre
outras formas igualmente gramaticais, uma delas é de uso mais corrente”. E é nesse
momento que ele poderá recorrer a um corpus para construir um texto fluente.
4. Casos ilustrativos
O tradutor parte daí para fazer eliminações, por exemplo, achar que o ‘g’ pode ser
de ‘garage’ ou ‘gas’. Ao digitar ‘gch garage’ no WebCorp ou até mesmo no Google,
todas as ocorrências trarão os termos entre vírgulas ‘gch, garage’. Entretanto, ‘gch gas’
traz a sigla e a definição ‘gas central heating’ (aquecimento a gás central). Torna-se mais
complicado se a sigla for ‘d/g’. O caminho a se percorrer é o mesmo do exemplo
mencionado anteriormente. Quando o tradutor chegar a ‘double glazing’ (espécie de
‘duplo envidraçamento’), o problema terá sido solucionado. Tanto melhor, se ele
encontrar o mesmo exemplo dado pelo Bank of English, que já traz o termo ‘double
glazed’. A partir desses exemplos, percebemos que o desenvolvimento de nossa própria
memória de tradução agilizará nosso trabalho de uma próxima vez.
Em uma página do website Ricesu (www.ricesu.com.br) sobre educação a
distância para ser vertido para o inglês em sala de aula, surgiu o segmento ‘[...] voltado
para a organização e realização do evento bienal [...]’. A dúvida recaía sobre ‘realização’.
A primeira opção de um dos alunos foi a intuitiva, ‘realization’, que, na verdade, é um
falso cognato. No entanto, ao procurá-la no Google, diversos sites com terminação .br
traziam-na acompanhando a palavra ‘event’. As duas outras alternativas do tradutor eram
‘accomplishment’ e ‘achievement’. Em seguida, resolveu digitar o seguinte segmento no
WebCorp:
O website exibiu duas novas palavras que pertenciam ao mesmo contexto que o
texto original do tradutor: ‘execution’ e ‘implementation’, ambas com considerável
incidência. Resolveu, então, retornar ao Google para se certificar dessas possibilidades,
digitando-as entre aspas: ‘execution of the event’ e ‘implementation of the event’. Tanto
o número de ocorrências quanto a procedência dos sites foram satisfatórios, optando,
então, por ‘the organization and execution of the event’. Conseqüentemente, o aluno da
1 ...ao qual confiro os mais amplos, I hereby revoke any and all
gerais e ilimitados poderes... general powers of attorney…
Esse trecho nos serve de análise entre a oração coordenada ‘mas’ em português, e
a oração subordinada em inglês ‘not only...but also’. Todos os verbos do texto da LO
estão no infinitivo, enquanto os do texto da LT estão no gerúndio. A reconstrução de
período foi a modalidade tradutória utilizada no segmento acima. Conforme vimos em
Nida, trata-se de equivalência dinâmica, pois atinge naturalidade textual na LT.
As listas online de discussão de tradutores, como o fórum KudoZ, parte integrante
do site ProZ, portal de serviços e recursos voltado a tradutores, também fazem parte do
conceito de corpus. A partir de dúvidas postadas por profissionais da área, o fórum traz
trechos encontrados com as propostas de solução em destaque, avaliados e inseridos por
“[...] a fórmula ideal do exercício intelectual. Cada vez que traduzimos somos
obrigados a abandonar os moldes mentais a que estamos habituados e a pegar o
jeito de outros moldes completamente alheios à nossa maneira de pensar. Não
há nada melhor para adquirir flexibilidade mental – o que ... é praticamente o
ingrediente principal do pensamento claro. Se as línguas estrangeiras não
existissem, deveríamos inventá-las como mecanismo de treinamento
intelectual”.
Conclusão
Referências Bibliográficas
ALVES, Augusta Rodrigues. Buying a house. New Routes Magazine, São Paulo, p. 40-
41, out. 2001.
HOEY, Michael. What’s in a word?. English Teaching Professional, p. 5-8, 27 abr. 2003.
LAVIOSA, Sara. Corpus-based translation studies: where does it come from? Where is it
going? Revista do Centro Interdepartamental de Tradução e Terminologia FFLCH/USP.
Trad Term 10. São Paulo: Humanitas/FFLCH/USP, 2004.
LOUSADA, Eliane. Oral and written comprehension and production: a contribution from
the study of different genres of test to second language studies. Braz-Tesol Newsletter, p.
12-14, mar. 2003.
RÓNAI, Paulo. A tradução técnica e seus problemas. In: ______. São Paulo: Álamo,
1983. p. 5-15.
______. Lingüística de Corpus: uma entrevista com Tony Berber Sardinha. Revista
Virtual de Estudos da Linguagem – ReVEL. Vol. 2, n. 3, ago. 2004. Disponível
em:<http://www.revel.inf.br/site2007/_pdf/3/entrevistas/revel_3_entrevista_tony_berber_
sardinha.pdf >. Acesso em: 12 fev. 2007.
Bibliografia Consultada
ARROJO, Rosemary. Oficina de tradução: A teoria na prática. São Paulo: Ática, 2002.
(Série Princípios).
AURÉLIO. Novo dicionário básico de língua portuguesa. São Paulo: Nova Fronteira,
Folha de São Paulo, 1995.
DARIN, Leila Cristina de Mello. The dream behind the software. Braz-Tesol Newsletter,
São Paulo: Braz-Tesol, p. 6-7, mar. 2003.
GIBSON, Eva. Software piracy, fair use law and copyright infringement. Disponível em:
<http://ezinearticles.com/?Software-Piracy,-Fair-Use-Law,-and-Copyright-
Infringement&id=316068 >. Acesso em: 7 fev. 2007.
Eventos
Apêndice 1
24
Para consultar outros corpora, acesse http://en.wikipedia.org/wiki/Text_corpus.
Apêndice 2