18 de Dezembro de 2000
Os recursos linguísticos que aqui disponibilizamos
consistem num grupo de 5813 regras de expressões bilingues inglês-português
(português de Portugal), na sua maioria expressões verbais, que fazem parte de
uma base de dados de regras sintáctico-semânticas.
Este trabalho foi desenvolvido no âmbito de um programa
de estágio técnico em tradução automática que teve lugar na Logos Corporation e
que contou com o apoio da Fundação para a Ciência e Tecnologia do Ministério da
Ciência e Tecnologia, através da participação de Aurea Balhares, Maria João Albernaz, Paula Cristina Gonçalves e Paula Carvalho.
O trabalho apresentado é trabalho em progresso. Ainda não
foi feita nenhuma avaliação destas regras, como tal não asseguramos a sua
validade. Existem, sem dúvida, incorrecções e falhas,
sobre as quais apreciamos sugestões e comentários para o endereço electrónico abaixo indicado.
As regras têm essencialmente a finalidade de substituir a
tradução original no dicionário das palavras da língua-fonte, no contexto
especificado pela regra, ou seja, são utilizadas para a criação de novos
significados e novas nuances das
palavras do dicionário. Cobrem também certas expressões idiomáticas. Em alguns
casos, existe a criação de palavras na língua-alvo que não existiam na
língua-fonte, em outros casos, existe um anulamento de uma ou mais palavras da
língua-fonte no contexto definido pela regra.
As regras são constituídas por duas partes:
o padrão da língua-fonte (inglês) – coluna da esquerda
o padrão da língua-alvo (português) – coluna da direita
Os padrões da língua-fonte e da língua-alvo são
utilizados para descrever as transformações sintáctico-semânticas que a regra
levará a efeito.
Todas as notações estão em inglês:
N = Noun – substantivo
Adj = Adjective – adjectivo
Adv = Adverb – advérbio
Prep = Preposition – preposição
V = Verb – verbo
Self = myself, yourself, himself, herself, itself,
ourselves, yourselves, themselves – formas reflexivas
Os verbos têm,
na língua-fonte, especificado o atributo de transitividade, determinando se um
verbo pode receber um objecto directo. “vi”
especifica que o verbo é intransitivo em inglês, “vt” especifica que o verbo é transitivo em inglês. Os atributos “pass” e “act” são utilizados para marcar uma transformação de uma passiva
numa activa e vice-versa.
|
N
V(preserve,vt,pass) |
N
V(conservar-se,act) |
|
N V(own,vt,pass)
Prep(by) N |
N V(ser,act)
N(propriedade) Prep(de) N |
Os substantivos
podem estar especificados ou não na língua-fonte. Se um substantivo não está
especificado na língua-fonte, surge apenas como N, sem nada a seguir,
representando qualquer substantivo. Se o substantivo é seguido de uma palavra
ou um grupo de palavras entre parênteses, significa que a regra se aplica
apenas no caso daquele(s) substantivo(s) específico(s) aparecer(em). Se o
substantivo é seguido de _ com uma ou mais mnemónicas, significa que a regra se
aplica a uma ou mais classes semânticas de substantivos. A notação <>
representa um grupo de palavras do dicionário ou um grupo de classes
semânticas.
|
Adj(casual)
N(<clothes,clothing,attire>) |
N Adj(informal) |
|
|
Adj(big)
N(<_AnimateNoun, _Place> ) |
N Adj(grande) |
|
Adj(wide)
N(<_FunctionalNoun> ) |
Adj(grande) N |
|
|
N(<_ProcessNoun,
_AbstractNoun> ) V(retreat,vi) |
N V(retirar-se) |
Se um substantivo estiver especificado na língua-fonte, mas não na língua-alvo (português), significa que recebe a tradução por defeito. Se um substantivo estiver especificado na língua-fonte e na língua-alvo, significa que se está a dar uma tradução ao substantivo da língua-fonte que é diferente da tradução por defeito. Neste caso, a tradução do substantivo é acompanhada de um atributo obrigatório para o género (“fem” para o feminino e “masc” para o masculino). No nosso sistema, outras informações morfológicas (incluindo número e flexão) são geradas automáticamente, a menos que haja alteração em relação à forma canónica (segundo e terceiro exemplos).
|
Adj(final) N(say) |
Adj(último)
N(palavra,fem) |
|
N(expenditure)
N(framework) |
N(estrutura,fem) de
N(gastos,masc,pl,invar) |
|
V(do,vt)
N(overtime) |
V(fazer) N(horas
extraordinárias,fem,pl,invar) |
Existe ainda um atributo que se aplica aos substantivos e
que permite anular o determinante que surge por defeito. Esse atributo é nulldet.
|
Prep(by) N(day) |
Prep(de,temp)
N(dia,masc,nulldet) |
No caso de haver criação de um novo substantivo na
língua-alvo, não é necessário acrescentar qualquer tipo de atributo para a
morfologia, uma vez que esse substantivo se manterá invariável.
|
V(advertise,vi) |
V(fazer)
N(publicidade) |
|
|
V(window shop,vi) |
V(ver) N(as
montras) |
|
|
V(be,vi)
Adj(careful) |
V(ter) N(cuidado) |
|
|
V(be,vi) Adj(sure) |
V(ter) N(a certeza) |
Os adjectivos,
tal como os substantivos, podem estar especificados ou não na língua-fonte. Se
um adjectivo não está especificado na língua-fonte, surge apenas como Adj, sem
nada a seguir representando qualquer adjectivo. Se o adjectivo é seguido de uma
palavra ou um grupo de palavras entre parênteses, significa que a regra se
aplica apenas no caso daquele(s) adjectivo(s) específico(s) aparecer(em).
|
V(be,vi)
Adj(<empty,vacant,full>) |
V(estar) Adj |
|
V(be,vi)
Adj(absent) |
V(estar)
Adj(ausente) |
|
V(be,vi)
Adj(applicable) |
V(ser) Adj |
Os adjectivos aparecem na sua forma canónica e são
gerados pelo nosso sistema de forma a flexionar com o substantivo, a menos que
sejam especificados como invariáveis.
|
Adj(further) N |
Adj(mais,invar) N |
Também os advérbios
podem estar especificados ou não na língua-fonte. Se um advérbio não está especificado
na língua-fonte, surge apenas como Adv, sem nada a seguir representando
qualquer advérbio. Se o advérbio é seguido de uma palavra entre parênteses,
significa que a regra se aplica apenas no caso daquele advérbio específico
aparecer.
|
V(be,vi) Adv(here) |
V(estar) Adv |
|
V(be,vi) Adv(late) |
V(chegar)
Adv(tarde) |
|
V(take,vi)
Adv(long) |
V(levar) Adv(muito
tempo) |
|
V(take,vt)
Adv(seriously) |
V(levar) Adv(a
sério) |
Resumindo, a lista de marcações que surgem na coluna da
língua-fonte é a seguinte:
(palavra) = indica especificação de uma única palavra, a
que está indicada dentro dos parênteses.
(<palavra,palavra,…>) = indica especificação de
mais do que uma palavra.
(_classe semântica) = indica especificação de uma classe
semântica.
(<_classe semântica,_ classe semântica,…>) = indica
especificação de mais do que uma classe semântica.
A lista de mnemónicas para classes semânticas na
língua-fonte é a seguinte:
FunctionalNoun
AnimateNoun
Measure
Place
ProcessNoun
AbstractNoun
ConcreteNoun
InformationNoun
MassNoun
Time
Gostaríamos de agradecer os esforços conseguidos pelos
estagiários para a criação destas equivalências sintáctico-semânticas e, do
mesmo modo, agradecer e felicitar a iniciativa da Fundação para a Ciência e
Tecnologia de fomentar a formação e especialização de jovens investigadores
nesta área do processamento computacional da língua portuguesa e de estimular a
criação de novos recursos linguísticos.
--------------------------------------------------------------------------------------------------
Anabela Barreiro Colasuonno Voice +1+973-366-7225 Ext. 142
Linguista Inglês-Português Fax +1+973-366-7697
Logos Corporation Email barreiro_anabela@hotmail.com
--------------------------------------------------------------------------------------------------