Documentação associada aos recursos linguísticos disponibilizados pela Logos Corporation

Logos Corporation

18 de Dezembro de 2000

 

Os recursos linguísticos que aqui disponibilizamos consistem num grupo de 5813 regras de expressões bilingues inglês-português (português de Portugal), na sua maioria expressões verbais, que fazem parte de uma base de dados de regras sintáctico-semânticas.

 

Este trabalho foi desenvolvido no âmbito de um programa de estágio técnico em tradução automática que teve lugar na Logos Corporation e que contou com o apoio da Fundação para a Ciência e Tecnologia do Ministério da Ciência e Tecnologia, através da participação de Aurea Balhares, Maria João Albernaz, Paula Cristina Gonçalves e Paula Carvalho.

 

O trabalho apresentado é trabalho em progresso. Ainda não foi feita nenhuma avaliação destas regras, como tal não asseguramos a sua validade. Existem, sem dúvida, incorrecções e falhas, sobre as quais apreciamos sugestões e comentários para o endereço electrónico abaixo indicado.

 

As regras têm essencialmente a finalidade de substituir a tradução original no dicionário das palavras da língua-fonte, no contexto especificado pela regra, ou seja, são utilizadas para a criação de novos significados e novas nuances das palavras do dicionário. Cobrem também certas expressões idiomáticas. Em alguns casos, existe a criação de palavras na língua-alvo que não existiam na língua-fonte, em outros casos, existe um anulamento de uma ou mais palavras da língua-fonte no contexto definido pela regra.

 

As regras são constituídas por duas partes:

o padrão da língua-fonte (inglês) – coluna da esquerda

o padrão da língua-alvo (português) – coluna da direita

Os padrões da língua-fonte e da língua-alvo são utilizados para descrever as transformações sintáctico-semânticas que a regra levará a efeito.

 

Todas as notações estão em inglês:

N = Noun – substantivo

Adj = Adjective – adjectivo

Adv = Adverb – advérbio

Prep = Preposition – preposição

V = Verb – verbo

Self = myself, yourself, himself, herself, itself, ourselves, yourselves, themselves – formas reflexivas

 

Os verbos têm, na língua-fonte, especificado o atributo de transitividade, determinando se um verbo pode receber um objecto directo. “vi” especifica que o verbo é intransitivo em inglês, “vt” especifica que o verbo é transitivo em inglês. Os atributos “pass” e “act” são utilizados para marcar uma transformação de uma passiva numa activa e vice-versa.

 

N V(preserve,vt,pass)

N V(conservar-se,act)

N V(own,vt,pass) Prep(by) N

N V(ser,act) N(propriedade) Prep(de) N

 

 

Os substantivos podem estar especificados ou não na língua-fonte. Se um substantivo não está especificado na língua-fonte, surge apenas como N, sem nada a seguir, representando qualquer substantivo. Se o substantivo é seguido de uma palavra ou um grupo de palavras entre parênteses, significa que a regra se aplica apenas no caso daquele(s) substantivo(s) específico(s) aparecer(em). Se o substantivo é seguido de _ com uma ou mais mnemónicas, significa que a regra se aplica a uma ou mais classes semânticas de substantivos. A notação <> representa um grupo de palavras do dicionário ou um grupo de classes semânticas.

 

Adj(casual) N(<clothes,clothing,attire>)

N Adj(informal)

 

Adj(big) N(<_AnimateNoun, _Place> )

N Adj(grande)

 

Adj(wide) N(<_FunctionalNoun> )

Adj(grande) N

 

N(<_ProcessNoun, _AbstractNoun> ) V(retreat,vi)

N V(retirar-se)

 

Se um substantivo estiver especificado na língua-fonte, mas não na língua-alvo (português), significa que recebe a tradução por defeito. Se um substantivo estiver especificado na língua-fonte e na língua-alvo, significa que se está a dar uma tradução ao substantivo da língua-fonte que é diferente da tradução por defeito. Neste caso, a tradução do substantivo é acompanhada de um atributo obrigatório para o género (“fem” para o feminino e “masc” para o masculino). No nosso sistema, outras informações morfológicas (incluindo número e flexão) são geradas automáticamente, a menos que haja alteração em relação à forma canónica (segundo e terceiro exemplos).

 

Adj(final) N(say)

Adj(último) N(palavra,fem)

N(expenditure) N(framework)

N(estrutura,fem) de N(gastos,masc,pl,invar)

V(do,vt) N(overtime)

V(fazer) N(horas extraordinárias,fem,pl,invar)

 

Existe ainda um atributo que se aplica aos substantivos e que permite anular o determinante que surge por defeito. Esse atributo é nulldet.

 

Prep(by) N(day)

Prep(de,temp) N(dia,masc,nulldet)

 

No caso de haver criação de um novo substantivo na língua-alvo, não é necessário acrescentar qualquer tipo de atributo para a morfologia, uma vez que esse substantivo se manterá invariável.

 

V(advertise,vi)

V(fazer) N(publicidade)

V(window shop,vi)

V(ver) N(as montras)

V(be,vi) Adj(careful)

V(ter) N(cuidado)

 

V(be,vi) Adj(sure)

V(ter) N(a certeza)

 

 

Os adjectivos, tal como os substantivos, podem estar especificados ou não na língua-fonte. Se um adjectivo não está especificado na língua-fonte, surge apenas como Adj, sem nada a seguir representando qualquer adjectivo. Se o adjectivo é seguido de uma palavra ou um grupo de palavras entre parênteses, significa que a regra se aplica apenas no caso daquele(s) adjectivo(s) específico(s) aparecer(em).

 

V(be,vi) Adj(<empty,vacant,full>)

V(estar) Adj

V(be,vi) Adj(absent)

V(estar) Adj(ausente)

V(be,vi) Adj(applicable)

V(ser) Adj

 

Os adjectivos aparecem na sua forma canónica e são gerados pelo nosso sistema de forma a flexionar com o substantivo, a menos que sejam especificados como invariáveis.

 

Adj(further) N

Adj(mais,invar) N

 

 

Também os advérbios podem estar especificados ou não na língua-fonte. Se um advérbio não está especificado na língua-fonte, surge apenas como Adv, sem nada a seguir representando qualquer advérbio. Se o advérbio é seguido de uma palavra entre parênteses, significa que a regra se aplica apenas no caso daquele advérbio específico aparecer.

 

V(be,vi) Adv(here)

V(estar) Adv

V(be,vi) Adv(late)

V(chegar) Adv(tarde)

V(take,vi) Adv(long)

V(levar) Adv(muito tempo)

V(take,vt) Adv(seriously)

V(levar) Adv(a sério)

 

 

Resumindo, a lista de marcações que surgem na coluna da língua-fonte é a seguinte:

(palavra) = indica especificação de uma única palavra, a que está indicada dentro dos parênteses.

(<palavra,palavra,…>) = indica especificação de mais do que uma palavra.

(_classe semântica) = indica especificação de uma classe semântica.

(<_classe semântica,_ classe semântica,…>) = indica especificação de mais do que uma classe semântica.

 

A lista de mnemónicas para classes semânticas na língua-fonte é a seguinte:

FunctionalNoun

AnimateNoun

Measure

Place

ProcessNoun

AbstractNoun

ConcreteNoun

InformationNoun

MassNoun

Time

 

 

Gostaríamos de agradecer os esforços conseguidos pelos estagiários para a criação destas equivalências sintáctico-semânticas e, do mesmo modo, agradecer e felicitar a iniciativa da Fundação para a Ciência e Tecnologia de fomentar a formação e especialização de jovens investigadores nesta área do processamento computacional da língua portuguesa e de estimular a criação de novos recursos linguísticos.

 

 

--------------------------------------------------------------------------------------------------
Anabela Barreiro Colasuonno              Voice +1+973-366-7225 Ext. 142
Linguista Inglês-Português                   Fax +1+973-366-7697
Logos Corporation                              Email barreiro_anabela@hotmail.com

www http://www.logos-ca.com

--------------------------------------------------------------------------------------------------