Léxico-gramática dos adjectivos intransitivos humanos do português europeu

Enquadramento

Os dados aqui disponibilizados foram desenvolvidos no âmbito da tese de doutoramento de Paula Carvalho, intitulada Análise e Representação de Construções Adjectivais para Processamento Automático de texto. Adjectivos Intransitivos Humanos., apresentada à Universidade de Lisboa, em 2007.

Este estudo teve como principal objectivo determinar e formalizar as propriedades léxico-sintácticas dos adjectivos intransitivos, i.e., sem complementos, e que se constroem com sujeito humano, do português europeu contemporâneo. Muitos destes adjectivos têm sido classificados como nomes, por forma a dar conta dos casos em que aparecem em posições sintácticas tipicamente nominais. Esta ambiguidade encontra eco no fenómeno de criação lexical tradicionalmente designado como derivação imprópria (ou conversão).

Nesta dissertação, defendemos que certos adjectivos humanos têm a propriedade de desempenhar superficialmente a função de núcleo de grupos nominais. Entre as várias estruturas analisadas, tratámos (i) as 'construções caracterizadoras indefinidas', em que o adjectivo aparece precedido de artigo indefinido, em contexto predicativo, (ii) as 'construções cruzadas', em que o adjectivo ocupa a posição típica de núcleo de um grupo nominal, (iii) as 'orações exclamativas de insulto', e outras, cujas especificidades sintácticas, semânticas e discursivas procurámos igualmente clarificar.

Demonstrámos que os adjectivos humanos construídos com o verbo copulativo 'ser' podem, em geral, representar sozinhos um GN decepado, isto é, um grupo nominal cujo elemento nuclear não está lexicalmente explícito. Defendemos que, quando o GN tem um valor de referência genérico, o núcleo dessas construções sintácticas corresponde a um nome classificador apropriado, passível de ser reconstituído. Mostrámos que, nos casos em que o adjectivo se encontra a representar isoladamente um GN com um valor de referência particularizante, é possível proceder à reconstituição do elemento nuclear do GN, mediante o estabelecimento das relações de correferência e anáfora no texto. Verificámos que os adjectivos que têm a propriedade de integrar a construção caracterizadora indefinida estão, na sua maioria, associados a um valor negativo ou depreciativo. Demonstrámos que os adjectivos, nestas construções, exibem um significado idêntico àquele que exibiriam se se encontrassem numa construção predicativa e preservam a sua natureza predicativa, impondo o mesmo número de argumentos e idênticas restrições lexicais. Vimos que, na construção cruzada, a relação de predicação subjacente ao GN pode, na maioria dos casos, ser formalizada com recurso a uma frase predicativa com o verbo copulativo 'ser', desde que o adjectivo não apresente um sentido irónico ou metafórico, que só a construção caracterizadora indefinida consegue captar. Observámos ainda que as exclamativas parciais de insulto são fundamentalmente constituídas por adjectivos que tenham a propriedade de ocorrer numa construção caracterizadora indefinida.

A investigação baseou-se na análise de 4.250 lemas adjectivais, que organizámos em 15 subclasses sintáctico-semânticas, de acordo com os princípios teórico-metodológicos do Léxico-Gramática, fundados na gramática transformacional de operadores harrissiana. As informações linguísticas foram formalizadas em matrizes léxico-sintácticas, permitindo, como ilustrámos, a sua utilização em diversas tarefas de processamento de linguagem natural, nomeadamente, na desambiguação e análise sintáctica de textos.


Matrizes léxico-sintácticas

As matrizes do Léxico-Gramática permitem representar, de uma forma simples, compacta e sistemática, as propriedades lexicais, sintácticas e semânticas dos predicados de uma língua natural. Elas podem ser vistas como dicionários sintácticos, cujas entradas correspondem não a unidades lexicais, mas a unidades léxico-sintácticas, nomeadamente a frases simples (ou elementares). Cada entrada (linha da matriz) é constituída por um elemento predicativo (no caso em concreto, um adjectivo), cujo lema se encontra lexicalmente explicitado, e por um conjunto de propriedades (colunas da matriz) consideradas relevantes para a sua descrição. Os sinais «+» e «-» dão a indicação de que o adjectivo exibe ou não, respectivamente, cada uma das propriedades tidas em consideração nas colunas das matrizes.

As propriedades descritas nas matrizes podem ser de tipo distribucional (restrições quanto ao número e quanto à natureza sintáctico-semântica dos argumentos seleccionados pelo predicador), de tipo transformacional (processos sintácticos que podem operar sobre os predicados) e/ou de tipo lexical (restrições quanto à especificação lexical de certos elementos na construção, por exemplo, as preposições que introduzem o GN resultante de reestruturação, bem como os eventuais nomes e verbos morfologicamente associados aos predicadores adjectivais em análise).

Os adjectivos analisados encontram-se agrupados em diferentes classes léxico-sintácticas, estabelecidas segundo um conjunto de critérios formais descritos em Carvalho (2008).

Matriz Exemplo Nº Entradas
SAHP1 honesto 549
SAHP2 atlético 367
SAHP3 comunicativo 359
SAHC1 arrogante 343
SAHC2 introvertido 217
SAHC3 azelha 518
EAHP2 bronzeado 104
EAHP3 zangado 266
SEAHP2 cadavérico 139
SEAHP3 calvo 124
SEAHC2 esquelético 54
SEAHC3 alucinado 67
SAF social-democrata 303
SAN português 651
SEAD anoréctico 187

Os nomes das tabelas representam as classes léxico-sintácticas apuradas: S designa os Adj que se constroem com o verbo copulativo 'ser', E os que se constroem com 'estar' e SE os adjectivos que aceitam ambos os auxiliares. AH indica que se trata de um Adj Hum. C distingue os adjectivos que têm a propriedade de ocorrer no âmbito de uma construção caracterizadora indefinida; P caracteriza os adjectivos que apenas aceitam o contexto predicativo. Os algarismos 1, 2 e 3 referem o preenchimento léxico-sintáctico da posição argumental de sujeito: 1 está associado aos adjectivos que se podem construir quer com um Nhum, quer com um GN com Nap quer com uma completiva-sujeito; 2 representa os Adj que aceitam apenas as duas primeiras construções sintácticas; 3 representa os Adj que se constroem com N estritamente humanos.

Além disso, todos os recursos podem ser levantados de um único ficheiro Excel.


Referência aos recursos

Os recursos disponibilizados deverão ser referidos como "Matrizes léxico-sintácticas dos adjectivos intransitivos humanos do português", seguindo-se a referência ao trabalho de tese:

Paula Cristina Quaresma da Fonseca Carvalho. Análise e Representação de Construções Adjectivais para Processamento Automático de Texto. Adjectivos Intransitivos Humanos. Tese de Doutoramento. Universidade de Lisboa. 2007. http://www.linguateca.pt/Repositorio/TeseDoutPaulaCarvalho.pdf


Contactar Paula Carvalho para mais informações.

Última actualização: 31 de Dezembro de 2008.