Acesso a corpos de português: Projecto AC/DC: corpo Literateca

Literateca : AC/DC : Linguateca
O corpo Literateca inclui todas as obras literárias presentes nos corpos disponibilizados pela Linguateca (Vercial, OBras, NOBRE, Tycho Brahe, Colonia e PANTERA) de forma a permitir que esse material possa ser interrogado duma só vez, evitando ao mesmo tempo sobreposições.

Os corpos que lhe deram origem continuam a existir e a serem mantidos independentemente (e prioritariamente). A Literateca é apenas uma forma mais simples de interagir com todos se o utilizador assim o desejar.

Tal como o corpo TODOS, tem apenas como atributos adicionais os atributos variante e corpo. Além disso, chamamos a atenção para o facto de poder estar pontualmente desatualizado em relação a versões modernas dos corpos individuais que o constituem.

No caso da sobreposição entre os vários corpos, usamos a ordem enunciada anteriormente. "Preferimos" os textos que se encontram no Vercial, etc.

Estrutura do corpo

Os marcadores estruturais são: s, p, e, dependendo dos corpos envolvidos, também ext, texto, entrevista, TEXTO, etc.

Para todas as obras existem os atributos posicionais autor (valores e chave em lista de autores), obra (contendo o seu título), e data (que quando é desconhecida tem o valor "desc").

Versão do corpo

Corpo Literateca, criado a 12 de maio de 2026, v. 14.5

Excerto do corpo


<ext id=1 gen=«literatura»>
<p par=1>
<s> Foi entre a sopa e a galinha de molho pardo -- especialidade do restaurante Mickey Mouse -- que Sergio falou (voz forte, porém pouco firme, dir-se-ia: trôpega): </s>
</p>
<p par=2>
<s> Sergio não hesitou em se mostrar desarvorado com o protesto . </s>
<s> A intervenção de Silvio, porém, foi imediata: </s>
</p>
(...)
</ext>

Dados quantitativos

Corpo LITERATECA Número de formasNúmero de tipos
Unidades 52741328568681
Total de palavras 37864742568296
Palavras em minúscula 29076165302250
Palavras com inicial maiúscula3611292113341
Palavras todas em maiúsculas 12148911648
Números 818572218
Palavras com números1193681
Palavras mistas282936469
Pontuação26909348

Número de unidades estruturais

Atributo Número
p 816987
s 2334374
t 2502
v 289303
obra 1006
capitulo 699
parte 619
tit 0
autor 895
tituloobra 895
div 6278
mwe 573678
fala 43102
personagem 47507

Contabilização de multipalavras

Número de entidades Número de unidades
Nomes próprios 996314 1661977
Locuções 573678 1238001
Palavras gráficas 37864742 37864742
Palavras simples 34964764 34964764
Palavras 36534756 37864742

Distribuição por categoria gramatical

Categoria gramaticalExpressão de procura Número de palavrasPercentagem do corpo
Substantivos N|N[^U].* 7220809 20,65%
Verbos V.* 6166421 17,64%
Adjectivos ADJ.* 2212336 6,33%
Pronomes pessoais .*PERS.* 1774424 5,07%
Preposições PRP.* 5441590 15,56%
Conjunções K.* 2000691 5,72%
Advérbios ADV.* 2316575 6,63%
Determinantes .*DET.* 6559089 18,76%
Especificadores .*SPEC.* 918619 2,63%
Numerais NUM.* 326124 0,93%

Para informação sobre como foram obtidos este valores, consulte esta página

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 12 de Maio de 2026
Perguntas, comentários e sugestões