Projeto AC/DC: corpo CorpiRef

AC/DC : Linguateca
O CorpiRef é um corpo experimental para procurar personagens e as suas ações, usando -- por enquanto -- um processo manual de coreferência e anotação de sujeitos nulos. É um subconjunto do OBras, com as seguintes obras: O Cortiço, Canaã e Úrsula.

Procurar:     

Resultado:
Concordância
Distribuição das formas (word)
Distribuição dos lemas (lema)
Distribuição da categoria gramatical (PoS) (pos)
Distribuição do tempo verbal e/ou do caso pronominal (temcagr)
Distribuição de pessoa e/ou número (pessnum)
Distribuição do género morfológico (gen)
Distribuição da função sintáctica (func)
Opções
Resultados por ordem alfabética (só distribuições)
Resultados em formato separado por ponto e vírgula
Ignorar maiúsculas/minúsculas (não admite parâmetros)
Fazer nuvem com limite de
Amostra aleatória de linhas.

Tipo Literário
Variante(s) PT BR
Tamanho (unidades) 0 mil
Tamanho (palavras) 0 mil

Carateres úteis: | { } [ ]
Página principal
Procure noutros corpos:
AmostRA-NILC ANCIB Avante! Corpus Brasileiro CD HAREM CETEMPúblico CHAVE Ciência Viva Colonia CONDIVport CONDIVport2 CoNE C-Oral-Brasil CORDIAL-SIN CorpiRef CorTrad, lado português DHBB DiaCLAV Diáspora TL-PT DisPR ECI-EBR ECI-EE ENPCPUB (parte em português) Floresta FrasesPB FrasesPP Mariano Gago LeMe Literateca Marielle, presente! Moçambula Museu da Pessoa Natura/Minho NOBRE OBras PANTERA, lado português P'lo Norte Português Falado - Documentos Autênticos ReLi NILC/São Carlos todos juntos Tycho Brahe Vercial

Estrutura do corpo

Utilizámos como marcadores estruturais para todas as obras obra (que contém o nome da obra, o tipo de obra e o código do autor), tituloobra, (o nome da obra), autor (o autor da obra), capituloy, u (uma unidade de texto: frase, verso, título ou indicação de cena, consoante o tipo de obra). As obras em prosa têm os marcadores estruturais adicionais p [parágrafo], t [título], s [frase], e poesia [partes em poesia].

Além disso, para todas as obras existem os atributos posicionais autor (valores e chave em lista de autores), obra (contendo o seu título), e data (que quando é desconhecida tem o valor "desc").

Veja um excerto do corpo e informação adicional.

Exemplo de pesquisas

Procurar: Resultado:
a palavra mineiromineiroconcordância
palavras terminando em eiro ou eira ".*eir[oa]" concordância
adjectivos antecedidos por uma preposição [pos="PRP"] @[pos="ADJ"] distribuição dos lemas
formas do verbo pôr[lema="pôr"] concordância
substantivos modificados por muito[lema="muito" & func=">N"] @[pos="N.*"] distribuição dos lemas
palavras iniciando uma saudação<saudacao> [] concordância

Dados quantitativos

Para informação sobre como foram obtidos este valores, consulte a página dos Corpos

Agradecimentos

Este projeto foi originado por uma tese de mestrado na UEMA.

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 27 de Julho de 2024
Perguntas, comentários e sugestões