Projeto AC/DC: corpo Português Falado - Documentos Autênticos

AC/DC : Linguateca
O corpus PortFalDA é um corpo de entrevistas transcritas proveniente dos quatro CD-ROM Português Falado: Documentos Autênticos (Gravações audio com transcrição alinhada), produzidos pelo Centro de Linguística da Universidade de Lisboa (CLUL) e pelo Instituto Camões em 1995-1997. Este material foi coletado maioritariamente no âmbito do projeto Português Falado, Variedades Geográficas e Sociais, levado a cabo pelo CLUL em parceria com as universidades francesas de Toulouse-le-Mirail e de Provence-Aix-Marseille. Para mais informação sobre este corpo, veja-se Bacelar do Nascimento (2001a) (em inglês) e Bacelar do Nascimento (2001b) (em francês).

Procurar:     

Resultado:
Concordância
Distribuição das formas (word)
Distribuição dos lemas (lema)
Distribuição da categoria gramatical (PoS) (pos)
Distribuição do tempo verbal e/ou do caso pronominal (temcagr)
Distribuição de pessoa e/ou número (pessnum)
Distribuição do género morfológico (gen)
Distribuição da função sintáctica (func)
Distribuição por fonte (fonte)
Distribuição por variante do português (variante)
Distribuição por campo semântico (sema)
Distribuição por grupo (de cor, roupa, etc.) (grupo)
Distribuição de papéis temáticos (papel)
Distribuição das dependências (dependente_de)
Distribuição de molduras (frames) (moldura)
Opções
Resultados por ordem alfabética (só distribuições)
Resultados em formato separado por ponto e vírgula
Ignorar maiúsculas/minúsculas (não admite parâmetros)
Fazer nuvem com limite de
Amostra aleatória de linhas.

Tipo Fala espontânea
Variante(s) todas
Tamanho (unidades) 148 mil
Tamanho (palavras) 107 mil

Carateres úteis: | { } [ ]
Página principal
Procure noutros corpos:
AmostRA-NILC ANCIB Avante! Corpus Brasileiro CD HAREM CETEMPúblico CHAVE Ciência Viva Colonia CONDIVport CONDIVport2 CoNE C-Oral-Brasil CORDIAL-SIN CorTrad, lado português DHBB DiaCLAV Diáspora TL-PT DisPR ECI-EBR ECI-EE ENPCPUB (parte em português) Floresta FrasesPB FrasesPP Mariano Gago LeMe Literateca Marielle, presente! Moçambula Museu da Pessoa Natura/Minho NOBRE OBras PANTERA, lado português P'lo Norte Português Falado - Documentos Autênticos ReLi NILC/São Carlos todos juntos Tycho Brahe Vercial

Estrutura do corpo

Marcadores posicionais: variante

Marcadores estruturais: texto [nome do texto], pergunta, resposta, p [parágrafo], s [frase].

Veja um excerto do corpo e informação adicional.

Exemplo de pesquisas

Procurar: Resultado:
a palavra inteirointeiroconcordância
palavras terminando em ístico ".*ístico" concordância
adjectivos antecedidos por uma preposição [pos="PRP"] [pos="ADJ"] concordância
formas do verbo reunir[lema="reunir"] concordância
substantivos modificados por muito[lema="muito"& pos="DET" & func=">N"] @[pos="N.*"] distribuição de lema

Dados quantitativos

Para informação sobre como foram obtidos este valores, consulte a página dos Corpos

Agradecimentos

Agradecemos a (ainda em aberto) para incluir no AC/DC.

[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]


Última atualização: 27 de Julho de 2024
Perguntas, comentários e sugestões