Mais informação sobre o corpus em: http://www.clul.ulisboa.pt/recurso/cordial-sin-syntax-oriented-corpus-portuguese-dialects
E acesso ao CORDIAL-SIN-TreeBank (ISLRN: 337-389-991-117-2) em: acesso
No AC/DC por enquanto apenas usamos o texto editado, mas é possível que incluamos a anotação numa segunda fase.
Estrutura do corpoO corpo contém as etiquetas entrevista (documento), fala (fala de um interlocutor), personagem (identificação do interlocutor), p (parágrafo) e s (frase).O atributo posicional fonte indica a que excerto cada palavra pertence (ver lista das fontes). Aqui listamos os metadados associados a cada fonte (excerto de entrevista) do CORDIAL-SIN: Metadados CORDIAL-SIN
E aqui a informação genérica relacionada com os informantes: Informantes CORDIAL-SIN Versão do corpoCorpo CORDIAL-SIN, versão texto de janeiro de 2021, anotado a 6 de julho de 2024, v. 3.1Excerto do corpo<entrevista VPA01> <p> <fala INF> <personagem> INF </personagem> <s> Nós dantes, nestas redes, era raro o dia que não se pegava um, dois lavagantes ou três . </s> <s> Agora não há . </s> <s> Não há . </s> <s> Vai acontecer como à lagosta, aqui ao norte . </s> </fala> </p> <p> <fala INQ1> <personagem> INQ1 </personagem> <s> Desaparece tudo... </s> </fala> </p> Dados quantitativos
Número de unidades estruturais
Contabilização de multipalavras
Distribuição por categoria gramatical
Para informação sobre como foram obtidos este valores, consulte esta página |
[ Exemplos | Atomização | Anotação | Corpos | Agradecimentos ]