Linguateca

O objectivo da Linguateca, um centro de recursos -- distribuído -- para o processamento computacional da língua portuguesa, é servir a comunidade que se dedica ao processamento da nossa língua. Em particular,

facilitar o acesso aos recursos já existentes, através do desenvolvimento de serviços de acesso na rede, e mantendo um portal com informação útil,
desenvolver, de forma harmoniosa, em colaboração com os interessados, os recursos considerados mais prementes,
organizar avaliações conjuntas que envolvam a comunidade como um todo.

Duas linhas mestras norteiam a actividade da Linguateca:

Total abertura: Todas as actividades e trabalhos desenvolvidos pela Linguateca são públicos.
Disponibilização livre: Os autores de recursos serão remunerados ou compensados de forma a não serem lesados, mas a Linguateca não se destina a desenvolver ou apoiar o desenvolvimento de recursos proprietários, mas sim a criar condições para a existência de recursos bons e gratuitos para a língua portuguesa.

A actividade da Linguateca reparte-se, assim, entre:

a formação de pessoal especializado em gestão, criação, disseminação e avaliação de recursos
o assegurar dos serviços básicos de repositório, distribuição e catálogo, de forma distribuída
o desenvolvimento de recursos públicos, em especial, recursos para avaliação ou calibragem
a manutenção do contacto e da comunicação entre os vários actores e clientes dos nossos serviços
a organização de avaliações conjuntas em torno de áreas chave

Estrutura

A Linguateca entrou numa nova fase a partir de 2012 em que conta com a colaboração de investigadores de instituições em vários países, após terem terminado os projectos de I&D que a vinham a financiar. A FCCN continua a garantir a gestão dos servidores onde estão alojados os conteúdos e serviços, em www.linguateca.pt. A equipa de investigadores que desenvolveu a Linguateca está atenta aos programas que, a vários níveis, poderão vir a financiar futuras fases do projecto.

Para ver quem somos, visite a equipa da Linguateca.

Convém também referir que a Linguateca é/foi a continuação do projecto Processamento computacional do português decorrido no SINTEF de Maio de 1998 a Maio de 2000.

Modelo de funcionamento

O trabalho da Linguateca pode ser descrito através do modelo IRA (Informação - Recursos - Avaliação):

Informação: mantemos um portal constantemente actualizado sobre o processamento computacional da língua portuguesa, contendo
- Catálogo de recursos (Corpora, Léxicos e dicionários, Enciclopédias, Serviços envolvendo o processamento computacional do português, Material didáctico, Comunicação social, Textos em português, etc.)
- Catálogo de actores (Grupos, centros e institutos, Projectos, Projectos europeus, Projectos internacionais, Associações e instituições, Empresas, Páginas pessoais, Ensino, Revistas sobre o português, etc.)
- Catálogo de ferramentas computacionais
- Catálogo de publicações sobre o processamento computacional da língua portuguesa
- um fórum sobre assuntos relacionados com o processamento computacional da língua portuguesa, contendo notícias, ofertas de emprego e anúncios de conferências e de cursos
- um repositório na rede de teses e outros trabalhos na área
- um sistema de procura sobre a área do processamento computacional do português, construído para facilitar a navegação no nosso portal (com quatro modalidades: procura por pessoas, procura por publicações, procura por palavras chave e procura em texto livre nas páginas apontadas pelo nosso portal)
Recursos: Criámos e damos acesso através da rede ao um conjunto considerável de recursos para a engenharia da linguagem em português, assim como serviços que disponibilizam recursos. Veja-se acesso a recursos para uma apresentação detalhada. Entre os mais conhecidos e usados encontram-se o CETEMPúblico, o COMPARA, o Corpógrafo e o AC/DC. Refira-se também o jardim de ferramentas, que disponibiliza os próprios programas criados no âmbito da Linguateca.
Avaliação: Neste campo dedicamo-nos sobretudo a promover o modelo de avaliação conjunta para o português. Organizámos as Morfolimpíadas, a primeira avaliação conjunta para a nossa língua, comparando analisadores morfológicos, temos participado na organização do CLEF desde 2004, e preparámos a primeira avaliação conjunta em identificação e reconhecimento de entidades mencionadas, o HAREM.

Além disso, a nossa actividade cobre também, sobretudo desde 2003, um esforço considerável em investigação, desenvolvimento e apoio aos nossos utilizadores.

Impacto do trabalho desenvolvido

Veja-se a informação sobre

Visitas ao nosso sítio e consultas aos nossos serviços
Documentação (artigos, relatórios, páginas na rede) produzida no âmbito da Linguateca
Historial da Linguateca

Financiamento

A criação da Linguateca, e a sua organização, foi operacionalizada até 31 de Dezembro de 2011 através de um projecto coordenado e executado pela Fundação para a Computação Científica Nacional (responsável máximo: Pedro Veiga), financiado pelo MCTES, pela UMIC e pela FCT, assim como através dos seguintes meios:

Projecto POSC 339/1.3/C/NAC, de 16 de Dezembro de 2006 a 31 de Dezembro de 2008
Projecto POSI/PLP/43931/2001 (Centro de Recursos Distribuído para o Processamento Computacional da Língua Portuguesa), até 15 de Dezembro de 2006
Projecto POSI - Eixo Prioritário 1: Desenvolver Competências / Medida 1.3 Investigação e Desenvolvimento; Projecto: Centro de Recursos Distribuído para o Processamento Computacional da Língua Portuguesa; Sub-Projecto Componente de Projecto de I&D; Período: 2003-2006;
Projecto POSI - Eixo Prioritário 1: Desenvolver Competências /Medida 1.3 Investigação e Desenvolvimento; Projecto: Centro de Recursos Distribuído para o Processamento Computacional da Língua Portuguesa (Número de Origem: 4/1.3/C/NRE); Período: 2001-2003

Última actualização: 11 de julho de 2015.

Perguntas, comentários e sugestões