Linguateca


O objectivo da Linguateca, um centro de recursos -- distribuído -- para o processamento computacional da língua portuguesa, é servir a comunidade que se dedica ao processamento da nossa língua. Em particular, Duas linhas mestras norteiam a actividade da Linguateca:
  1. Total abertura: Todas as actividades e trabalhos desenvolvidos pela Linguateca são públicos.
  2. Disponibilização livre: Os autores de recursos serão remunerados ou compensados de forma a não serem lesados, mas a Linguateca não se destina a desenvolver ou apoiar o desenvolvimento de recursos proprietários, mas sim a criar condições para a existência de recursos bons e gratuitos para a língua portuguesa.
A actividade da Linguateca reparte-se, assim, entre:

Estrutura

A Linguateca entrou numa nova fase a partir de 2012 em que conta com a colaboração de investigadores de instituições em vários países, após terem terminado os projectos de I&D que a vinham a financiar. A FCCN continua a garantir a gestão dos servidores onde estão alojados os conteúdos e serviços, em www.linguateca.pt. A equipa de investigadores que desenvolveu a Linguateca está atenta aos programas que, a vários níveis, poderão vir a financiar futuras fases do projecto.

Para ver quem somos, visite a equipa da Linguateca.

Convém também referir que a Linguateca é/foi a continuação do projecto Processamento computacional do português decorrido no SINTEF de Maio de 1998 a Maio de 2000.

Modelo de funcionamento

O trabalho da Linguateca pode ser descrito através do modelo IRA (Informação - Recursos - Avaliação):
  1. Informação: mantemos um portal constantemente actualizado sobre o processamento computacional da língua portuguesa, contendo
  2. Recursos: Criámos e damos acesso através da rede ao um conjunto considerável de recursos para a engenharia da linguagem em português, assim como serviços que disponibilizam recursos. Veja-se acesso a recursos para uma apresentação detalhada. Entre os mais conhecidos e usados encontram-se o CETEMPúblico, o COMPARA, o Corpógrafo e o AC/DC. Refira-se também o jardim de ferramentas, que disponibiliza os próprios programas criados no âmbito da Linguateca.
  3. Avaliação: Neste campo dedicamo-nos sobretudo a promover o modelo de avaliação conjunta para o português. Organizámos as Morfolimpíadas, a primeira avaliação conjunta para a nossa língua, comparando analisadores morfológicos, temos participado na organização do CLEF desde 2004, e preparámos a primeira avaliação conjunta em identificação e reconhecimento de entidades mencionadas, o HAREM.
Além disso, a nossa actividade cobre também, sobretudo desde 2003, um esforço considerável em investigação, desenvolvimento e apoio aos nossos utilizadores.

Impacto do trabalho desenvolvido

Veja-se a informação sobre

Financiamento

A criação da Linguateca, e a sua organização, foi operacionalizada até 31 de Dezembro de 2011 através de um projecto coordenado e executado pela Fundação para a Computação Científica Nacional (responsável máximo: Pedro Veiga), financiado pelo MCTES, pela UMIC e pela FCT, assim como através dos seguintes meios: Logos do POSC, UE, UMIC e FCCN
Última actualização: 11 de julho de 2015.
Perguntas, comentários e sugestões