Linguateca
O objectivo da Linguateca, um centro de recursos --
distribuído -- para o processamento computacional da língua portuguesa, é servir a comunidade que se dedica ao processamento da nossa língua. Em particular,
- facilitar o acesso aos recursos já existentes, através do desenvolvimento de serviços de acesso na rede, e mantendo um portal com informação útil,
- desenvolver, de forma harmoniosa, em colaboração com os interessados, os recursos considerados mais prementes,
- organizar avaliações conjuntas que envolvam a comunidade como um todo.
Duas linhas mestras norteiam a actividade da Linguateca:
- Total abertura: Todas as actividades e trabalhos desenvolvidos pela Linguateca são públicos.
- Disponibilização livre: Os autores de recursos serão remunerados ou compensados de forma a não serem lesados, mas a Linguateca não se destina a desenvolver ou apoiar o desenvolvimento de recursos proprietários, mas sim a criar condições para
a existência de recursos bons e gratuitos para a língua portuguesa.
A actividade da Linguateca reparte-se, assim, entre:
- a formação de pessoal especializado em gestão, criação, disseminação e avaliação de recursos
- o assegurar dos serviços básicos de repositório, distribuição e catálogo, de forma distribuída
- o desenvolvimento de recursos públicos, em especial, recursos para avaliação ou calibragem
- a manutenção do contacto e da comunicação entre os vários actores e clientes dos nossos serviços
- a organização de avaliações conjuntas em torno de áreas chave
Estrutura
A Linguateca entrou numa nova fase a partir de 2012 em que conta com a colaboração de investigadores de instituições em vários países, após terem terminado os projectos de I&D que a vinham a financiar. A FCCN continua a garantir a gestão dos servidores onde estão alojados os conteúdos e serviços, em www.linguateca.pt. A equipa de investigadores que desenvolveu a Linguateca está atenta aos programas que, a vários níveis, poderão vir a financiar futuras fases do projecto.
Para ver quem somos, visite a equipa da Linguateca.
Convém também referir que a Linguateca é/foi a continuação do projecto Processamento computacional do português decorrido no SINTEF de Maio de 1998 a Maio de 2000.
Modelo de funcionamento
O trabalho da Linguateca pode ser descrito através do modelo IRA (Informação - Recursos - Avaliação):
- Informação: mantemos um portal constantemente actualizado sobre o processamento computacional da língua portuguesa, contendo
- Catálogo de recursos (Corpora,
Léxicos e dicionários, Enciclopédias, Serviços envolvendo o processamento
computacional do português, Material didáctico, Comunicação social, Textos em português, etc.)
- Catálogo de actores (Grupos, centros
e institutos, Projectos, Projectos europeus, Projectos internacionais, Associações e
instituições, Empresas, Páginas pessoais, Ensino, Revistas sobre o português, etc.)
- Catálogo de ferramentas computacionais
- Catálogo de publicações sobre o processamento computacional da língua portuguesa
- um fórum sobre assuntos relacionados com o processamento computacional da língua portuguesa, contendo notícias, ofertas de emprego e anúncios de conferências e de cursos
- um repositório na rede de teses e outros trabalhos na área
- um sistema de procura sobre a área do processamento computacional do português, construído para facilitar a navegação no nosso portal (com quatro modalidades: procura por pessoas, procura por publicações, procura por palavras chave e procura em texto livre nas páginas apontadas pelo nosso portal)
- Recursos: Criámos e damos acesso através da rede ao um conjunto considerável de recursos para a engenharia da linguagem em português, assim como serviços que disponibilizam recursos. Veja-se acesso a recursos para uma apresentação detalhada. Entre os mais conhecidos e usados encontram-se o CETEMPúblico, o COMPARA, o Corpógrafo e o AC/DC. Refira-se também o jardim de ferramentas, que disponibiliza os próprios programas criados no âmbito da Linguateca.
- Avaliação: Neste campo dedicamo-nos sobretudo a promover o modelo de avaliação conjunta para o português. Organizámos as Morfolimpíadas, a primeira avaliação conjunta para a nossa língua, comparando analisadores morfológicos, temos participado na organização do CLEF desde 2004, e preparámos a primeira avaliação conjunta em identificação e reconhecimento de entidades mencionadas, o HAREM.
Além disso, a nossa actividade cobre também, sobretudo desde 2003, um esforço considerável em investigação, desenvolvimento e apoio aos nossos utilizadores.
Impacto do trabalho desenvolvido
Veja-se a informação sobre
Financiamento
A criação da Linguateca, e a sua organização, foi operacionalizada até 31 de Dezembro de 2011 através de um projecto coordenado e executado pela Fundação para a Computação Científica Nacional (responsável máximo: Pedro Veiga), financiado pelo MCTES, pela UMIC e pela FCT, assim como através dos seguintes meios:
- Projecto POSC 339/1.3/C/NAC, de 16 de Dezembro de 2006 a 31 de Dezembro de 2008
- Projecto POSI/PLP/43931/2001 (Centro de Recursos Distribuído para o Processamento Computacional da Língua Portuguesa), até 15 de Dezembro de 2006
- Projecto POSI - Eixo Prioritário 1: Desenvolver Competências / Medida 1.3 Investigação e Desenvolvimento; Projecto: Centro de Recursos Distribuído para o Processamento Computacional da Língua Portuguesa; Sub-Projecto Componente de Projecto de I&D; Período: 2003-2006;
- Projecto POSI - Eixo Prioritário 1: Desenvolver Competências /Medida 1.3 Investigação e Desenvolvimento; Projecto: Centro de Recursos Distribuído para o Processamento Computacional da Língua Portuguesa (Número de Origem: 4/1.3/C/NRE); Período: 2001-2003
Última actualização: 11 de julho de 2015.
Perguntas, comentários e sugestões