Leva-e-traz, um protótipo de meta buscador para português

Recurso disponibilizado pela Linguateca


Este protótipo foi criado no âmbito do trabalho de doutorado de Rachel Aires,

Uso de marcadores estilísticos para a busca na Web em português. ICMC, Universidade de São Paulo, Brasil. Data de entrega: agosto de 2005.

O Leva-e-traz executa as consultas digitadas pelo usuário no Google e no AlltheWeb; pega os primeiros 10 resultados de cada uma das máquinas de busca e elimina os resultados repetidos.

O download das páginas que precede o cálculo das features encarece o processo de classificação, fazendo com que o tempo de resposta possa chegar a pouco mais de três minutos.

O Leva-e-traz classifica os resultados por gêneros, tipos textuais, necessidades de busca e necessidades personalizadas. Permite, também, a criação de necessidades personalizadas. Através de sua tela principal, é possível também obter resultados sem qualquer classificação.

A tese de doutoramento referida anteriormente inclui mais detalhes sobre este protótipo.

Para o seu funcionamento o protótipo necessita de um atomizador. É necessário indicar a localização de um atomizador no arquivo "all2txt.c" do diretório "fontes" e em seguida compilar este arquivo como "all2txt.exe" para o diretório "bin".

A biblioteca Lingua-PT-PLNbase por exemplo inclui um atomizador para o português, embora nunca tenhamos testado o Leva-e-traz com este atomizador.

O Leva-e-traz pode ser obtido em levaetraz.tar.gz

Para mais informações, contatar Rachel Aires.


Última atualização: 2 de Fevereiro de 2009.
Perguntas, comentários e sugestões