Grupo de pesquisa desenvolve buscador para recuperação inteligente de informações

27/12/2019 - 16:14  •  Atualizado 30/12/2019 19:40
Compartilhe

O grupo de pesquisa de Recuperação Inteligente da Informação, do Programa de Pós-Graduação em Informática da Ufes, desenvolveu o aLine, um buscador de termos e informações com base nos jornais impressos capixabas A Tribuna e Metro, e também no jornal Informa, da Ufes. O aLine é uma ferramenta-laboratório para a mineração de dados sobre os acervos desses jornais, que traz resultados de quaisquer termos existentes nos documentos indexados e também gera gráficos da evolução quantitativa do uso dos termos na base, ao longo do tempo.

Os criadores do aLine, Marcos Spalenza e Matheus Nogueira, disseram que a ideia do aplicativo surgiu por uma demanda do grupo de pesquisa Observatório Saúde na Mídia - Regional ES que realizava buscas manuais nos documentos do acervo do jornal A Tribuna. O grupo precisava de uma ferramenta que realizasse buscas mais eficientes e rápidas com as palavras-chave "odontologia", "saúde bucal" e "dentista".

Na sua primeira missão, o aLine viabilizou o levantamento retrospectivo de todas as matérias relacionadas à saúde bucal, veiculadas no período de 17 de março de 2004 a 30 de junho de 2009, sendo coletadas 214 matérias. Essa coleta foi realizada em aproximadamente quatro dias, com oito horas de trabalho diárias (32 horas). Considerando que o tempo médio de leitura de um jornal completo - para posterior seleção das matérias - seja de três horas, para se ler o total de volumes de periódicos do estudo (1.933 volumes) seriam necessárias 5.799 horas ou 724 dias, trabalhando oito horas por dia. Portanto, o uso do sistema permitiu a economia de aproximadamente 720 dias de trabalho. Posteriormente, o aLine foi utilizado para a coleta de matérias relacionadas aos termos dengue e H1N1.

"Utilizar buscadores inteligentes para auxiliar pesquisas em acervos, em uma ou várias bases grandes, economiza muito tempo do usuário pesquisador", destacou Nogueira.

Método

A ferramenta indexa todos os termos/palavras dos documentos incorporados aos acervos, ao converter os documentos vindos de formatos pdf, ou outros formatos, para arquivos de texto. "Optamos por esse método, porque queremos que a indexação seja automática e que as buscas possam ser realizadas sobre qualquer termo que leve a um documento da base", disse Nogueira.

O primeiro protótipo do aLine foi desenvolvido em 2015 e contou com a participação de estudantes dos cursos da Ufes de Ciência da Computação, Física, Arquivologia, mestrado em Informática e doutorado em Ciência da Computação. Após muitos ajustes, a versão mais estável do aplicativo (1.0) foi concluída em janeiro de 2018. Segundo Nogueira, o trabalho de aperfeiçoamento do aplicativo continua e o próximo passo será inserir novas bases e tipos de dados, como imagens, áudios e vídeos.

O aLine está disponível para qualquer usuário no endereço vitoriavirtual.com.br/aline.


Texto: Hélio Marchioni
Edição: Thereza Marinho