Projeto da Universidade do Minho sobre minorias em jornais vence Prémio Arquivo.pt
Uma equipa da Universidade do Minho vai receber esta quarta-feira o Prémio Arquivo.pt 2021, por ter criado uma plataforma que identifica e estuda as minorias nos jornais online. Paulo Martins, Leandro Costa e José Carlos Ramalho vão ser laureados às 17h15, no Centro de Congressos de Lisboa, na presença do Presidente da República e durante o encerramento do “Encontro Ciência 2021”. O prémio tem o valor de 10.000 euros, é promovido pela Fundação para a Ciência e a Tecnologia e distingue pelo quarto ano projetos que valorizem o serviço Arquivo.pt, que guarda milhões de páginas da web portuguesa.
“Estamos muito felizes por este reconhecimento, não estávamos à espera, havia muitos e bons candidatos”, sorriem Paulo Martins e Leandro Costa, ligados ao Departamento de Informática da UMinho. A plataforma, chamada “Major Minors”, ganha agora projeção, podendo até auxiliar quem estuda grupos minoritários, sub-representados ou alvo de estigma social, acrescentam. Em minors.ilch.uminho.pt pode consultar-se 16.286 artigos, com 4406 comentários associados, mas há também gráficos comparativos e detalhes como as figuras e os partidos mencionados. Os recortes são do período 2001-2019 e pertencem ao “Público”, o jornal com uma representação mais antiga e ampla no Arquivo.pt, mas a ideia é juntar em breve outros jornais e ano a ano.
Paulo Martins e Leandro Costa iniciaram o projeto em janeiro de 2020, no âmbito de duas disciplinas do mestrado em Engenharia Informática da UMinho, orientadas pelo professor José Carlos Ramalho. Desenvolveram um algoritmo que identifica automaticamente artigos, comentários e fotos com referência a oito grupos: refugiados, mulheres, homossexuais, animais, africanos, asiáticos, ciganos e migrantes. São também focadas questões de género ou raciais mais gerais. “Sabemos que há imensas subcategorias nas minorias e este é um ponto de partida, a intenção inicial foi apoiar interesses de alguns grupos científicos do Centro de Estudos Humanísticos da UMinho, que abordam temas como identidades, multiculturalismo, marginalização, linguística computacional e ética animal”, diz Paulo Martins.
O algoritmo que criaram permite “um mar de relações semânticas” para cada artigo, como o volume de vezes que nele surgem certas palavras e se o é no título, subtítulo ou corpo da notícia. Isso gera níveis de relevância nos artigos sobre minorias, quando num motor de busca como o Google aqueles poderiam aparecer na mesma ordem de importância, justifica Leandro Costa.
A plataforma está construída em camadas e de forma modelar, o que permite adaptar a outros temas e línguas, como estrangeirismos introduzidos, a evolução da linguagem e dos estigmas sobre certos grupos ou ainda o sentimento da carga negativa ou positiva da notícia. Os autores vão também convidar a comunidade científica a usar o “Major Minors”; a 1 e 2 de julho apresentam o projeto no 10º Symposium on Languages, Applications and Technologies (SLATE), em Esposende.