Professores publicam artigo na revista internacional Frontiers
Estudo com monitor da graduação une Computação, Linguística e Psiquiatria
O artigo “Na interface entre linguística, ciência da computação e psiquiatria: análise de fatores-chave textuais que influenciam a classificação da esquizofrenia baseada em BERT em textos de mídias sociais” foi publicado na revista internacional Frontiers. O trabalho é resultado da pesquisa de doutorado em Estudos da Linguagem (PUC-Rio) do auxiliar de curso João Victor Miranda e Silva, realizada em parceria com os professores do IMPA Tech Cilene Rodrigues e Emílio Brazil.
A pesquisa investiga padrões linguísticos associados à esquizofrenia (SZ) a partir de um experimento com o modelo de linguagem BERT – modelo baseado em redes neurais para Processamento de Linguagem Natural (PLN) capaz de entender o contexto de uma palavra com base em todo o texto ao seu redor, e não apenas sequencialmente.
“Foi um trabalho altamente colaborativo. Pensamos juntos em como analisar automaticamente e comparar estatisticamente dados linguísticos que dialoguem com achados prévios da linguística e psiquiatria, disse Silva.
O estudo utilizou um modelo baseado em transformadores para distinguir textos produzidos por pessoas com esquizofrenia e por pessoas sem o transtorno, integrando contribuições da linguística teórica e de abordagens computacionais.
Ao todo, foram analisadas 31.278 postagens da plataforma Reddit, um fórum online organizado em comunidades temáticas. Segundo os pesquisadores, um dos principais desafios foi equilibrar a quantidade e a qualidade dos dados utilizados. “Investimos bastante na curadoria dos dados, selecionando e revisando cuidadosamente o material. Ainda assim, é um processo trabalhoso, especialmente no contexto de mídias sociais”, afirma Silva.
Por outro lado, o uso de métodos computacionais permitiu analisar grandes volumes de dados linguísticos, algo pouco comum nas abordagens tradicionais da área. “A interdisciplinaridade nos permite combinar diferentes perspectivas sobre um mesmo problema, ampliando a compreensão dos fenômenos estudados”, acrescenta.
Os resultados indicam que modelos de linguagem podem contribuir para a identificação de padrões linguísticos associados à esquizofrenia. O estudo também destaca a importância da qualidade dos dados para garantir previsões confiáveis e aponta possíveis vieses — como a influência de palavras diretamente relacionadas ao transtorno — que precisam ser controlados para melhorar a capacidade de generalização dos modelos.
João Victor Silva atualmente é auxiliar de curso da disciplina Habilidades Linguísticas. Desde 2024, já atuou como monitor de Inglês e Introdução à Ciência de Dados. Em abril do ano passado, o jovem foi o palestrante convidado para o seminário acadêmico do IMPA Tech, quando apresentou os estudos preliminares da pesquisa aos estudantes do bacharelado em Matemática da Tecnologia e Inovação.
