Explorando Técnicas de Aprendizado em Modelos de Linguagem para Classificação de Discurso de Ódio e Ofensivo em Português

  • Gabriel Assis Universidade Federal Fluminense
  • Annie Amorim Universidade Federal Fluminense
  • Jonnathan Carvalho Instituto Federal Fluminense
  • Mariza Ferro Universidade Federal Fluminense
  • Daniel de Oliveira Universidade Federal Fluminense
  • Daniela Vianna JusBrasil
  • Aline Paes Universidade Federal Fluminense
Palavras-chave: Transformers, classificação, discurso de ódio

Resumo

 As Redes Sociais, que desempenham um papel significativo no debate e na comunicação moderna, enfrentam o desafio contemporâneo do grande volume desordenado de conteúdo nocivo, como discurso de ódio e desinformação. Este artigo aborda a detecção de discurso de ódio em português, considerando suas particularidades linguísticas e nuances culturais. Utilizando-se modelos derivados de Transformers, juntamente com diversas estratégias de treinamento e ativação, são investigados nove modelos com variações em arquitetura, tamanho e corpora de pré-treinamento. Os resultados obtidos demonstram que, apesar de grandes modelos generativos acessados via prompts apresentarem resultados promissores, modelos de linguagem de menor escala ajustados permanecem superiores na realização dessa delicada tarefa.

Publicado
2024-12-27
Como Citar
Assis, G., Amorim, A., Carvalho, J., Ferro, M., de Oliveira, D., Vianna, D., & Paes, A. (2024). Explorando Técnicas de Aprendizado em Modelos de Linguagem para Classificação de Discurso de Ódio e Ofensivo em Português. Linguamática, 16(2), preprint. Obtido de https://linguamatica.com/index.php/linguamatica/article/view/446
Edição
Secção
PROPOR 2024 | Artigos Convidados