Explorando Técnicas de Aprendizado em Modelos de Linguagem  para Classificação de Discurso de Ódio e Ofensivo em Português

Gabriel Assis; Annie Amorim; Jonnathan  Carvalho; Mariza Ferro; Daniel de Oliveira; Daniela Vianna; Aline Paes

doi:10.21814/lm.16.2.446

Explorando Técnicas de Aprendizado em Modelos de Linguagem para Classificação de Discurso de Ódio e Ofensivo em Português

Gabriel Assis Universidade Federal Fluminense
Annie Amorim Universidade Federal Fluminense
Jonnathan Carvalho Instituto Federal Fluminense
Mariza Ferro Universidade Federal Fluminense
Daniel de Oliveira Universidade Federal Fluminense
Daniela Vianna JusBrasil
Aline Paes Universidade Federal Fluminense

DOI: https://doi.org/10.21814/lm.16.2.446

Resumen

As Redes Sociais, que desempenham um papel significativo no debate e na comunicação moderna, enfrentam o desafio contemporâneo do grande volume desordenado de conteúdo nocivo, como discurso de ódio e desinformação. Este artigo aborda a detecção de discurso de ódio em português, considerando suas particularidades linguísticas e nuances culturais. Utilizando-se modelos derivados de Transformers, juntamente com diversas estratégias de treinamento e ativação, são investigados nove modelos com variações em arquitetura, tamanho e corpora de pré-treinamento. Os resultados obtidos demonstram que, apesar de grandes modelos generativos acessados via prompts apresentarem resultados promissores, modelos de linguagem de menor escala ajustados permanecem superiores na realização dessa delicada tarefa.

PDF (Português (Portugal))

Publicado

2024-12-27

Cómo citar

Assis, G., Amorim, A., Carvalho, J., Ferro, M., de Oliveira, D., Vianna, D., & Paes, A. (2024). Explorando Técnicas de Aprendizado em Modelos de Linguagem para Classificação de Discurso de Ódio e Ofensivo em Português. Linguamática, 16(2), 91-113. https://doi.org/10.21814/lm.16.2.446

Descargar Cita

Número

Vol. 16 Núm. 2

Sección

PROPOR 2024 | Artículos Invitados

Derechos de autor 2024 Gabriel Assis, Annie Amorim, Jonnathan Carvalho, Mariza Ferro, Daniel de Oliveira, Daniela Vianna, Aline Paes

Esta obra está bajo licencia internacional Creative Commons Reconocimiento 4.0.

Los autores que envíen sus trabajos a esta revista implícitamente estón de acuerdo con los siguientes términos:

Los autores retienen los derechos de autor de sus trabajos, permitiendo a esta revista su primera publicación bajo licencia de Creative Commons Attribution License, que permite a otros acceder libremente, usar y compartir dicho trabajo, citando adecuadamente la autoría del trabajo y su presentación en esta revista.
Los autores pueden prescindir de los términos de licencia de CC y acordar por su cuenta arreglos contractuales adicionales independientes para la distribución no exclusiva y posterior publicación de este trabajo (p.e., para incluirlo en un repositorio institucional o publicarlo en un libro), citando adecuadamente su publicación inicial en esta revista.
Además, se anima a los autores a poner en línea su trabajo (p.e., en repositorios institucionales o en su propio sitio web) en cualquier momento antes o durante el proceso de envío, ya que eso puede conducir a intercambios productivos y a un número mayor y más temprano de citas del trabajo publicado (Ver The Effect of Open Access).