Explorando Técnicas de Aprendizado em Modelos de Linguagem  para Classificação de Discurso de Ódio e Ofensivo em Português

Gabriel Assis; Annie Amorim; Jonnathan  Carvalho; Mariza Ferro; Daniel de Oliveira; Daniela Vianna; Aline Paes

doi:10.21814/lm.16.2.446

Explorando Técnicas de Aprendizado em Modelos de Linguagem para Classificação de Discurso de Ódio e Ofensivo em Português

Autores

Gabriel Assis Universidade Federal Fluminense https://orcid.org/0009-0000-2674-0427 (não autenticado)
Annie Amorim Universidade Federal Fluminense https://orcid.org/0009-0000-6678-4723 (não autenticado)
Jonnathan Carvalho Instituto Federal Fluminense https://orcid.org/0000-0003-0983-2308 (não autenticado)
Mariza Ferro Universidade Federal Fluminense https://orcid.org/0000-0003-0191-582X (não autenticado)
Daniel de Oliveira Universidade Federal Fluminense https://orcid.org/0000-0001-9346-7651 (não autenticado)
Daniela Vianna JusBrasil https://orcid.org/0000-0003-2943-5211 (não autenticado)
Aline Paes Universidade Federal Fluminense https://orcid.org/0000-0002-9089-7303 (não autenticado)

DOI:

https://doi.org/10.21814/lm.16.2.446

Palavras-chave:

Transformers, classificação, discurso de ódio

Resumo

As Redes Sociais, que desempenham um papel significativo no debate e na comunicação moderna, enfrentam o desafio contemporâneo do grande volume desordenado de conteúdo nocivo, como discurso de ódio e desinformação. Este artigo aborda a detecção de discurso de ódio em português, considerando suas particularidades linguísticas e nuances culturais. Utilizando-se modelos derivados de Transformers, juntamente com diversas estratégias de treinamento e ativação, são investigados nove modelos com variações em arquitetura, tamanho e corpora de pré-treinamento. Os resultados obtidos demonstram que, apesar de grandes modelos generativos acessados via prompts apresentarem resultados promissores, modelos de linguagem de menor escala ajustados permanecem superiores na realização dessa delicada tarefa.

Downloads

Publicado

2024-12-27

Edição

Vol. 16 N.º 2

Secção

PROPOR 2024 | Artigos Convidados

Licença

Ao publicar na presente revista, os autores concordam com os seguintes termos:

os direitos sobre a obra pertencem aos autores, que apenas concedem à Linguamática o direito de primeira publicação sob a licença Creative Commons, que permite que outros possam redistribuir a obra desde que acompanhada de referência ao autor e à Linguamática.
os autores podem estabelecer outros contratos para a distribuição não exclusiva da obra, desde que mencionem que a sua primeira publicação foi efectuada na Linguamática.
para aumentar as referências ao seu trabalho, os autores são encorajados a disponibilizar a obra, como "pré-publicação", antes de ou durante o processo de apreciação pela Linguamática, por exemplo em repositórios institucionais ou nas suas páginas pessoais na rede.

Como Citar

Explorando Técnicas de Aprendizado em Modelos de Linguagem para Classificação de Discurso de Ódio e Ofensivo em Português. (2024). Linguamática, 16(2), 91-113. https://doi.org/10.21814/lm.16.2.446