Classificação da qualidade da argumentação em tweets no domínio da política brasileira

  • Cássio Faria da Silva Universidade Federal de São Carlos
  • Vânia Paula de Almeida Neris
  • Helena de Medeiros Caseli
Palavras-chave: avaliação da qualidade da argumentação, tweet, BERT, política brasileira

Resumo

A argumentação é uma habilidade inerente à comunicação humana, tanto em situações orais quanto escritas. Argumentos bem fundamentados são importantes para amparar a tomada de decisões e aprendizado, assim como para a obtenção de conclusões amplamente aceitas. Como área de pesquisa, a argumentação é um campo multidisciplinar que estuda os processos de debate e raciocínio. Em linguística computacional, investigações têm sido realizadas para (i) identificar argumentos e suas unidades e (ii) gerar ou (iii) avaliar a qualidade dos argumentos. No entanto, a maioria dos trabalhos atuais se concentra na mineração de argumentos em textos formais em inglês. Neste artigo, foi avaliada a qualidade da argumentação em tweets de domínio político, escritos em português do Brasil, usando algoritmos tradicionais de aprendizado de máquina -- como Regressão Logística, K-Nearest Neighbors, Árvores de Decisão, Máquinas de Vetores Suporte (SVM), Floresta Aleatória e Naive Bayes -- e também um ajuste fino de dois modelos neurais (BERTimbau e RobertaTwitterBR). Além de trazer resultados práticos para a avaliação da qualidade da argumentação em um gênero textual desafiador, como o Twitter, e em um domínio controverso, como a política brasileira, este artigo também visa suprir a carência de trabalhos que avaliem automaticamente a qualidade dos argumentos em português. Dentre os algoritmos de classificação avaliados, o modelo obtido a partir do ajuste fino do BERTimbau apresentou os melhores resultados com uma precisão de 69,65\% quando foram consideradas todas as classes e de 100,00\% para as mensagens de alta qualidade de argumentação.

Publicado
2023-07-07
Como Citar
Cássio Faria da Silva, Vânia Paula de Almeida Neris, & Helena de Medeiros Caseli. (2023). Classificação da qualidade da argumentação em tweets no domínio da política brasileira. Linguamática, 15(1), 103-127. https://doi.org/10.21814/lm.15.1.387
Edição
Secção
Artigos de Investigação