Classificação Automática de Textos por Período Literário Utilizando Compressão de Dados Através do PPM-C

  • Bruno Barufaldi Universidade Federal da Paraíba
  • Milton Marques Junior Universidade Federal da Paraíba
  • Eduardo Freire Santana Universidade Federal da Paraíba
  • JanKees van der Poel Universidade Federal da Paraíba
  • José Rogério Bezerra Barbosa Filho Universidade Federal da Paraíba
  • Leonardo Vidal Batista Universidade Federal da Paraíba

Resumo

Métodos e técnicas para compressão de dados têm sido utilizados para o reconhecimento de padrões, incluindo a classificação automática de textos. A eficiência do método Prediction by Partial Matching (PPM) como classificador textual já foi comprovada em diversos trabalhos, entre eles a atribuição de autoria para textos em português. As classes utilizadas no processo de classificação não precisam ficar restringidas a apenas um autor. Ao incluir dois ou mais autores numa mesma classe pode-se definir um estilo literário. Esse trabalho objetiva a aplicação do modelo estatístico PPM-C para a classificação de textos dos períodos literários da literatura brasileira.
Publicado
2010-04-07
Como Citar
Barufaldi, B., Junior, M. M., Santana, E. F., Poel, J. van der, Filho, J. R. B. B., & Batista, L. V. (2010). Classificação Automática de Textos por Período Literário Utilizando Compressão de Dados Através do PPM-C. Linguamática, 2(1), 35-43. Obtido de https://linguamatica.com/index.php/linguamatica/article/view/50
Edição
Secção
Artigos de Investigação