Classificação Automática de Textos por Período Literário Utilizando Compressão de Dados Através do PPM-C
Resumo
Métodos e técnicas para compressão de dados têm sido utilizados para o reconhecimento de padrões, incluindo a classificação automática de textos. A eficiência do método Prediction by Partial Matching (PPM) como classificador textual já foi comprovada em diversos trabalhos, entre eles a atribuição de autoria para textos em português. As classes utilizadas no processo de classificação não precisam ficar restringidas a apenas um autor. Ao incluir dois ou mais autores numa mesma classe pode-se definir um estilo literário. Esse trabalho objetiva a aplicação do modelo estatístico PPM-C para a classificação de textos dos períodos literários da literatura brasileira.
Publicado
2010-04-07
Como Citar
Barufaldi, B., Junior, M. M., Santana, E. F., Poel, J. van der, Filho, J. R. B. B., & Batista, L. V. (2010). Classificação Automática de Textos por Período Literário Utilizando Compressão de Dados Através do PPM-C. Linguamática, 2(1), 35-43. Obtido de https://linguamatica.com/index.php/linguamatica/article/view/50
Edição
Secção
Artigos de Investigação
Ao publicar na presente revista, os autores concordam com os seguintes termos:
- os direitos sobre a obra pertencem aos autores, que apenas concedem à Linguamática o direito de primeira publicação sob a licença Creative Commons, que permite que outros possam redistribuir a obra desde que acompanhada de referência ao autor e à Linguamática.
- os autores podem estabelecer outros contratos para a distribuição não exclusiva da obra, desde que mencionem que a sua primeira publicação foi efectuada na Linguamática.
- para aumentar as referências ao seu trabalho, os autores são encorajados a disponibilizar a obra, como "pré-publicação", antes de ou durante o processo de apreciação pela Linguamática, por exemplo em repositórios institucionais ou nas suas páginas pessoais na rede.