Detecção de posicionamentos a partir de textos usando expansão semiautomática de córpus
Resumen
A detecção computacional de posicionamentos---a tarefa de determinar, a partir de um texto de entrada, a atitude ou posição (e.g., favorável ou contrária) em relação a um tópico-alvo específico---geralmente depende de córpus rotulados com informações de posicionamentos para cada tópico de interesse. Uma vez que esses tópicos são em princípio ilimitados, a necessidade de novos córpus rotulados também o é. Como forma de amenizar algumas dessas dificuldades, este trabalho adapta para a detecção de posicionamento um método de expansão de córpus originalmente desenvolvido para a tarefa análoga de análise de sentimento. O método é então aplicado a um grande (46 mil instâncias) córpus de posicionamentos cobrindo seis temas de interesse político e/ou moral em português brasileiro, obtendo um aumento substancial no número de instâncias. Resultados de avaliação automática e humana sugerem que a adição de instâncias rotuladas semiautomaticamente ao conjunto de dados original não prejudica a precisão da classificação, e que os rótulos gerados automaticamente estão, em sua maioria, corretos.
Derechos de autor 2024 Camila Pereira e Ivandré Paraboni
Esta obra está bajo licencia internacional Creative Commons Reconocimiento 4.0.
Los autores que envíen sus trabajos a esta revista implícitamente estón de acuerdo con los siguientes términos:
- Los autores retienen los derechos de autor de sus trabajos, permitiendo a esta revista su primera publicación bajo licencia de Creative Commons Attribution License, que permite a otros acceder libremente, usar y compartir dicho trabajo, citando adecuadamente la autoría del trabajo y su presentación en esta revista.
- Los autores pueden prescindir de los términos de licencia de CC y acordar por su cuenta arreglos contractuales adicionales independientes para la distribución no exclusiva y posterior publicación de este trabajo (p.e., para incluirlo en un repositorio institucional o publicarlo en un libro), citando adecuadamente su publicación inicial en esta revista.
- Además, se anima a los autores a poner en línea su trabajo (p.e., en repositorios institucionales o en su propio sitio web) en cualquier momento antes o durante el proceso de envío, ya que eso puede conducir a intercambios productivos y a un número mayor y más temprano de citas del trabajo publicado (Ver The Effect of Open Access).