Un algoritmo lingüístico-estadístico para resumen automático de textos especializados

  • Iria Da Cunha LIA/IULA
  • Juan-Manuel Torres-Moreno Laboratoire Informatique d'Avignon
  • Patricia Velazquez-Morales
  • Jorge Vivaldi IULA
Keywords: summarization, linguistic models, statistic models, Cortex, Disicosum, Enertex

Abstract

En este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico, que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio.

Author Biography

Juan-Manuel Torres-Moreno, Laboratoire Informatique d'Avignon
Responsable del Equipo de Procesamiento de Lenguaje Natural (LIA)
Published
2009-11-21
How to Cite
Da Cunha, I., Torres-Moreno, J.-M., Velazquez-Morales, P., & Vivaldi, J. (2009). Un algoritmo lingüístico-estadístico para resumen automático de textos especializados. Linguamática, 1(2), 67-79. Retrieved from https://linguamatica.com/index.php/linguamatica/article/view/33
Section
Research Articles