Un algoritmo lingüístico-estadístico para resumen automático de textos especializados

  • Iria Da Cunha LIA/IULA
  • Juan-Manuel Torres-Moreno Laboratoire Informatique d'Avignon
  • Patricia Velazquez-Morales
  • Jorge Vivaldi IULA
Palabras clave: resumen automatico, modelos linguisticos, modelos estadisticos, Cortex, Disicosum, Enertex

Resumen

En este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico, que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio.

Biografía del autor/a

Juan-Manuel Torres-Moreno, Laboratoire Informatique d'Avignon
Responsable del Equipo de Procesamiento de Lenguaje Natural (LIA)
Publicado
2009-11-21
Cómo citar
Da Cunha, I., Torres-Moreno, J.-M., Velazquez-Morales, P., & Vivaldi, J. (2009). Un algoritmo lingüístico-estadístico para resumen automático de textos especializados. Linguamática, 1(2), 67-79. Recuperado a partir de https://linguamatica.com/index.php/linguamatica/article/view/33
Sección
Artículos de investigación