Un algoritmo lingüístico-estadístico para resumen automático de textos especializados

Autores

  • Iria Da Cunha LIA/IULA
  • Juan-Manuel Torres-Moreno Laboratoire Informatique d'Avignon image/svg+xml
  • Patricia Velazquez-Morales
  • Jorge Vivaldi IULA

Palavras-chave:

sumarização, modelos linguísticos, modelos estatísticos, Cortex, Disicosum, Enertex

Resumo

En este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico, que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio.

Biografia do Autor

  • Juan-Manuel Torres-Moreno, Laboratoire Informatique d'Avignon
    Responsable del Equipo de Procesamiento de Lenguaje Natural (LIA)

Referências

Downloads

Publicado

2009-11-21

Edição

Secção

Artigos de Investigação

Como Citar

Un algoritmo lingüístico-estadístico para resumen automático de textos especializados. (2009). Linguamática, 1(2), 67-79. https://linguamatica.com/index.php/linguamatica/article/view/33