Un algoritmo lingüístico-estadístico para resumen automático de textos especializados

Iria Da Cunha; Juan-Manuel Torres-Moreno; Patricia Velazquez-Morales; Jorge Vivaldi

Un algoritmo lingüístico-estadístico para resumen automático de textos especializados

Iria Da Cunha LIA/IULA
Juan-Manuel Torres-Moreno Laboratoire Informatique d'Avignon
Patricia Velazquez-Morales
Jorge Vivaldi IULA

Palabras clave: resumen automatico, modelos linguisticos, modelos estadisticos, Cortex, Disicosum, Enertex

Resumen

En este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico, que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio.

Biografía del autor/a

Juan-Manuel Torres-Moreno, Laboratoire Informatique d'Avignon

Responsable del Equipo de Procesamiento de Lenguaje Natural (LIA)

PDF (English)

Publicado

2009-11-21

Cómo citar

Da Cunha, I., Torres-Moreno, J.-M., Velazquez-Morales, P., & Vivaldi, J. (2009). Un algoritmo lingüístico-estadístico para resumen automático de textos especializados. Linguamática, 1(2), 67-79. Recuperado a partir de https://linguamatica.com/index.php/linguamatica/article/view/33

Descargar Cita

Número

Vol. 1 Núm. 2

Sección

Artículos de investigación

Los autores que envíen sus trabajos a esta revista implícitamente estón de acuerdo con los siguientes términos:

Los autores retienen los derechos de autor de sus trabajos, permitiendo a esta revista su primera publicación bajo licencia de Creative Commons Attribution License, que permite a otros acceder libremente, usar y compartir dicho trabajo, citando adecuadamente la autoría del trabajo y su presentación en esta revista.
Los autores pueden prescindir de los términos de licencia de CC y acordar por su cuenta arreglos contractuales adicionales independientes para la distribución no exclusiva y posterior publicación de este trabajo (p.e., para incluirlo en un repositorio institucional o publicarlo en un libro), citando adecuadamente su publicación inicial en esta revista.
Además, se anima a los autores a poner en línea su trabajo (p.e., en repositorios institucionales o en su propio sitio web) en cualquier momento antes o durante el proceso de envío, ya que eso puede conducir a intercambios productivos y a un número mayor y más temprano de citas del trabajo publicado (Ver The Effect of Open Access).