Un algoritmo lingüístico-estadístico para resumen automático de textos especializados

Iria Da Cunha; Juan-Manuel Torres-Moreno; Patricia Velazquez-Morales; Jorge Vivaldi

Un algoritmo lingüístico-estadístico para resumen automático de textos especializados

Autores

Iria Da Cunha LIA/IULA
Juan-Manuel Torres-Moreno Laboratoire Informatique d'Avignon
Patricia Velazquez-Morales
Jorge Vivaldi IULA

Palavras-chave:

sumarização, modelos linguísticos, modelos estatísticos, Cortex, Disicosum, Enertex

Resumo

En este trabajo se presenta un nuevo algoritmo de resumen automático de textos especializados, en concreto del dominio médico, que aúna estrategias lingüísticas y estadísticas. La novedad del artículo radica en la correcta combinación de dichas estrategias de cara a demostrar que los sistemas híbridos pueden obtener mejores resultados que los sistemas estadísticos o lingüísticos por sí solos. Se aplica el algoritmo sobre un corpus de textos médicos y se evalúa siguiendo el protocolo de NIST y utilizando el paquete Rouge. Se obtienen excelentes resultados en comparación con otros sistemas y se observa que los resúmenes realizados son muy similares a los de los especialistas del dominio.

Biografia do Autor

Juan-Manuel Torres-Moreno, Laboratoire Informatique d'Avignon

Responsable del Equipo de Procesamiento de Lenguaje Natural (LIA)

Downloads

PDF (inglês)

Publicado

2009-11-21

Edição

Vol. 1 N.º 2

Secção

Artigos de Investigação

Licença

Ao publicar na presente revista, os autores concordam com os seguintes termos:

os direitos sobre a obra pertencem aos autores, que apenas concedem à Linguamática o direito de primeira publicação sob a licença Creative Commons, que permite que outros possam redistribuir a obra desde que acompanhada de referência ao autor e à Linguamática.
os autores podem estabelecer outros contratos para a distribuição não exclusiva da obra, desde que mencionem que a sua primeira publicação foi efectuada na Linguamática.
para aumentar as referências ao seu trabalho, os autores são encorajados a disponibilizar a obra, como "pré-publicação", antes de ou durante o processo de apreciação pela Linguamática, por exemplo em repositórios institucionais ou nas suas páginas pessoais na rede.

Como Citar

Un algoritmo lingüístico-estadístico para resumen automático de textos especializados. (2009). Linguamática, 1(2), 67-79. https://linguamatica.com/index.php/linguamatica/article/view/33