Extracção de Informação de Relatórios Médicos

  • Liliana da Silva Ferreira IEETA / Universidade de Aveiro
  • César Telmo Oliveira IEETA / UA / HIP
  • António Joaquim da Silva Teixeira IEETA / UA
  • João Paulo da Silva Cunha IEETA / UA

Resumo

A utilização, cada vez mais frequente nos serviços de saúde nacionais, de sistemas de Registo Clínico Electrónico tem levado a um aumento significativo da Informação disponível em formato electrónico. Embora muita desta informação exista, actualmente, numa forma estruturada, uma parte significativa encontra-se sob a forma de texto livre não estruturado. A necessidade de processar e gerir estas grandes quantidades de texto tem motivado o recente interesse em aproximações semânticas. Este artigo descreve o trabalho desenvolvido no âmbito do projecto MedAlert para a criação de um corpus anotado semanticamente e no desenvolvimento de um sistema de extracção automática de informação capaz de identificar entidades clínicas relevantes, bem como os seus relacionamentos. Para tal, o MedAlert possui actualmente um corpus de cerca de 48 000 textos médicos relativos a episódios de internamento ocorridos no Hospital Infante D. Pedro, em Aveiro. Um subconjunto do corpus foi seleccionado para a criação das directivas de anotação e anotação semântica manual e automática. O sistema de reconhecimento de entidades mencionadas REMMA foi usado numa primeira avaliação. Os primeiros resultados são apresentados indicando a necessidade de desenvolver directivas precisas para a anotação de textos médicos, de modo a melhorar a concordância entre anotadores.

Publicado
2009-04-06
Como Citar
Ferreira, L. da S., Oliveira, C. T., Teixeira, A. J. da S., & da Silva Cunha, J. P. (2009). Extracção de Informação de Relatórios Médicos. Linguamática, 1(1), 89-101. Obtido de https://linguamatica.com/index.php/linguamatica/article/view/12
Edição
Secção
Artigos de Investigação