Extracción no supervisada de patrones sintácticos para la identificación de relaciones de oposición léxica en español

Palabras clave: extracción automática de antónimos, extracción automática de cohipónimos, lingüística computacional, relaciones léxicas, patrones sintácticos

Resumen

Los recursos léxicos son difíciles, costosos y requieren mucho tiempo para su producción y mantenimiento. En este trabajo, se propone una metodología para la extracción automática de relaciones léxicas de oposición, en particular de antónimos y cohipónimos, mediante patrones sintácticos yuxtapuestos, con el fin de contribuir a la construcción y expansión de recursos léxicos. A partir de un extenso corpus textual en español, reglas específicas y herramientas de análisis textual desarrolladas en Python, se implementó una metodología basada en tres módulos: (1) extracción de patrones de repetición, (2) filtración de cohipónimos mediante simetría, y (3) binarización de múltiples pares candidatos a antónimos. El sistema mostró un alto nivel de precisión en la clasificación de los cohipónimos y los antónimos, de acuerdo con una evaluación basada en anotaciones humanas. Los resultados demuestran que la metodología es capaz de identificar relaciones léxicas de oposición de manera eficiente, sin depender de recursos lingüísticos externos, lo cual puede contribuir al enriquecimiento y mantenimiento automatizado de recursos léxicos.

Publicado
2025-12-10
Cómo citar
Pimentel-Alarcón, A., Sierra, G., Gelbukh, A., & Sánchez-Montero, A. (2025). Extracción no supervisada de patrones sintácticos para la identificación de relaciones de oposición léxica en español. Linguamática, 17(2), preprint. Recuperado a partir de https://linguamatica.com/index.php/linguamatica/article/view/475
Sección
Artículos de investigación