O procesamento da estrutura sintáctica nos modelos de linguaxe neurais: a concordancia suxeito-verbo en galego e portugués

Palavras-chave: modelos de linguaxe, sintaxe, concordancia suxeito-verbo, galego, portugués

Resumo

Combinando coñecementos das áreas de lingüística computacional e de psicolingüística, neste traballo explórase o coñecemento sintáctico dos modelos de linguaxe neurais, concretamente o principio da concordancia suxeito-verbo en galego e portugués. Co fin de estudar se os modelos procesan este fenómeno de forma semellante aos humanos, elaboráronse dous datasets (un en galego e outro en portugués) con 16 oracións e 8 variantes para cada unha delas, que teñen en conta a gramaticalidade, a presenza ou ausencia dun distractor e a distancia entre o suxeito e o verbo principal. Con estes elementos, realizáronse avaliacións de aceptabilidade a falantes destas linguas para comprobar a aceptabilidade das oracións en relación ás variables referidas. Cunha versión adaptada dos datasets, avaliáronse modelos de lingua neurais para galego e portugués. Os resultados parecen indicar que, aínda que tanto humanos coma modelos distinguen entre oracións gramaticais e agramaticais, os falantes amosan maior precisión e incluso se benefician dos distractores, mentres que estes confunden os LMs, especialmente en contextos longos.

Publicado
2026-01-13
Como Citar
Pérez Puente, H. (2026). O procesamento da estrutura sintáctica nos modelos de linguaxe neurais: a concordancia suxeito-verbo en galego e portugués. Linguamática, 17(2), 119-128. https://doi.org/10.21814/lm.17.2.498
Edição
Secção
Novas Perspectivas