AMALEU: Una representació universal del llenguatge basada en aprenentatge automàtic

Assistència tècnica sobre la rehabilitació als edificis 1, 2 i 4 de Can Bagaria
desembre 21, 2019
Estudi de manipuladors telescòpics (telehandlers) per a AUSA
desembre 16, 2019

El Centre de Tecnologies i Aplicacions del Llenguatge i la Parla (TALP) de la UPC participa en el projecte AMALEU (A Machine-Learned Universal Language Representation), en què es pretén tenir una representació universal del llenguatge basat en l’aprenentatge automàtic, una per a la llengua oral i una per a la llengua escrita.


 

Per què la traducció automàtica entre anglès i portuguès és significativament millor que la traducció automàtica entre holandès i espanyol? Per què els reconeixements de veu funcionen millor en alemany que en finès? El principal problema és la quantitat insuficient de dades etiquetades per a l’entrenament en ambdós casos. Tot i que el món és multimodal i altament multilingüe, la tecnologia de la parla i el llenguatge dona resposta satisfactòria per a tots els idiomes. Calen millors mètodes d'aprenentatge que aprofitin els avenços d'algunes modalitats i idiomes en benefici d'altres.

L’objectiu d’AMALEU és aprendre de manera automàtica una representació universal del llenguatge, ja sigui amb veu o text, de manera que es pugui explotar en aplicacions d’intel·ligència artificial per a diferents idiomes. El projecte també planteja utilitzar fonts d’informació no etiquetades, així com informació lingüística. El projecte es focalitza en el repte de l’aprenentatge a partir de pocs recursos i d’una aproximació per a la traducció automàtica multillenguatge.

AMALEU impactarà en comunitats altament multidisciplinàries d’especialistes en informàtica, matemàtiques, enginyeria i lingüística que treballen en aplicacions de comprensió del llenguatge natural, llenguatge natural i processament de la parla.

AMALEU està finançat pel Ministeri d’Economia i Competitivitat d’Espanya (MINECO), en el marc del programa Europa Excel·lència. El projecte té una durada de dos anys (gener 2019 - desembre 2020).