Per què la traducció automàtica entre anglès i portuguès és significativament millor que la traducció automàtica entre holandès i espanyol? Per què els reconeixements de veu funcionen millor en alemany que en finès? El principal problema és la quantitat insuficient de dades etiquetades per a l’entrenament en ambdós casos. Tot i que el món és multimodal i altament multilingüe, la tecnologia de la parla i el llenguatge dona resposta satisfactòria per a tots els idiomes. Calen millors mètodes d'aprenentatge que aprofitin els avenços d'algunes modalitats i idiomes en benefici d'altres.
L’objectiu d’AMALEU és aprendre de manera automàtica una representació universal del llenguatge, ja sigui amb veu o text, de manera que es pugui explotar en aplicacions d’intel·ligència artificial per a diferents idiomes. El projecte també planteja utilitzar fonts d’informació no etiquetades, així com informació lingüística. El projecte es focalitza en el repte de l’aprenentatge a partir de pocs recursos i d’una aproximació per a la traducció automàtica multillenguatge.
AMALEU impactarà en comunitats altament multidisciplinàries d’especialistes en informàtica, matemàtiques, enginyeria i lingüística que treballen en aplicacions de comprensió del llenguatge natural, llenguatge natural i processament de la parla.
AMALEU està finançat pel Ministeri d’Economia i Competitivitat d’Espanya (MINECO), en el marc del programa Europa Excel·lència. El projecte té una durada de dos anys (gener 2019 - desembre 2020).