Centre d’innovació i Tecnologia BARCELONATECH

TALP UPC

Tecnologies i Aplicacions del Llenguatge i de la Parla

El Centre de Tecnologies i Aplicacions del Llenguatge i de la Parla, està especialitzat en el processament automàtic del llenguatge natural, tant oral com escrit, amb l’objectiu de vèncer les barreres lingüístiques, facilitant la interacció entre persones, entre persones i dispositius, i l'accessibilitat a la informació multilingüe.

El Centre TALP es va constituir en 1998, està format per un equip de 50 persones i és membre del Clúster català de les Indústries de la Llengua(CLUSTERLINGUA).

TALP treballa en les següents àmbits d'expertesa en R+D:

Reconeixement automàtic de la parla

Transformar la veu en text, possibilitant que les màquines entenguin el que una persona diu i en puguin interpretar les ordres orals.

Síntesi de veu

Conversió d’un text en veu, generant una prosòdia intel·ligible i natural, i adequada a cada aplicació.

Mineria de textos

Explotació del coneixement contingut en textos, amb finalitats diverses: Recuperació de la informació; extracció d'informació (dotar d'estructura el coneixement no estructurat contingut en els textos, extreure fets, esdeveniments, o característiques rellevants descrites en el text); Resum automàtic (resumir un o més documents per a facilitar-ne la comprensió i l'accés); Resposta a preguntes (Question Answering: trobar la resposta a una pregunta concreta en una col·lecció de documents).

Sistemes de diàleg home-màquina

Sistemes capaços de conversar amb un humà mantenint estructures coherents, amb una finalitat determinada (proporcionar la informació requerida, efectuar una venda o una comanda, etc.)

Reconeixement de veu i àudio

Identificar una persona a partir de les característiques de la veu (biometria); identificar la llengua o dialecte que es parla, detectar l'estat emocional del parlant; distingir si l'àudio correspon a parla, música, aplaudiments, soroll ambiental, o un altre tipus de so; filtrar senyals acústiques rellevants en entorns sorollosos.

Traducció automàtica

Traducció de text o veu d'una llengua a una altra, possibilitant l'accés a la informació multilingüe, subtitulació automàtica de mitjans audiovisuals, etc.

Processadors lingüístics

Anàlisi lingüística de textos, com a pas previ per a qualsevol aplicació que requereixi un cert grau de comprensió de la llengua. Anàlisi morfològica; desambiguació morfo-sintàctica; detecció de grups i sintagmes; construcció d'un arbre sintàctic, anàlisi semàntica (desambiguació de sentits, de rols, de la coreferència, etc).

TALP és un dels principals contribuïdors al clúster de computació del departament de Llenguatges i Sistemes Informàtics (LSI) de la UPC. Des de 2004 compta amb una sala intel·ligent que permet estudiar la parla en un context més natural. També compta amb el laboratori multimèdia del departament de Teoria del Senyal i Comunicacions (TSC), amb les prestacions d'un estudi de gravació d'àudio i TV.


La tecnologia de TALP ha generat dues spin-off: Verbio Technologies (creada el 1999) i HERTASECURITY (creada el 2009).

El sectors on tenen aplicació aquestes tecnologies són, entre d’altres:

Mitjans de comunicació escrits o parlatsAglomeració d'opinions online i recomanació de continguts o productesAnàlisi de reputació onlineAssistents virtuals (aprenentatge de llengües, compra online, sector automobilístic, mèdic, turístic, etc)Assistència a discapacitats amb problemes cognitius, de parla o d'audicióMineria de text en diferents dominis (mèdic, financer, etc.)Serveis d'assistència a la traduccióAtenció al client, call-centersSeguretat i monitorització acústicaIndústria d'entreteniment: doblatge de pel·lícules, subtitulació…

http://www.talp.upc.edu/ | info.cit@upc.edu | +34 93 405 46 90 | +34 93 405 44 19

  • Asiya

    Aplicació de codi obert amb diferents mètriques per a l'avaluació de la similitud entre textos. Pot aplicar-se a l'avaluació de traductors automàtics, a l'agrupació de documents, o a qualsevol altra aplicació que requereixi mesures de similitud entre documents. Veure demo

  • Tecnologia per a la traducció de patents

    El Centre de Tecnologies i Aplicacions del Llenguatge i de la Parla (TALP UPC) ha col·laborat en el desenvolupament d'un conjunt d’eines per a la traducció de textos entre diversos idiomes, en temps real i d'alta qualitat. A partir de la hibridació entre gramàtiques sintàctic-semàntiques i traductors estadístics, TALP UPC ha creat una eina que permet la traducció automàtica de patents en tres idiomes (anglès, francès i alemany). Aquesta tecnologia s’ha desenvolupat en el marc del projecte Europeu MOLTO.

  • Nou observatori digital

    Investigadors del Centre de Tecnologies i Aplicacions del Llenguatge i de la Parla (TALP UPC) ha participat en un projecte pilot amb el Centro Nacional de Referencia de Aplicación de las Tecnologías de Información y la Comunicación (CENATIC) i la Secretaria d’Estat de Telecomunicacions i per la Societat de la Informació (SETSI) del Ministeri d'Indústria, Energia i Turisme, dins del marc del projecte "Innovation Support Platform" que aquests organismes estan desenvolupant. L'objectiu de la plataforma és permetre a aquestes institucions captar el pols de diferents sectors industrials, centrant-se en el sector TIC en el present projecte pilot. Per fer-ho, es monitoritzen de forma automàtica milers de documents relacionats amb el sector (patents, concursos, convocatòries, contractes...), creant un observatori digital de l'activitat de les empreses, que permeti detectar nous productes i iniciatives innovadores. TALP UPC ha adaptat les seves eines d'anàlisi textual per estructurar la informació dels textos a analitzar, possibilitant així el seu procés mitjançant motors de classificació de documents o de data mining.

  • Sintetitzador de veu per a pacients amb disàrtria