Centre d’innovació i Tecnologia BARCELONATECH

TALP UPC

Tecnologies i Aplicacions del Llenguatge i de la Parla

El Centre de Tecnologies i Aplicacions del Llenguatge i de la Parla, està especialitzat en el processament automàtic del llenguatge natural, tant oral com escrit, amb l’objectiu de vèncer les barreres lingüístiques, facilitant la interacció entre persones, entre persones i dispositius, i l'accessibilitat a la informació multilingüe.

El Centre TALP es va constituir en 1998, està format per un equip de 50 persones i és membre del Clúster català de les Indústries de la Llengua(CLUSTERLINGUA).

TALP treballa en les següents àmbits d'expertesa en R+D:

Reconeixement automàtic de la parla

Transformar la veu en text, possibilitant que les màquines entenguin el que una persona diu i en puguin interpretar les ordres orals.

Síntesi de veu

Conversió d’un text en veu, generant una prosòdia intel·ligible i natural, i adequada a cada aplicació.

Mineria de textos

Explotació del coneixement contingut en textos, amb finalitats diverses: Recuperació de la informació; extracció d'informació (dotar d'estructura el coneixement no estructurat contingut en els textos, extreure fets, esdeveniments, o característiques rellevants descrites en el text); Resum automàtic (resumir un o més documents per a facilitar-ne la comprensió i l'accés); Resposta a preguntes (Question Answering: trobar la resposta a una pregunta concreta en una col·lecció de documents).

Sistemes de diàleg home-màquina

Sistemes capaços de conversar amb un humà mantenint estructures coherents, amb una finalitat determinada (proporcionar la informació requerida, efectuar una venda o una comanda, etc.)

Reconeixement de veu i àudio

Identificar una persona a partir de les característiques de la veu (biometria); identificar la llengua o dialecte que es parla, detectar l'estat emocional del parlant; distingir si l'àudio correspon a parla, música, aplaudiments, soroll ambiental, o un altre tipus de so; filtrar senyals acústiques rellevants en entorns sorollosos.

Traducció automàtica

Traducció de text o veu d'una llengua a una altra, possibilitant l'accés a la informació multilingüe, subtitulació automàtica de mitjans audiovisuals, etc.

Processadors lingüístics

Anàlisi lingüística de textos, com a pas previ per a qualsevol aplicació que requereixi un cert grau de comprensió de la llengua. Anàlisi morfològica; desambiguació morfo-sintàctica; detecció de grups i sintagmes; construcció d'un arbre sintàctic, anàlisi semàntica (desambiguació de sentits, de rols, de la coreferència, etc).

TALP és un dels principals contribuïdors al clúster de computació del departament de Llenguatges i Sistemes Informàtics (LSI) de la UPC. Des de 2004 compta amb una sala intel·ligent que permet estudiar la parla en un context més natural. També compta amb el laboratori multimèdia del departament de Teoria del Senyal i Comunicacions (TSC), amb les prestacions d'un estudi de gravació d'àudio i TV.


La tecnologia de TALP ha generat dues spin-off: Verbio Technologies (creada el 1999) i HERTASECURITY (creada el 2009).

El sectors on tenen aplicació aquestes tecnologies són, entre d’altres:

Mitjans de comunicació escrits o parlatsAglomeració d'opinions online i recomanació de continguts o productesAnàlisi de reputació onlineAssistents virtuals (aprenentatge de llengües, compra online, sector automobilístic, mèdic, turístic, etc)Assistència a discapacitats amb problemes cognitius, de parla o d'audicióMineria de text en diferents dominis (mèdic, financer, etc.)Serveis d'assistència a la traduccióAtenció al client, call-centersSeguretat i monitorització acústicaIndústria d'entreteniment: doblatge de pel·lícules, subtitulació…

http://www.talp.upc.edu/ | info.cit@upc.edu | +34 93 405 46 90 | +34 93 405 44 19

  • Segona Veu

    TALP UPC desenvolupa diferents tecnologies de la parla aplicables al sector mèdic, amb l’objectiu d’oferir un sintetitzador de veu, adaptat a pacients que han perdut -total o parcialment- la veu després d’un procés operatori que afecti a les cordes vocals. El projecte es desenvolupa amb el suport del programa INNPACTO i es desenvolupa conjuntament amb les Universidades de Vigo  i del Pais Vasco. El treball de TALP UPC es centra en adaptar la síntesi de veu a cada persona, aplicant models d'aprenentatge conexionista (p.ex. xarxes neuronals) al reconeixement automàtic de la parla de persones amb veu distorsionada, com a resultat d'una intervenció quirúrgica.

    Veu 1 - Veu 2

  • BUSCAMEDIA

    Projecte que persegueix aconseguir un significatiu avanç en les àrees de semàntica, producció audiovisual i distribució de media enriquit amb independència de xarxes i terminals de consum, amb l’objectiu de crear un buscador semàntic multimèdia únic en el món. TALP ha participat amb assessorament en el desenvolupament de tecnologia de la parla, subcontractat per TV3.

    Declaracions sobre el sistema que subtitula i tradueix programes.

  • XLike

    Projecte europeu amb l'objectiu de desenvolupar tecnologia per monitoritzar i agrupar coneixement dispers per les xarxes socials, així com habilitar serveis cross-lingüistics per editors de continguts, monitoritzar els mitjans, o extreure informació rellevant amb finalitats financeres o comercials. Es basa en analitzar el text per crear una representació semàntica independent de l'idioma original,  sobre la qual es poden aplicar tècniques de mineria de dades i intel·ligència empresarial.

  • FreeLing

    Llibreria de codi obert que ofereix serveis d'anàlisi lingüística i pot ser usada com a base per desenvolupar aplicacions de processament de la llengua. Es llicencia per a usos comercials. Demo