Centre d’innovació i Tecnologia BARCELONATECH

TALP UPC

Tecnologías y Aplicaciones del Lenguaje y del Habla

El Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla, está especializado en el procesamiento automático del lenguaje natural, tanto oral como escrito, con el objetivo de vencer las barreras lingüísticas, facilitando la interacción entre personas, entre personas y dispositivos, y la accesibilidad a la información multilingüe.

TALP UPC se constituyó en 1998, está formado por un equipo de 50 personas y es miembro del Clúster Catalán de las Industrias de la Lengua(CLUSTERLINGUA).

El Centro trabaja en las siguientes ámbitos de I+D:

Síntesis de voz

Conversión de un texto en voz, generando una prosodia inteligible y natural, y adecuada a cada aplicación.

Sistemas de diálogo hombre- máquina

Sistemas capaces de conversar con un humano manteniendo estructuras coherentes, con una finalidad determinada (proporcionar la información requerida, efectuar una venta o un pedido…)

Traducción automática

Traducción de texto o voz de una lengua a otra, posibilitando el acceso a la información multilingüe, subtitulación automática de medios audiovisuales...

Reconocimiento automático del habla

Transformar la voz en texto, posibilitando que las máquinas entiendan lo que una persona dice y que pueda interpretar las órdenes orales.

Minería de textos

Explotación del conocimiento contenido en textos, con finalidades diversas: Recuperación de la información; extracción de información (dotar de estructura el conocimiento no estructurado contenido en los textos, extraer hechos, acontecimientos, o características relevantes descritas en el texto); Resumen automático (resumir uno o más documentos para facilitar su comprensión y el acceso); respuesta a preguntas (Question Answering: encontrar la respuesta a una pregunta concreta en una colección de documentos).

Reconocimiento de voz y audio

Identificar una persona a partir de las características de la voz (biometría); identificar la lengua o dialecto que se habla, detectar el estado emocional del hablante; distinguir si el audio corresponde a habla, música, aplausos, ruido ambiental , o un otro tipo de sonido; filtrar señales acústicas relevantes en entornos ruidosos.

Procesadores lingüísticos

Análisis lingüístico de textos, como paso previo para cualquier aplicación que requiera un cierto grado de comprensión de la lengua. Análisis morfológico; desambiguación morfo- sintáctica; detección de grupos y sintagmas; construcción de un árbol sintáctico, análisis semántico (desambiguación de sentidos, de roles, de la correferencia…).

TALP UPC es uno de los principales contribuidores al clúster de computación del departamento de Lenguajes y Sistemas Informáticos (LSI) de la UPC . Desde 2004 cuenta con una sala inteligente que permite estudiar el habla en un contexto más natural. También cuenta con el laboratorio multimedia del departamento de Teoría de la Señal y Comunicaciones (TSC) , con las prestaciones de un estudio de grabación de audio y TV.

La tecnología de TALP ha generado dos spin- off: Verbio Technologies (creada en 1999) y HERTASECURITY en 2009).


Los sectores donde tienen aplicación estas tecnologías son, entre otros:

Medios de comunicación escritos o habladosAglomeración de opiniones online y recomendación de contenidos o productosAnálisis de reputación onlineAsistentes virtuales (aprendizaje de lenguas, compra online, sector automovilístico, médico, turístico…) Asistencia a discapacitados con problemas cognitivos, de habla o de audición Minería de texto en diferentes dominios (médico, financiero… ) Servicios de asistencia a la traducciónAtención al clienteCall - centersSeguridad y monitorización acústicaIndustria del entretenimiento: doblaje de películas, subtitulación...

http://www.talp.upc.edu/ | info.cit@upc.edu | +34 93 405 46 90 | +34 93 405 44 19

  • Segunda voz

    TALP UPC desarrolla diferentes tecnologías del habla, aplicables al sector médico. El objetivo es ofrecer un sintetizador de voz adaptado a pacientes con pérdida total o parcial de la voz tras una intervención quirúrgica que afecte a sus cuerdas vocales. El proyecto se desarrolla en el marco del programa INNPACTO y se desarrolla conjuntamente con las Universidades de Vigo y del Pais Vasco. El trabajo de TALP UPC se centra en adaptar la síntesis de voz a cada persona, aplicando modelos de aprendizaje conexionista (p.e. redes neuronales) al reconocimiento automático del habla de personas con voz distorsionada, como  resultado de una intervención quirúrgica.

    Voz 1 - Voz 2

  • BUSCAMEDIA

    Proyecto que persigue conseguir un avance significativo en las áreas de la semántica, producción audiovisual y distribución de media enriquecido con independencia de redes y terminales de consumo, con el objetivo de crear un buscador semántico multimedia único en el mundo. TALP ha participado con asesoramiento en el desarrollo de tecnologías del habla, siendo subcontratado por TV3.

    Declaraciones sobre el sistema que subtitula y traduce programas de televisión

  • XLike

    Proyecto europeo con el objetivo de desarrollar tecnología para monitorizar y agrupar conocimientos dispersos por las redes sociales, así como habilitar servicios cross-linguísticos para editores de contenidos, monitorizar los medios, o extraer información relevante con finalidades financieras o comerciales. Se basa en analizar el texto para crear una representación semántica independientemente del idioma original, sobre la cual se pueden aplicar técnicas de minería de datos e inteligencia empresarial.

  • Freeling

    Librería de código abierto que ofrece servicios de análisis lingüística y puede ser usada como base para desarrollar aplicaciones de procesamiento de la lengua. Tiene licencia para usos comerciales.

    Demo