Casos de éxito

Mireia Farrús: “La tecnología puede normalizar una lengua como el catalán”

Mireia Farrús Cabeceran trabaja en dos campos que quizás a simple vista no tienen nexos de unión, pero que pueden interconectarse. Farrús estudió física y lingüística y ahora centra su investigación en la tecnología del habla y la prosodia, concretamente de la lengua catalana. Dice que «la voz es el reflejo del alma» y la suya evoca serenidad y didáctica en un tema tan complejo y con tantas aplicaciones como es la lingüística computacional: accesibilidad, detección de enfermedades o normalización del catalán en el ámbito digital.

Estudió Física y después Lingüística; ¿cómo une estos dos campos?

Siempre me habían gustado las matemáticas y la lengua. Me apasionaban la lógica, las estructuras sintácticas, los formalismos con los que podemos describir el mundo. Dudé mucho entre Matemáticas y Filología, y al final el profesor de Física de COU, que era muy bueno, hizo que me decantara por la física. También había estudiado música durante muchos años, y la parte de acústica me encantaba: entender cómo se transmite el sonido, el habla, la fonética… Y así terminé estudiando Física y Lingüística, que para mí tienen muchos puntos en común, y haciendo un doctorado sobre el reconocimiento del locutor, que tiene como objetivo identificar a las personas de forma automática a partir de su voz.

Y entonces se centra en la lingüística computacional. ¿Qué es exactamente?

La lingüística computacional es el tratamiento informático del lenguaje. Desarrollamos herramientas relacionadas con la lengua que facilitan la comunicación entre nosotros o con las máquinas. La traducción automática, por ejemplo, es una de las aplicaciones estrella de la lingüística computacional. Actualmente, cada vez tienen más popularidad las aplicaciones que funcionan con la voz, como el reconocimiento del habla, en el que se intenta simular computacionalmente la comprensión humana: tú hablas y una máquina lo entiende y lo transcribe. O la síntesis del habla, que simula el proceso contrario: tú pasas un texto y la máquina lo lee. Y con estas tecnologías se pueden crear asistentes virtuales que funcionen con la voz, como Siri o Alexa, los cuales, además de entender lo que dices, pueden establecer un diálogo con la información que tienen almacenada.

¿Pueden la síntesis y el reconocimiento del habla tener una aplicación en cuestiones de accesibilidad, uno de los grandes retos de esta década en materia social?

Sin duda. Es imprescindible trabajar en el componente social de estas tecnologías. Tanto el reconocimiento como la síntesis del habla pueden aplicarse también a las necesidades concretas de una persona. A una persona con problemas auditivos le puede ir bien utilizar un reconocedor del habla y tener por escrito lo que se está diciendo, ya que así lo podrá leer. Para una persona con dificultades visuales, tener una máquina que lea el diario le facilitará su lectura. Es muy importante que estos sistemas funcionen, y sobre todo que estén al alcance de todos y adaptados a las necesidades de cada grupo de usuarios. También es importante que las voces que generan estos sistemas no sean robóticas, sino que sean voces expresivas que se asemejen al máximo a la voz humana. La expresividad y la naturalidad a veces son difíciles de conseguir, y nosotros investigamos las características de la voz humana en cuanto a entonación, prosodia, expresión, etc., para poder incorporarlas a estos sistemas.

También trabaja con profesionales de la medicina para detectar desórdenes clínicos a través del habla

Sí. Se dice a veces que la voz es el reflejo del alma. Cuando hablamos decimos muchas más cosas, aparte del mensaje que queremos transmitir: cómo somos, qué edad tenemos, si somos hombres o mujeres, si estamos cansados, contentos, preocupados… La voz puede reflejar tanto nuestro estado emocional como nuestra condición física, y por tanto a través de la voz podemos detectar posibles enfermedades, tanto físicas como emocionales. Y no sólo a partir de la voz en sí, que tiene unas características determinadas, sino también por la forma de hablar, de transmitir un contenido lingüístico: el vocabulario, las construcciones sintácticas y discursivas, la entonación, etc. Y aquí es donde la lingüística juega un papel importante.

¿Y qué pueden detectar con el habla?

A nivel físico, enfermedades como la EPOC (enfermedad pulmonar obstructiva crónica), por ejemplo, que parecen tener un impacto en las características de la voz, pero también en el modo de hablar. La lengua es un proceso cognitivo muy importante, y por tanto también se refleja en desórdenes cognitivos o cambios emocionales, como el trastorno bipolar o el Alzheimer. Así, por ejemplo, una persona deprimida hablará con una entonación mucho más plana. Éste es un fenómeno que también se observa en personas que sufren Alzheimer, además de utilizar un vocabulario más genérico, o estructuras sintácticas particulares. El habla nos permite realizar una detección precoz de la enfermedad mediante algoritmos de aprendizaje automático y actuar rápidamente, así como monitorizar su evolución sin necesidad de que cada semana el paciente acuda al médico a someterse a un análisis exhaustivo. Hay que tener en cuenta, sin embargo, que lo que proporcionamos es un indicador de alerta, una ayuda al médico, y no un diagnóstico. Pero no sólo hacemos investigación en estos temas, sino que trabajamos también directamente con empresas para implementarlo en aplicaciones reales.

Hace pocos meses la Plataforma per la Llengua advertía que el catalán había perdido más de medio millón de hablantes en los últimos dieciséis años. ¿Cómo puede ayudar la tecnología a revertir esta situación?

La tecnología puede normalizar un idioma como el catalán. Hoy en día todo es digital; por tanto, si una lengua no sube al tren de la digitalización, no tiene nada que hacer. No sólo los productos audiovisuales deben ser en catalán, también deben ser en catalán los videojuegos y otras aplicaciones informáticas. En el caso de los videojuegos y otras aplicaciones, que suelen utilizar un vocabulario reducido, es tan fácil como traducir los comandos automáticamente e implementar un sintetizador del habla cuando sea necesario. Si desarrollamos las tecnologías necesarias y las hacemos abiertas y libres, con apoyo institucional, las empresas lo tendrán mucho más fácil para implementar el catalán en todas sus aplicaciones. Otro ejemplo: subtitular manualmente es muy costoso, pero si cuentas con un sistema de reconocimiento del habla y de traducción automática al catalán que funcione bien, puedes subtitular miles de películas y series. Ahora bien, todo esto debe ir acompañado del uso social de la lengua, si no, no haremos nada.

Sin embargo, existe el problema añadido de que el catalán es una lengua minorizada y en un contexto de diglosia

El catalán se encuentra en una situación de minorización; existe una lengua dominante que se nos come, y el catalán corre el peligro de acabar siendo prescindible. Por lo que respecta a los recursos computacionales del catalán, este contexto también puede ser una oportunidad. Los sistemas actuales se basan en redes neuronales, en algoritmos matemáticos muy potentes. El problema es que necesitan muchísimos datos, millones de datos. Esto se lo puede permitir el inglés, el chino, el castellano y pocas lenguas más. Ahora hay algoritmos que permiten adaptar un sistema que utiliza una lengua con muchos datos a una lengua con menos datos, y cuanto más se le parezca lingüísticamente, mejor. Todos estos avances debemos aprovecharlos para impulsar las tecnologías en las lenguas minoritarias y minorizadas.

Más sobre Mireia Farrús

El mejor invento de la historia

Sin duda, los inventos que han salvado vidas, como la penicilina. Como física diría el telescopio, porque es el instrumento clave que marca el inicio de la ciencia moderna. Y como lingüista me gusta la imprenta, que democratizó los libros y representó una revolución contra el poder de la Iglesia.

¿Qué le gustaría ver en un futuro?

En la universidad me gustaría ver una mayor colaboración entre los investigadores y menos egos. También que se reconociera más la parte docente y no sólo la investigación. Y en el ámbito lingüístico, un mayor reconocimiento hacia las lenguas, sobre todo las minorizadas, porque son un tesoro de la humanidad.

Un avance del futuro que le dé miedo

Todo lo que tiene que ver con la inteligencia artificial y su uso. Llegará un momento en que una máquina podrá reproducir todas las características del ser humano, no sólo nuestra voz, y nos surgirán muchas dudas éticas.

Un referente

Citaré a tres clásicos: Galileo como gran divulgador, porque empezó a divulgar en italiano en un momento en que toda la ciencia estaba en latín; Einstein, porque es otra dimensión de pensamiento, y Maria Skłodowska (Marie Curie) como referente femenino.

La FBG es…

¡Ha sido un descubrimiento! Un puente con la realidad, y con un equipo humano fantástico que te apoya en todo lo que necesitas.

Comparte esta entrada:

¿Tienes un caso de éxito de innovación y te gustaría compartirlo?

Contacta con nosotros a través de comunicacio@fbg.ub.edu y explícanos tu proyecto

Haremos visible la labor de transferencia de la UB

Utilitzem cookies de tercers amb finalitats tècniques i analítiques. Si continua navegant vol dir que accepta la nostra política de cookies. Més informació,plugin cookies política de cookies.

ACEPTAR
Aviso de cookies