Actualitat

Mireia Farrús: “La tecnologia pot normalitzar una llengua com el català”

Mireia Farrús Cabeceran treballa en dos camps que potser a simple vista no tenen nexes d’unió, però que poden interconnectar-se. Farrús va estudiar física i lingüística, i ara centra la seva recerca en la tecnologia de la parla i la prosòdia, concretament de la llengua catalana. Diu que “la veu és el reflex de l’ànima” i la seva evoca serenor i didàctica en un tema tan complex i amb tantes aplicacions com és la lingüística computacional: accessibilitat, detecció de malalties o normalització del català en l’àmbit digital.

Va estudiar Física i després Lingüística; com uneix aquests dos camps?

Sempre m’havien agradat les matemàtiques i la llengua. M’apassionaven la lògica, les estructures sintàctiques, els formalismes amb què podem descriure el món. Vaig dubtar molt entre Matemàtiques i Filologia, i al final el professor de Física de COU, que era molt bo, va fer que em decantés per la física. També havia estudiat música durant molts anys, i la part d’acústica m’encantava: entendre com es transmet el so, la parla, la fonètica… I així vaig acabar estudiant Física i Lingüística, que per a mi tenen molts punts en comú, i fent un doctorat sobre el reconeixement del locutor, que té com a objectiu identificar les persones de manera automàtica a partir de la seva veu.

I llavors se centra en la lingüística computacional. Què és exactament?

La lingüística computacional és el tractament informàtic del llenguatge. Desenvolupem eines relacionades amb la llengua que faciliten la comunicació entre nosaltres o amb les màquines. La traducció automàtica, per exemple, és una de les aplicacions estrella de la lingüística computacional. Actualment, cada vegada tenen més popularitat les aplicacions que funcionen amb la veu, com per exemple el reconeixement de la parla, en què s’intenta simular computacionalment la comprensió humana: tu parles i una màquina ho entén i ho transcriu. O la síntesi de la parla, que simula el procés contrari: tu passes un text i la màquina el llegeix. I amb aquestes tecnologies es poden crear assistents virtuals que funcionen amb la veu, com Siri o Alexa, els quals, a més d’entendre el que dius, poden establir un diàleg amb la informació que tenen emmagatzemada.

Poden la síntesi i el reconeixement de la parla tenir una aplicació en qüestions d’accessibilitat, un dels grans reptes d’aquesta dècada en matèria social?

Sens dubte. És imprescindible treballar en el component social d’aquestes tecnologies. Tant el reconeixement com la síntesi de la parla es poden aplicar també a les necessitats concretes d’una persona. A una persona amb problemes auditius li pot anar bé utilitzar un reconeixedor de la parla i tenir per escrit el que s’està dient, ja que així ho podrà llegir. Per a una persona amb dificultats visuals, el fet de tenir una màquina que llegeixi el diari li’n facilitarà la lectura. És molt important que aquests sistemes funcionin, i sobretot que estiguin a l’abast de tothom i adaptats a les necessitats de cada grup d’usuaris. També és important que les veus que generen aquests sistemes no siguin robòtiques, sinó que siguin veus expressives que s’assemblin al màxim a la veu humana. L’expressivitat i la naturalitat a vegades són difícils d’aconseguir, i nosaltres investiguem les característiques de la veu humana pel que fa a l’entonació, la prosòdia, l’expressió, etc., per poder-les incorporar a aquests sistemes.

També treballa amb professionals de la medicina per detectar desordres clínics a través de la parla

Sí. Es diu a vegades que la veu és el reflex de l’ànima. Quan parlem diem moltes més coses, a part del missatge que volem transmetre: com som, quina edat tenim, si som homes o dones, si estem cansats, contents, preocupats… La veu pot reflectir tant el nostre estat emocional com la nostra condició física, i per tant a través de la veu podem detectar possibles malalties, tant físiques com emocionals. I no només a partir de la veu en si, que té unes característiques determinades, sinó també per la manera de parlar, de transmetre un contingut lingüístic: el vocabulari, les construccions sintàctiques i discursives, l’entonació, etc. I aquí és on la lingüística hi juga un paper important.

I què poden detectar amb la parla?

A nivell físic, malalties com la MPOC (malaltia pulmonar obstructiva crònica), per exemple, que sembla que tenen un impacte en les característiques de la veu, però també en la manera de parlar. La llengua és un procés cognitiu molt important, i per tant també es reflecteix en desordres cognitius o canvis emocionals, com el trastorn bipolar o l’Alzheimer. Així, per exemple, una persona deprimida parlarà amb una entonació molt més plana. Aquest és un fenomen que també s’observa en persones que pateixen Alzheimer, a més d’utilitzar un vocabulari més genèric, o estructures sintàctiques particulars. La parla ens permet fer una detecció precoç de la malaltia mitjançant algorismes d’aprenentatge automàtic i actuar ràpidament, i també monitoritzar-ne l’evolució sense necessitat que cada setmana el pacient vagi al metge a sotmetre’s a una anàlisi exhaustiva. Cal tenir en compte, però, que el que proporcionem és un indicador d’alerta, una ajuda al metge, i no pas un diagnòstic. Però no només fem recerca en aquests temes, sinó que treballem també directament amb empreses per implementar-ho en aplicacions reals.

Fa pocs mesos la Plataforma per la Llengua advertia que el català havia perdut més de mig milió de parlants en els últims setze anys. Com pot ajudar la tecnologia a revertir aquesta situació?

La tecnologia pot normalitzar una llengua com el català. Avui dia tot és digital; per tant, si una llengua no puja al tren de la digitalització, no té res a fer. No només els productes audiovisuals han de ser en català, també ho han de ser els videojocs i altres aplicacions informàtiques. En el cas dels videojocs i altres aplicacions, que acostumen a utilitzar un vocabulari reduït, és tan fàcil com traduir les comandes automàticament i implementar un sintetitzador de la parla quan faci falta. Si desenvolupem les tecnologies necessàries i les fem obertes i lliures, amb suport institucional, les empreses ho tindran molt més fàcil per implementar el català en totes les aplicacions. Un altre exemple: subtitular manualment és molt costós, però si disposes d’un sistema de reconeixement de la parla i de traducció automàtica al català que funcioni bé, pots subtitular milers de pel·lícules i de sèries. Ara bé, tot això ha d’anar acompanyat de l’ús social de la llengua, si no, no farem res.

Hi ha, però, el problema afegit que el català és una llengua minoritzada i en un context de diglòssia

El català es troba en una situació de minorització; hi ha una llengua dominant que se’ns menja, i el català corre el perill d’acabar sent prescindible. Pel que fa als recursos computacionals del català, aquest context també pot ser una oportunitat. Els sistemes actuals es basen en xarxes neuronals, en algoritmes matemàtics molt potents. El problema és que necessiten moltíssimes dades, milions de dades. Això s’ho pot permetre l’anglès, el xinès, el castellà i poques llengües més. Ara hi ha algorismes que permeten adaptar un sistema que utilitza una llengua amb moltes dades a una llengua amb menys dades, i com més s’hi assembli lingüísticament, millor. Tots aquests avenços els hem d’aprofitar per impulsar les tecnologies en les llengües minoritàries i minoritzades.


Més sobre Mireia Farrús

El millor invent de la història

Sens dubte, els invents que han salvat vides, com la penicil·lina. Com a física diria el telescopi, perquè és l’instrument clau que marca l’inici de la ciència moderna. I com a lingüista m’agrada la impremta, que va democratitzar els llibres i va representar una revolució contra el poder de l’Església.

Què li agradaria veure en un futur?

A la universitat m’agradaria veure més col·laboració entre els investigadors i menys egos. També que es reconegués més la part docent i no només la recerca. I en l’àmbit lingüístic, un reconeixement més gran cap a les llengües, sobretot les minoritzades, perquè són un tresor de la humanitat.

Un avenç del futur que li faci por

Tot el que té a veure amb la intel·ligència artificial i l’ús que se’n faci. Arribarà un moment que una màquina podrà reproduir totes les característiques de l’ésser humà, no només la nostra veu,  i ens sorgiran molts dubtes ètics.

Un referent

Citaré tres clàssics: Galileu com a gran divulgador, perquè va començar a divulgar en italià en un moment en què tota la ciència era en llatí; Einstein, perquè és una altra dimensió de pensament, i Maria Skłodowska (Marie Curie) com a referent femení.

L’FBG és…

Ha estat una descoberta! Un pont amb la realitat, i amb un equip humà fantàstic que et dona suport en tot el que necessites.

Comparteix aquest post:

Utilitzem cookies de tercers amb finalitats tècniques i analítiques. Si continua navegant vol dir que accepta la nostra política de cookies. Més informació,plugin cookies política de cookies.

ACEPTAR
Aviso de cookies