
La UB desenvoluparà un sistema de transcripció digital en temps real per a fer més accessible la docència universitària en català
La Universitat de Barcelona (UB) desenvoluparà un innovador sistema de transcripció digital en temps real per a fer més accessible la docència universitària en català. El sistema està basat en intel·ligència artificial (IA), s’anomena SCRIBAL i s’adapta especialment als diferents dialectes del català i a la terminologia específica de les universitats. El projecte, liderat per la professora del departament de Filologia Catalana i Lingüística General de la Facultat de Filologia i Comunicació de la UB, Mireia Farrús, ha rebut un ajut Producte del programa Indústria del Coneixement, del Departament de Recerca i Universitats de la Generalitat de Catalunya, per desenvolupar un prototip i validar-ho en les aules de la Universitat.
La tecnologia permet transcriure de forma ràpida i precisa classes, conferències i altres continguts acadèmics en àudio facilitant l’estudi i millorant l’accessibilitat per a l’alumnat amb problemes auditius o que no dominen la llengua d’instrucció. “La majoria de les institucions educatives no ofereixen un servei de transcripció d’àudio a text degut a les limitacions tecnològiques i als costos de la transcripció manual. Amb aquest sistema digital els estudiants amb discapacitats auditives podran accedir completament a les classes i conferències, millorar la seva experiència d’aprenentatge i reduir les barreres que sovint els impedeixen aprofitar al màxim el seu temps a la universitat”, destaca la investigadora de la UB.
SCRIBAL és l’únic projecte de l’àrea d’Humanitats que ha rebut un ajut de la modalitat Producte en aquesta convocatòria. Es tracta d’ajuts destinats a l’obtenció de prototipus i a la valorització i transferència i forma part del programa Indústria del Coneixement, una iniciativa del Departament de Recerca i Universitats de la Generalitat de Catalunya per incentivar la transferència dels resultats de la recerca.
Solució integral per a la gestió de continguts educatius
Partint dels avenços en tecnologies de reconeixement de la parla i processament del llenguatge natural, SCRIBAL és un sistema que permet la transcripció del contingut oral del professor, mitjançant la subtitulació de presentacions en PowerPoint o directament a l’ordinador o mòbil de l’alumne.
Un altre aspecte innovador de SCRIBAL és la seva capacitat per a identificar diferents ponents durant una classe o conferència, sincronitzar el text amb l’àudio i exportar les transcripcions a diversos formats, facilitant així la seva integració amb plataformes d’e-learning. A més, els estudiants que no dominen la llengua d’instrucció podran utilitzar les transcripcions per a traduir el contingut a la seva llengua materna, millorant així la seva comprensió i rendiment acadèmic. “Aquestes funcions fan que SCRIBAL no sigui només una eina de transcripció, sinó també una solució integral per a la gestió i distribució de contingut educatiu”, explica la investigadora.
El sistema també ofereix avantatges significatius en termes de privacitat i seguretat. “Com que és autogestionat per la universitat, les dades dels estudiants i els continguts de les classes es poden emmagatzemar i transmetre de manera segura, complint amb les regulacions de privacitat i protecció de dades”, destaca Mireia Farrús.
Un sistema optimitzat per al català i amb perspectiva de gènere
Aquesta nova solució es basa el sistema de transcripció de codi lliure Whisper de l’empresa OpenAI. Es tracta d’una tecnologia de xarxes neuronals – un camp de la intel·ligència artificial que utilitza models computacionals inspirats en el cervell humà per reconèixer patrons i resoldre problemes complexos – que és puntera en reconeixement de la veu i que ha estat entrenada amb centenars de milers d’hores de parla.
Els investigadors han incorporat al sistema les bases de dades CommonVoice i ParlamentParla, per adaptar-ho a les diferents varietats del català. El resultat ha estat un increment de la precisió de les transcripcions amb una reducció significativa en la taxa d’error per paraula. A més, es tracta de bases de dades que han estat acuradament equilibrades per tal de tenir en compte la perspectiva de gènere en el seu desenvolupament, evitant així els biaixos d’altres sistemes.
El projecte, liderat per un equip multidisciplinari d’investigadors en intel·ligència artificial i emprenedors, es troba en una fase avançada de maduresa tecnològica, havent-ne validat la viabilitat tècnica en entorns rellevants. Ara, amb aquest ajut 2024 PROD 00007 de 150.000 euros, l’objectiu és desenvolupar d’un prototip complet amb interfície d’usuari que es pugui utilitzar en temps real a les aules. A més, es duran a terme proves pilot a la UB amb usuaris per a validar l’acceptació i la utilitat de la solució.