Actualidad

La UB desarrollará un sistema de transcripción digital en tiempo real para hacer más accesible la docencia universitaria en catalán

La Universidad de Barcelona (UB) desarrollará un innovador sistema de transcripción digital en tiempo real para hacer más accesible la docencia universitaria en catalán. El sistema está basado en inteligencia artificial (IA), se llama SCRIBAL y se adapta especialmente a los distintos dialectos del catalán y a la terminología específica de las universidades. El proyecto, liderado por la profesora del departamento de Filología Catalana y Lingüística General de la Facultad de Filología y Comunicación de la UB, Mireia Farrús, ha recibido una ayuda Producto del programa Industria del Conocimiento, del Departamento de Investigación y Universidades de la Generalitat de Catalunya, para desarrollar un prototipo y validarlo en las aulas de la Universidad.

La tecnología permite transcribir de forma rápida y precisa clases, conferencias y otros contenidos académicos en audio, facilitando el estudio y mejorando la accesibilidad para el alumnado con problemas auditivos o que no dominan la lengua de instrucción. «La mayoría de las instituciones educativas no ofrecen un servicio de transcripción de audio a texto debido a las limitaciones tecnológicas y a los costes de la transcripción manual. Con este sistema digital los estudiantes con discapacidades auditivas podrán acceder completamente a las clases y conferencias, mejorar su experiencia de aprendizaje y reducir las barreras que a menudo les impiden aprovechar al máximo su tiempo en la universidad».

SCRIBAL es el único proyecto del área de Humanidades que ha recibido una ayuda de la modalidad Producto en esta convocatoria. Se trata de ayudas destinadas a la obtención de prototipos y la valorización y transferencia y forma parte del programa Industria del Conocimiento, una iniciativa del Departamento de Investigación y Universidades de la Generalidad de Cataluña para incentivar la transferencia de los resultados de la investigación.

Solución integral para la gestión de contenidos educativos

Partiendo de los avances en tecnologías de reconocimiento del habla y procesamiento del lenguaje natural, SCRIBAL es un sistema que permite la transcripción del contenido oral del profesor, mediante la subtitulación de presentaciones en PowerPoint o directamente en el ordenador o móvil del alumno.

Otro aspecto innovador de SCRIBAL es su capacidad para identificar a diferentes ponentes durante una clase o conferencia, sincronizar el texto con el audio y exportar las transcripciones a diversos formatos, facilitando así su integración con plataformas de e-learning. Además, los estudiantes que no dominan la lengua de instrucción podrán utilizar las transcripciones para traducir el contenido a su lengua materna, mejorando su comprensión y rendimiento académico. «Estas funciones hacen que SCRIBAL no sea sólo una herramienta de transcripción, sino también una solución integral para la gestión y distribución de contenido educativo», explica la investigadora.

El sistema también ofrece ventajas significativas en términos de privacidad y seguridad. «Como es autogestionado por la universidad, los datos de los estudiantes y los contenidos de las clases se pueden almacenar y transmitir de forma segura, cumpliendo con las regulaciones de privacidad y protección de datos», destaca Mireia Farrús.

Un sistema optimizado para el catalán y con perspectiva de género

Esta nueva solución se basa en el sistema de transcripción de código libre Whisper de la empresa OpenAI. Se trata de una tecnología de redes neuronales – un campo de la inteligencia artificial que utiliza modelos computacionales inspirados en el cerebro humano para reconocer patrones y resolver problemas complejos – que es puntera en reconocimiento de la voz y que ha sido entrenada con cientos de miles de horas de habla.

Los investigadores han incorporado al sistema las bases de datos CommonVoice y ParlamentParla, para adaptarlo a las distintas variedades del catalán. El resultado ha sido un incremento de la precisión de las transcripciones con una reducción significativa en la tasa de error por palabra. Además, se trata de bases de datos que han sido cuidadosamente equilibradas para tener en cuenta la perspectiva de género en su desarrollo, evitando así los sesgos de otros sistemas.

El proyecto, liderado por un equipo multidisciplinar de investigadores en inteligencia artificial y emprendedores, se encuentra en una fase avanzada de madurez tecnológica, validando su viabilidad técnica en entornos relevantes. Ahora, con esta ayuda 2024 PROD 00007 de 150.000 euros, el objetivo es desarrollar un prototipo completo con interfaz de usuario que se pueda utilizar en tiempo real en las aulas. Además, se llevarán a cabo pruebas piloto en la UB con usuarios para validar la aceptación y utilidad de la solución.

Comparte esta entrada:

Utilitzem cookies de tercers amb finalitats tècniques i analítiques. Si continua navegant vol dir que accepta la nostra política de cookies. Més informació,plugin cookies política de cookies.

ACEPTAR
Aviso de cookies