A Coruña (EFE).- Unas 10.000 muestras de audio aportadas por voluntarios sirven al Instituto da Lingua Galega (ILG) de la Universidad de Santiago para mejorar el primer sistema de reconocimiento de voz en gallego con uso gratuito, del proyecto Nós, que mejora a una segunda fase en la que será más preciso.
La directora del ILG, Elisa Fernández, ha explicado a EFE que el proyecto Nós suma una importante contribución con miles de muestras de voluntarios que sirven para entrenar el sistema de inteligencia artificial vinculado a la transcripción automática de voces y al dictado de textos.
Para ello, su entidad ha organizado el Validatón, un evento que concluyó este jueves por la noche y que consistió en recopilar fragmentos de voz de voluntarios, hasta acumular unos 10.000 que se suman a los 23.000 que tenían antes, y posteriormente validar lo que dicen, a lo que han contribuido treinta voluntarios.
«Necesitamos muchos datos de mucha gente muy diferente que hable de manera diferente, con acentos distintos, voces distintas y calidades de grabación distinta. Luego necesitamos que las transcripciones estén alineadas con el audio de manera que la máquina pueda aprender», resume.
Grabar voces, validad y comprobar
Las tareas desarrolladas han sido grabar las voces, validar y comprobar que las grabaciones almacenadas están bien y posteriormente construir frases, con cerca de 2.000 conseguidas.
La meta de todo ello es «entrenar el modelo de reconocimiento automático del habla», que ya está entrenado, pero ahora pasa a una segunda fase en el que Elisa Fernández espera una importante mejora en la precisión y el servicio que aporta a la sociedad.
Este sistema de reconocimiento de voz (ASR por sus siglas en inglés) está disponible de forma gratuita como prototipo en la web del proyecto Nós.
Elisa Fernández espera que esta nueva versión mejorada tenga un impacto social positivo en áreas como la medicina o la Administración de Justicia.
Para todo ello, dentro del proyecto Nós -que también cuenta con la colaboración del Centro Singular de Investigación en Tecnoloxías Intelixentes (CiTIUS)- se realiza una campaña que busca la recolección de voces de toda Galicia y las suma a la plataforma Common Voice, «abierta, transparente y ética», que ahora cuenta con 13 horas más gracias al trabajo de los últimos días.
«Además de esto, se hizo una campaña en los ayuntamientos y está abierta una campaña de donación con el nombre ‘Doa a túa voz, preserva a túa lingua'», continúa.
El éxito de las últimas jornadas cuenta también con el apoyo de la Universidad de Santiago, que reconoce un crédito optativo por la participación y ha sumado a estudiantes de Filología.
Dentro del Validatón ha habido un concurso con premios en varias categorías. En grabación de fragmentos de voz ha ganado Víctor Pose, en validación de audios se ha impuesto Álex Rodríguez Guisantes, en generación de frases ha triunfado Lucía López Lires y la ganadora global ha sido Noa Sobrino Lamas.