Logroño (EFE).- El Observatorio Global del Español defiende el necesario entrenamiento de la inteligencia artificial (IA) con corpus específicos y no con corpus inmensos, de gran tamaño, para evitar que tenga un gran impacto medioambiental.
Así lo ha explicado a EFE Héctor Álvarez Mella, jefe de departamento e investigador de este Observatorio, impulsado por el Instituto Cervantes, y quien participa en el encuentro ‘¡Háblame, máquina! Oralidad e IA en español’, que se celebra en Logroño y en el Centro Internacional de Investigación de la Lengua Española, situado en San Millán de la Cogolla (La Rioja).
Uno de los focos de la mesa redonda ‘Las variedades del español hablado en la IA’, que él ha moderado este martes en San Millán de la Cogolla, cuna del español, está centrado en la importancia de un entrenamiento del español para la IA que sea sostenible, ha añadido.
Por eso, es necesario que «no se intente alimentar las máquinas con todos los textos posibles (de variedades del español) porque hay que tener en cuenta que ello tiene un impacto medioambiental enorme», ha indicado este lingüista.

El director del Instituto Cervantes, Luis García Montero (d) y la secretaria General Instituto Cervantes, Carmen Noguero, (i), en el Pleno anual del Observatorio Global del Español (OGE), en una imagen de archivo. EFE/Raquel Manzanares
Desde ese punto de vista, en el ámbito de la lingüística, ha precisado, se defiende que el español tiene que tener esa perspectiva ecológica y, además, es importante entrenar la IA «de manera efectiva con corpus específicos y no con corpus inmensos».
Ha añadido que se trabaja en esta dirección, como se ha puesto de manifiesto en este encuentro, en el que también se ha explicado el proyecto ‘Data Observatory-LATAM-GPT-Corpus’, de lenguaje abierto para IA desde Latinoamérica, que articula al sector público y privado.
La IA, un hablante virtual
Álvarez Mella también ha destacado que adaptar el habla de la IA, que es un hablante virtualmente potencial con todos los hispanohablantes, a los contextos geográficos, sociales y variedades sociales del español requiere crear o entrenar modelos de manera muy concreta y específica.
Ello permitirá que haya una representación completa del panorama lingüístico del español y que esté presente en todos los ámbitos de uso, como profesional, jurídico y cotidiano, entre otros, ha recalcado.
Si no se empieza a invertir y a crear y a trabajar en inteligencia artificial en todas las variedades del español, ha advertido de que se corre el riesgo de que el español se mantenga bajo la hegemonía del inglés, que es «la lengua en la que se está creando realmente la IA».
Este encuentro, organizado por el Observatorio Global del Español, con la colaboración del Gobierno riojano, reúne a especialistas en lingüística, IA, derecho, ingeniería y empresa de distintos países del ámbito español, para analizar cómo se representan las variedades de español oral y qué aplicaciones reales tiene en la actualidad la inteligencia artificial oral en sectores estratégicos.










