El Gobierno destina 3 millones al proyecto Aina para crear un corpus tecnológico en catalán

El Gobierno destina 3 millones al proyecto Aina para crear un corpus tecnológico en catalán


Lanzar una campaña para recolectar «millones de votos» que permita crear

BARCELONA, 15 de febrero (EUROPA PRESS) –

El vicepresidente y consejero de Política Digital y Territorios de la Generalitat, Jordi Puigneró, ha anunciado que este año el Gobierno destinará tres millones de euros al proyecto Aina para crear un corpus lingüístico en catalán para su uso en las capturas tecnológicas a través de la Voz Común Plataforma.

Lo ha dicho este martes en una rueda de prensa a la que han asistido también el director del Barcelona Supercomputing Center (BSC), Josep Maria Martorell, y la responsable de la Unidad de Minería de Textos del BSC, Marta Villegas.

Puigneró ha explicado que el objetivo es recoger «millones de voces» para enseñar catalán a las máquinas, para que cualquier empresa u organismo pueda desarrollar servicios como traductores o asistentes personales en catalán.

Señaló que el proyecto tiene el doble objetivo de promover el catalán en la era digital y garantizar el derecho de los catalanohablantes a poder identificarse con las máquinas en su lengua.

“Me gustaría recordaros que TV3 ha hecho un gran trabajo de normalización y socialización del catalán en la sociedad y en cierto modo Aina ha conquistado nuevos territorios que pasan por nuevas plataformas como el móvil”, ha explicado Puigneró.

Villegas ha explicado que el proyecto tiene tres objetivos: dotar al catalán de la infraestructura necesaria para desarrollar aplicaciones basadas en inteligencia artificial, hacer rentable y atractiva la inclusión del catalán en las plataformas y conseguir que los catalanes hablen su lengua con normalidad puedan participar Mundo Digital .

Señaló que Aina es una infraestructura lingüística diseñada para que empresas e instituciones construyan aplicaciones finales.

Para ello, han establecido convenios de colaboración con entidades como SoftCatalà o Racó Català, universidades o la Enciclopèdia Catalana, así como con la Corporación Catalana de Mitjans Audiovisuals (CCMA) o emisoras de radio locales para obtener datos sobre los diferentes dialectos catalanes. .

CAMPANA DE VIDRIO

Con el fin de promover este corpus de voces, el gobierno lanzará este miércoles la campaña «La nostra llengua és la teva veu» para captar voces que permitan generar este corpus.

La campaña permitirá a los ciudadanos leer diferentes frases a través de la plataforma Common Voice para crear un «diccionario» que se puede utilizar para entrenar a la tecnología para «entender y hablar» catalán.

Villegas ha explicado que este tipo de tecnología «requiere datos masivos» y que la única forma que tiene el catalán de conseguirlo es a través de una iniciativa pública.

Villegas ha anunciado que espera sacar 2.000 horas de las 1.000 disponibles actualmente para catalán en Voz Común.

Por su parte, Puigneró indicó que estaba trabajando con organizaciones para impulsar la campaña en todo el territorio catalán y que en el futuro estaba previsto celebrar reuniones con los gobiernos del resto de territorios de habla catalana para que también pudieran publicitar la campaña. campaña para la inclusión de sus dialectos.


Felipe Tordero

Felipe Tordero

Deja una respuesta

Tu dirección de correo electrónico no será publicada.