Bilbao

LEJOS de ser lo más parecido a una lengua muerta, el euskera se perfila gracias a la cada vez más preparada juventud vasca en un idioma con un futuro prometedor. El sugestivo amanecer del siglo veintiuno ha estado caracterizado por avances hacia la normalización lingüística. La primera piedra puesta en 1545 por Bernard Etxepare con su Linguae Vasconum Primitiae ha vivido un nuevo episodio casi quinientos años después con la investigación de Alicia Pérez Ramírez quien ha desarrollado un sistema para la traducción de palabras pronunciadas en euskera.

Esta joven, junto al Departamento de Electricidad y Electrónica de la Facultad de Ciencia y Tecnología de la UPV-EHU ha desarrollado un innovador sistema automático de traducción de voz. "La voz es la palabra clave", defendió Pérez en su tesis doctoral ya que su trabajo va más allá de la mera traducción de textos escritos y permite poner en marcha, por primera vez, un sistema de traducción automática de voz, con métodos estadísticos.

El sistema de traducción automática permite convertir el habla de un locutor en una lengua a texto en otra. Traduce el habla en español o en euskera en origen, a dos o tres idiomas de forma simultánea en la salida: euskera, español e inglés. De hecho, la tesis de esta investigadora fue presentada ante el jurado en la lengua de Shakespeare bajo el título de Speech and text translation involving Basque language: an application of stochastic finite-state transducers.

"El software de esta aplicación surgió a partir de la demanda empresarial del grupo Ametzagaiña Software Production, que dio lugar al desarrollo de una innovadora línea de investigación en traducción automática a sumar a las ya existentes en otras tecnologías de la lengua en la Facultad de Ciencia y Tecnología", explicaron los integrantes del equipo de trabajo que ha dado como fruto este novedoso sistema de traducción.

La relevancia de este trabajo de investigación de Alicia Pérez es que está basado en métodos estadísticos y no en reglas como se hace tradicionalmente. Por otra parte, "el software contribuye a integrar la sintaxis de euskera, muy diferente a la de otros idiomas, así como la rica morfología de este idioma", describieron desde la UPV-EHU.

"El software se ha desarrollado a través del estudio de muestras comparadas entre textos de informaciones en euskera y castellano, para encontrar soluciones de rendimiento óptimo. A partir de aquí se han extraído regularidades con métodos estadísticos, lo que ha permitido aprender no sólo el léxico (la transferencia de un idioma a otro) sino también la sintaxis, es decir, las diferencias en el orden en una oración", añadieron.

"El reconocimiento del habla continua, independiente del locutor, con gran vocabulario y gramáticas naturales es una de las dificultades más importantes en el campo de la inteligencia artificial. Los sistemas de traducción automática, es decir, sistemas con capacidad de percepción, aprendizaje, razonamiento y comunicación, son una tarea en la que confluyen disciplinas muy diversas, que van de las matemáticas aplicadas a la psicología cognitiva", apuntaba Pérez en su tesis.

Esta investigación supone un primer paso de gran importancia hacia el desarrollo de sistemas de traducción automática de voz en lenguas debilitadas para las que normalmente se encuentran pocos recursos lingüísticos disponibles con la consiguiente dificultad de desarrollo. Por otra parte el interés de los sistemas de traducción automática, tanto texto como voz, en comunidades bilingües es evidentemente muy alto aunque el reducido tamaño del mercado potencial en el caso del par castellano-euskera dificulta el interés de las multinacionales del sector.