_
_
_
_
_

Arranca el primer traductor automático gratuito para las cuatro lenguas oficiales de España

Cuatro universidades españolas y tres empresas de informática presentaron ayer en Barcelona el sistema Opentrad, el primero de código abierto que traduce de forma automática entre el castellano y el resto de las lenguas oficiales del Estado (catalán, gallego y euskera) de forma gratuita. Pero el sistema sólo traduce del castellano al euskera -es el primer sistema que lo hace- y no a la inversa por las enormes dificultades técnicas que ello implicaría.

El código abierto permite a cualquier empresa de desarrollo de programas descargar los programas y recursos lingüísticos y adaptarlos a sus necesidades, desde traducir correos electrónicos a integrar la traducción en las aplicaciones de gestión. El diario La Voz de Galicia ha introducido esta tecnología en su diario digital para que con sólo un clic el lector pueda leer en gallego el diario escrito en castellano.

Opentrad permite traducir en Internet (www.opentrad.org) textos y documentos, con un límite de 10.000 caracteres, en los formatos txt, rtf y html, y próximamente en el formato doc de Microsoft Word, y también el contenido de páginas web a medida que se va navegando.

La fiabilidad de las traducciones es elevada de español a catalán (3,8% de errores) y de español a gallego (4,8%), pero es muy baja de español a euskera (24,8% de errores). Para que una traducción automática sea útil, la tasa de aciertos debe superar el 90%. Los ingenieros trabajan para que el euskera llegue a ese nivel, pero sólo funcionará con textos especializados, afirmó Iñaki Arantzabal, director de la empresa Eleka, que ha liderado el proyecto.

La Administración pública gallega, con su servicio de salud a la cabeza, es uno de los principales usuarios de este sistema gratuito. Ya existían traductores automáticos propietarios de español a catalán, como Internostrum, también creado por la Universidad de Alicante, que sólo funciona por Internet. Ahora éste se basará en el Opentrad.

El sistema utiliza dos motores de transferencia sintáctica: uno parcial para los pares de lenguas románicas (español-catalán y español-gallego) y otro completo para el par de lenguas divergentes (español-euskera). Los diccionarios tienen unas 13.000 entradas cada uno. La futura versión Opentrad Plus combinará las reglas lingüísticas con memorias de traducción de textos traducidos por humanos.

Lo que más afecta es lo que sucede más cerca. Para no perderte nada, suscríbete.
Suscríbete

El proyecto, de un millón de euros (600.000 euros aportados por el Ministerio de Industria a través del programa PROFIT), ha durado dos años y han participado en él la Universidad Politécnica de Cataluña, la Universidad del País Vasco, la Universidad de Alicante, la Universidad de Vigo, la Fundación Elhuyar y las empresas Eleka Ingenieritza Linguistikoak e Imaxin Software. La empresa Promsit se encargará de comercializar los servicios para el catalán. Otro proyecto de la Universidad Pompeu Fabra y la Universidad de Alicante financiado por la Generalitat de Cataluña tendrá listo dentro de un mes un prototipo para la traducción del par catalán-aranés a partir de la misma tecnología.

Regístrate gratis para seguir leyendo

Si tienes cuenta en EL PAÍS, puedes utilizarla para identificarte
_

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
_
_