El aprendizaje automático en la traducción

Actualizado en diciembre de 2024.

Hace tiempo hice el pequeño curso de Google Actívate sobre el aprendizaje automático (machine learning) y he pensado en enfocarlo desde el punto de vista de la traducción en este artículo.

Seguramente el término ‘aprendizaje automático’ te haga pensar en la famosa traducción automática, pero en realidad también puedo aprovechar y comentaros qué es la traducción asistida por ordenador o los lenguajes de transcripción, que son otros dos ejemplos de lo que supone el aprendizaje automático en el mundo de la comunicación.

👇 ¿Empezamos?

¿Qué es la traducción automática y qué inconvenientes y ventajas tiene?

La traducción automática es aquella que realiza íntegramente un programa específico para ello de forma automática.

Todos tenemos en mente las típicas imágenes que dan a entender que para traducir tan solo necesitamos presionar un botón y todos conocemos el traductor de Google.

También conocemos los infinitos errores que esta tecnología agrega a los textos.

Sin embargo, el de la gran G no es el único traductor automático y no todos son gratuitos.

Si decides usar un traductor automático gratuito, piensa antes qué datos estás introduciendo, ya que esa información se almacenará y se utilizará para futuras traducciones.

Si no compras, el producto son tus datos (o los de tu empresa, o los que escribe, o los que introduces, o a los que das acceso porque has aceptado una política general que si no aceptas no te deja usar la aplicación).

En cuanto a las versiones de pago, de nada sirven si no se utilizan correctamente —más a delante te lo explico— y sin un profesional que revise esas traducciones; que lo haga de cualquier forma tampoco nos serviría de nada, así que no nos sirve tu prima que estuvo viviendo en Londres tres años.

La posedición es la revisión de una traducción automática y, básica y resumidamente, se caracteriza por incorporar los mínimos cambios posibles para poder retroalimentar el programa, así que poco tiene que ver con la revisión o la corrección de textos (escritos por humanos).

Incluso si la traducción se realiza mediante inteligencia artificial (IA) (que es una inteligencia humana por la que han pagado muy poco o nada y que han programado para resolver de forma fluida los textos, por explicarlo de una forma sencilla), sigue aplicándose el método de posedición: realizar los mínimos cambios posibles. También por una cuestión económica, nos pagan menos por estos encargos. #PagadPorCalidad

¿Significa esto que desaconsejo totalmente la traducción automática?
No. Como siempre, depende del contexto. La traducción automática es muy rápida y permite entender a grandes rasgos la idea general de un texto, pero muy pocas veces es un sinónimo de calidad.

Ahora bien, utilizar un traductor automático no tiene que suponer una merma en la calidad del producto final siempre y cuando se utilice un lenguaje controlado, se acote el ámbito de especialidad y se ofrezca la inteligencia artificial como una herramienta al profesional; aunque este no suele ser el caso.

En algunos contextos en los que predomina la literalidad, como es el caso de las patentes, la traducción automática puede resultar bastante útil para la fase de documentación, es decir, cuando la finalidad de la traducción es averiguar el objeto o saber de qué trata una patente o a qué tecnología se refiere.

Por lo demás, la traducción automática puede utilizarse para mensajes sencillos, cuando la finalidad principal sea comprender estos mensajes y siempre de manera interna, personal, como puede ser el caso de la comunicación electrónica (correos) entre los departamentos de una empresa internacional, pero, por supuesto, nunca si estos forman parte de la documentación de un caso en el ámbito jurídico.

El contexto del encargo y la finalidad son determinantes para recomendar o no la traducción automática (y la posedición).

¿Qué es la traducción asistida por ordenador y qué inconvenientes y ventajas tiene?

La traducción asistida por ordenador (TAO) es aquella que escribe un profesional usando sugerencias de traducciones propias anteriores.

Es un recurso profesional muy útil, aunque no es indispensable en todos los contextos, como suele suceder en el ámbito literario.

No es una herramienta para el público general, por el elevado precio y porque, aunque utilices uno gratuito, el proceso de aprendizaje que supone usarlo de manera correcta, organizada y útil es bastante complejo.

La principal ventaja es que no se trata de una traducción automática. Quien traduce es la persona. El programa simplemente se limita a asistir, es decir, a ayudar a mantener la coherencia, no solo terminológica y del sector, sino del estilo del propio cliente.

Para mí la traducción asistida por ordenador es un sinónimo de eficiencia en traducción.

¿Qué son los lenguajes de transcripción y qué inconvenientes y ventajas tienen?

En este artículo sobre los lenguajes de marcado te preguntaba si conocías alguno que traspasase el discurso escrito. He aquí mi respuesta: los lenguajes de transcripción.

Cascos con micro sobre un teclado.

Los lenguajes de transcripción se componen de indicaciones que damos con la voz cuando usamos ciertos programas para transcribir, es decir, para redactar un mensaje originalmente oral.

Un ejemplo que todos tenemos a mano es el dictado por voz del móvil, pero también existen diversos programas gratuitos y otros desarrollados para profesionales de la comunicación.

Ahora bien, debemos ser conscientes de que nuestra información puede ser utilizada para mejorar la inteligencia artificial que utiliza para reconocer las palabras. Incluso podrían usar nuestra propia voz para futuras herramientas que la empresa desarrolle. ¿Te imaginas los problemas que te podría generar? Imagina ahora que justo te dedicas a la locución, que eres actor de doblaje. Tu voz es tu herramienta principal para generar ingresos y… la estarías regalando.

Aunque no te dediques a la locución ni al doblaje, cediendo tu voz estás formando parte de esta desocupación de profesionales que sí se dedican a ello. Seamos conscientes.

En cuanto a los programas orientados como herramientas para profesionales:

Todos tenemos una manera particular de entonar y pronunciar, es decir, un idiolecto, por lo que estas herramientas utilizan el aprendizaje automático para aprender tu manera de dictar.

Esto significa que, aunque hayas pagado por un programa que te permite utilizar un lenguaje de transcripción, tienes que entrenarlo para que se adapte a ti. Esto requiere de tiempo, paciencia y unas habilidades que pueden recordar a la interpretación en algunos aspectos.

La ventaja ya te la puedes imaginar: somos más rápidos hablando que escribiendo, por lo que usar estos programas y entrenarlos para que se adapten a nosotros puede ser realmente útil tanto para transcribir como para crear contenido escrito sin tener que teclear.

Lo curioso es que muchos de estos programas no solo reconocen las etiquetas o marcas que repercuten directamente en el formato del texto (cursivanegritas, símbolos), sino que puedes configurar «atajos» para, por ejemplo, nombres propios o estructuras que vas a repetir a lo largo del discurso.

Algunos contextos requieren de mucha inmediatez y los lenguajes de transcripción pueden ser (parte de) la solución.

Gracias a los lenguajes de transcripción, podemos hablar a día de hoy del subtitulado por rehablado o subtitulado en directo, para el que se requieren conocimientos de subtitulado, de lenguajes de transcripción y habilidades similares a la interpretación simultánea.

Yo no utilizo ningún programa para transcribir, pero disfruté a lo grande un taller de subtitulado por rehablado impartido por Pablo Romero Fresco. Fue una experiencia única y no me cabe duda de que estos programas supondrán una ventaja para muchos contextos.

Última reflexión ética (y económica)

Además de lo comentado a lo largo de este artículo sobre la cuestión ética y los derechos de nuestros textos y de nuestra voz, me preocupa comprobar que para poder perfeccionar los programas que usan el aprendizaje automático se utilicen bases de datos (no solo texto, también grabaciones) que quedan en manos de empresas privadas, del software privativo y del mercado de datos que hoy en día existe y que apenas está regulado. Creemos que no lo tiene, pero todos estos datos tienen mucho valor. Las empresas invierten comprándolos cuando tú los estás cediendo de manera gratuita y pierdes el rastro de quién lo usará o quién se beneficiará a costa tuya.

Nadie esconde que, como dijo Clive Humby en 2006, «los datos son el nuevo petróleo».

Y tú, ¿en qué más piensas cuando piensas en el aprendizaje automático?

¿Qué opinas sobre todo este melón que hemos abierto?

⌨ Coméntamelo en los comentarios.

¡Nos leemos!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *