La fascinación de la traducción automática

El viernes pasado se terminaba el plazo para entregar el artículo comprometido con el IVAP. Estoy un poco atenazado por el formato, o mejor dicho por el género “artículo”.

El registro y el rigor me tienen bloqueado. Me veo más suelto aquí, con el género blog, especialmente inspirado además por la invitación de Marta Pastor a participar en el programa Imaginario de RN1 este próximo jueves. Estas son algunas de las cosas que pueden ir en la entrevista:
Al hablar de la traducción automática habría que destacar algunas cuestiones cruciales:

  1. Pese a las grandes inversiones y dotadísimas mentes que la han encarado, la traducción automática sigue desafiando a la informática.
  2. Han pasado siete décadas, desde que comenzara a ensayarse después de la II guerra mundial (en 1946).
  3. ¿Un desafío? No es para tanto cuando se dan las siguientes dos condiciones: (a) se traduce entre lenguas tipológicamente cercanas y (b) la tipología textual que se va a abordar es conocida.
  4. La traducción automática entre pares de lenguas cercanas, como es el caso de las lenguas romances, y particularmente de las habladas en la península ibérica (catalán, español, gallego y portugués), es un problema resuelto con calidad y éxito (OpenTrad, InterNostrum, ATS, Translendium).
  5. Fuera de ahí, la calidad baja en picado, bien sea porque la distancia lingüística se acrecienta (euskara) o porque se produce un importante alejamiento cultural (japonés).
  6. Pero esto se puede resolver si se da la segunda condición: El buen conocimiento de la tipología textual que se va a tratar. Conocer de antemano los textos que se deben traducir permite entrenar a los sistemas con el vocabulario e incluso con grandes segmentos bilingües, del tamaño que se requiera.
  7. Si no se dan estas dos condiciones ¡cuidado, que vienen curvas!

La traducción automática aporta inagotables anécdotas para enriquecer la antología del disparate. Ejemplos de perlas:

  • Ambigüedad:
    • I danced at the ball / Bailé en la bola / Bailé en la pelota / Bailé en la pelota
    • I played with the ball / Jugué con la bola / Jugué con la pelota / Jugué con la pelota
    • I eat meat balls / Yo como bolas de la carne / Como albóndigas / Como pelotas de carne
  • Grupos verbales
    • I gave up cigarettes / Di para arriba cigarrillos / Dejé cigarrillos / Yo me rendí cigarrillos

Se pueden consultar más ejemplos en esta antología que acabo de iniciar.

¿Y por qué es tan difícil hacerlo bien? ¿Más complicado que el ajedrez o la secuencia ADN de un genoma (el humano contiene 3.000 millones de pares de bases)? Sí, las posibilidades combinatorias son astronómicas y pese a que existe la gramática y tenemos reglas de combinación de palabras, la capacidad creativa de los hablantes es tal que el problema es muy complejo (Complejidad: partidas de ajedrez vs. sonetos libres).

Durante los setenta y hasta los ochenta se creía que la gramática generativa de Chomsky podría dar la clave del problema. En los noventa se vio que no. Se probaron métodos cuantitativos, basados en grandes colecciones de traducciones. Esto ha funcionado en parte, pero hasta unos límites. Ahora se están ensayando métodos híbridos, con reglas y mucha memoria de textos ya traducidos.

La traducción es una de las artes más elevadas. Traducir bien es incluso más difícil que escribir bien. El traductor humano es un ser “invisible” pero muy cualificado.

Publicado en littera, nlp, translation
2 comments on “La fascinación de la traducción automática
  1. leónidas dice:

    Soy estudiante de clásicas, creo que esto de la traducción automática es la perfecta salida laboral para unos estudios que tienen fama de ser tan poco prácticos. ¿Qué mejor manera de demostrar al mundo lo que sirve nuestra carrera que creando un software de este tipo que les saque las castañas del fuego en el ámbito de la traducción?

  2. Sí, es algo que solemos comentar con los alumnos, pero la paradoja es que los nuevos métodos de traducción automática están basados en probabilidades y aprendizaje automático (a partir de grandes colecciones de segmentos bilingües alineados). Y para eso no hacen falta lingüistas, las máquinas lo hacen solas (vg. Google Translate). Un abrazo, -J

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Páginas
Temas
Blog Stats
  • 164,585 hits
A %d blogueros les gusta esto: