martes, 15 de mayo de 2012

DéjàVu X2: Crear una memoria de traducción


¡Hola, hola!

Como prometí en mi entrada anterior del blog, aquí estoy para hablar sobre memorias de traducción (MT), especialmente sobre cómo crear una MT con DéjàVu X2.

Las opciones generales de una MT varían según el sistema que usemos, pero los pasos generales son prácticamente los mismos:

- Selección de idiomas: cada MT tiene al menos dos idiomas; es la configuración básica para cualquier programa de memoria de traducción. Hay programas en los que podemos trabajar hasta con tres idiomas. Prácticamente todas las memorias de traducción vienen configuradas para trabajar con todas las lenguas posibles.  En el caso de DéjàVu X2 la configuración del idioma ha sido pre-determinada e incluye todos los idiomas.
- Gestión de archivos: Aquí vemos dónde o cómo se van generando los archivos de la memoria de traducción. Una MT puede estar compuesta de un archivo (p.ej. En  Wordfast) o de varios archivos en formatos distintos. Sin embargo, en el caso de DéjàVu X2 hay dos formatos fijos: *.dvmdb, *.dvmdx. Tendremos tantos archivos como idiomas hayamos especificado.
- Configuración del usuario: Nos referimos a la información adicional sobre la base de datos o las unidades de traducción. La información se va almacenando para luego poder extraerla para otro proyecto (se puede extraer mediante filtros). Según el programa puede venir predeterminada (DéjàVu) o completamente abierta para que la defina el usuario (Trados).  Se puede incluir información adicional sobre la base de datos o sobre las unidades de traducción que a lo mejor ahora no es relevante pero luego podría serlo. 
- Opciones para coincidencias parciales (fuzzy matching): Se refieren al grado de similitud entre lo  nuevo a traducir y lo que tenemos ya en la memoria; queremos que nuestro sistema encuentre la información almacenada. Hay una opción que nos permite fijar el grado/umbral de sensibilidad (grado que informa el porcentaje de coincidencia con la nueva traducción). Si tenemos un grado demasiado bajo (ruido) es que hay mucha información que no sirve, no relevante. Si tenemos un grado demasiado alto nos reduce demasiado los resultados y no genera coincidencias (silencio). Por eso lo adecuado sería tener un umbral de sensibilidad del 60-70%. (En DéjàVu es el 75%) Generalmente se aproximan por orden: los más próximos al original aparecerán en las primeras posiciones.

Umbral de sensibilidad de DéjàVu X2


Importación de una MT

Podemos recopilar información para crear una primera memoria de traducción. Pero también podemos importar archivos una vez que la memoria esté creada, al igual que se pueden importar memorias de traducción con formatos concretos y exportarlos hacia formatos distintos como TXT, etc. El formato estándar para la importación y exportación de memorias de traducción es el TMX (translation memory exchange). Éste por lo general no da problemas ni requiere ninguna adaptación. 

Por ejemplo, cuando hacemos una alineación con Bitext obtenemos un TMX y eso lo podemos importar en TMX a DéjàVu.

Exportación de una MT

También podemos exportar una MT o partes de una MT a TMX desde Déjàvu. El programa facilita la conversión a distintos formatos, pero el TMX es el estándar, por lo que es mejor hacerlo con dicho formato. Déjà Vu también ofrece formatos opcionales para la conversión de datos en TMX: a veces puede elegir entre los formatos UTF-16, UTF8 e ISO-646 (archivo de 7 bits).

La exportación de una MT permite que un grupo de traductores pueda compartir una información a pesar de trabajar con herramientas u ordenadores distintos.


Por último, os dejo con el enlace de un vídeo donde se explica cómo crear una MT con Déjà Vu X2 y cómo importar diferentes archivos y memorias: http://www.youtube.com/watch?v=x4sV84SWEEc


1 comentario:

  1. Casino Games near me - Mapyro
    Explore the 10 casinos closest to me 광주광역 출장마사지 including: Bellagio, 인터넷 바카라 사이트 The Casino at Harrah's Cherokee, Cherokee, NC. 부천 출장샵 The 충청남도 출장샵 Hotel at Harrah's 충주 출장안마 Cherokee is located

    ResponderEliminar