Manual del usuario de petraREV

 
 
 
 

Funciones: Avanzadas


Estas funciones permiten comprobar si en una traducción se ha seguido el glosario o cualquier otro tipo de criterios relativos al uso de terminología.

Mostrar segmentos similares

Muestra grupos de segmentos similares, que difieren entre sí en un determinado número de caracteres. Por ejemplo, sirve para comprobar que segmentos con un texto en el idioma de destino similar se han traducido de manera coherente.

Parámetros
Porcentaje máximo de diferencia Máxima diferencia, expresada en porcentaje respecto a la longitud del texto en el idioma de destino, que puede existir entre un segmento y otro para que se consideren como similares. Por ejemplo, si un segmento tiene una longitud de 200 caracteres y no se ha modificado el valor por defecto de este parámetro del 25%, cualquier segmento cuyo texto en el idioma de origen se diferencie en menos de 200 x 25% = 50 caracteres, se considerará también similar.
Mostrar también traducción Si se activa esta casilla de verificación, se mostrará tanto el texto de origen como la traducción. Si se desactiva, solo se mostrará el texto de origen.

Volver arriba

Comprobar términos bilingües

Muchos traducciones mantienen determinados elementos en el idioma de origen, junto a su correspondiente traducción al idioma de destino. Por ejemplo, al traducir la documentación de un software que no se ha traducido, es frecuente encontrarse con segmentos similares al siguiente.

Inglés Press Save.
Español Pulse Save (Guardar).
Ejemplo 1a. Segmento con elemento bilingüe en la traducción

Estos elementos bilingües pueden disminuir la eficacia de petraREV, tanto por ocultar ciertos errores como por elevar el número de falsos positivos. Esta operación intenta minimizar estos problemas mediante una doble función:
  • comprobar que la traducción que se ha dado a los elementos es coherente. Por ejemplo, en el caso anterior, se comprobaría que la opción Save no ha recibido otras traducciones, como podría ser Guardar.
  • modificar la traducción cargada en petraREV (manteniendo intacta la traducción presente en los archivos a partir de los que se ha cargado la traducción), de manera que no queden opciones bilingües. Por ejemplo, en el ejemplo 1b podemos ver cómo quedaría el ejemplo 1a tras aplicarle esta opción.

Inglés Press Save.
Español Pulse Guardar.
Ejemplo 1b. Segmento en la que el elemento bilingüe se ha modificado para que solo aparezca su traducción

Estas sustituciones pueden hacer que las demás comprobaciones de petraREV resulten mucho más efectivas. Normalmente, no obstante, es recomendable aplicar estas comprobaciones tanto antes de la operación como después de ella, ya que la manera de responder de las distintas comprobaciones a esta operación puede variar.

Parámetros
Ruta de archivo de exportación Para exportar los términos extraídos a un archivo de texto separado por tabuladores, especifica aquí la ruta de dicho archivo. Si el campo se deja en blanco, no se exportarán los términos.
Mostrar términos Si se marca esta casilla de verificación, se mostrarán en el informe todos los términos detectados junto con su respectiva frecuencia.
Quitar términos en el idioma de origen de la traducción Si esta casilla de verificación está desactivada, la traducción se deja tal cual. Si está activada, se eliminará la parte correspondiente al idioma de origen de cada término bilingüe que se detecte.

Volver arriba

Comprobar transferencia semántica por grupos

Comprueba que un grupo de elementos de significados similares pero excluyentes se ha traducido de manera que en ningún caso la traducción correspondiente a uno de ellos se ha utilizado para traducir otro. Por ejemplo, para el grupo por defecto red,green,blue, esta operación comprueba que en ningún caso se ha traducido red como verde o azul. Para que los resultados de esta comprobación sean los correctos, es necesario que las traducciones se hayan introducido en el diccionario de traducciones de petraREV.

Parámetros
Grupo semántico Elementos del grupo semántico, separados por comas.

Volver arriba

Inferir terminología y comprobar estructuras

Infiere, a partir de un término semilla y su correspondiente traducción, todos los términos que aparezcan con estructuras similares y comprueba que estas estructuras se han utilizado de manera uniforme. Por ejemplo, imaginemos que partimos del par file-archivo. Este par aparece en el segmento del ejemplo 2a.

Inglés Open the file.
Español Abre el archivo.
Ejemplo 2a. Segmento con el par semilla file-archivo

Aplicando la información de este par, se extrae la información de la estructura en que aparece, con objeto de detectar otros pares que aparezcan en segmentos con una estructura idéntica a la ya reconocida. Por ejemplo, con esta información esta operación podría extraer el par system-sistema del segmento mostrado en el ejemplo 2b.

Inglés Open the system.
Español Abre el sistema.
Ejemplo 2b. Segmento con un par nuevo que se reconoce gracias a su coincidencia con un par anterior

El proceso continúa reconociendo todos los pares y estructuras que puede detectar a partir del par semilla. Finalmente, comprueba si hay algún segmento que presente una discordancia respecto al uso de pares y estructuras. El segmento del ejemplo 2d muestra una de estas discordancias, ya que presentando en el texto de origen la misma estructura del ejemplo 2c su traducción no presenta esta misma estructura, lo que corresponde a un error.

Inglés Closes the file.
Español Cierra el archivo.
Ejemplo 2c. Segmento con el par semilla file-archivo

Inglés Closes the system.
Español Abre el sistema.
Ejemplo 2d. Segmento cuyo texto de origen corresponde a la estructura del ejemplo 2c con otro par, en el que el texto de destino no respeta dicha estructura

Esta comprobación suele ser particularmente útil en textos en los que las estructuras son muy rígidas y se repiten con ligeras variaciones de terminología.

Parámetros
Término semilla en idioma de origen Texto en el idioma de origen del término semilla que se utilizará para comenzar a detectar estructuras y otros términos.
Término semilla en idioma de destino Texto en el idioma de destino del término semilla que se utilizará para comenzar a detectar estructuras y otros términos.
Ruta de archivo de entrada Si se indica una ruta en este campo, no se obtendrán automáticamente los términos a partir del término semilla, sino que se empleará la lista de términos del archivo.
Ruta de archivo de exportación Si se indica una ruta en este campo, los términos obtenidos se exportarán al archivo aquí indicado.
Normalizar términos Si se activa esta casilla de verificación, se eliminarán los espacios de los términos, lo que suele ser muy útil para evitar falsos positivos.
Mostrar términos y estructuras Si se activa esta casilla de verificación, además de las advertencias sobre posibles incoherencias también se mostrarán las listas de términos y estructuras empleadas para realizar la inferencia.
Marcar segmentos inferibles Si se activa esta casilla de verificación, se añadirá el texto «(canBeInferred)» a aquellos segmentos cuya traducción pueda inferirse combinando las estructuras y los términos obtenidos. Esta opción es útil para reducir la cantidad de texto que es necesario revisar cuando hay segmentos similares que resultan de la combianción de una cantidad limitada de términos y estructuras.

Volver arriba

Evaluar etiquetado

petraREV incluye de serie los diccionarios necesarios para realizar un etiquetado suficientemente preciso para la mayoría de los textos en español. No obstante, en algunos casos puede ser necesario afinar estos diccionarios a fin de adaptarlos a un tipo concreto de textos o corregir determinados fallos. Para realizar estos ajustes y comprobar que la precisión del etiquetador, se pueden utilizar archivos que indiquen el etiquetado correcto de un determinado texto, con el siguiente formato:

los el DA0MP0
rayos rayo NCMP000
disparados disparado AQ0MPP
Ejemplo 3. Fragmento de un archivo con el etiquetado correcto de un texto

En cada línea debe incluirse el token en cuestión seguida del lema y la etiqueta, utilizando espacios para separar estos tres datos. Esta operación comparará el etiquetado indicado en el archivo con el generado automáticamente por el etiquetador. Los tokens que no se hayan etiquetado correctamente se mostrarán en rojo y con un asterisco. No hay que olvidar que se considera que la conversión en tokens se ha realizado correctamente, por lo que es necesario tener cuidado al definir las locuciones incluidas en el diccionario, ya que una definición incorrecta puede ocasionar errores que no se detectarían mediante esta operación. No obstante, la diferencia sería muy pequeña.

Parámetros
Ruta de archivo Ruta del archivo que contiene el etiquetado correcto de un texto.

Volver arriba

Comprobar memoria de revisión heredada

Esta comprobación es muy similar a la operación Comprobar memoria de revisión, con la principal diferencia de que utiliza un formato de codificación anterior de los criterios de la memoria de revisión.

En general, es recomendable utilizar siempre el nuevo formato, que es que se emplea en el cuadro de diálogo Memoria de revisión. No obstante, se ha mantenido esta función por compatibilidad con memorias creadas con versiones anteriores de petraREV.

Parámetros
Ruta de archivo Ruta del archivo que contiene la memoria de revisión. Si se deja en blanco, se comprueba una memoria de revisión genérica, válida para la mayoría de las traducciones.
Mostrar detalles Si se activa esta casilla, además de las advertencias habituales generadas por esta comprobación, también se muestran otros datos, como por ejemplo el número de veces que se cumple cada uno de los criterios de la memoria de revisión.

Volver arriba

Mostrar etiquetado

Muestra el lema y la etiqueta morfosintática correspondiente a cada token (palabra, signo de puntuación, locución, etc.) de un texto. Es preciso tener cuidado al utilizar esta función con textos muy grandes, ya que la salida podría tardar bastante en mostrarse. Normalmente, se utiliza para comprobar que el etiquetado de pequeños fragmentos de texto es el correcto y no está impidiendo que se detecten determinados errores gramaticales.

Parámetros
Idioma Puede tomar los valores Original y Traducción en función del texto cuyo etiquetado queramos consultar.

Volver arriba

Invertir traducción

Esta operación invierte el orden de las palabras presentes en el texto traducido. Por ejemplo, imaginemos que aplicamos esta operación al segmento del ejemplo 4a.

Inglés Press this key.
Español Pulse esta tecla.
Ejemplo 4a. Segmento antes de la inversión

El resultado sería el segmento que se muestra en el ejemplo 4b.

Inglés Press this key.
Español tecla. esta Pulse
Ejemplo 4b. Segmento después de la inversión

La inversión del texto traducido no suele resultar muy útil y, habitualmente, solo sirva de ayuda para preparar el texto antes de someterlo a otros procesos, por ejemplo, en el caso de textos sujetos a normas muy específicas que es posible traducir con fiabilidad de forma, como ocurre en ocasiones con las listas de palabras clave.

Esta operación no se puede configurar.
Volver arriba

Extraer muestra con toda la terminología

Muestra el menor número de segmentos de manera que aparezcan en ellos todas las palabras utilizadas en la traducción. Suele utilizarse para realizar revisiones puntuales de grandes volúmenes de texto o solo se desea llevar a cabo tareas de terminología con un texto, como por ejemplo extraer todos los términos que aparecen en él.

Esta operación no se puede configurar.
Volver arriba

Comprobar orden de secuencias de tokens

Esta comprobación resulta útil cuando deseamos que determinados elementos gramaticales aparezcan en el texto siempre en el mismo orden. Por ejemplo, tal vez queramos que los adjetivos aparezcan siempre en el mismo orden o quizás no querramos que se utilice en unas ocasiones la secuencia «nombre-adjetivo-preposición-nombre» y en otras la secuencia «nombre-preposición-nombre-adjetivo» cuando las palabras implicadas en ambas combinaciones sean las mismas. Podemos ver un ejemplo a continuación:

Inglés Note: The new release of Ubuntu will be the Precise Pangolin.
Español Nota: La versión nueva de Ubuntu será el Pangolín Preciso.
Ejemplo 5a. Se ha utilizado la secuencia «nombre-adjetivo-preposición-nombre»

Inglés Note: The new release of Ubuntu will be the Precise Pangolin.
Español Nota: La versión de Ubuntu nueva será el Pangolín Preciso.
Ejemplo 5b. Se ha utilizado la secuencia «nombre-preposición-nombre-adjetivo»

Por supuesto, es posible que el orden de las palabras haya sido alterado de manera intencionada, por lo que es importante evaluar los resultados de esta comprobación de manera crítica.

Parámetros
Secuencias gramaticales Especifica las secuencias gramaticales cuyo orden no debería variar en el texto. Cada grupo de secuencias se separa con punto y coma «;» y, para dentro de cada grupo, las secuencias se separan con coma «,». Para indicar una secuencia en concreto, se indica una letra para cada elemento gramatical que deba incluir la secuencia. Por ejemplo, para una secuencia «nombre adjetivo preposición nombre» la secuencia sería «nasn». El valor predeterminado es «aa;nasn,nsna» que realiza dos comprobaciones: a) secuencias «adjetivo adjetivo, b) secuencias «nombre adjetivo preposición nombre»/«nombre preposición nombre adjetivo».

Volver arriba

Comparar longitud


Esta operación muestra todas aquellos segmentos en los que la longitud del texto de destino supera en más de un determinado porcentaje la longitud del texto de origen. El siguiente ejemplo muestra un ejemplo:

Inglés Precise Pangolin is forthcoming.
Español Precise Pangolin proximamente estará disponible.
Ejemplo 6. Diferencia excesiva de longitud

En caso de que restrinjamos el porcentaje máximo de diferencia en un 20%, aparecerá una advertencia ya que el texto de origen tiene 32 caracteres y el texto de destino tiene 48 caracteres, lo que supone una diferencia de longitud del 50%. Para que superase la comprobación de longitud sería necesario acortar la traducción aproximadamente unos 10 caracteres.

Parámetros
Máximo El uso de este parámetro depende del tipo del método de comparación que se esté utilizando:
  • Por porcentaje de diferencia: El parámetro indica el porcentaje máximo en que la longitud del texto de destino puede superar la longitud del texto de origen. Es importante recordar que el texto de origen puede ser más pequeño que el texto de destino en cualquier porcentaje, sin que dicha diferencia genere nunca una advertencia.
  • Fijo: El parámetro indica el número máximo de caracteres que puede tener un segmento.
Exclusión Este parámetro es útil cuando se marca la casilla Sugerir unión de líneas y permite indicar un texto que evite que se sugiera que se unan líneas. Por ejemplo, si se indica en este campo un punto (.), no se sugerirá que se unan segmentos si uno de ellos contiene un punto.
Método de comparación Este cuadro combinado indica el método que se empleará para comparar las longitudes de los segmentos:
  • Por porcentaje de diferencia: se calculará la diferencia porcentual entre la longitud del texto de destino de un segmento y su texto de origen.
  • Fijo: se comparará la longitud de los segmentos respecto a un valor fijo.
Sugerir unión de líneas Si se marca esta casilla, se mostrarán los segmentos que puedan unirse sin que la suma de las longitudes de los segmentos supere el máximo indicado.

Volver arriba

Convertir etiquetas en secuencias


Esta operación convierte las etiquetas presentes tanto en el texto de origen como en el de destino a un formato diferente. El siguiente ejemplo muestra un ejemplo:

Inglés {0}Precise Pangolin{1} is forthcoming.
Español {0}Precise Pangolin{1} proximamente estará disponible.
Ejemplo 7a. Formato original de las etiquetas

Con los ajustes predeterminados, las etiquetas de este segmento se transformarían de la siguiente manera:

Inglés &tA;Precise Pangolin&tB; is forthcoming.
Español &tA;Precise Pangolin&tB; proximamente estará disponible.
Ejemplo 7b. Formato original de las etiquetas

El uso principal de esta función es convertir las etiquetas al formato utilizado por ciertos tipos de memorias de traducción.

Parámetros
Inicio de etiqueta Carácter que marca el inicio de la etiqueta.
Final de etiqueta Carácter que marca el final de la etiqueta.
Secuencia Caracteres que se utilizarán sucesivamente al convertir las etiquetas. En caso de que en un segmento el número de etiquetas presentes supere el número de caracteres indicados, se mostrará una advertencia y no se convertirán dichas etiquetas del segmento.

Volver arriba

Mostrar traducciones sin comparar


La comparación de la traducción revisada con la traducción creada originalmente por el traductor puede ser muy útil, por ejemplo para que traductor pueda detectar las pautas que debe seguir en el futuro o para que el revisor compruebe que no ha cometido errores al introducir los cambios. Para este fin, petraREV ofrece varias funciones que permiten realizar esta comparación. No obstante, es fácil que el traductor o el revisor olvide cuáles son las traducciones que ha examinado y cuáles no. Esta función examina todas las traducciones de la carpeta de traducciones comparadas y, si detecta que una traducción aún no se ha comparado, lo indica.


Parámetros
Mostrar también archivos ya comparados Si esta casilla está activada se muestran también los archivos para los que se existe una versión original (v1) y una versión revisada (v2).

Volver arriba

Modificar estilo


Modifica el estilo de un texto mediante la sustitución de palabras. Es posible indicar que unos lemas se sustituyan por otros, ajustando la palabra sustituida al contexto de manera automática. Las sustituciones se definen en un archivo, donde cada línea indica una condición y una acción. La condición se especifica en la notación gramatical habitual. La acción puede ser:
  • cloneVerb=verbo: sustituye el token 0 de la condición por un verbo conjugado de idéntica manera.
Aparte de esta posibilidad, esta operación también puede ayudar a regularizar la terminología, cuando se desea que la traducción utilice de manera uniforme varias opciones. Por ejemplo, si se quiere analizar el número de veces que aparece sin embargo y no obstante, habrá que incluir la siguiente línea en el archivo con el estilo: sin embargo;no obstante

Parámetros
Ruta del archivo Ruta del archivo que contiene los cambios de estilo.
Regularizar variedad Si se marca esta casilla, se regularizará la terminología en lugar de modificarla.
Mostrar detalles Si se marca esta casilla, se mostrarán los cambios realizados.

Uso sugerido:
Esta operación es útil para crear variantes de una traducción, por ejemplo, para adaptarla a los usos a una zona geográfica determinada. También es útil para parafrasear textos.
Volver arriba

Comparar texto de origen

Compara el texto de origen de los segmentos de un grupo de archivos con el texto de origen de los segmentos de otro grupo de archivos y muestra todos los segmentos que están en un grupo, pero no en el otro.

Parámetros
Ruta del primer grupo de archivos Primer grupo de archivos cuyos textos de origen se compararán.
Ruta del primer grupo de archivos Segundo grupo de archivos cuyos textos de origen se compararán.

Volver arriba

Acortar segmentos

Acorta el texto de los segmentos de un archivo a la longitud indicada. También es posible quitar los espacios de la cadena acortada y cambiar a mayúscula la primera letra de cada palabra.

Parámetros
Ruta del archivo Ruta del archivo que contiene los segmentos que se desea acortar.
Longitud máxima Longitud máxima que deben tener los segmentos acortados.
Palabras eliminadas Palabras que se eliminarán del segmento acortado. Hay que tener en cuenta que estas palabra se eliminarán, independientemente de si es necesario acortar la cadena o no.
Quitar espacios Si se activa esta casilla de verificación, se eliminarán los espacios del segmento acortado.
Mayúscula inicial Si se activa esta casilla de verificación, se cambiará a mayúscula la primera letra de cada palabra del segmento acortado.

Volver arriba

Recuperar y organizar información


Combina la información de varias páginas web de referencia en una única ordenando alfabéticamente la información y eliminando las cabeceras y los pies de página.

Volver arriba

Comparar léxicos


Compara el léxico presente en la traducción cargada con el contenido en una referencia, consistente en uno o varios archivos bilingües. Esta operación es útil para localizar rápidamente los problemas de traducción que puede presentar una traducción.

Parámetros
Ruta del archivo Ruta de los archivos bilingües con cuyo léxico se comparará el de la traducción.
Categorías analizadas Solo se tendrán en cuenta las categorías indicadas en este cuadro. El valor por defecto nvar tiene en cuenta nombres, verbos, adjetivos y adverbios.
Idioma Especifica si se analizará el análisis del texto de origen o del texto de destino.
Mostrar traducción Esta cuadro combinado ofrece tres opciones: no mostrar traducción, mostrar la traducción mostrando las palabras encontradas la referencia o mostrar la traducción mostrando las palabras que no aparecen en la referencia.
Mostrar palabras nuevas Si se marca esta casilla, se mostrará una lista con las palabras nuevas.
Mostrar palabras encontradas Si se marca esta casilla, se mostrará una lista con las palabras encontradas.
Mostrar gráfico Muestra un gráfico que representa la evolución según la que aparecen las nuevas palabras del texto. Este gráfico puede corresponder a la evolución de la dificultad de un texto.
Mostrar palabras por porcentaje Si se marca esta casilla, se mostrará la lista de palabras en cada 10 % de la traducción. Es decir, se mostrará una lista con las palabras nuevas que corresponden al primer 10 % de la traducción, a continuación, una lista con las palabras nuevas que aparecen desde el 10 % hasta el 20 % de la traducción y así sucesivamente hasta llegar al 100%. Esta opción es útil para detectar posibles agrupaciones de palabras en las diferentes partes de una traducción.

Volver arriba

Extraer automáticamente terminología


Extrae automáticamente la terminología de la traducción. Para ello, busca las secuencias nombre-nombre presentes en el texto de origen para intentar obtener su correspondiente traducción. Los resultados se muestran en una lista.

Volver arriba

Comparar redacción


Compara la redacción de la traducción con una determinada referencia, consistente en un archivo monolingüe. Se muestran los segmentos similares. Esta operación puede ser útil cuando la traducción debe ser lo más próxima posible a un texto de referencia que no está disponible en formato bilingüe.

Parámetros
Ruta del archivo Archivo de texto que contiene la referencia. Debe ser un archivo de texto plano con la codificación predeterminada del sistema.
Umbral mínimo Máximo de diferencias posibles que se tolerarán entre la traducción y la referencia con la que se está comparando.
Idioma Indica si se comparará el idioma de origen o el de destino.
Mostrar segmentos por debajo del mínimo Indica si se mostrarán los segmentos inferiores al mínimo. Puede facilitar la lectura de los resultados, al no omitirse ningún segmento.

Volver arriba

Mostrar texto


Muestra el texto contenido en un archivo marcando la terminología. Esta operación es muy similar a la que muestra la traducción, pero con la diferencia de que esta muestra un texto monolingüe.

Parámetros
Ruta del archivo Ruta del archivo cuyo texto se desea mostrar.
Ruta del glosario Ruta del glosario cuyos términos se marcarán en el texto.
Exportar a archivo Si se indica una ruta en esta casilla, se exportarán los resultados a un archivo .fodt.
Longitud mínima Longitud mínima que debe tener un término para que se marque al mostrarlo.
Coincidir mayúsculas y minúsculas Si se marca esta casilla, solo se marcarán aquellos términos que aparezcan en la traducción con las mismas mayúsculas y minúsculas con las que aparecen en la traducción.

Volver arriba

Buscar léxicos similares

A partir de una carpeta donde hay varios archivos con listas de frecuencias de tokens, busca aquella en la que aparecen el mayor número de tokens de la traducción cargada. Por ejemplo, si los tokens de la traducción cargada son «sistema, operativo, libre, ordenador, computadora», en la lista «sistema, libre, procesador», aparecerán solo 2 de estos tokens y en la lista «sistema, operativo, libre, electrónica, conversación», aparecerán 3 de ellos, por lo que se estimará que esta lista es más similar a la traducción cargada.

Parámetros
Carpeta con listas de palabras Ruta de la carpeta donde se encuentran las listas de tokens. Pueden ser listas únicamente de tokens o de tokens y frecuencias, pero en ambos casos la lista debe estar ordenada de mayor frecuencia a menor. Puedes crearla mediante la función Buscar tokens.
Archivo con lista para restar Para eliminar el archivo de tokens comunes que aparecen en todos los textos y resaltar las diferencias, puedes restarle una lista de palabras frecuentes, tanto al léxico extraído de la traducción como a las listas con las que se comparará.
Categorías consideradas Indica las categorías que se tendrán en cuenta en la comparación. Hay que tener en cuenta que estas categorías deben coincidir con las categorías de las listas extraídas, ya que no se volverán a etiquetar.
Máximo de lemas comparados Para evitar el efecto de los textos de mayor tamaño, en los que es más posible que aparezca una palabra cualquiera, se puede limitar el número máximo de lemas que compararán. Por ejemplo, si se establece este valor en 100, solo se compararán las 100 palabras más frecuentes de la traducción con las 100 palabras de cada una de las listas existentes.
Idioma Este cuadro combinado indica si la comparación se lleva a cabo con los tokens del texto de origen o de destino.

Volver arriba

Crear muestra


Crea una muestra a partir de la traducción cargada. Esta operación es útil cuando no resulta factible trabajar con la traducción completa, porque no se dispone de tiempo o porque solo está finalizada parte de la traducción.

Parámetros
Número máximo de segmentos Indica el número máximo de segmentos que tendrá la muestra. Se puede indicar como un número fijo o como un porcentaje. Por ejemplo, si se indica el 10%, la muestra contendrá el 10% de los segmentos de la traducción cargada.

Volver arriba

Contar palabras


Muestra el número de palabras que contiene un texto, sin incluir las etiquetas.

Parámetros
Idioma Puede tomar los valores Original y Traducción en función del texto cuyas palabras queramos contar.
Agrupar Si se indica en este cuadro combinado Por archivo se mostrará una tabla con el número de palabras de cada archivo y el porcentaje que dicho archivo supone respecto al total de la traducción cargada. Si se indica Por número de palabras de segmento se mostrará una tabla y un gráfico que indican el número de segmentos que caen dentro de cada intervalo de longitud de segmentos.
Intervalo Cuando en el cuadro combinado anterior se ha elegido la opción Por número de palabras de segmento, este parámetro sirve para especificar el tamaño de los intervalos en los que se dividirán los recuentos de palabras por segmentos. Por ejemplo, un intervalo de 10, dividirá los recuentos en los intervalos 0-10, 10-20, 20-30, etc., un intervalo de 50, dividirá los recuentos en los intervalos 0-50, 50-100, 150-200, etc.

Volver arriba

Convertir palabras en lemas


Convierte las palabras de la traducción de un texto en sus correspondientes lemas. Esta operación resulta útil cuando se desea eliminar las flexiones de las palabras (género, número, persona, etc.) con objeto de someter el texto a un procesamiento posterior. Por ejemplo, para comprobar el glosario, esta operación puede servir para eliminar falsos positivos. A continuación, podemos ver cómo quedaría un segmento tras aplicarle esta operación:

Inglés The files will be updated.
Español Los archivos se actualizarán.
Ejemplo 8a. Texto antes de la conversión de palabras en lemas

Con los ajustes predeterminados, las etiquetas de este segmento se transformarían de la siguiente manera:

Inglés The files will be updated.
Español El archivo él actualizar.
Ejemplo 8b. Texto antes de la conversión de palabras en lemas

Volver arriba

Aplicar correcciones

Analiza las correcciones que se han indicado en un archivo y las aplica a la traducción cargada. El archivo con las correcciones debe indicar en cada línea la versión y la original separada por un tabulador de la siguiente manera:

Versión original→Versión corregida

Por ejemplo, imaginemos que el archivo con las correcciones incluye la siguiente línea:

No se puede abrir el fichero.→No se puede abrir el archivo.

A partir de esta línea, se derivará la corrección fichero→archivo. Por tanto, si la traducción incluye el siguiente segmento:

Inglés Choose another file.
Español Elija otro fichero.
Ejemplo 9a. Texto antes de aplicar la corrección
Esta operación lo modificará y lo convertirá en:
Inglés Choose another file.
Español Elija otro archivo.
Ejemplo 9b. Texto después de aplicar la corrección


Parámetros
Ruta del archivo Ruta del archivo que contiene las correcciones.
Longitud mínima Longitud mínima que deben tener los cambios detectados para que se apliquen.
Validar Si esta casilla está activada, no se aplica una corrección si el texto sustituido aparece en algún punto del texto corregido. Continuando con el ejemplo anterior, si se extrae la corrección fichero→archivo, pero se detecta que el término fichero se utiliza en algunos casos en la versión corregida, no se aplicará esta corrección en ningún caso.

Volver arriba

Generar traducción de enumeración por glosario


Esta operación permite generar automáticamente la traducción de un texto compuesto únicamente por una enumeración de términos cuya traducción figura en un glosario. Por ejemplo, imagemos que el texto incluye la siguiente línea:

file, screen, computer, mouse

También disponemos de un glosario donde se indica la traducción de cada uno de estos términos:

file→archivo
screen→pantalla
computer→ordenador
mouse→ratón

A partir de este archivo y este glosario, esta operación generará la siguiente traducción:

archivo, pantalla, ordenador, ratón

Cuando no sea posible localizar un elemento de la enumeración en el glosario, se marcará con los caracteres %% para que podamos localizarlo y escribir una traducción adecuada.

Parámetros
Ruta del archivo de entrada Ruta del archivo que contiene el texto que se quiere traducir.
Archivo de glosario Ruta del archivo que contiene el glosario con los términos cuya traducción se conoce.
Ruta del archivo de salida Ruta del archivo donde se guardará la traducción generada.

Volver arriba

Alinear lotes de archivos


Alinea los archivos existentes en dos carpetas y exporta la alineación a una tercera carpeta. Para que sea posible esta alineación, los archivos de la carpeta con el texto de origen y de destino deben tener el mismo nombre. Actualmente, esta operación está especialmente adaptada a los textos con la legislación de la Unión Europea, pero sería posible generalizarla para adaptarla a otros textos.

Parámetros
Carpeta de entrada de origen Carpeta donde se encuentran los archivos con el texto de origen.
Carpeta de entrada de destino Carpeta donde se encuentran los archivos con el texto de destino.
Carpeta de salida Carpeta donde se guardarán los archivos alineados.
Idioma Indica el código del idioma para el que se realizará la alineación. La alineación se realiza siempre entre el español y otro idioma que, de manera predeterminada, es el inglés. Sin embargo, por ejemplo, puede cambiarse este valor por FR si se desea realizar una alineación entre archivos en francés y en español.
Codificación Codificación que emplean los archivos alineados.

Volver arriba

Evaluar división de palabras


A partir de una lista de palabras que se consideran erróneas, se evalúa si es posible dividirlas en varias palabras. Como criterio para realizar esta división, se utiliza un modelo del lenguaje.

Volver arriba

Resumir proyectos


A partir de una carpeta con los controles de proyectos de varios años, genera una tabla donde se indica para cada cuenta:
  • el código
  • los años en los que se recibieron proyectos de dicha cuenta
  • el número de proyectos total

Además, si se dispone de un archivo con información adicional en el que se indique otros datos para cada código de cuenta, se indicarán estos datos, que suelen ser el campo de especialización (p. ej., medicina, juegos, finanzas, etc.) y el tipo de material (p. ej., web, marketing, instrucciones, etc.).

Parámetros
Carpeta de entrada Carpeta donde se encuentran los controles de proyectos.
Ruta del archivo de salida Si se indica una ruta de archivo, se guardará un archivo delimitado por tabuladores con la información presentada en pantalla.
Ruta del archivo con información adicional Si se indica una ruta de archivo, se utilizará este archivo para asociar información genérica sobre cada cuenta.

Volver arriba

Evaluar probabilidades de texto


(No funcional) Corrige las palabras que no están correctamente separadas por espacios y no figuran en el diccionario.
Volver arriba

Compilar comentarios


Muestra una tabla con todos los comentarios presentes en un archivo de memoQ. Si es necesario, se puede indicar el nombre del usuario cuyos comentarios se desean mostrar, para ocultar así los demás. También se pueden omitir los comentarios eliminados.
Parámetros
Ruta de archivo de traducción Ruta del archivo de memoQ que contiene los comentarios
Autor de los comentarios Si se deja en blanco, se mostrarán todos los comentarios, pero si se introduce un texto solo se mostrarán aquellos comentarios cuyo autor contenga dicho texto.
Omitir comentarios eliminados Si se marca esta casilla de verificación, no se mostrarán los comentarios que se hayan marcado como eliminados.

Volver arriba

Analizar con búsqueda seccionada


Analiza un texto resaltando aquellas palabras que aparecen en un texto de referencia. Es importante señalar que el texto cargado como traducción es el que se tomará como referencia y el texto indicado en la operación es el que se analizará.

Esta aplicación es útil para evaluar hasta que punto dos textos son similares, especialmente cuando las diferencias en la segmentación hacen que esta similitud no pueda evaluarse sencillamente utilizando un texto como memoria de traducción y el otro como texto para traducir.
Parámetros
Ruta de archivo analizado Ruta del archivo que se analizará tomando como referencia la traducción cargada.
Número mínimo de tokens en secuencias Solo se tendrán en cuenta las secuencias que contengan un número de tokens igual o superior al número aquí indicado.
Mostrar texto resaltado Si se activa esta casilla de verificación, se mostrará el texto resaltando aquellas secuencias de tokens que aparezcan en el texto de referencia.

Volver arriba

Buscar lista


Busca en la traducción cargada todas las líneas de un archivo de texto. Esta operación es particularmente útil para hacer comprobaciones cuando solo se conoce el texto de origen o de destino. Por ejemplo, sirve para comprobar rápidamente que se han introducido correctamente las respuestas a unas consultas cuando se sabe qué texto debe aparecer en el texto de edestino, pero no se conoce el texto de origen.


Parámetros
Ruta de archivo de lista Ruta del archivo que contiene la lista con las líneas que se buscará.
Buscar en texto de origen Si esta casilla está activada, se buscará en el texto de origen.
Buscar en texto de destino Si esta casilla está activada, se buscará en el texto de destino.

Volver arriba

Analizar datos de EyeTracker


Muestra una lista y una tabla que resumen los datos procedentes de un EyeTracker.


Parámetros
Ruta del archivo Ruta del archivo .csv con los datos del EyeTracker.

Volver arriba

Generar memorias de traducción a partir de carpetas


Crea varias memorias de traducción utilizando los códigos de cuentas de un archivo para buscar en una carpeta (que debe incluir dicho código y seguir cierta estructura) los archivos con las extensiones indicadas.

Parámetros
Ruta del archivo Ruta de un archivo en el que cada línea corresponde a un código de una cuenta para la que se desea generar una memoria de traducción.
Carpeta base Ruta de la carpeta donde se encuentran los archivos bilingües. Se puede utilizar un asterisco para sustituirlo por los códigos de cuenta que contiene el archivo anterior. Si el campo anterior se ha dejado en blanco, se buscarán archivos bilingües directamente en la carpeta que se indique aquí.
Carpeta de salida Carpeta en la que se guardarán las memorias de traducción generadas.
Extensiones Extensiones que se considerará que corresponden a archivos bilingües.
Cargar y guardar traducción Si esta casilla está desactivado, solo se examinarán los directorios indicados, pero no se generará ni se guardará ninguna memoria de traducción.

Volver arriba

Comparar anotaciones de sentimientos


Compara los locutores y sentimientos indicados por dos o tres anotadores para calcular los porcentajes de concordancia y señalar, cuando hay tres anotadores, cuál es la anotación más frecuente para cada línea.

Parámetros
Ruta del archivo del primer anotador Ruta del archivo que contiene las anotaciones indicadas por el primer anotador. Si se indica la ruta de una carpeta, se compararán todos los archivos de dicha carpeta.
Ruta del archivo del segundo anotador Ruta del archivo que contiene las anotaciones indicadas por el segundo anotador. Si se indica la ruta de una carpeta, se compararán todos los archivos de dicha carpeta.
Ruta del archivo del tercer anotador Ruta del archivo que contiene las anotaciones indicadas por el tercer anotador. Si se indica la ruta de una carpeta, se compararán todos los archivos de dicha carpeta.
Lote de archivos Si no se deja en blanco, este campo especifica la ruta de un archivo que detalla los archivos que deben compararse.
Locutores admitidos Posibles anotaciones de locutores (separadas por punto y coma). Si en la columna correspondiente al locutor se indica cualquier valor diferente a alguno de los aquí indicados, se mostrará una advertencia.
Sentimientos admitidos Posibles anotaciones de sentimientos (separadas por punto y coma). Si en la columna correspondiente al sentimiento se indica cualquier valor diferente a alguno de los aquí indicados, se mostrará una advertencia.
Columnas comparadas Permite comparar columnas adicionales que incluya la anotación, como por ejemplo, el fragmento de texto donde se pone de manifiesto el sentimiento.
Mostrar solo resumen Si se activa esta casilla de verificación, solo se mostrará el resumen global para un archivo. Si se deja desactivada, se mostrará una comparación línea por línea.
Mostrar opción más frecuente Si se activa esta casilla de verificación, se mostrará la opción que tiene un mayor porcentaje de concordancia en los casos en los que los anotadores discrepen.
Crear combinación Si se activa esta casilla de verificación, se generará un archivo combinando aleatoriamente las anotaciones indicadas por los diferentes anotadores.
Codificación Codificación que emplean los archivos con las anotaciones.

Volver arriba

Marcar subsegmentos


Marca la traducción añadiendo etiquetas en torno a subsegmentos que ya hayan aparecido antes o que no se hayan traducido. Por ejemplo, en los dos segmentos que aparecen a continuación vemos que un texto de origen (y su correspondiente texto de destino) coinciden si separamos el texto por los dos puntos, aunque el segmento completo no coincida. Esta operación es útil cuando una traducción incluye un elevado número de repeticiones dentro de los segmentos, pero no interesa separarlos resegmentando la traducción.

Inglés Select an option: you can open or close the file.
Español Seleccione una opción: puede abrir o cerrar el archivo.
Ejemplo 10a. Repetición en el interior de un segmento

Inglés Select an option: you can protect the file or leave it unprotected.
Español Seleccione una opción: puede proteger el archivo o dejarlo desprotegido.
Ejemplo 10b. Repetición en el interior de un segmento

Si se elige marcar estos segmentos con las marcas {r} y {/r}, el segmento 10b se transformará en el siguiente:

Inglés {r}Select an option{/r}: you can protect the file or leave it unprotected.
Español {r}Seleccione una opción{/r}: puede proteger el archivo o dejarlo desprotegido.
Ejemplo 10c. Repetición en el interior de un segmento

En el segmento que aparece a continuación utilizando nuevamente los dos puntos como separador de subsegmentos, vemos que el primer subsegmento coincide en el texto de origen y en el texto de destino, por lo que se marcará con las etiquetas que se hayan especificado:

Inglés USB: you can use the USB port.
Español USB: puede utilizar el puerto USB.
Ejemplo 11a. Texto sin traducir en el interior de un segmento

En este caso, el segmento con las marcas sería el siguiente:

Inglés {r}USB{\r}: you can use the USB port.
Español {r}USB{\r}: puede utilizar el puerto USB.
Ejemplo 11b. Texto sin traducir en el interior de un segmento

Parámetros
Delimitador de subsegmentos Carácter o secuencia de caracteres que delimita los subsegmentos.
Marca inicial de subsegmentos Cadena de texto que se añadirá al comienzo de cada subsegmento identificado.
Marca final de subsegmentos Cadena de texto que se añadirá al final de cada subsegmento identificado.
Longitud mínima de subsegmentos Si los subsegmentos resultantes tienen una longitud inferior a la indicada por este parámetro, no se marcarán.
Marcar subsegmentos Puede elegirse entre dos opciones:
  • Repetidos: se marcarán los subsegmentos repetidos.
  • Destino igual a origen: se marcarán los subsegmentos cuyo texto de origen coincida con el texto de destino.

Volver arriba

Buscar texto


Busca el texto especificado en la traducción. No se obligará a que coincidan el uso de mayúsculas y minúsculas ni se buscarán las palabras completas.


Parámetros
Texto Texto que se buscará

Volver arriba

Extraer, transformar y exportar etiquetas


Prepara una lista de etiquetas para facilitar la conversión de archivos entre formatos. Esta lista de etiquetas está compuesta por las diferentes etiquetas que contiene la traducción a las que se asigna una marca, formada combinando un número consecutivo con los caracteres indicados para crear la marca. Por ejemplo, con la configuración predeterminada a las etiquetas <b> y </b> se les asignarán las marcas {1} y {2}.

Parámetros
Ruta del archivo Ruta del archivo donde se guardará la lista con las etiquetas y las marcas asignadas.
Inicio de etiqueta Texto que señala el inicio de una etiqueta.
Final de etiqueta Texto que señala el final de una etiqueta.
Inicio de marca Texto que señala el inicio de una marca.
Final de marca Texto que señala el final de una marca.

Volver arriba

Analizar documentación


Uso interno. Comprueba que se han documentado todas las operaciones disponibles y el número de parámetros descrito para cada una de ellas es el correcto.

Volver arriba

 
 
Para enviar cualquier comentario, sugerencia o pregunta, escribe a .
Copyleft 2020. Sitio desarrollado con la colaboración del grupo de investigación PETRA. Actualizado 23-noviembre-2021.
 
 
 
 
 

Solicitamos su permiso para obtener datos estadísticos de su navegación en esta web, en cumplimiento del Real Decreto-ley 13/2012.
Si continúa navegando consideramos que acepta el uso de cookies. Aceptar | Más información