Manual del usuario de petraREV
Conceptos básicos Pantallas Funciones Programación Tutoriales Nosotros ¿Conoces petraTAG?

Blogger

Avanzadas

Estas funciones permiten comprobar si en una traducción se ha seguido el glosario o cualquier otro tipo de criterios relativos al uso de terminología.

Mostrar segmentos similares
Muestra grupos de segmentos similares, que difieren entre sí en un determinado número de caracteres. Por ejemplo, sirve para comprobar que segmentos con un texto en el idioma de destino similar se han traducido de manera coherente.

Parámetros
Porcentaje máximo de diferencia Máxima diferencia, expresada en porcentaje respecto a la longitud del texto en el idioma de destino, que puede existir entre un segmento y otro para que se consideren como similares. Por ejemplo, si un segmento tiene una longitud de 200 caracteres y no se ha modificado el valor por defecto de este parámetro del 25%, cualquier segmento cuyo texto en el idioma de origen se diferencie en menos de 200 x 25% = 50 caracteres, se considerará también similar.
Mostrar también traducción Si se activa esta casilla de verificación, se mostrará tanto el texto de origen como la traducción. Si se desactiva, solo se mostrará el texto de origen.

Volver arriba

Extraer términos bilingües
Muchos traducciones mantienen determinados elementos en el idioma de origen, junto a su correspondiente traducción al idioma de destino. Por ejemplo, al traducir la documentación de un software que no se ha traducido, es frecuente encontrarse con segmentos similares al siguiente.

Inglés Press Save.
Inglés Pulse Save (Guardar).
Ejemplo 1a. Segmento con elemento bilingüe en la traducción

Estos elementos bilingües pueden disminuir la eficacia de petraREV, tanto por ocultar ciertos errores como por elevar el número de falsos positivos. Esta operación intenta minimizar estos problemas mediante una doble función:
  • comprobar que la traducción que se ha dado a los elementos es coherente. Por ejemplo, en el caso anterior, se comprobaría que la opción Save no ha recibido otras traducciones, como podría ser Guardar.
  • modificar la traducción cargada en petraREV (manteniendo intacta la traducción presente en los archivos a partir de los que se ha cargado la traducción), de manera que no queden opciones bilingües. Por ejemplo, en el ejemplo 1b podemos ver cómo quedaría el ejemplo 1a tras aplicarle esta opción.

Inglés Press Save.
Inglés Pulse Guardar.
Ejemplo 1b. Segmento en la que el elemento bilingüe se ha modificado para que solo aparezca su traducción

Estas sustituciones pueden hacer que las demás comprobaciones de petraREV resulten mucho más efectivas. Normalmente, no obstante, es recomendable aplicar estas comprobaciones tanto antes de la operación como después de ella, ya que la manera de responder de las distintas comprobaciones a esta operación puede variar.

Parámetros
Ruta de archivo de exportación Para exportar los términos extraídos a un archivo de texto separado por tabuladores, especifica aquí la ruta de dicho archivo. Si el campo se deja en blanco, no se exportarán los términos.
Mostrar términos Si se marca esta casilla de verificación, se mostrarán en el informe todos los términos detectados junto con su respectiva frecuencia.
Quitar términos en el idioma de origen de la traducción Si esta casilla de verificación está desactivada, la traducción se deja tal cual. Si está activada, se eliminará la parte correspondiente al idioma de origen de cada término bilingüe que se detecte.

Volver arriba

Comprobar transferencia semántica por grupos
Comprueba que un grupo de elementos de significados similares pero excluyentes se ha traducido de manera que en ningún caso la traducción correspondiente a uno de ellos se ha utilizado para traducir otro. Por ejemplo, para el grupo por defecto red,green,blue, esta operación comprueba que en ningún caso se ha traducido red como verde o azul. Para que los resultados de esta comprobación sean los correctos, es necesario que las traducciones se hayan introducido en el diccionario de traducciones de petraREV.

Parámetros
Grupo semántico Elementos del grupo semántico, separados por comas.

Volver arriba

Inferir terminología y comprobar estructuras
Infiere, a partir de un término semilla y su correspondiente traducción, todos los términos que aparezcan con estructuras similares y comprueba que estas estructuras se han utilizado de manera uniforme. Por ejemplo, imaginemos que partimos del par file-archivo. Este par aparece en el segmento del ejemplo 2a.

Inglés Open the file.
Inglés Abre el archivo.
Ejemplo 2a. Segmento con el par semilla file-archivo

Aplicando la información de este par, se extrae la información de la estructura en que aparece, con objeto de detectar otros pares que aparezcan en segmentos con una estructura idéntica a la ya reconocida. Por ejemplo, con esta información esta operación podría extraer el par system-sistema del segmento mostrado en el ejemplo 2b.

Inglés Open the system.
Inglés Abre el sistema.
Ejemplo 2b. Segmento con un par nuevo que se reconoce gracias a su coincidencia con un par anterior

El proceso continúa reconociendo todos los pares y estructuras que puede detectar a partir del par semilla. Finalmente, comprueba si hay algún segmento que presente una discordancia respecto al uso de pares y estructuras. El segmento del ejemplo 2d muestra una de estas discordancias, ya que presentando en el texto de origen la misma estructura del segmento 2c su traducción no presenta esta misma estructura, lo que corresponde a un error en este caso.

Inglés Closes the file.
Inglés Cierra el archivo.
Ejemplo 2c. Segmento con el par semilla file-archivo

Inglés Closes the system.
Inglés Abre el sistema.
Ejemplo 2d. Segmento cuyo texto de origen corresponde a la estructura del ejemplo 2c con otro par, en el que el texto de destino no respeta dicha estructura

Esta comprobación suele ser particularmente útil en textos en los que las estructuras son muy rígidas y se repiten con ligeras variaciones de terminología.

Parámetros
Término semilla en idioma de origen Texto en el idioma de origen del término semilla que se utilizará para comenzar a detectar estructuras y otros términos.
Término semilla en idioma de destino Texto en el idioma de destino del término semilla que se utilizará para comenzar a detectar estructuras y otros términos.
Normalizar términos Si se activa esta casilla de verificación, se eliminarán los espacios de los términos, lo que suele ser muy útil para evitar falsos positivos.
Mostrar términos y estructuras Si se activa esta casilla de verificación, además de las advertencias sobre posibles incoherencias también se mostrarán las listas de términos y estructuras empleadas para realizar la inferencia.

Volver arriba

Evaluar etiquetado
petraREV incluye de serie los diccionarios necesarios para realizar un etiquetado suficientemente preciso para la mayoría de los textos en español. No obstante, en algunos casos puede ser necesario afinar estos diccionarios a fin de adaptarlos a un tipo concreto de textos o corregir determinados fallos. Para realizar estos ajustes y comprobar que la precisión del etiquetador, se pueden utilizar archivos que indiquen el etiquetado correcto de un determinado texto, con el siguiente formato:

los el DA0MP0
rayos rayo NCMP000
disparados disparado AQ0MPP
Ejemplo 3. Fragmento de un archivo con el etiquetado correcto de un texto

En cada línea debe incluirse el token en cuestión seguida del lema y la etiqueta, utilizando espacios para separar estos tres datos. Esta operación comparará el etiquetado indicado en el archivo con el generado automáticamente por el etiquetador. Los tokens que no se hayan etiquetado correctamente se mostrarán en rojo y con un asterisco. No hay que olvidar que se considera que la conversión en tokens se ha realizado correctamente, por lo que es necesario tener cuidado al definir las locuciones incluidas en el diccionario, ya que una definición incorrecta puede ocasionar errores que no se detectarían mediante esta operación. No obstante, la diferencia sería muy pequeña.

Parámetros
Ruta de archivo Ruta del archivo que contiene el etiquetado correcto de un texto.

Volver arriba

Comprobar memoria de revisión heredada
Esta comprobación es muy similar a la operación Comprobar memoria de revisión, con la principal diferencia de que utiliza un formato de codificación anterior de los criterios de la memoria de revisión.

En general, es recomendable utilizar siempre el nuevo formato, que es que se emplea en el cuadro de diálogo Memoria de revisión. No obstante, se ha mantenido esta función por compatibilidad con memorias creadas con versiones anteriores de petraREV.

Parámetros
Ruta de archivo Ruta del archivo que contiene la memoria de revisión. Si se deja en blanco, se comprueba una memoria de revisión genérica, válida para la mayoría de las traducciones.
Mostrar detalles Si se activa esta casilla, además de las advertencias habituales generadas por esta comprobación, también se muestran otros datos, como por ejemplo el número de veces que se cumple cada uno de los criterios de la memoria de revisión.

Volver arriba

Mostrar etiquetado
Muestra el lema y la etiqueta morfosintática correspondiente a cada token (palabra, signo de puntuación, locución, etc.) de un texto. Es preciso tener cuidado al utilizar esta función con textos muy grandes, ya que la salida podría tardar bastante en mostrarse. Normalmente, se utiliza para comprobar que el etiquetado de pequeños fragmentos de texto es el correcto y no está impidiendo que se detecten determinados errores gramaticales.

Parámetros
Idioma Puede tomar los valores Original y Traducción en función del texto cuyo etiquetado queramos consultar.

Volver arriba

Comparar columnas
Muestra las diferencias existentes entre el texto de la primera columna y el de la segunda columna de un archivo con el formato mostrado en el ejemplo 4, es decir un archivo de solo texto donde las columnas se separan mediante un tabulador (representado en ejemplo mediante una flecha).

Pulse la tecla Abrir.→Presione la tecla Abrir.
Pulse la tecla Cerrar.→Presione la tecla Cerrar.
Ejemplo 4. Líneas de un archivo de texto con dos columnas para compararlo


Esta operación sirve para comparar cualquier tipo de textos, tanto en el idioma de origen como en el idioma de destino. Resulta especialmente útil, entre otros usos, para ver las modificaciones que se han hecho a un texto de origen o las correcciones que ha introducido un revisor tras revisar una traducción.

Parámetros
Ruta de archivo Ruta del archivo que contiene los textos que se desea comparar.

Volver arriba

Invertir traducción
Esta operación invierte el orden de las palabras presentes en el texto traducido. Por ejemplo, imaginemos que aplicamos esta operación al segmento del ejemplo 5a.

Inglés Press this key.
Inglés Pulse esta tecla.
Ejemplo 5a. Segmento antes de la inversión

El resultado sería el segmento que se muestra en el ejemplo 5b.

Inglés Press this key.
Inglés tecla. esta Pulse
Ejemplo 5b. Segmento después de la inversión

La inversión del texto traducido no suele resultar muy útil y, habitualmente, solo sirva de ayuda para preparar el texto antes de someterlo a otros procesos, por ejemplo, en el caso de textos sujetos a normas muy específicas que es posible traducir con fiabilidad de forma, como ocurre en ocasiones con las listas de palabras clave.

Esta operación no se puede configurar.
Volver arriba

Extraer muestra con toda la terminología
Muestra el menor número de segmentos de manera que aparezcan en ellos todas las palabras utilizadas en la traducción. Suele utilizarse para realizar revisiones puntuales de grandes volúmenes de texto o solo se desea llevar a cabo tareas de terminología con un texto, como por ejemplo extraer todos los términos que aparecen en él.

Esta operación no se puede configurar.
Volver arriba

Comprobar orden de secuencias gramaticales
Esta comprobación resulta útil cuando deseamos que determinados elementos gramaticales aparezcan en el texto siempre en el mismo orden. Por ejemplo, tal vez queramos que los adjetivos aparezcan siempre en el mismo orden o quizás no querramos que se utilice en unas ocasiones la secuencia «nombre-adjetivo-preposición-nombre» y en otras la secuencia «nombre-preposición-nombre-adjetivo» cuando las palabras implicadas en ambas combinaciones sean las mismas. Podemos ver un ejemplo a continuación:

Inglés Note: The new release of Ubuntu will be the Precise Pangolin.
Inglés Nota: La versión nueva de Ubuntu será el Pangolín Preciso.
Ejemplo 6a. Se ha utilizado la secuencia «nombre-adjetivo-preposición-nombre»

Inglés Note: The new release of Ubuntu will be the Precise Pangolin.
Inglés Nota: La versión de Ubuntu nueva será el Pangolín Preciso.
Ejemplo 6b. Se ha utilizado la secuencia «nombre-preposición-nombre-adjetivo»

Por supuesto, es posible que el orden de las palabras haya sido alterado de manera intencionada, por lo que es importante evaluar los resultados de esta comprobación de manera crítica.

Parámetros
Secuencias gramaticales Especifica las secuencias gramaticales cuyo orden no debería variar en el texto. Cada grupo de secuencias se separa con punto y coma «;» y, para dentro de cada grupo, las secuencias se separan con coma «,». Para indicar una secuencia en concreto, se indica una letra para cada elemento gramatical que deba incluir la secuencia. Por ejemplo, para una secuencia «nombre adjetivo preposición nombre» la secuencia sería «nasn». El valor predeterminado es «aa;nasn,nsna» que realiza dos comprobaciones: a) secuencias «adjetivo adjetivo, b) secuencias «nombre adjetivo preposición nombre»/«nombre preposición nombre adjetivo».

Volver arriba

Comparar longitud

Esta operación muestra todas aquellos segmentos en los que la longitud del texto de destino supera en más de un determinado porcentaje la longitud del texto de origen. El siguiente ejemplo muestra un ejemplo:

Inglés Precise Pangolin is forthcoming.
Inglés Precise Pangolin proximamente estará disponible.
Ejemplo 7. Diferencia excesiva de longitud

En caso de que restrinjamos el porcentaje máximo de diferencia en un 20%, aparecerá una advertencia ya que el texto de origen tiene 32 caracteres y el texto de destino tiene 48 caracteres, lo que supone una diferencia de longitud del 50%. Para que superase la comprobación de longitud sería necesario acortar la traducción aproximadamente unos 10 caracteres.

Parámetros
Porcentaje máximo de diferencia Porcentaje máximo en que la longitud del texto de destino puede superar la longitud del texto de origen. Es importante recordar que el texto de origen puede ser más pequeño que el texto de destino en cualquier porcentaje, sin que dicha diferencia genere nunca una advertencia.

Volver arriba

Convertir etiquetas en secuencias

Esta operación convierte las etiquetas presentes tanto en el texto de origen como en el de destino a un formato diferente. El siguiente ejemplo muestra un ejemplo:

Inglés {0}Precise Pangolin{1} is forthcoming.
Inglés {0}Precise Pangolin{1} proximamente estará disponible.
Ejemplo 8a. Formato original de las etiquetas

Con los ajustes predeterminados, las etiquetas de este segmento se transformarían de la siguiente manera:

Inglés &tA;Precise Pangolin&tB; is forthcoming.
Inglés &tA;Precise Pangolin&tB; proximamente estará disponible.
Ejemplo 8b. Formato original de las etiquetas

El uso principal de esta función es convertir las etiquetas al formato utilizado por ciertos tipos de memorias de traducción.

Parámetros
Inicio de etiqueta Carácter que marca el inicio de la etiqueta.
Final de etiqueta Carácter que marca el final de la etiqueta.
Secuencia Caracteres que se utilizarán sucesivamente al convertir las etiquetas. En caso de que en un segmento el número de etiquetas presentes supere el número de caracteres indicados, se mostrará una advertencia y no se convertirán dichas etiquetas del segmento.

Volver arriba

Comparar listas
Compara los elementos presentes en las listas definidas por dos archivos de texto y muestra los elementos de la segunda lista que no están presentes en la primera lista.

Parámetros
Ruta de primera lista Ruta del archivo que contiene la primera lista. Se considera que cada línea corresponde a un elemento.
Ruta de segunda lista Ruta del archivo que contiene la segunda lista. Se considera que cada línea corresponde a un elemento.
Máximo de caracteres diferentes Cuando queramos que dos elementos se consideren suficientemente parecidos aunque no sean exactamente iguales, podemos especificar para este parámetro un valor diferente de cero, que corresponderá al número de caracteres en que pueden diferir dos elementos para que se sigan considerando iguales. Estos elementos también se mostrarán como resultado de la comparación para que podamos examinarlos personalmente.

Volver arriba

Mostrar traducciones sin comparar

La comparación de la traducción revisada con la traducción creada originalmente por el traductor puede ser muy útil, por ejemplo para que traductor pueda detectar las pautas que debe seguir en el futuro o para que el revisor compruebe que no ha cometido errores al introducir los cambios. Para este fin, petraREV ofrece varias funciones que permiten realizar esta comparación. No obstante, es fácil que el traductor o el revisor olvide cuáles son las traducciones que ha examinado y cuáles no. Esta función examina todas las traducciones de la carpeta de traducciones comparadas y, si detecta que una traducción aún no se ha comparado, lo indica.


Parámetros
Mostrar también archivos ya comparados Si esta casilla está activada se muestran también los archivos para los que se existe una versión original (v1) y una versión revisada (v2).

Volver arriba

Convertir glosario múltiple en glosario simple

Esta operación convierte un glosario delimitado por tabuladores, en el que en cada línea se indican varias traducciones para varios términos en el idioma de origen, en un glosario simple, también delimitado por tabuladores, en el que en cada línea aparece únicamente un término y una traducción. Para ello, para cada uno de los términos en el idioma de origen, se detallan todas las posibles traducciones. Esta operación solo es útil cuando el glosario tiene exactamente el formato indicado. Si se trata de un glosario con varias columnas de las que solo una corresponde al término y otra a su traducción, es necesario cargarlo como un archivo multitab.


Parámetros
Ruta del glosario de entrada Ruta del archivo que contiene el glosario de entrada.
Ruta del glosario de salida Ruta del archivo donde se guardará el glosario de salida.
Columna divisora Columna a partir de la que extraerán las traducciones.

Volver arriba

Modificar estilo

Modifica el estilo de un texto mediante la sustitución de palabras. Es posible indicar que unos lemas se sustituyan por otros, ajustando la palabra sustituida al contexto de manera automática. Las sustituciones se definen en un archivo, donde cada línea indica una condición y una acción. La condición se especifica en la notación gramatical habitual. La acción puede ser:
  • cloneVerb=verbo: sustituye el token 0 de la condición por un verbo conjugado de idéntica manera.

Parámetros
Ruta del archivo Ruta del archivo que contiene los cambios de estilo.

Volver arriba

Comparar texto de origen
Compara el texto de origen de los segmentos de un grupo de archivos con el texto de origen de los segmentos de otro grupo de archivos y muestra todos los segmentos que están en un grupo, pero no en el otro.

Parámetros
Ruta del primer grupo de archivos Primer grupo de archivos cuyos textos de origen se compararán.
Ruta del primer grupo de archivos Segundo grupo de archivos cuyos textos de origen se compararán.

Volver arriba

Acortar segmentos
Acorta el texto de los segmentos de un archivo a la longitud indicada. También es posible quitar los espacios de la cadena acortada y cambiar a mayúscula la primera letra de cada palabra.

Parámetros
Ruta del archivo Ruta del archivo que contiene los segmentos que se desea acortar.
Longitud máxima Longitud máxima que deben tener los segmentos acortados.
Palabras eliminadas Palabras que se eliminarán del segmento acortado. Hay que tener en cuenta que estas palabra se eliminarán, independientemente de si es necesario acortar la cadena o no.
Quitar espacios Si se activa esta casilla de verificación, se eliminarán los espacios del segmento acortado.
Mayúscula inicial Si se activa esta casilla de verificación, se cambiará a mayúscula la primera letra de cada palabra del segmento acortado.

Volver arriba

Recuperar y organizar información

Combina la información de varias páginas web de referencia en una única ordenando alfabéticamente la información y eliminando las cabeceras y los pies de página.

Volver arriba

Comparar léxicos

Compara el léxico presente en la traducción cargada con el contenido en una referencia, consistente en uno o varios archivos bilingües. Esta operación es útil para localizar rápidamente los problemas de traducción que puede presentar una traducción.

Parámetros
Ruta del archivo Ruta de los archivos bilingües con cuyo léxico se comparará el de la traducción.
Categorías analizadas Solo se tendrán en cuenta las categorías indicadas en este cuadro. El valor por defecto nvar tiene en cuenta nombres, verbos, adjetivos y adverbios.
Idioma Especifica si se analizará el análisis del texto de origen o del texto de destino.
Mostrar traducción Esta cuadro combinado ofrece tres opciones: no mostrar traducción, mostrar la traducción mostrando las palabras encontradas la referencia o mostrar la traducción mostrando las palabras que no aparecen en la referencia.
Mostrar palabras nuevas Si se marca esta casilla, se mostrará una lista con las palabras nuevas.
Mostrar palabras encontradas Si se marca esta casilla, se mostrará una lista con las palabras encontradas.
Mostrar gráfico Muestra un gráfico que representa la evolución según la que aparecen las nuevas palabras del texto. Este gráfico puede corresponder a la evolución de la dificultad de un texto.

Volver arriba

Extraer automáticamente terminología

Extrae automáticamente la terminología de la traducción. Para ello, busca las secuencias nombre-nombre presentes en el texto de origen para intentar obtener su correspondiente traducción. Los resultados se muestran en una lista.

Volver arriba

Comparar redacción

Compara la redacción de la traducción con una determinada referencia, consistente en un archivo monolingüe. Se muestran los segmentos similares. Esta operación puede ser útil cuando la traducción debe ser lo más próxima posible a un texto de referencia que no está disponible en formato bilingüe.

Parámetros
Ruta del archivo Archivo de texto que contiene la referencia. Debe ser un archivo de texto plano con la codificación predeterminada del sistema.
Umbral mínimo Máximo de diferencias posibles que se tolerarán entre la traducción y la referencia con la que se está comparando.
Idioma Indica si se comparará el idioma de origen o el de destino.
Mostrar segmentos por debajo del mínimo Indica si se mostrarán los segmentos inferiores al mínimo. Puede facilitar la lectura de los resultados, al no omitirse ningún segmento.

Volver arriba

Mostrar texto

Muestra el texto contenido en un archivo marcando la terminología. Esta operación es muy similar a la que muestra la traducción, pero con la diferencia de que esta muestra un texto monolingüe.

Parámetros
Ruta del archivo Ruta del archivo cuyo texto se desea mostrar.
Ruta del glosario Ruta del glosario cuyos términos se marcarán en el texto.
Exportar a archivo Si se indica una ruta en esta casilla, se exportarán los resultados a un archivo .fodt.
Longitud mínima Longitud mínima que debe tener un término para que se marque al mostrarlo.
Coincidir mayúsculas y minúsculas Si se marca esta casilla, solo se marcarán aquellos términos que aparezcan en la traducción con las mismas mayúsculas y minúsculas con las que aparecen en la traducción.

Volver arriba

Buscar léxicos similares
A partir de una carpeta donde hay varios archivos con listas de frecuencias de tokens, busca aquella en la que aparecen el mayor número de tokens de la traducción cargada. Por ejemplo, si los tokens de la traducción cargada son «sistema, operativo, libre, ordenador, computadora», en la lista «sistema, libre, procesador», aparecerán solo 2 de estos tokens y en la lista «sistema, operativo, libre, electrónica, conversación», aparecerán 3 de ellos, por lo que se estimará que esta lista es más similar a la traducción cargada.

Parámetros
Carpeta con listas de palabras Ruta de la carpeta donde se encuentran las listas de tokens. Pueden ser listas únicamente de tokens o de tokens y frecuencias, pero en ambos casos la lista debe estar ordenada de mayor frecuencia a menor. Puedes crearla mediante la función Buscar tokens.
Archivo con lista para restar Para eliminar el archivo de tokens comunes que aparecen en todos los textos y resaltar las diferencias, puedes restarle una lista de palabras frecuentes, tanto al léxico extraído de la traducción como a las listas con las que se comparará.
Categorías consideradas Indica las categorías que se tendrán en cuenta en la comparación. Hay que tener en cuenta que estas categorías deben coincidir con las categorías de las listas extraídas, ya que no se volverán a etiquetar.
Máximo de lemas comparados Para evitar el efecto de los textos de mayor tamaño, en los que es más posible que aparezca una palabra cualquiera, se puede limitar el número máximo de lemas que compararán. Por ejemplo, si se establece este valor en 100, solo se compararán las 100 palabras más frecuentes de la traducción con las 100 palabras de cada una de las listas existentes.
Idioma Este cuadro combinado indica si la comparación se lleva a cabo con los tokens del texto de origen o de destino.

Volver arriba

Crear muestra

Crea una muestra a partir de la traducción cargada. Esta operación es útil cuando no resulta factible trabajar con la traducción completa, porque no se dispone de tiempo o porque solo está finalizada parte de la traducción.

Parámetros
Número máximo de segmentos Indica el número máximo de segmentos que tendrá la muestra. Se puede indicar como un número fijo o como un porcentaje. Por ejemplo, si se indica el 10%, la muestra contendrá el 10% de los segmentos de la traducción cargada.

Volver arriba

Contar palabras

Muestra el número de palabras que contiene un texto, sin incluir las etiquetas.

Parámetros
Idioma Puede tomar los valores Original y Traducción en función del texto cuyas palabras queramos contar.
Intervalo Este parámetro sirve para especificar el tamaño de los intervalos en los que se dividirán los recuentos de palabras por segmentos. Por ejemplo, un intervalo de 10, dividirá los recuentos en los intervalos 0-10, 10-20, 20-30, etc., un intervalo de 50, dividirá los recuentos en los intervalos 0-50, 50-100, 150-200, etc.

Volver arriba

Convertir palabras en lemas

Convierte las palabras de la traducción de un texto en sus correspondientes lemas. Esta operación resulta útil cuando se desea eliminar las flexiones de las palabras (género, número, persona, etc.) con objeto de someter el texto a un procesamiento posterior. Por ejemplo, para comprobar el glosario, esta operación puede servir para eliminar falsos positivos. A continuación, podemos ver cómo quedaría un segmento tras aplicarle esta operación:

Inglés The files will be updated.
Inglés Los archivos se actualizarán.
Ejemplo 9a. Texto antes de la conversión de palabras en lemas

Con los ajustes predeterminados, las etiquetas de este segmento se transformarían de la siguiente manera:

Inglés The files will be updated.
Inglés El archivo él actualizar.
Ejemplo 9b. Texto antes de la conversión de palabras en lemas

Volver arriba

Aplicar correcciones
Analiza las correcciones que se han indicado en un archivo y las aplica a la traducción cargada. El archivo con las correcciones debe indicar en cada línea la versión y la original separada por un tabulador de la siguiente manera:

Versión original→Versión corregida

Por ejemplo, imaginemos que el archivo con las correcciones incluye la siguiente línea:

No se puede abrir el fichero.→No se puede abrir el archivo.

A partir de esta línea, se derivará la corrección fichero→archivo. Por tanto, si la traducción incluye el siguiente segmento:

Inglés Choose another file.
Inglés Elija otro fichero.
Ejemplo 10a. Texto antes de aplicar la corrección
Esta operación lo modificará y lo convertirá en:
Inglés Choose another file.
Inglés Elija otro archivo.
Ejemplo 10b. Texto después de aplicar la corrección


Parámetros
Ruta del archivo Ruta del archivo que contiene las correcciones.
Longitud mínima Longitud mínima que deben tener los cambios detectados para que se apliquen.
Validar Si esta casilla está activada, no se aplica una corrección si el texto sustituido aparece en algún punto del texto corregido. Continuando con el ejemplo anterior, si se extrae la corrección fichero→archivo, pero se detecta que el término fichero se utiliza en algunos casos en la versión corregida, no se aplicará esta corrección en ningún caso.

Volver arriba

Generar traducción de enumeración por glosario

Esta operación permite generar automáticamente la traducción de un texto compuesto únicamente por una enumeración de términos cuya traducción figura en un glosario. Por ejemplo, imagemos que el texto incluye la siguiente línea:

file, screen, computer, mouse

También disponemos de un glosario donde se indica la traducción de cada uno de estos términos:

file→archivo
screen→pantalla
computer→ordenador
mouse→ratón

A partir de este archivo y este glosario, esta operación generará la siguiente traducción:

archivo, pantalla, ordenador, ratón

Cuando no sea posible localizar un elemento de la enumeración en el glosario, se marcará con los caracteres %% para que podamos localizarlo y escribir una traducción adecuada.

Parámetros
Ruta del archivo de entrada Ruta del archivo que contiene el texto que se quiere traducir.
Archivo de glosario Ruta del archivo que contiene el glosario con los términos cuya traducción se conoce.
Ruta del archivo de salida Ruta del archivo donde se guardará la traducción generada.

Volver arriba

Resumir proyectos

Crea un resumen a partir de varios registros de proyectos de traducción.

Parámetros
Carpeta de entrada Carpeta donde están los registros que contiene los proyectos correspondientes a diferentes años.
Ruta del archivo de salida Archivo donde se guardará el resumen.
Ruta del archivo con información adicional Ruta opción de un archivo que contiene información adicional sobre cada uno de los proyectos que se incluirán en el resumen.

Volver arriba

Alinear lotes de archivos

Alinea los archivos existentes en dos carpetas y exporta la alineación a una tercera carpeta. Para que sea posible esta alineación, los archivos de la carpeta con el texto de origen y de destino deben tener el mismo nombre. Actualmente, esta operación está especialmente adaptada a los textos con la legislación de la Unión Europea, pero sería posible generalizarla para adaptarla a otros textos.

Parámetros
Carpeta de entrada de origen Carpeta donde se encuentran los archivos con el texto de origen.
Carpeta de entrada de destino Carpeta donde se encuentran los archivos con el texto de destino.
Carpeta de salida Carpeta donde se guardarán los archivos alineados.

Volver arriba

Evaluar división de palabras

A partir de una lista de palabras que se consideran erróneas, se evalúa si es posible dividirlas en varias palabras. Como criterio para realizar esta división, se utiliza un modelo del lenguaje.

Volver arriba
Para enviar cualquier comentario, sugerencia o pregunta, escribe a .
Copyleft 2017. Sitio desarrollado con la colaboración del grupo de investigación PETRA. Actualizado 27-julio-2017. Made in Linux

Solicitamos su permiso para obtener datos estadísticos de su navegación en esta web, en cumplimiento del Real Decreto-ley 13/2012.
Si continúa navegando consideramos que acepta el uso de cookies. Aceptar | Más información