Manual del usuario de petraREV

 
 
 
 

Funciones: Gramática


Estas funciones permiten realizar comprobaciones y operaciones de tipo gramatical, como por ejemplo asegurarse de que no haya errores de ortografía a de concordancia.

Etiquetar texto

Muchas de las funciones de petraREV requieren que el texto de destino se etiquete previamente, es decir, que se asigne a cada palabra un lema y una etiqueta con su categoría morfosintáctica. Esta operación se realiza de manera automática cuando es necesaria. No obstante, en ocasiones puede ser necesario repetirla, por ejemplo, si hemos actualizado el diccionario o hemos cambiado el texto mediante la función de buscar y reeemplazar. En función del tamaño del texto, esta operación puede tardar varios minutos.

Parámetros
Idioma Especifica el idioma de los segmentos que se etiquetarán.


Volver arriba

Buscar tokens

Busca todos los elementos de una determinada categoría gramatical, según las etiquetas que se describen en la sección sobre programación. Por ejemplo, si se buscan las etiquetas de tipo «n», se mostrarán todos los nombres, «a» buscará los adjetivos, «v» los verbos, etc. También es posible acceder a esta función mediante la pestaña Buscar gramática de la pantalla Buscar y reemplazar.

Parámetros
Archivo de exportación Si se quiere guardar la lista resultante como un archivo (texto plano, con cada token y su correspondiente frecuencia en cada línea separados por un tabulador), basta con indicar la ruta en este cuadro. Si se deja en blanco, no se guardará ninguna lista.
Categoría gramatical Categoría gramatical que queremos buscar. Se puede introducir un único carácter o varios, pero siempre deberán ser los primeros de la etiqueta. Si se quieren buscar varias categorías gramaticales, se pueden separar mediante punto y coma. Por ejemplo, n;v busca todos los tokens que son un nombre o un verbo.
Idioma Puede tomar los valores Original y Traducción en función del texto en el que deseemos realizar las búsquedas.
Presentación Si se selecciona Lista, los resultados se mostrarán en una lista, con un elemento por línea. Si se selecciona Línea, todos los elementos aparecerán en una única línea, separados por comas y con las frecuencias entre paréntesis. Por último, si se selecciona Contexto, los elementos se mostrarán marcados en rojo en los segmentos en los que aparecen.
Mostrar gráfico Si se marca esta casilla, se mostrará un gráfico de barras con las frecuencias de los tokens encontrados ordenados de mayor frecuencia a menos.
Ignorar mayúsculas Si se marca esta casilla, se agruparán las palabras que solo difieran en el uso de mayúsculas y minúsculas. Por ejemplo, sistema, Sistema y SISTEMA se agruparán bajo un solo token, dándose prioridad a las formas en minúsculas. En el ejemplo anterior, se utilizaría sistema.
Mostrar lemas Si se marca esta casilla, se agruparán las palabras que compartan el mismo lema. Por ejemplo, cantaría, canté y cantará se agruparán bajo un solo token, que corresponde a la forma canónica, en este caso cantar.

Volver arriba

Comprobar concordancia

Comprueba si hay alguna disconcordancia de género o número entre determinantes y adjetivos/sustantivos. Por ejemplo, el siguiente segmento muestra un error de concordancia.

Inglés The selected option is not valid.
Español El opción seleccionada no es válida.
Ejemplo 1. Error de concordancia.

Hay que tener en cuenta que no se comprueba ningún otro tipo de concordancia más allá del indicado. Por ejemplo, no se comprobarán las concordancias sustantivo-adjetivo o sustantivo-adjetivo.

Parámetros
Comprobar verbos Comprueba la concordancia nombre-verbo.


Volver arriba

Comprobar conectores

Normalmente, las preposiciones y los determinantes que se emplean para conectar dos elementos siempre suelen ser los mismos. Esta comprobación determina todos estos conectores y muestra los casos en los que detecta alguna diferencia, lo que suele corresponder a una falta de coherencia. Por ejemplo, veamos los segmentos 2a y 2b:

Inglés Open the data base.
Español Abra la base datos.
Ejemplo 2a. Incoherencia en el uso de conectores.

Inglés Close the data base.
Español Cierre la base de datos.
Ejemplo 2b. Incoherencia en el uso de conectores.

Mientras que en el ejemplo 2a no existe ninguna preposición entre base y datos, en el ejemplo 2b se ha utilizado la preposición de, que es una opción más correcta.

Parámetros
Categorías gramaticales de los elementos conectados Categoría gramaticales, según las etiquetas que se describen en la sección sobre programación, entre las que se examinarán los conectores utilizados. Por ejemplo, el valor «na» buscará los conectores entre nombres y adjetivos. No suele ser necesario alterar el valor por defecto.
Número máximo de tokens conectados Indica el número máximo de tokens (determinantes y preposiciones) que puede haber entre dos elementos conectados. Por ejemplo, para el valor 1, se considerarán los grupos nombre pantalla y nombre de pantalla, pero no nombre de la pantalla, porque entre nombre y pantalla hay 2 tokens.
Modo resumido Si se activa esta casilla de verificación, solo se mostrarán las incoherencias relacionados con un grupo en el que no haya ningún conector intermedio y otro grupo con uno o varios conectores. Por ejemplo, se mostrarán advertencias para los grupos nombre pantalla y nombre de pantalla, pero no para nombre de pantalla y nombre de la pantalla.


Volver arriba

Comprobar gramática

Las reglas gramaticales describen combinaciones de elementos gramaticales que no deseamos que aparezcan en una traducción. En ocasiones sirven para detectar errores, como por ejemplo determinados errores de concordancia entre verbo y sustantivo, pero también son útiles para imponer ciertas convenciones de estilo. Por ejemplo, mediante estas reglas podemos evitar que se utilice la segunda persona en una traducción, si deseamos darle un tono más formal.

Cada regla de estilo se compone de dos elementos, separados por un tabulador. El primero consiste en una serie de condiciones, expresadas en la notación gramatical de petraREV que indican la combinación que queremos que se nos muestra. El segundo es un mensaje que informa al usuario del posible problema que presenta dicha combinación. Por ejemplo, veamos la regla del ejemplo 3.

0(E1=Fia)1(P=cuando)→Probablemente se debería añadir el acento al pronombre interrogativo:
Ejemplo 3. Regla gramatical para detectar errores en la puntuación del pronombre interrogativo cuando.

Esta regla indica que queremos ver aquellos casos en los que un símbolo de apertura de interrogación aparece seguido por la palabra cuando (sin tilde). Aunque hay casos en los que dicho uso es aceptable, por lo general suele corresponder a un error, por lo que merece la pena examinar estos casos.

Parámetros
Ruta del archivo con las reglas gramaticales Ruta del archivo que contiene las reglas gramaticales.


Volver arriba

Comprobar repeticiones

Muestra los casos en los que una o varias palabras aparecen repetidas, lo que suele corresponder a un error. En el ejemplo 4, podemos ver un segmento en el que la palabra la aparece incorrectamente dos veces.
Inglés Close the data base.
Español Cierre la la base de datos.
Ejemplo 4. Repetición errónea de la palabra «la»


Parámetros
N.º de palabras repetidas Indica cuántas palabras deben repetirse para que se considere un error. Un ejemplo del valor 1 sería «la la», uno del valor 2 sería «de la de la», uno del valor 3 sería «para que no para que no», etc. Se pueden escribir varios valores escribiéndolos uno tras otros sin ningún tipo de separación. Por ejemplo, el valor «123» indica que se busquen las repeticiones de 1, 2 o 3 palabras.
No mostrar repeticiones que también aparezcan en el original La mayoría de las advertencias que no corresponden a errores de esta comprobación están relacionadas con repeticiones de elementos que también aparecen en el texto de origen. Por tanto, si se activa esta casilla, no se considerará que una repetición es un error si también aparece en el texto de origen.

Volver arriba

Buscar segmentos con texto de origen igual a texto de destino

Muestra aquellos segmentos en los que el texto de destino coincide con el texto de origen.

Parámetros
Comprobar criterios de traducibilidad Si se activa esta casilla, no se mostrarán los segmentos que estén compuestos únicamente por números y signos de puntuación (concretamente los caracteres 0123456789.,;:), a pesar de que coincidan texto de origen y texto de destino.
Invertir resultados Si se marca esta casilla, se mostrarán aquellos segmentos en los que el texto de origen no coincida con el texto de destino.

Volver arriba

Buscar segmentos con traducción vacía

Muestra aquellos segmentos en los que el texto de origen contiene algún carácter y, sin embargo, el texto de destino no contiene ninguno.

Esta operación no se puede configurar.
Volver arriba

Generar diccionario

Genera el diccionario flexionado que utiliza petraREV para etiquetar los textos mediante las tablas de terminaciones y lemas. Se trata de una operación bastante avanzada que puede tardar cierto tiempo (normalmente, unos quince minutos) y que sólo es necesario realizar cuando se han introducido cambios en los diccionarios que es necesario aplicar al diccionario generado. También puede llevarse a cabo utilizando el botón Generar de la pantalla Diccionario.

Parámetros
Idioma Indica el idioma para el que se generará el diccionario.

Volver arriba

Mostrar estadísticas de etiquetado

Presenta una lista con la frecuencia de distribución de cada categoría morfológica.

Parámetros
Idioma Indica el idioma para el que se mostrarán las estadísticas.

Volver arriba

Buscar acrónimo

Cuando en un texto aparecen un acrónimo cuyo significado desconocemos, esta función nos ayuda mostrando todas las combinaciones de palabra del texto cuyas iniciales coinciden con las que estamos buscando.

Parámetros
Acrónimo buscado Secuencia de letras que forma el acrónimo.
Idioma Indica el idioma en el que se buscará el acrónimo.

Volver arriba

Buscar secuencia de tokens

Busca todos los tokens que cumplen una determinada condición gramatical, según las etiquetas que se describen en la sección sobre programación y se genera una lista con un número fijo de tokens a partir de dicho token. Por ejemplo, si se buscan los tokens que sean un nombre seguido de un verbo y se especifica que se extraigan dos tokens, se mostrarán todos los casos en los que un nombre aparezca seguido de un verbo. También es posible guardar la lista de secuencias de tokens obtenida en un archivo.

Parámetros
Condición gramatical Condición gramatical que debe cumplirse.
Longitud de secuencia Número de tokens que se mostrarán a partir del token que cumple la condición. Por defecto, siempre se parte del token 0, por lo que debe ajustarse la condición de manera que el primer token que se extraiga sea siempre el token 0.
Ruta de archivo Ruta del archivo al que se exportará la lista de secuencias de tokens. Si se deja en blanco, no se exportará ningún resultado.
Idioma Puede tomar los valores Original y Traducción en función del texto en el que deseemos realizar las búsquedas.
Presentación Si se selecciona Lista, los resultados se mostrarán en una lista, con un elemento por línea. Si se selecciona Línea, todos los elementos aparecerán en una única línea, separados por comas y con las frecuencias entre paréntesis. Por último, si se selecciona Contexto, los elementos se mostrarán marcados en rojo en los segmentos en los que aparecen.

Volver arriba

Mostrar repeticiones excesivas de palabras

Muestra advertencias cuando aparecen varias palabras con un mismo lema excesivamente cerca. En estos casos, con frecuencia resulta preferible recurrir a un sinónimo para que el texto resulte menos repetitivo. Por ejemplo, en el siguiente segmento, se puede sustituir seleccione por elija para mejorar el estilo del texto.

Inglés Select the object and choose the action to perform.
Español Seleccione el objeto y seleccione la acción que desea llevar a cabo.
Ejemplo 5. Repetición excesiva de la palabra «seleccionar»

Tal como se puede observar, para determinar si la repetición es excesiva se emplea el lema, de forma que varias formas flexionadas de un mismo lema se considerarán como una repetición.

Parámetros
Categorías analizadas Solo se mostrarán las repeticiones de estas categorías, lo que evita las advertencias relacionadas con categorías de uso muy habitual (como las preposiciones). Por ejemplo, nv solo muestra las repeticiones de nombres y verbos.
Excepciones Aún restringiendo las repeticiones a categorías muy concretas, hay lemas que aparecen con mucha frecuencia, como por ejemplo los verbos auxiliares. Para evitar estas advertencias, basta con especificar aquí los lemas cuyas repeticiones no deseamos ver.
Distancia mínima en palabras Si es 0, bastará con que aparezcan dos palabras con un mismo lema en un segmento para que se muestre una advertencia. Si el valor es mayor, indicará el número máximo de tokens que pueden aparecer entre dos palabras con un mismo lema para que se considere una repetición excesiva. Por ejemplo, si se elige el valor 3 y las palabras seleccione y seleccionar aparecen en un segmento separadas por tres tokens o más, no se considerará como una repetición excesiva.

Volver arriba

Comprobar mayúsculas intermedias

Muestra una advertencia cuando se detecta una palabra en la que hay una mayúscula más allá de la primera letra, sin que la palabra esté completamente escrita en mayúsculas. Por ejemplo, sistema, Sistema y SISTEMA son opciones válidas, pero sIstema, SIstema y sISTEMA no lo son. Si la palara que hace un uso poco habitual de las mayúsculas aparece exactamente igual en el texto de origen, no se muestra la advertencia.

Volver arriba

Comprobar mayúsculas después de palabra

Muestra advertencias en aquellos casos en los que para las mismas dos palabras seguidas, en un caso la segunda palabra va en mayúscula y en otro va en minúscula. Por ejemplo, en el segmento del ejemplo 6a podemos ver que la palabra de va seguida de datos en minúscula mientras que en el segmento del ejemplo 6b la palabra de va seguida de Datos con la primera letra en mayúscula.

Inglés Open the data base.
Español Abra la base de datos.
Ejemplo 6a. Error en el uso de mayúsculas.

Inglés Close the data base.
Español Cierre la base de Datos.
Ejemplo 6b. Error en el uso de mayúsculas.


Parámetros
Incluir signos de puntuación Si se marca esta casilla, también se analizarán las mayúsculas de las palabras precedidas por un signo de puntuación.
Incluir etiquetas Si se marca esta casilla, también se analizarán las mayúsculas de las palabras precedidas por una etiqueta.

Volver arriba

Buscar patrones gramaticales


A partir de una serie de patrones gramaticales, busca las instancias de dichos patrones en el texto de destino.

Parámetros
Patrones gramaticales Indica los patrones gramaticales que se buscarán en el texto. Por ejemplo, el patrón na buscará los casos en los que un nombre (n) aparezca seguido de un adjetivo (a) como, por ejemplo, sistema operativo. Para indicar varios patrones, pueden separarse con punto y coma. Por ejemplo, na;nsn buscará los patrones nombre-adjetivo y los patrones nombre-preposición-nombre.

Volver arriba

Crear modelo del lenguaje


Crea a partir de un archivo de referencia un modelo de bigramas del lenguaje que exporta al archivo indicado con el siguiente formato:

elementoBigrama1→elementoBigrama2→frecuenciaBigrama→frecuenciaElementoBigrama1

Por ejemplo, imaginemos la siguiente línea:

de→papel→2→14

Esta línea ofrece información sobre el bigrama (de,papel) y nos indica que este bigrama aparece 2 veces, mientras que el primer elemento de aparece 14 veces. Por lo tanto, la probabilidad de que aparezca papel después de de es de 2/14. Esta operación puede ser bastante lenta si el modelo quiere crearse a partir de textos muy extensos.

Parámetros
Ruta de los archivos de entrada Ruta de los archivos a partir de los que se generará el modelo.
Frecuencia mínima Indica el número mínimo de veces que debe aparecer un token para que se incluya en el modelo.
Utilizar lemas Si se marca esta casilla de verificación, los n-gramas se crearán utilizando lemas en lugar de tokens.
Mostrar modelo Si se marca esta casilla, se mostrarán todos los bigramas que componen el modelo.

Volver arriba

Crear lista de autocorrección

Analiza el texto de destino de la traducción cargada y muestra una lista con todos los cambios que son necesarios para reducir el número de palabras no válidas según el diccionario.


Parámetros
Ruta para exportar lista de autocorrección Si no se deja en blanco este campo, se guardará la lista obtenida en la ubicación indicada.
Longitud mínima de palabras para autocorregir Longitud mínima que tiene que tener una palabra para que se corrija.
Palabras que se corregirán Especifica si se corregirán las palabras en Mayúsculas y minúsculas, Solo minúsculas o Solo mayúsculas.
Unir palabras Si se activa esta casilla de verificación, se evaluará si la unión de palabras no válidas genera una palabra válida.

Volver arriba

Comprobar plurales

Comprueba que cuando dos elementos aparecen conectados mediante una preposición, el uso del plural en el segundo elemento siempre es el mismo si el primer elemento coincide. Por ejemplo, a continuación vemos dos segmentos en los que no se cumple esta condición, ya que en el primer segmento, se utiliza el plural y en el segundo no.

Inglés Open the user management tool.
Español Abra la herramienta de administración de usuarios.
Ejemplo 7a. Incoherencia en el uso del plural.

Inglés Open the user management tool.
Español Abra la herramienta de administración del usuario.
Ejemplo 7a. Incoherencia en el uso del plural.


Parámetros
Categorías de comienzo y final de términos Categoría gramatical que han de tener los elementos conectados con una preposición. Por defecto, solo se tienen en cuenta los nombres (n), pero puede ser interesante comprobar también los adjetivos, en cuyo caso habría que especificar el valor na.

Volver arriba

Analizar repetición excesiva por categoría gramatical

Muestra los palabras de una determinada categoría gramatical que se encuentran a una distancia inferior a un mínimo. Por ejemplo, en el siguiente segmento, el adverbio ya dos veces con solo ocho palabras intermedias, lo que puede ser significativo de un estilo pobre.

Inglés «Yes,» he said, already grasping the doorknob. Now he did not seem eager to go.
Español —Sí… —dijo ya, con la mano en el picaporte la puerta. Ya no parecía tener tanta prisa por marcharse.
Ejemplo 8a. El adverbio ya aparece dos veces a una distancia de pocas palabras.

Cuando se utiliza el modo Por segmento se permite que haya palabras próximas siempre que en el texto de origen también aparezcan palabras equivalentes separadas por una distancia inferior a la indicada. Por ejemplo, en el siguiente segmento la palabra proceso aparece dos veces muy seguidas, pero no se mostrará en una advertencia ya que ocurre lo mismo en el texto de origen.

Inglés The process begins with the assignment process.
Español El proceso comienza con el proceso de asignación.
Ejemplo 9a. El nombre proceso aparece dos veces a una distancia de pocas palabras, pero no se marcará como error ya que también ocurre lo mismo con el nombre process en el texto de origen.


Parámetros
Categoría gramatical Categoría gramatical cuya frecuencia de uso se analizará.
Distancia mínima entre apariciones Distancia mínima que debe haber entre dos apariciones de una misma palabra de la categoría analizada para que no se considere un uso excesivo.
Modo Este cuadro combinado ofrece dos opciones:
  • Por palabra: con este modo, se informará de las repeticiones de palabras próximas, aunque estén en segmentos diferentes. Este modo es adecuado cuando el texto se va a leer de manera secuencial, como ocurre por ejemplo con una novela.
  • Por palabra: con este modo, se informará de las repeticiones de palabras próximas, solo si están en un mismo segmento. Este modo es adecuado cuando el texto no se va a leer de manera secuencial, como ocurre por ejemplo con el texto de un software.

Volver arriba

 
 
Para enviar cualquier comentario, sugerencia o pregunta, escribe a .
Copyleft 2020. Sitio desarrollado con la colaboración del grupo de investigación PETRA. Actualizado 23-noviembre-2021.
 
 
 
 
 

Solicitamos su permiso para obtener datos estadísticos de su navegación en esta web, en cumplimiento del Real Decreto-ley 13/2012.
Si continúa navegando consideramos que acepta el uso de cookies. Aceptar | Más información