Manual del usuario de petraREV
Conceptos básicos Pantallas Funciones Programación Tutoriales Nosotros ¿Conoces petraTAG?

Blogger

Gramática

Estas funciones permiten realizar comprobaciones y operaciones de tipo gramatical, como por ejemplo asegurarse de que no haya errores de ortografía a de concordancia.

Etiquetar texto
Muchas de las funciones de petraREV requieren que el texto de destino se etiquete previamente, es decir, que se asigne a cada palabra un lema y una etiqueta con su categoría morfosintáctica. Esta operación se realiza de manera automática cuando es necesaria. No obstante, en ocasiones puede ser necesario repetirla, por ejemplo, si hemos actualizado el diccionario o hemos cambiado el texto mediante la función de buscar y reeemplazar. En función del tamaño del texto, esta operación puede tardar varios minutos.

Parámetros
Idioma Especifica el idioma de los segmentos que se etiquetarán.


Volver arriba

Buscar tokens
Busca todos los elementos de una determinada categoría gramatical, según las etiquetas que se describen en la sección sobre programación. Por ejemplo, si se buscan las etiquetas de tipo «n», se mostrarán todos los nombres, «a» buscará los adjetivos, «v» los verbos, etc. También es posible acceder a esta función mediante la pestaña Buscar gramática de la pantalla Buscar y reemplazar.

Parámetros
Archivo de exportación Si se quiere guardar la lista resultante como un archivo (texto plano, con cada token y su correspondiente frecuencia en cada línea separados por un tabulador), basta con indicar la ruta en este cuadro. Si se deja en blanco, no se guardará ninguna lista.
Categoría gramatical Categoría gramatical que queremos buscar. Se puede introducir un único carácter o varios, pero siempre deberán ser los primeros de la etiqueta. Si se quieren buscar varias categorías gramaticales, se pueden separar mediante punto y coma. Por ejemplo, n;v busca todos los tokens que son un nombre o un verbo.
Idioma Puede tomar los valores Original y Traducción en función del texto en el que deseemos realizar las búsquedas.
Presentación Si se selecciona Lista, los resultados se mostrarán en una lista, con un elemento por línea. Si se selecciona Línea, todos los elementos aparecerán en una única línea, separados por comas y con las frecuencias entre paréntesis. Por último, si se selecciona Contexto, los elementos se mostrarán marcados en rojo en los segmentos en los que aparecen.
Mostrar gráfico Si se marca esta casilla, se mostrará un gráfico de barras con las frecuencias de los tokens encontrados ordenados de mayor frecuencia a menos.
Ignorar mayúsculas Si se marca esta casilla, se agruparán las palabras que solo difieran en el uso de mayúsculas y minúsculas. Por ejemplo, sistema, Sistema y SISTEMA se agruparán bajo un solo token, dándose prioridad a las formas en minúsculas. En el ejemplo anterior, se utilizaría sistema.
Mostrar lemas Si se marca esta casilla, se agruparán las palabras que compartan el mismo lema. Por ejemplo, cantaría, canté y cantará se agruparán bajo un solo token, que corresponde a la forma canónica, en este caso cantar.

Volver arriba

Comprobar concordancia
Comprueba si hay alguna disconcordancia de género o número entre determinantes y adjetivos/sustantivos. Por ejemplo, el siguiente segmento muestra un error de concordancia.

Inglés The selected option is not valid.
Inglés El opción seleccionada no es válida.
Ejemplo 1. Error de concordancia.

Hay que tener en cuenta que no se comprueba ningún otro tipo de concordancia más allá del indicado. Por ejemplo, no se comprobarán las concordancias sustantivo-adjetivo o sustantivo-adjetivo.

Parámetros
Comprobar verbos Comprueba la concordancia nombre-verbo.


Volver arriba

Comprobar conectores
Normalmente, las preposiciones y los determinantes que se emplean para conectar dos elementos siempre suelen ser los mismos. Esta comprobación determina todos estos conectores y muestra los casos en los que detecta alguna diferencia, lo que suele corresponder a una falta de coherencia. Por ejemplo, veamos los segmentos 2a y 2b:

Inglés Open the data base.
Inglés Abra la base datos.
Ejemplo 2a. Incoherencia en el uso de conectores.

Inglés Close the data base.
Inglés Cierre la base de datos.
Ejemplo 2b. Incoherencia en el uso de conectores.

Mientras que en el ejemplo 2a no existe ninguna preposición entre base y datos, en el ejemplo 2b se ha utilizado la preposición de, que es una opción más correcta.

Parámetros
Categorías gramaticales de los elementos conectados Categoría gramaticales, según las etiquetas que se describen en la sección sobre programación, entre las que se examinarán los conectores utilizados. Por ejemplo, el valor «na» buscará los conectores entre nombres y adjetivos. No suele ser necesario alterar el valor por defecto.


Volver arriba

Comprobar reglas gramaticales
Las reglas gramaticales describen combinaciones de elementos gramaticales que no deseamos que aparezcan en una traducción. En ocasiones sirven para detectar errores, como por ejemplo determinados errores de concordancia entre verbo y sustantivo, pero también son útiles para imponer ciertas convenciones de estilo. Por ejemplo, mediante estas reglas podemos evitar que se utilice la segunda persona en una traducción, si deseamos darle un tono más formal.

Cada regla de estilo se compone de dos elementos, separados por un tabulador. El primero consiste en una serie de condiciones, expresadas en la notación gramatical de petraREV que indican la combinación que queremos que se nos muestra. El segundo es un mensaje que informa al usuario del posible problema que presenta dicha combinación. Por ejemplo, veamos la regla del ejemplo 3.

0(E1=Fia)1(P=cuando)→Probablemente se debería añadir el acento al pronombre interrogativo:
Ejemplo 3. Regla gramatical para detectar errores en la puntuación del pronombre interrogativo cuando.

Esta regla indica que queremos ver aquellos casos en los que un símbolo de apertura de interrogación aparece seguido por la palabra cuando (sin tilde). Aunque hay casos en los que dicho uso es aceptable, por lo general suele corresponder a un error, por lo que merece la pena examinar estos casos.

Parámetros
Ruta del archivo con las reglas gramaticales Ruta del archivo que contiene las reglas gramaticales.


Volver arriba

Comprobar repeticiones
Muestra los casos en los que una o varias palabras aparecen repetidas, lo que suele corresponder a un error. En el ejemplo 4, podemos ver un segmento en el que la palabra la aparece incorrectamente dos veces.
Inglés Close the data base.
Inglés Cierre la la base de datos.
Ejemplo 4. Repetición errónea de la palabra «la»


Parámetros
N.º de palabras repetidas Indica cuántas palabras deben repetirse para que se considere un error. Un ejemplo del valor 1 sería «la la», uno del valor 2 sería «de la de la», uno del valor 3 sería «para que no para que no», etc. Se pueden escribir varios valores escribiéndolos uno tras otros sin ningún tipo de separación. Por ejemplo, el valor «123» indica que se busquen las repeticiones de 1, 2 o 3 palabras.
No mostrar repeticiones que también aparezcan en el original La mayoría de las advertencias que no corresponden a errores de esta comprobación están relacionadas con repeticiones de elementos que también aparecen en el texto de origen. Por tanto, si se activa esta casilla, no se considerará que una repetición es un error si también aparece en el texto de origen.

Volver arriba

Buscar segmentos con texto de origen igual a texto de destino
Muestra aquellos segmentos en los que el texto de destino coincide con el texto de origen.

Parámetros
Comprobar criterios de traducibilidad Si se activa esta casilla, no se mostrarán los segmentos que estén compuestos únicamente por números y signos de puntuación (concretamente los caracteres 0123456789.,;:), a pesar de que coincidan texto de origen y texto de destino.
Invertir resultados Si se selecciona esta casilla, se mostrarán aquellos segmentos en los que el texto de origen no coincida con el texto de destino.

Volver arriba

Buscar segmentos con traducción vacía
Muestra aquellos segmentos en los que el texto de origen contiene algún carácter y, sin embargo, el texto de destino no contiene ninguno.

Esta operación no se puede configurar.
Volver arriba

Generar diccionario
Genera el diccionario flexionado que utiliza petraREV para etiquetar los textos mediante las tablas de terminaciones y lemas. Se trata de una operación bastante avanzada que puede tardar cierto tiempo (normalmente, unos quince minutos) y que sólo es necesario realizar cuando se han introducido cambios en los diccionarios que es necesario aplicar al diccionario generado. También puede llevarse a cabo utilizando el botón Generar de la pantalla Diccionario.

Parámetros
Idioma Indica el idioma para el que se generará el diccionario.

Volver arriba

Mostrar estadísticas de etiquetado
Presenta una lista con la frecuencia de distribución de cada categoría morfológica.

Parámetros
Idioma Indica el idioma para el que se mostrarán las estadísticas.

Volver arriba

Buscar acrónimo
Cuando en un texto aparecen un acrónimo cuyo significado desconocemos, esta función nos ayuda mostrando todas las combinaciones de palabra del texto cuyas iniciales coinciden con las que estamos buscando.

Parámetros
Idioma Indica el idioma en el que se buscará el acrónimo.

Volver arriba

Buscar secuencia de tokens
Busca todos los tokens que cumplen una determinada condición gramatical, según las etiquetas que se describen en la sección sobre programación y se genera una lista con un número fijo de tokens a partir de dicho token. Por ejemplo, si se buscan los tokens que sean un nombre seguido de un verbo y se especifica que se extraigan dos tokens, se mostrarán todos los casos en los que un nombre aparezca seguido de un verbo. También es posible guardar la lista de secuencias de tokens obtenida en un archivo..

Parámetros
Condición gramatical Condición gramatical que debe cumplirse.
Longitud de secuencia Número de tokens que se mostrarán a partir del token que cumple la condición. Por defecto, siempre se parte del token 0, por lo que debe ajustarse la condición de manera que el primer token que se extraiga sea siempre el token 0.
Ruta de archivo Ruta del archivo al que se exportará la lista de secuencias de tokens. Si se deja en blanco, no se exportará ningún resultado.
Idioma Puede tomar los valores Original y Traducción en función del texto en el que deseemos realizar las búsquedas.
Presentación Si se selecciona Lista, los resultados se mostrarán en una lista, con un elemento por línea. Si se selecciona Línea, todos los elementos aparecerán en una única línea, separados por comas y con las frecuencias entre paréntesis. Por último, si se selecciona Contexto, los elementos se mostrarán marcados en rojo en los segmentos en los que aparecen.

Volver arriba

Mostrar repeticiones excesivas de palabras
Muestra advertencias cuando aparecen varias palabras con un mismo lema excesivamente cerca. En estos casos, con frecuencia resulta preferible recurrir a un sinónimo para que el texto resulte menos repetitivo. Por ejemplo, en el siguiente segmento, se puede sustituir seleccione por elija para mejorar el estilo del texto.

Inglés Select the object and choose the action to perform.
Inglés Seleccione el objeto y seleccione la acción que desea llevar a cabo.
Ejemplo 5. Repetición excesiva de la palabra «seleccionar»

Tal como se puede observar, para determinar si la repetición es excesiva se emplea el lema, de forma que varias formas flexionadas de un mismo lema se considerarán como una repetición.

Parámetros
Categorías analizadas Solo se mostrarán las repeticiones de estas categorías, lo que evita las advertencias relacionadas con categorías de uso muy habitual (como las preposiciones). Por ejemplo, nv solo muestra las repeticiones de nombres y verbos.
Excepciones Aún restringiendo las repeticiones a categorías muy concretas, hay lemas que aparecen con mucha frecuencia, como por ejemplo los verbos auxiliares. Para evitar estas advertencias, basta con especificar aquí los lemas cuyas repeticiones no deseamos ver.
Distancia mínima en palabras Si es 0, bastará con que aparezcan dos palabras con un mismo lema en un segmento para que se muestre una advertencia. Si el valor es mayor, indicará el número máximo de tokens que pueden aparecer entre dos palabras con un mismo lema para que se considere una repetición excesiva. Por ejemplo, si se elige el valor 3 y las palabras seleccione y seleccionar aparecen en un segmento separadas por tres tokens o más, no se considerará como una repetición excesiva.


Volver arriba

Comprobar mayúsculas intermedias
Muestra una advertencia cuando se detecta una palabra en la que hay una mayúscula más allá de la primera letra, sin que la palabra esté completamente escrita en mayúsculas. Por ejemplo, sistema, Sistema y SISTEMA son opciones válidas, pero sIstema, SIstema y sISTEMA no lo son. Si la palara que hace un uso poco habitual de las mayúsculas aparece exactamente igual en el texto de origen, no se muestra la advertencia.

Volver arriba

Buscar patrones gramaticales

A partir de una serie de patrones gramaticales, busca las instancias de dichos patrones en el texto de destino.

Parámetros
Patrones gramaticales Indica los patrones gramaticales que se buscarán en el texto. Por ejemplo, el patrón na buscará los casos en los que un nombre (n) aparezca seguido de un adjetivo (a) como, por ejemplo, sistema operativo.

Volver arriba
Para enviar cualquier comentario, sugerencia o pregunta, escribe a .
Copyleft 2015. Sitio desarrollado con la colaboración del grupo de investigación PETRA. Actualizado 22-junio-2015. Made in Linux

Solicitamos su permiso para obtener datos estadísticos de su navegación en esta web, en cumplimiento del Real Decreto-ley 13/2012.
Si continúa navegando consideramos que acepta el uso de cookies. Aceptar | Más información