Manual del usuario de petraTAG
Conceptos básicos Referencia Tutoriales Programación Nosotros ¿Conoces petraREV?

Blogger

Sintaxis

El etiquetado añade dos nuevas dimensiones a cada palabra –categoría morfosintáctica y lema– que multiplican las posibilidades de realizar búsquedas en un texto. Para ello se utiliza la siguiente sintaxis de secuencias:

N1(A1=B1)N2(A2=B2)N3(A3=B3)...

En la expresión anterior, N1 indica la distancia (en tokens) entre la palabra a y la palabra b que se está comprobando. Por ejemplo, 0 indica que queremos examinar exactamente dicha palabra; +1, la palabra siguiente; –1, la palabra anterior. También es posible especificar las opciones x, a o p en lugar de un número. La letra x indica que basta con que la comprobación se cumpla en cualquiera de los tokens de la secuencia. La letra a especifica que la comprobación debe cumplirse en alguno de los tokens anteriores al elemento estudiado y, por último, la letra p indica que la comprobación deben cumplirse en alguno de los tokens posteriores al elemento estudiado. En la misma expresión, A1 indica el elemento que se comprueba:

  • P: sobre la palabra
  • E: sobre la etiqueta
  • L: sobre el lema
  • M: comprueba si la primera letra de la palabra está en mayúsculas
En el caso de que se indique que se desea comprobar la etiqueta, es posible añadir un número que especifique exactamente el carácter de la etiqueta que se desea comprobar. Por ejemplo, E1 examinará el primer carácter de la etiqueta, E2 el segundo, E3 el tercero y así sucesivamente.

B1 es el valor que debe tener el elemento comprobado. Si va precedido del asterisco * indica que la comprobación se cumplirá con cualquier valor excepto con el señalado.

Estas expresiones pueden ser tan largas como se desee, añadiendo todas las comprobaciones necesarias con la misma sintaxis.

A continuación, podemos ver algunos ejemplos de secuencias con esta sintaxis:

Condición Significado
0(E1=n) Busca todos los nombres.
0(E1=v)0(E3=s) Busca todos los verbos en subjuntivo.
0(E1=n)1(E1=a) Busca todos los grupos nombre-adjetivo.

Puedes descargar la versión más actualizada de petraTAG de manera gratuita desde la página de SourceForge.
Para enviar cualquier comentario, sugerencia o pregunta, escríbenos a .
Copyleft 2014. Este sitio se ha desarrollado con la colaboración del grupo de investigación PETRA. Actualizado 19-ago-2014. Made in Linux

Solicitamos su permiso para obtener datos estadísticos de su navegación en esta web, en cumplimiento del Real Decreto-ley 13/2012.
Si continúa navegando consideramos que acepta el uso de cookies. Aceptar | Más información