Cómo buscar

El corpus está compuesto por cuatro secciones:

  1. Consultar conversaciones
  2. Buscar por intervención
  3. Buscar por grupo entonativo
  4. Buscar por palabra

1. Consultar conversaciones

La consulta de las conversaciones permite realizad una lectura completa de las transcripciones. Así mismo, si el investigador requiere hacer algún trabajo posterior, las conversaciones pueden exportarse directamente a Word, Excel o XML.

2. Buscar por intervenciones

La búsqueda por intervención está pensada para buscar palabras presentes en las intervenciones. Por tanto, es obligatorio introducir alguna palabra en el campo “Texto en la intervención”. En este caso, hay un filtrado posible con las características del hablante que haya emitido esas intervenciones. En este campo está habilitada una posible búsqueda en lenguaje de base de datos MYSQL.

Por ejemplo, si se introduce la palabra “tener” en el campo de búsqueda, los resultados incluirán intervenciones en las que aparezca no solo “tener”, sino “tenerte, tenerlo, tenerla, sostener, mantener...”. Para encontrar únicamente “tener” puede buscarse la siguiente secuencia:

% tener %

Para más información: http://dev.mysql.com/doc/refman/5.0/es/pattern-matching.html

En cualquier caso, si lo que se pretende es hacer una búsqueda más específica, se recomienda la búsqueda por palabra.

3. Búsqueda por grupo entonativo

La búsqueda por grupo entonativo tiene los mismos requisitos que la búsqueda por intervención, aunque suma otros factores, como la presencia de pausas o de tonos adyacentes al grupo entonativo. Como en el caso anterior, se permite una búsqueda con secuencia de código MYSQL.

4. Búsqueda por palabra

La búsqueda por palabra permite buscar por las características del grupo entonativo y de la intervención en la que aparezca la palabra. Así mismo, hay una búsqueda de distancias léxicas de palabras situadas a una distancia máxima de 2 palabras hacia adelante y hacia detrás. En el caso de las distancias léxicas, debe tenerse en cuenta que la búsqueda debe realizarse teniendo en cuenta que la información de estos campos está dispuesta así:

PALABRA,LEMA,ETIQUETA

Por ejemplo, para buscar “eres muy listo”, puede escribirse “eres” en el campo “palabra” y en el campo distancia léxica (+1) podría buscarse teniendo en cuenta que si se escribe “muy,” se encontrará la palabra, pero también puede buscarse “,muy,” para buscar el lema o “,RG” (etiqueta EAGLE de Freeling para un adverbio positivo). Así, para “eres”, hay un campo “distancia léxica (+1)” en el que estaría incluido la información de la siguiente manera “muy,muy,RG”.

En otras palabras, la búsqueda de palabra, lema o categoría está separada en tres campos para la búsqueda de una sola palabra, pero si se quiere buscar palabras (por forma léxica, lema o categoría) que se encuentran a una distancia de 2 hacia adelante o hacia atrás, estos datos se encuentran aglutinados.

Español