visitante ::
identificación
|
|||||||||||||||
Buscar | Ayuda | Departament de Filologia Catalana UAB | Sobre Traces | Català English Español |
Página principal > Centro de ayuda > Guía de búsqueda |
El indexador de este sistema trata de ofrecer la tecnología más actual de búsqueda web, desarrollada por buscadores tan populares como Google. Sin embargo, la naturaleza de la búsqueda bibliográfica difiere considerablemente de la de una página Web. Ofrecemos muchas extensiones para permitir una búsqueda estructurada compleja y precisa, incluso combinando metadatos, texto completo y citas bibliográficas en una misma consulta. Esta página ofrece una serie consejos útiles para conseguir una búsqueda más eficaz.
El modo de búsqueda por defecto es la búsqueda simple que permite, en términos generales, escribir una consulta en el campo de texto, acompañado de la posibilidad de seleccionar uno de los índices comunes sobre los que efectuar la consulta. Se introducen las palabras clave a buscar y se acciona la consulta mediante la tecla de retorno (o intro). Por ejemplo, si interesa recuperar documentos sobre standard model que han sido escritos por (o que mencionan a) Ellis, debemos escribir:
y en la página de resultados de la búsqueda podemos volver a añadir o quitar palabras clave para obtener mayor precisión en los resultados, tal y como se especifica más adelante.
El interfaz de búsqueda avanzada ofrece herramientas específicas con las que configurar la búsqueda: podemos cambiar el tipo de búsqueda por defecto (de alguna palabra a todas, buscar por frase exacta, por expresión regular, etc.); nos permite utilizar las expresiones booleanas combinando varios índices, etc. Por ejemplo, para recuperar todos los documentos escritos por Ellis, J -transcrito exactamente de ese modo- y también las palabras muons o neutrino en el título de la publicación y 2001 en el año, escribiremos lo siguiente:
Obsérvese que si utilizamos una sintaxis especial, la búsqueda simple ofrece prácticamente la misma funcionalidad que la avanzada, tal y como se indica en las siguientes secciones de esta guía. Este apartado de búsqueda simple-versus-avanzada no se refiere tanto a las funcionalidades disponibles, sino a la forma de búsqueda que podemos configurar mediante pequeñas modificaciones. El sistema se ha adaptado al uso común de los términos de simple/avanzado que podemos encontrar en otros motores de búsqueda.
En realidad, gran parte de la explicación que sigue a continuación, responde a la cuestión de «cómo un usuario avanzado puede utilizar la interficie de búsqueda simple». Recordamos que en cualquier momento es posible recurrir a la ayuda de la búsqueda avanzada para conseguir más asistencia.
Después de recibir una consulta, el motor de búsqueda la analiza y, en caso de no localizar ninguna coincidencia en la base de datos, el sistema tratará de guiar al usuario. Un ejemplo de ello son las listas de los términos indexados que se encuentran más cercanos al término introducido, en caso de que se produzacan errores ortográficos o de transcripción al efectuar la consulta:
Las opciones alternativas se muestran en rojo. El motor de búsqueda avisa de forma similar cuando detecta que los términos de búsqueda no se encuentran, o cuando detecta que sí que existen pero la fórmula de consulta booleana utilizada no puede localizarlos. Así mismo, el motor de búsqueda también realiza de forma oculta acciones alternativas para mejorar los resultados, como por ejemplo eliminar puntuación, etc.
Gracias al sistema de búsqueda en múltiples etapas y a la ayuda que se proporciona en cada una de estas etapas, por lo general resulta suficiente escribir la palabra de búsqueda y revisar los resultados qué nos devuelve el sistema. Si los resultados no son pertinentes, o son excesivos o insuficientes, es posible añadir o quitar palabras de la consulta hasta conseguir resultados más satisfactorios.
El modo de búsqueda por defecto es la búsqueda por palabras. Ello significa que se ignoran los espacios en blanco, pero también que el motor de búsqueda lo interpreta por defecto como «añade automáticamente una Y booleana entre las palabras introducidas», del mismo modo que hace Google. Por ejemplo, para recuperar todos los registros que contengan tanto la palabra ellis como muon en cualquier parte del registro, debemos escribir:
Si queremos que el espacio en blanco sea significativo, debemos escribir la sentencia entrecomillada. Existen dos formas de búsqueda por frases:La diferencia entre buscar por frase exacta o buscar en parte de la frase puede parecer poco obvia en un primer momento. Sin embargo, mientras que la búsqueda en parte de la frase se asemeja a la búsqueda por frase que suele utilizarse en el contexto de los buscadores web, el uso de la búsqueda por frase exacta resulta mucho más efectiva y rápida cuanto más se conocen y especifican los valores a recuperar.
Otro modo interesante de búsqueda, aparte de la búsqueda por
palabra o por frase, es el uso de la búsqueda por
expresión regular, que se efectúa entre barras
inclinadas en lugar de entrecomillado. Por ejemplo, la búsqueda
anterior según el modo de en parte de la frase 'muon
decay'
es equivalente a la expresión regular/muon
decay/
. La sintaxis de las expresiones regulares es muy
potente, y permite construir búsquedas muy complejas. Para
obtener más información, recomendamos la consulta de la
sección expresión regular de esta
guia.
+
ANDellis +muon
recupera todos los registros que contengan ambas palabras: ellis y la palabra muon ellis muon
ídem, simplificación sintáctica ellis and muon
ídem, simplificación sintáctica -
NOTellis -muon
recupera todos los registros que contengan la palabra ellis pero que no contenga la palabra muon ellis not muon
lo mismo, simplificación sintáctica |
ORellis |muon
recupera todos los registros que contengan al menos, una de las dos palabras ellis or muon
ídem, simplificación sintáctica
Los operadores lógicos se disponen de forma automática de izquierda a derecha. Por ejemplo, si queremos buscar documentos escritos por Ellis sobre muon o kaon, escribiremos:
ello nos realizará una búsqueda equivalente a(muon O kaon)
Y ellis
. Nótese también que se obtienen resultados
diferentes si introducimos
que si introducimos (ellis AND muon) OR kaon
.
La disposición de los elementos de izquierda a derecha permite
refinar fácilmente una búsqueda añadiendo o quitando palabras
utilizanto los operadores AND/NOT +/-. Por ejemplo, para
excluir los documentos sobre desintegración en la búsqueda
anterior, sólo hay que añadir -decay
:
Esta búsqueda devuelve registros que contengan tanto gravity o supergravity, o bien ellis o perelstein en cualquier parte del registro.
Obsérvese que puede usar cualquier número de paréntesis en la
búsqueda. También es posible incluir paréntesis dentro de
otros, como esto AND (aquello OR (más NOT
lejos))
.
Cuando se indexan las palabras, se pone especial atención en indexarlas con y sin puntuación. Ello hace posible la búsqueda de términos que contienen caracteres especiales, como por ejemplo C++, textualmente:
Por ejemplo, para recuperar registros que contengan la expresión LaTeX$e^{+}e^{-}$
en el título, debemos escribir:
Por ejemplo, para recuperar un documento con el número de informe
hep-ph/0204133, debemos escribir:
Nótese que esta búsqueda es sensible a las mayúsculas:
El motor de búsqueda se basa en el estandar Unicode UTF-8, lo que hace posible introducir cadenas de búsqueda en cualquier idioma que se encuentre en la base de datos. Por ejemplo, para recuperar documentos escritos por (o sobre) Пушкин, debemos escribir:
Obsérvese que no es necesario introducir acentos para conseguir registros que contienen palabras acentuadas. Por ejemplo, escribiremosLemaitre
para buscar artículos
de Lemaître:
El truncamiento de una palabra se efectua a través del uso del asterisco (*). Este comodín indica al motor de búsqueda que retorne cualquier número de carácteres en su lugar. Por ejemplo, para recuperar registros que contengan las palabras muon, muonic, muons etc, debemos escribir:
La búsqueda por comodín puede utilizarse tanto en posición de prefijo como de sufijo. Por ejemplo, para recuperar todas las palabras que comiencen por CERN-TH y acaben con 31, debemos escribir: Obsérvese que el comodín se ignorará si tratamos de utilizarlo en palabras demasiado cortas, como por ejemplo a*: El carácter comodín también puede usarse en el modo de búsqueda por frase. Por ejemplo, para recuperar todos los documentos cuyo título comience con "Neutrino mass", debemos escribir: Recordamos que en esta búsqueda hemos introducido las formas de 'frase exacta' y 'parte de la frase'. En realidad, el modo de búsqueda de 'parte de la frase' lanzará una búsqueda exacta sin necesidad de utilizar los comodines: tanto podemos utilizar'foo bar baz'
como "*foo bar baz*"
.
Esto ayuda a comprender porqué la búsqueda de palabras en una
parte de la frase es lenta: debido al uso de dos asteriscos
delante y detrás del texto, todos y cada de los registros de la
base de datos son comprobados para determinar si se corresponden a
la búsqueda o no. Actualmente no hay ningún índice de búsqueda que
indexe partes de frase.
La búsqueda realizada utilizando varios campos bibliográficos
(tales como título, autor) se realiza a través de una sintaxis
similar a la que utiliza Google en sus búsquedas tipo
"site:"
. Si un término de búsqueda es precedido
por un nombre de campo seguido por dos puntos este término se
buscará únicamente en el campo especificado. Por ejemplo, para
recuperar documentos que contienen la palabra ellis
dentro del índice de autores, debemos escribir:
author
, title
,
reportnumber
, abstract
,
keyword
, year
, experiment
,
fulltext
, and reference
.
El uso del modo de búsqueda por expresión regular está dirigida sobre todo a usuarios avanzados que conocen la sintaxis tradicional de expressión regular Unix/POSIX. En el interfaz de consulta simple se puede forzar este modo usando barras inclinadas en lugar de comillas:
mientras que en el modo de búsqueda avanzado se puede seleccionar explícitamente este modo de búsqueda seleccionandolo en el menú desplegable. En el ejemplo anterior se recuperarían todos los títulos que comienzan por la letra E, seguida de cualquier número o cualquier carácter, y que terminen por la letra s.Otro ejemplo similar es el de la búsqueda por autor de un autor que se ha introducido en la base de datos como Ellis, J o bien como Ellis, John:
La búsqueda por expresión regular permite formular consultas de palabras muy específicas por su proximidad. Por ejemplo, permite recuperar registros cuyos títulos contienen las palabras dense y matter y que estén separadas al menos por una palabra que no contenga la letra l:
Obsérvese que también pueden utilizarse carácteres de intervalo
como [a-k]
y contadores de ocurrencia como
{3}
. Por ejemplo, podemos recuperar todos los
pre-prints que no se corresponden con la política de
catalogación AAAA para describir los años,
opcionalmente seguida por ? o por
otro -AAAA:
[:alnum:]
, el cual en el ejemplo
anterior sería equivalente a:
Para conocer más acerca de las expresiones regulares POSIX, se recomienda la consulta de Wikipedia regexp article y MySQL regexp documentation.
La consulta por rango se realiza a través del signo
->
. Por ejemplo, para recuperar todos los documentos
sobre par motor publicados entre 1983 y
1992, debemos escribir:
Toda la sintaxis mencionada anteriormente se puede combinar en una misma consulta. Por ejemplo, para recuperar documentos que contienen la palabra ellis dentro del campo autor, y que no contienen palabras como muon, 'muonic', etc., en ningún otro campo, y que contienen la frase (o subcadena de palabras, para ser más precisos) 'dense quark matter' dentro del campo de resumen, y que han sido publicados dentro de los años que comienzan por los dígitos '200', debe escribirse:
Obsérvese que la opción de índice global “cualquier campo” por defecto contiene únicamente términos de metadatos, no del texto completo ni de las citas bibliográficass. Es necesario especificar explícitamente las opciones de buscar en el índicetexto completo
o de referencia
si
se desea buscar en estos campos. Por ejemplo, para recuperar el
término Higgs tanto dentro de los metadatos, las citas o
el texto completo, debe escribirse:
Ello permite una interesante combinación de metadatos, texto
completo y citas dentro de una misma búsqueda. Por ejemplo, para
recuperar todos los documentos escritos por Lin que en el
texto completo contengan las palabras Schwarzschild
y AdS, que citen la revista
Adv. Theor. Math. Phys., debe escribirse:
black hole
que por "black
hole"
.and
,
of
, o siglas como CERN
.La búsqueda por autor puede realizarse de diversas formas, cada una de las cuales presenta sus ventajas y desventajas.
Ellis J
dentro del índice de autores, ello se interpretará como dos
consultas (para las palabras Ellis
y J
) que se efectuarán en primer lugar, y una
booleana Y que se realizará después.
La consulta realizada de este modo recuperará también un documento que presenta como primer autor a Ellis, R y como segundo autor Finch, A J, lo cual, probablemente, no es lo deseado. La búsqueda se ha realizado muy rápidamente y se han recuperado registros sobre el autor requerido, sin embargo, los resultados recuperados siguiendo este método pueden no ser pertinentes, tal y como ocurre en el ejemplo citado anteriormente. En lugar de buscar por palabras, la técnica más conveniente que debe aplicarse en este caso es la búsquda por frase, que permite conseguir mayor precisión.
Esta técnica de búsqueda confiere mayor precisión y evita falsos positivos. (La presunción de que no existen otros autores cuyo nombre se escriba como Ellis, J, en ocasiones puede no ser cierta *.) La búsqueda se realizará con mucha rapidez.
Este modo de búsqueda nos ofrece aún mayor precisión y evita falsos resultados positivos (o no pertinentes). (La presunción de que no hay más autores que se escriban como Ellis, J O Ellis, John, en ocasiones puede no ser cierta *.) La búsqueda es muy rápida.
Ello recuperará todos los nombres de autor que comienzan
con el texto Ellis, J
, esto es, no sólo con las
formas requeridas en el ejemplo Ellis, J
y Ellis, John, sino también Ellis, Jim,
o Ellis, John Rolfe, o Ellis, Jonathan
Richard.
Esta búsqueda retornará muchos más resultados, pero puede resultar conveniente en el caso en que se desconozca la forma de introducción de los nombres en la base de datos. Sin embargo, aumenta el riesgo de obtener resultados poco pertinentes. La búsqueda es relativamente rápida.
Esta búsqueda recupera no sólo todos los autores
mencionados, sino también todos aquellos cuyos nombres
contengan la expresión Ellis, J
en cualquier
parte de su nombre, como por ejemplo De Lellis,
Jim. Ello aumenta enormemente las posibilidades de
obtener registros con un alto riesgo de ser poco
pertinentes. La búsqueda es relativamente lenta.
(Obsérvese que este modo de búsqueda puede resultar muy práctico para apellidos compuestos tales como Pepe-Altarelli, M o 't Hooft, G en la que una consulta puntual de usuario por Hooft, G recuperará el autor requerido, a diferencia de los métodos mencionados anteriormente.)
*NOTA:
Si usted es responsable de su lista de publicaciones y detecta
que algunas veces su nombre se escribe de forma abreviada y a
veces completo, o si desea identificar sus publicaciones entre
diversos autores con la misma forma abreviada, por favor
contacte con los
administradores
de
Es posible seleccionar un campo determinado en función del tipo de ordenación de los resultados de búsqueda, por ejemplo para ordenarse los resultados por el título principal. De este modo, en ocasiones puede ocurrir que se desee ordenar los documentos por el código de referencia y que un mismo documento tenga más de uno. Por ejemplo, los códigos hep-ph/0204140, CERN-TH-2002-069 y RM3-TH-02-4 apuntan todos al mismo documento. Si se ordena el conjunto de resultados de búsqueda contenidos en el documento, el sistema tendrá en cuenta el primer número de informe, que puede ser cualquiera de los tres. En ocasiones se puede desear clasificar un documento según un determinado código de referencia hep-ph, u otro CERN según si se ha publicado en una colección de publicaciones de CERN o hep-ph. ¿Como se puede influir en el motor de búsqueda para priorizar un código antes que otro?
En otras palabras, el motor de búsqueda responde por defecto a
una pregunta similar a «ordena por el primer autor» u «ordena
por el primer código de informe», pero en ocasiones se desea
instar al buscador para que ordene por el «primer código de
informe que comience por el texto CERN-». Esta opción
es posible a través del uso de un paràmetre de ordenación
«invisible» denominado sp
(para a "ordenar según un
patrón") que permite ordenar siguiendo un patron de preferencia
dado. Este parámetro es «invisible» desde el punto de vista de
que no está presente en el interfaz de búsqueda, sino que debe
ser añadido manualmente en el URL de la búsqueda.
Por ejemplo, para recuperar todas las publicaciones del CERN-TH del
año 2001 ordenados por su código CERN-TH, debe buscarse por
CERN-TH-2001*
dentro del índice código de
informe
, y en la página de resultados de búsqueda, cuando
esté satisfecho con los resultados obtenidos, añadir
&sp=CERN-TH
en el URL a fin de ordenar los
resultados sgún los códigos de informe CERN-TH, y conseguir una
correcta
ordenación del listado de todas las publicaciones CERN-TH
del 2001.
En la página de resultadoss de búsqueda, se oferecen automáticament enlaces a otros servidores tales como Google, SPIRES o KEK bajo el nombre de "Intentar la búsqueda en...". Con un simple cic sobre los enlaces propuestos se puede enviar la búsqueda realizada en dichos buscadores.
Obsérvese que los enlaces a otros cercadores no se muestran si el buscador no soporta el tipo de búsqueda. Por ejemplo, SPIRES o KEK no pueden buscar términos dentro del campo «cualquier campo», de forma que en estos casos, el sistema no los enlazará.
Si un registro de metadatos contiene archivos a texto completo
asociados, texto completo
separado. Para recuperar todos
los documentos que contienen el término e- en el texto
completo de sus documentos asociados, debemos escribir: