visitant ::
identificació
|
|||||||||||||||
Cerca | Ajuda | Departament de Filologia Catalana UAB | Sobre Traces | Català English Español |
Pàgina inicial > Centre d'ajuda > Guia de Cerca |
El cercador d'aquest sistema tracta d'oferir la tecnologia més actual de cerca web, desenvolupada per cercadors tant populars com Google. La naturalesa de la cerca bibliogràfica, però, difereix considerablement de la d'una página Web. Oferim nombroses extensions que permetin una cerques estructurada complexa i precisa, incloent-ho la combinació de metadades, text complet i referències bibliogràfiques en una mateixa cerca. Aquesta pàgina ofereix una sèrie de consells útils per aconseguir una cerca més eficaç.
La cerca per defecte és la cerca simple, que fonamentalment permet escriure la consulta dins un camp de text, seguit de la possibilitat d'escollir un dels índexs comuns sobre els que realitzar la consulta. S'introdueixen les paraules clau a buscar i s'acciona la consulta mitjançant la tecla de retorn (intro). Per exemple, si interessa recuperar documents sobre standard model que han estat escrits per (o que fan esment a) Ellis, haurem d'escriure:
i a la pàgina dels resultats de la cerca podem tornar a afegir o treure paraules clau per tal d'obtenir més precisió als resultats, tal i com s'especifica més endavant.
La interficie de cerca avançada ofereix eines específiques amb les que configurar la cerca: podem canviar el tipus de cerca a realitzar per defecte (d'alguna paraula a totes les paraules, cerca per frase exacta, per expressió regular, etc.); ens permet emprar la combinació booleana a nombrosos índexs, etc. Per exemple, per localitzar tots els documents escrits per Ellis, J -transcrit exactament d'aquesta manera- i també les paraules muon o neutrino al títol de la publicació i 2001 a l'any, escriurem:
Observeu que si fem servir una sintaxi especial, la cerca simple ofereix pràcticament la mateixa funcionalitat que l'avançada, tal i com s'explica a les següents seccions d'aquesta guia. Aquest apartat de cerca simple-versus-avançada no es refereix tant a les funcionalitats disponibles, com a la forma de cerca que podem configurar mitjançant petites modificacions. El sistema s'ha adaptat a l'ús comú dels termes simple/avançat que podem trobar a altres cercadors.
En realitat, gran part de l'explicació que segueix a continuació, respòn a la qüestió de «com un usuari avançat pot utilitzar la interfície de cerca simple». Recordeu que en qualsevol moment és posible recórrer a l'ajuda de la cerca avanzada per aconseguir més assistència.
Un cop rebuda la consulta, el cercador l'analizarà i tractarà sempre de guiar a l'usuari en cas de que no localitzi cap coincidència a la base de dades. Un exemple d'això son les llistes dels termes indexats que es troben més propers al terme introduït a la consulta en cas que no es trobin coincidències per errors ortogràfics o de transcripció:
Les opcions alternatives es mostren en vermell. El motor de cerca avisa de forma similar quan detecta que els termes de cerca no es troben, o quan detecta que si que existeixen però la fórmula de consulta booleana emprada no aconsegueix localitzar-los. Així mateix, el motor de cerca també realitza de forma oculta accions alternatives per a millorar els resultats com, per exemple, eliminar puntuació, etc.
Gràcies al sistema de cerca en múltiples etapes i a l'ajuda que es va proporcionant a cadascuna d'aquestes etapes, pel general resulta suficient teclejar l'objecte de cerca i revisar que ens retorna el sistema. Si no quedem satisfets, podem afegir/treure paraules de la nostra consulta fins aconseguir uns resultats satisfactoris.
El mode de cerca per defecte es la cerca per paraules. Aquest mode implica que s'ignoren els espais en blanc, però també que el motor de cerca els interpreti per defecte com a «afegeix automàticament una I booleana entre les paraules introduïdes«, com fa Google. Per exemple, per recuperar tots els registres que continguin tant la paraula ellis com muon a qualsevol part del registre, haurem d'escriure:
Si volem que l'espai en blanc sigui significatiu, hem d'escriure la sentència entre cometes. Existeixen dues formes de cerca per frase:La diferència entre cercar per frase exacta o cercar per part de la frase pot semblar poc evident a primera vista. Ara bé, mentre que la cerca per part de la frase s'equipara a la cerca per frase que acostuma a aplicar-se dins el context dels cercadors web, l'ús de la cerca per frase exacta resulta molt més efectiva i ràpida com més es coneguin i especifiquin els valors a recuperar.
Un altra forma interessant de cerca, a més de la cerca per
paraula o frase, és l'ús de la cerca per expressió
regular, que s'expressa entre barres inclinades en
comptes de cometes. Per exemple, la cerca anterior segons el
mode de cerca parcial de la frase 'muon decay'
és
equivalent a l'expressió regular /muon decay/
. La
sintaxi de les expressions regulars és molt potent, i permet
construir cerques molt complexes. Per obtenir més informació,
recomanem la consulta de la secció expressió
regular d'aquesta guia.
+
ANDellis +muon
Recupera tots els registres que contenen ambdues paraules: ellis i la paraula muon ellis muon
ídem, simplificació sintàctica ellis and muon
ídem, simplificació sintàctica -
NOTellis -muon
recupera tots els registres que contenen la paraula ellis però que no contenen la paraula muon ellis not muon
ídem, simplificació sintàctica |
ORellis |muon
recupera tots els registres que contenen, com a mínim, una de les dues paraules ellis or muon
ídem, simplificació sintàctica
Els operadors lògics es disposen de forma automàtica d'esquerre a dreta. Per exemple, si es volen recuperar documents escrits per Ellis sobre muon o kaon, escriurem:
es realitzarà una cerca equivalent a(muon OR kaon) AND
ellis
. Notis també que s'obtenen resultats diferents si
s'introdueix
que si s'introdueix (ellis AND muon) OR kaon
.
La disposició dels elements d'esquerre a dreta permet refinar
fàcilment una cerca afegint o traient paraules utilitzant els
operadors AND/NOT +/-. Per exemple, per excloure els documents
sobre desintegració a la cerca anterior, només cal
afegir -decay
:
Aquesta cerca retorna registres que contingin bé gravity o supergravity, o bé ellis o perelstein a cualsevol part del registre.
Observeu que podeu usar qualsevol nombre de parèntesis en la
cerca. També és possible incloure parèntesis dins d'altres,
como això AND (allò OR (més NOT lluny))
.
Quan s'indexen les paraules, es posa especial atenció en que siguin indexades amb i sense puntuació. Això fa possible la cerca de termes que contenen caràcters especials, com per exemple C++, textualment:
Per exemple, per recuperar registres que contenen l'expresió LaTeX$e^{+}e^{-}$
al títol, cal escriure:
Per exemple, per recuperar un document amb número d'informe
hep-ph/0204133, cal escriure:
Observeu que aquesta cerca és sensible a les majúscules:
El motor de cerca es basa en l'estàndard Unicode UTF-8, que fa possible introduir cadenes de cerca en qualsevol llengua que es trobi a la base de dades. Per exemple, per recuperar documents escrits per (o sobre) Пушкин, cal escriure:
Observeu que no és necessari introduir accents per aconseguir registres que contenen paraules accentuades. Per exemple, escriuremLemaitre
para recuperar articles
de Lemaître:
El truncament d'una paraula es realitza a través de l'ús del símbol asterisc (*). Aquest comodí indica al motor de cerca que retorni qualsevol número de caràcters en el seu lloc. Per exemple, per recuperar registres que continguin les paraules astronomia, astrònoms, astronòmics etc, cal escriure:
La cerca por comodí pot utilitzar-se tant en posició de prefix com de sufix. Per exemple, per recuperar totes les paraules que comencin per CERN-TH i acabin amb 31, cal escriure: Notis que el comodí s'ignora si es tracta d'utilitzar-lo amb paraules massa curtes, com per exemple a*: El caràcter comodí també pot utilitzar-se al mode de cerca per frase. Per exemple, per recuperar tots els documents el títol dels quals comenci per "Neutrino mass", cal escriure: Recordem que a aquesta cerca hem introduït les formes de 'frase exacta' i 'part de la frase'. En realitat, el mode de cerca per 'part de la frase' ens llençarà una cerca exacta sense necessitat de fer servir els comodins: tant podem utilitzar'foo bar
baz'
com "*foo bar baz*"
. Això ajuda a
comprendre perquè la cerca de paraules a una part de la frase és
lenta: degut a l'ús de dos asteriscs davant i darrera del text,
tots i cadascun dels registres de la base de dades es comproven
per determinar si es corresponen o no amb la cerca introduïda.
Actualment no hi ha cap índex de cerca que indexi parts de frase.
La cerca realitzada utilitzant diversos camps bibliogràfics (com
títol, autor) es realitza a través d'una sintaxi similar a l'emprada
per Google en les seves cerques tipus "site:"
. Si un
terme de cerca es precedit per un nom de camp seguit per dos punts
aquest terme es cerca únicament dins el camp especificat. Per
exemple, per recuperar documents que contenen la paraula
ellis dins l'índex d'autors, cal escriure:
author
, title
,
reportnumber
, abstract
,
keyword
, year
, experiment
,
fulltext
, and reference
.
L'ús del mode de cerca per expressió regular està dirigida sobretot a usuaris avançats que coneixen la sintaxi tradicional d'expressió regular Unix/POSIX. A l'interfície de consulta simple es pot forçar aquest mode utilitzant les barres inclinades enlloc de comentes:
Al mode de cerca avançada es pot seleccionar explícitament aquest mode de cerca seleccionant-lo al menú desplegable. A l'exemple anterior es recuperarien tots els títols que comencen per la lletra E, seguida de qualsevol número o qualsevol caràcter, i que acabin per la lletra s.Un altre exemple similar és el de la cerca per autor d'un autor que ha estat introduït a la base de dades com Ellis, J o bé com Ellis, John:
La cerca per expressió regular permet formular consultes de paraules Molt específiques per proximitat. Per exemple, permet recuperar registres Els títols dels quals contenen les paraules dense i matter i que estiguin separades, al menys, per una paraula que no contingui la lletra l:
Observeu que també poden emprar-se caràcters d'interval com
[a-k]
i contadors de concurrència com {3}
.
Per ejemple, podem recuperar tots els pre-prints que no es
corresponguin amb la política de catalogació AAAA per
descriure anys, opcionalment seguida per ? o per altre
-AAAA:
[:alnum:]
, que a l'exemple
anterior seria equivalent a:
Per conèixer més sobre les expressions regulars POSIX, es recomana la Consulta de Wikipedia regexp article i MySQL regexp documentation.
La consulta por rang es realitza a través del signe
->
. Per exemple, per recuperar tots els documents
sobre par motor publicats entre
1983 i 1992, cal escriure:
Tota la sintaxi mencionada anteriorment es pot combinar en una mateixa consulta. Per exemple, per recuperar documents que contenen la paraula ellis dins el camp d'autor, i que no contenen paraules com muon, 'muonic', etc., a cap altre camp, i que contenen la frase (o subcadena de paraules, per ser més precisos) ‘dense quark matter' dins el camp de resum, i que han estat publicats dins els anys que comencen pels dígits '200', cal escriure:
Observeu que l'opció d'índex global «qualsevol camp» per defecte conté només els termes de metadades, no del text complet ni de les referències bibliogràfiques. Cal especificar explícitament les opcions de cercar a l'índextext complet
o de
referència
si volem cercar per aquests camps. Per
exemple, per recuperar el terme Higgs tant dins les
metadades, les referències o el text complet, cal escriure:
Això permet una interessant combinació de metadades, text complet
i referències dins una mateixa cerca. Per exemple, per recuperar
tots els documents escrits per Lin que en el text complet
continguin les paraules Schwarzschild and AdS,
que citi la revista Adv. Theor. Math. Phys., cal
escriure:
black hole
que per "black
hole"
.and
, of
, o sigles com
CERN
.La cerca per autor es pot realitzar de diverses formes, cadascuna de les quals presenta els seus avantatges i les seves desavantatges.
Ellis J
dins l'índex d'autors,
s'interpretarà como a dues consultes (per a les
paraules Ellis
i J
) que es
realitzaran en primer lloc, i una booleana I que es realitzarà
després.
La consulta realitzada d'aquesta forma recuperarà també un document que tingui com a primer autor a Ellis, R i com a segon autor a Finch, A J, fet que, probablement, no es el desitjat. La cerca s'ha realitzat amb molta rapidesa i s'han recuperat registres sobre l'autor requerit, ara bé, els resultats obtinguts seguint aquest mètode poden no ser pertinents, tal i com passa a l'exemple citat anteriorment. En lloc de cercar per paraules, la tècnica més convenient que s'ha d'aplicar en aquests casos és la cerca per frase, que permet aconseguir major grau de precisió.
Aquesta tècnica de cerca confereix major grau de precisió i evita falsos resultats aparentement positius. (La presumpció de que no existeixen altres autores els noms dels quals s'escrigui com Ellis, J, en ocasions pot no ser certa*.) La cerca es realitzarà con amb molta rapidesa.
Aquest mode de cerca ens ofereix encara major grau de precisió i evita falsos resultats positius (o no pertinents). (La presumpció de que no hi ha més autors que s'escriguin com Ellis, J O Ellis, John, en ocasions pot no ser certa *.) La cerca és molt ràpida.
Això recuperarà tots els noms d'autor que comencen amb el
text Ellis, J
, no només amb les formes
requerides a l'exemple Ellis, J i Ellis,
John, sinó també Ellis, Jim, o Ellis, John
Rolfe, o Ellis,Jonathan Richard.
Aquesta cerca retornarà molts més resultats, però pot resultar convenient en el cas que es desconegui la forma d'introducció dels noms a la base de dades. Ara bé, augmenta el risc d'obtenir resultats poc pertinents. La cerca és relativament ràpida.
Aquesta cerca recupera no només tots els autors mencionats,
sinó també tots aquells els noms dels quals continguin
l'expresió Ellis, J
a qualsevol part del seu
nom, com per exemple De Lellis, Jim. Això augmenta
enormement les possibilitats d'obtenir registres amb un alt
risc de ser poc pertinents. La cerca és relativament
lenta.
(Observeu que aquest mode de cerca pot resultar molt pràctic per a cognoms compostos, tals com Pepe-Altarelli, M o 't Hooft, G en els que una consulta d'una consulta puntual de usuari per Hooft, G recuperarà l'autor requerit, a diferència dels mètodes mencionats anteriorment.)
*NOTA:
Si sou responsable de la vostra pròpia llista de publicacions i
detecteu que algunes vegades el seu nom s'escriu de forma
abreujada i de vegades complet, o si desitgeu identificar les
vostres publicacions entre diversos autors amb la mateixa forma
abreujada, sis plau, contacteu amb els
administradors
de
És possible seleccionar un camp determinat en funció del tipus d'ordenació dels resultats de la cerca, per exemple per ordenar els resultats pel títol principal. D'aquesta forma, de vegades pot passar que es desitgi ordenar els documents pel codi de referència i que un mateix document en tingui més d'un. Per exemple, els codis hep-ph/0204140, CERN-TH-2002-069 i RM3-TH-02-4 apunten tots al mateix document. Si s'ordena el conjunt de resultats de cerca que conté el document, el sistema tindrà en consideració el primer número d'informe, que pot ser qualsevol dels tres. En ocasions es desitja classificar un document segons un determinat codi de referència hep-ph , o altre CERN> segons si ha estat publicat a una col•lecció de publicacions CERN o hep-ph. Com es pot influir en el motor de cerca per prioritzar un codi abans de l'altre?
En altres paraules, el motor de cerca respon per defecte a una
pregunta semblant a «ordena pel primer autor» o «ordena pel
primer codi d'informe», però en ocasions es pot desitjar instar
al cercador per tal que ordeni pel «primer codi d'informe que
comenci pel text CERN-». Aquesta darrera opció és
possible a través d'un paràmetre d'ordenació «invisible»
denominat sp
(per a «ordenar segons un patró») que
permet ordenar segons un patró de preferència donat. Aquest
paràmetre és «invisible» des del punt de vista que no és present
a l'interfície de cerca, sinó que ha d'afegir-se manualment a la
URL de cerca.
Per exemple, per recuperar totes les publicacions del CERN-TH de
l'any 2001 ordenats pel seu codi, cal cercar per
CERN-TH-2001*
dins l'índex de codi
d'informe
, i a la pàgina de resultats de cerca, quan
s'estigui satisfet amb els resultats obtinguts, afegiu
&sp=CERN-TH
a la URL per tal d'ordenar els
resultats segons els codis d'informe CERN-TH, i aconseguir una
correcta
ordenació de la llista de totes les publicacions CERN-TH
del 2001.
A la pàgina de resultats de cerca, s'ofereixen automàticament enllaços a altres servidors com Google, SPIRES o KEK sota el nom de «Proveu la vostra cerca a...». Amb un simple clic sobre els enllaços proposats es pot enviar la cerca realitzada en aquests cercadors.
Observeu que els enllaços a altres cercadors no es mostren si el cercador no suporta la cerca. Per exemple, SPIRES o KEK no poden cercar termes dintre del camp «qualsevol camp», de forma que en aquests casos, el sistema no els enllaçarà.
Si un registre de metadades té arxius a text complet associats
text complet
separat. Per recuperar tots els documents que contenen el
terme e-al text complet dels seus documents associats,
cal escriure: