Hinweise zur c't-Archiv-Suche
Grundlagen
Das c't-Archiv-Suchscript basiert auf dem fehlertoleranten
Suchwerkzeug a href="http://glimpse.cs.arizona.edu">agrep
und stellt nur ein bequemes Frontend für dessen Anwendung auf die
Inhaltsverzeichnisse der c't dar. Die meisten Schalter des Formulars
lassen sich direkt in die verschiedenen Optionen von agrep
übersetzen und die internen Beschränkungen von agrep
lassen sich damit auch durch das Suchscript nicht umgehen.
Die Suche erfolgt in den Jahresinhaltsverzeichnissen des
Heise-Registers oder der c't-ROMs. Als Ergebnis werden die
gefundenen vollständigen Einträge des Inhaltsverzeichnisses
angezeigt, aus denen bei gemounteter CD ein direkter Zugriff auf den
Artikeltext per Hyperlink möglich ist.
Suchworte
- Suchworte sollten normalerweise aus alphanumerischen Zeichen bestehen.
- Umlaute, ß und Sonderzeichen können direkt eingegeben werden.
- Mehrere Suchworte sind durch Leerzeichen zu trennen.
Optionen
- Groß-/Kleinschreibung
- Normalerweise werden Groß- und Kleinbuchstaben bei der Suche unterschieden.
Falls ein Substantiv z.B. aber auch als Bestandteil eines zusammengesetzten
Wortes gefunden werden soll, empfiehlt es sich, diese Unterscheidung
abzuschalten.
- Wortgrenzenerkennung
- Standardmäßig wird ein Suchmuster immer erkannt, falls es irgendwo
im Eintrag des Inhaltsverzeichnisses auftritt. Bei eingeschalteter
Worterkennung muß die Fundstelle im Eintrag dieselben Wortgrenzen
besitzen wie das Suchwort. Bei
Übereinstimmung: Teilstring würde das Suchwort Telekom also
auch Telekommunikation finden, bei Übereinstimmung: ganze Worte
nicht.
- Fehlertoleranz
-
agrep erlaubt es, Worte auch dann zu erkennen, wenn sie
erst durch Vertauschen, Weglassen oder Hinzufügen einzelner
Buchstaben mit dem Suchmuster übereinstimmen. Die maximale Anzahl
solcher Operationen kann unter Übereinstimmung spezifiziert
werden. Die Vorgabeeinstellung erlaubt nur das Erkennen bei exakter
Übereinstimmung.
Arbeiten Sie vorsichtig mit hohen Toleranzwerten! Sie
könnten wesentlich mehr Artikel finden als Sie beabsichtigen.
Der Toleranzwert muß grundsätzlich kleiner als die Länge aller
verwendeten Suchworte sein.
Leider gibt es einige Einschränkungen in der Kombination von
fehlertoleranter Suche und Boolschen Ausdrücken. So dürfen hier
die Suchmuster nicht länger als 32 Zeichen sein, und die
Wortgrenzenerkennung arbeitet nicht mehr korrekt.
- Logische Verknüpfung mehrerer Worte
- Normalerweise werden mehrere Worte im Suchmuster als
feste Formulierung interpretiert also als String behandelt.
Der Test des Auftretens verschiedener Worte kann aber auch
durch logisches AND bzw. OR verknüpft werden.
Die Verknüpfung bezieht sich dabei auf alle ausgewählten Suchfelder.
Bei der Suche nach zwei AND-verknüpften Worten wird der Artikel
damit auch gefunden, wenn das eine Wort im Titel, das andere aber in
den Schlagworten auftaucht (falls diese Felder selektiert sind).
- Fundstellenausgabe
- Bei häufig auftretenden Suchworten empfiehlt es sich die Anzahl
der maximalen Rückgabestellen zu begrenzen, um Datenoverload zu
vermeiden.
Die Fundstellen können in der Ausgabe zeitlich aufsteigend oder absteigend
sortiert werden.
Arbeiten mit den c't-ROMs
Ein direkter Zugriff aus der Liste der Fundstellen auf die
einzelnen Artikel der CD ist nur möglich, wenn die CD des jeweiligen
Jahrganges gemountet ist. Bei jahrgangsübergreifender Suche und
einem Single-CD-Laufwerk kann deshalb ein CD-Wechsel zwischen dem
Lesen verschiedener Fundstellen nötig sein.
Zurück zur c't-Archivsuche
V. Ossenkopf,
13.12.1998