Verknüpfung von Suchworten

GENIOS Verknuepfung Suchworte

 

Elasticsearch funktioniert anders als die bisherige Suche. Suchen, die nur mittels komplexer Suchsyntax abgebildet werden konnten, sind nun nicht mehr nötig. Durch den Einsatz von Kompositazerlegung und Grundformenreduktion (Stemming) werden ähnliche Dokumente gefunden, ohne dass der Nutzer seine Suchanfrage verändern muss.

Es ist mit Elasticsearch außerdem möglich, reguläre Ausdrücke zu verwenden (Siehe Reguläre Ausdrücke).
Aufgrund der damit verbundenen Wortstammzerlegung ist eine Trunkierung (siehe weitere Operatoren) nur noch in Ausnahmefällen notwendig.

Suche in Feldern
Um in einzelnen Metadaten/ Feldern - z.B. Titel, Firmenname, Schlagwort - suchen zu können, muss man den Feldnamen, gefolgt von einem Doppelpunkt und dem Suchbegriff (ohne Leerzeichen), eingeben (z.B. SCHLAGWORT:Politik).
Auch in einer ausgewählten Datenbank – z.B. Handelsblatt – kann gesucht werden (z.B. DATABASE:HB).

Die wichtigsten Feldnamen:

TI ARTIKELTITEL
AB ABSTRACT
AU AUTOR
BR BRANCHE
CN LAND
CO FIRMA
CT SCHLAGWORT
DT ERSCHEINUNGSDATUM
YR ERSCHEINUNGSJAHR
KO RESSORT
TX TEXT
XW WORTE

 

Boolesche Operatoren – nur in GROßSCHREIBUNG zu verwenden
 

UND
AND
+
Standardmäßig wird vom System mit UND gesucht, d.h. die Eingabe UND ist zwischen den Suchworten nicht unbedingt notwendig.
Bei der Verknüpfung von Suchwörtern mit UND werden Dokumente gefunden, die sowohl das erste, als auch das zweite Suchwort enthalten. Die Suche mit UND findet eine Schnittmenge, z. B. alle Dokumente, die "Urlaub" und "Freizeit" enthalten. Alternative Suchmöglichkeiten mit dem gleichen Ergebnis sind:
urlaub AND freizeit
urlaub +freizeit (ohne Leerzeichen hinter dem Plus)
ODER
OR
||

Bei der Verknüpfung von Suchwörtern mit ODER werden Dokumente gefunden, die eines der Suchwörter enthalten. Bei der Suche mit ODER wird die Vereinigungsmenge aus mehreren Suchbegriffen gefunden, z. B. werden bei einer Suche nach Urlaub ODER Freizeit alle Dokumente, die entweder "Urlaub" oder "Freizeit" oder beide Begriffe enthalten.
Alternative Suchmöglichkeiten mit dem gleichen Ergebnis sind:
urlaub OR freizeit
urlaub || freizeit

 

NOT
NICHT
-

Bei Verknüpfungen von Suchwörtern mit NICHT werden Dokumente gefunden, die den Suchbegriff vor dem NICHT enthalten, nicht aber den Suchbegriff hinter dem NICHT. Bei der Suche mit NICHT wird eine Teilmenge gefunden, z. B. werden bei Urlaub NICHT Freizeit alle Dokumente gefunden, die "Urlaub" enthalten. Dokumente, die zusätzlich "Freizeit" enthalten, werden nicht angezeigt.
Alternative Suchmöglichkeiten mit dem gleichen Ergebnis sind:
urlaub NOT freizeit
urlaub -freizeit (ohne Leerzeichen hinter dem Minus)

 

Weitere Operatoren
 

„SUCHBEGRIFF“

Um eine Phrasensuche durchzuführen, setzen Sie Anführungszeichen um die Phrase.
Bei folgender Suchanfrage werden Dokumente gefunden, die beide Begriffe in genau dieser Reihenfolge enthalten: „bundesweiter Feiertag“

Wenn Sonderzeichen (z.B. Doppelpunkt oder Klammern) in Ihrer Suchanfrage vorkommen, setzen Sie am besten Anführungszeichen um die Phrase, um nicht aus Versehen einen Konflikt mit anderen Operatoren zu verursachen.
Beispiele:
„Bayern - Dortmund 4:2“
„7-Tage-Inzidenz“
„91,2“
„Lyon Rosa (ORF)“

() Runde Klammern () dienen der Bildung von Gruppen. Sie müssen bei längeren Suchanfragen zwingend gesetzt werden, um zusammenhängende Gruppen zu bilden.
Werden keine Klammern verwendet, werden die Operatoren in der Reihenfolge des Vorkommens nacheinander abgearbeitet.
Bei folgender Suchanfrage werden Dokumente gefunden, die einen oder beide der Begriffe in der ersten Klammer, sowie einen oder beide der Begriffe in der zweiten Klammer enthalten: (Freizeit ODER Urlaub) UND ("bundesweiter Feiertag" ODER "gesetzlicher Feiertag")
Das heißt, die Suche findet Dokumente mit Freizeit und gesetzlicher Feiertag und Freizeit, Urlaub und bundesweiter Feiertag. Die Suche gibt keine Dokumente aus, die Freizeit und Urlaub enthalten, außer sie enthalten auch die Phrase „bundesweiter Feiertage“ und/oder „gesetzlicher Feiertag“.
*
$
?

Beim Trunkieren kann man zwischen einem und null-bis-unendlich Zeichen wählen, die ausgetauscht oder angehängt werden sollen. Wenn sich nur 1 Zeichen unterscheiden soll, verwendet man das Fragezeichen. Sternchen und Dollar-Zeichen stehen für eine beliebige Anzahl von Zeichen, inkl. 0.

Fragezeichen, Sternchen und Dollar-Zeichen können rechts von einem Wort oder innerhalb eines Wortes verwendet werden, oder auch innerhalb und am Ende eines Wortes gleichzeitig.
Die Trunkierungsoperatoren können nicht innerhalb einer Phrase (mit Klammern oder Anführungszeichen) verwendet werden.

Es müssen beim Trunkieren mit Sternchen bzw. Dollar-Zeichen mindestens drei Zeichen des Suchwortes angegeben werden.

Beispiele:
Lawine* findet Lawine, Lawinenabgang, Lawinensprengung etc.
Lawine$ findet Lawine, Lawinenabgang, Lawinensprengung etc.
Lawine? findet Lawinen
Hüt?? findet Hütte, hüten etc.
Ma*er findet Maer, Maier, Mayer, Mauer, Mahler, Magister etc.
Ma?er findet Maier, Mayer, Mauer etc.
AU? findet AUS, auf etc.
AU* bzw. AU$ ist nicht möglich

Bitte beachten! Bei Nutzung dieser Operatoren werden verwendete Suchbegriffe, die in den Texten der Trefferliste vorkommen, derzeit noch nicht farblich hinterlegt.

^

Boosting: Mit Hilfe des Dachzeichens, gefolgt von einer Zahl, kann man wichtigen Suchbegriffen in der Suchanfrage ein höheres Gewicht geben. Trefferdokumente, die den höher geboosteten Begriff öfter enthalten als den nicht oder niedriger geboosteten Begriff, werden in der Trefferliste höher gerankt, d.h. weiter oben angezeigt.

Alles was unter 1 ist (z.B. 0.005), ist ein negativer Boost und wirkt sich auch entsprechend aus.
Beispiel: Wetter Sonne^5 Regen^3 Hagel^1

Gefunden werden Dokumente, in denen alle Suchbegriffe vorkommen (Wetter, Sonne, Regen, Hagel), aber die Reihenfolge in der Trefferliste ist unterschiedlich. Ganz oben stehen Dokumente, die Sonne am häufigsten enthalten, gefolgt von denen die Regen häufig enthalten. Ganz unten stehen Dokumente, die Wetter enthalten.
 

#n Der Suchbegriff muss innerhalb eines Dokuments "n" mal vorkommen. "n" steht für eine beliebige Zahl zwischen 1 und 999. Beispiel: Merkel#10 findet Dokumente, in denen "Merkel" mindestens 10-mal vorkommt. Beispiel: ARTIKELTITEL:Merkel#2 findet Dokumente, in denen "Merkel" mindestens 2-mal im Artikeltitel vorkommt. Der Operator kann nicht mit Klammern oder Anführungszeichen verwendet werden. Die Verwendung einer Trunkierung im Zusammenhang mit dem Operator ist nicht möglich.

SUCHBEGRIFF~

 

Ähnlichkeitssuche (fuzzy search): Bei Verwendung der Tilde hinter einem Suchbegriff werden Dokumente gefunden, die sowohl den Suchbegriff als auch einen ähnlich lautenden Begriff enthalten.
Die Zahl hinter der Tilde definiert, wie viele Operationen durchgeführt werden dürfen. Gültige Operationen sind:
Einfügen, Löschen, Ersetzen und das Vertauschen von zwei direkt nebeneinanderliegenden Zeichen. Wenn man nur maximal 1 Zeichen ersetzen lassen möchte, verwendet man ~1.
Beispiele:
benking~2 wechselt bis zu 2 Zeichen aus und findet benking, bening, benning, banking, berking, ebnking, bekning etc.
jonathan~3 findet Johnathon, Johnathan, Jonnathan, Jonathan, Jonathon, Jonnaton, Athan etc.
„SUCHBEGRIFF“~

Abstandssuche (proximity search): Bei Verwendung der Tilde hinter einer Phrase mit Anführungszeichen werden Dokumente gefunden, die sowohl die Suchbegriffe in der Phrase nebeneinander als auch mit einem definierten Abstand zwischen den Wörtern enthalten. Dabei kommt es auf die Reihenfolge der Wörter innerhalb der Phrase nicht an.
Die Zahl hinter der Tilde definiert, wie viele Wörter maximal zwischen den Suchbegriffen stehen dürfen. Wenn Sie möchten, dass die Suchbegriffe im Dokument relativ eng beieinander stehen, verwenden Sie am besten ~2.

Beispiele:
„Kanzlerin Merkel“~1 findet Dokumente, die z.B.
„Merkel Kanzlerin“,
„Kanzlerin Angela Merkel“,
„Merkel Angela Kanzlerin“,
„Merkel die Kanzlerin“ etc. enthalten.

„Kanzlerin Merkel“~2 findet Dokumente, die z.B.
„Kanzlerin sagte Frau Merkel“,
„Merkel ist unsere Kanzlerin“
etc. und die gleichen wie bei „Kanzlerin Merkel“~1 enthalten.

„Java Bali Sonne“~2 findet Dokumente, die z.B.
„Java ist nicht Bali Sonne“,
„Java ist Bali mit Sonne“,
„Sonne auf Java und Bali“ etc. enthalten.

„Microsoft Explorer“~0 ist das gleiche wie die Phrase „Microsoft Explorer“ und findet Wörter in der gleichen Reihenfolge, d.h. findet Dokumente, die „Microsoft Explorer“ enthalten.

TO
<
>
=
[]
{}
Bereichssuche: Um von-bis-Suchen, z.B. beim Datum oder beim Umsatz, durchzuführen, verwendet man TO und eckige oder geschweifte Klammern. Bei eckigen Klammern werden der Start- und Endwert einbezogen, bei geschweiften Klammern nicht. Kombinationen aus eckiger und geschweifter Klammer sind möglich.
Beispiel:
ERSCHEINUNGSDATUM:[2019-01-01 TO 2019-03-31] findet Dokumente, die im Zeitraum ab 1.1.19 bis inklusive 31.3.19 erschienen sind.
ERSCHEINUNGSDATUM:{2019-01-01 TO 2019-03-31} findet Dokumente, die im Zeitraum ab 2.1.19 bis inklusive 30.3.19 erschienen sind.
Um “alles bis” oder “alles ab” suchen zu können, verwendet man das kleiner-als-Zeichen oder größer-als-Zeichen, mit oder ohne ist-gleich-Zeichen. Beispiel:
ABSCHLUSSDATUM:<2018-01-01
WORTE: Mit dem Operator WORTE wird die Suche auf Dokumente mit einer bestimmten Wortanzahl beschränkt. Damit können z.B. Artikel mit sehr geringem Umfang ausgeschlossen werden.
Beispiel:
Konjunktur AND WORTE:>50 findet Dokumente mit 51 oder mehr Wörtern, in denen das Wort Konjunktur enthalten ist.

 

Reguläre Ausdrücke
 

RegEx
Suchanfrage innerhalb von Schrägstrichen
/ … /

Mit regulären Ausdrücken (regex – regular expression) können Sie komplexe Zeichenersetzungen in Suchanfragen durchführen. Wir empfehlen die Verwendung nur für einzelne Begriffe, nicht für Wortgruppen oder Sätze.

Bitte verwenden Sie bei der Regex-Suche nur Kleinbuchstaben.

// Schrägstriche markieren den Anfang und das Ende eines Begriffs bzw. der ganzen Suchanfrage
Tipp: Für möglichst exakte Ergebnisse kann es empfehlenswert sein, die Kompositazerlegung bei RegEx Suchanfragen zu deaktivieren.
Operatoren:
(Innerhalb der RegEx Suchanfrage kann das Verhalten einzelner Operatoren (Beispiel: ?) von bekanntem Verhalten des Metazeichens im normalen Kontext bzw. einer bekannten Konvention abweichen. Andere (Beispiel: $) sind ggf. nicht erlaubt bzw. werden nicht unterstützt.)

[] eckige Klammern kennzeichnen die Zeichen die „geodert“ werden

() runde Klammern dienen dem klassischen Gruppieren

? das Fragezeichen gibt an, dass das vorhergehende Zeichen optional ist (d.h. 0 oder 1 Mal vorkommt)

()? wenn in Kombination mit runden Klammern verwendet, kann sich die Optionalität auch auf eine Zeichengruppe beziehen (d.h. die eingeklammerte Zeichengruppe kommt 0 oder 1 Mal vor)

* der Stern-Operator gibt an, dass das vorhergehende Zeichen optional ist (d.h. 0 Mal oder beliebig oft vorkommt)

In Kombination mit einem Punkt ähnelt das Verhalten der Metazeichen ? und * dem bekannten Verhalten außerhalb der RegEx-Suche:

.? ersetzt ein beliebiges Zeichen (0 Mal oder 1 Mal)

.* ersetzt ein beliebiges Zeichen (0 Mal oder beliebig oft)

Beispiele:
/mey?rhuber/ findet Merhuber und Meyrhuber
/mey.?rhuber/ findet Meyrhuber, Meyerhuber, Meyarhuber u.ä.
/mey.*rhuber/ findet Meyrhuber, Meyerhuber, Meyeerhuber, Meyaaarhuber u.ä.
/m[ae]y.*rhuber/ findet Mayerhuber, Meyerhuber, Mayrhuber u.ä.
/meyer(-huber)?/ findet Meyer ebenso wie Meyer-Huber