III.2.
Hermeneutische Fragen beim Retrieval
Vorbemerkung
a) Die
hermeneutische Konstituion
des Online-Dialogs
b) Die
"Search-and-Find"-Methode
als ein hermeneutischer Prozeß
c) Die
Frage nach der Relevanz
des Retrievalergebnisses
Vorbemerkung
"So
wie
der Aufbau einer Datenbasis ein schöpferischer Prozeß, d.h.
eine "ars" ist, so ist es ebenfalls der Prozeß der
Wiedergewinnung
von im Computer gespeicherten und für die Suche aufbereiteten
(bibliographischen)
Fachinformationen, das Information Retrieval.
Wenn
wir in diesem Zusammenhang von "ars quaerendi", d.h. der Kunst des
fragenden
Suchens (und Findens) sprechen, dann im Hinblick auf eine andere
traditionsreiche
und mit unserer Kunst verwandte Methode, nämlich die der "ars
inveniendi".
Vermutlich war Cicero der erste, der von "ars inveniendi" als der Kunst
des Findens von rhetorischen Argumenten sprach, während die "ars
judicandi"
sich mit der Evaluierung und Strukturierung der Argumente in der Rede
befaßte.
Cicero beruft sich auf Aristoteles, der im Zusammenhang mit der
dialektischen
Kunst eine "Topik" bzw. eine "Heuristik" entwickelte (Vgl. Cicero:
Topica
II.6).
Es
war aber vor allem Leibniz, der die Begriffe "ars inveniendi", d.h. ein
algebraisches Verfahren zur Auffindung neuer Wahrheiten (innerhalb
einer
Wissenschaft) und "ars iudicandi", d.h. ein algebraisches Verfahren zur
Entscheidung über die Wahrheit eines Satzes, prägte (G.W.
Leibniz:
Dissertatio De Arte Combinatoria, Berlin 1971). Beide Verfahren
betreffen
also den Findungsprozeß noch nicht bekannter Wahrheiten. Sie
sollen
der Wahrheitsfindung dienen. Demgegenüber, bemekrt Leibniz an
anderer
Stelle (G.W. Leibniz: Discours touchant la méthode de la
certitude
et l'art d'inventer, Kap. LIV, Aalen 1959), steht der gesamte Bereich
der
schon bekannten und "nützlichen" Wahrheiten ("verités
utiles",
"connnoissances solides et utiles"). Diese sind zum Teil schriftlich
fixiert,
befinden sich aber in großer Unordnung ("desordre"), zum Teil
sind
sie nicht geschrieben, besonders die, welche die Berufspraxis betreffen
("gens de profession"). Um sie zu ordnen und auffindbar zu machen,
müsste
man sie sammeln bzw. erst niederschreiben, Kataloge erstellen, genaue
Register
("indices") mit Verweisen aller Art wären nötig usw. Leibniz
erwähnt in diesem Zusammenhang auch die Frage nach dem Suchen von
bereits bekannten, gesammelten und geordneten Erkenntnissen, wodurch
wir
erst in unserem Wissen und Tun fortschreiten können:
"Je
suis obligé quelquefois de comparer nos connoissances à
une
grande boutique ou magasin ou comptoir sans ordre et sans inventaire;
car
nous ne savons pas nous mêmes ce que nous possedons deja et ne
pouvons
pas nous en servir au besoin. Il y a une se trouvant dans les auteurs,
mail il y en a encore bien plus, qui se trouvent dispersées
parmi
les hommes dans la pratique de chaque profession; et si le plus exquis
et le plus essentiel de tout cela se voyoit recueilli et rangé
par
ordre avec plusieurs indices, propres à trouver et à
employer
chaque chose là où elle peut servir, nous admirerions
peut-être
nous mêmes nos richesses et plaindrions notre aveuglement, d'en
avoir
si peu profité." (ebda.)
In Anschluß
an Leibniz wollen wir von "ars quaerendi" (der entsprechende
griechische
Ausdruck könnte, im Unterschied zu "Heuristik" etwa "Heuretik"
heißen)
sprechen. Eine ähnliche begriffliche und terminologische
Unterscheidung
wird im Bereich der "künstliche-Intelligenz-Forschung" zwischen
"heuristics"
(Technik zur Verbesserung der Effizienz eines Suchprozesses) und
"heuretics"
(das Wissen um die Suchkunst selbst) gemacht (vgl. E. Rich: Artificial
Intelligence, New York 1983, S. 35 ff).
Es
geht um die Kunst des Suchens und Findens von Erkenntnissen, sofern
diese
bereits (schriftlich fixiert) vorliegen. Im Unterschied zur "ars
inveniendi"
und "iudicandi" geht es nicht um einen Prozeß der
Wahrheitsfindung,
sondern im Mittelpunkt des suchenden Fragens steht die Relevanz
bzw. die Nützlichkeit ("vérités utiles"!)
des
Gefundenen. Die Wahrheitsfrage stellt sich also sowohl bei "Referenz-"
als auch bei "Quellen-Datenbasen" vor der Eingabe (z.B. bei der
Evaluierung
von numerischen Daten und, selbstverständlich, beim Aufbau von
bibliographischen
Datenbasen) bzw. nach der Suche. Der Erkenntnisfortschritt (auch
Leibniz'
Auffindung neuer Wahrheiten durch die "ars inveniendi" bzw.
Klärung
des noch unvollkommenen Erkannten durch die "méthode de la
certitude")
und die Möglichkeit, Erkenntnis in die (berufliche) Praxis
umzusetzen,
gründen nicht zuletzt in der "Kunst", das bereits Gewußte zu
suchen und zu finden.
Inwiefern
die sogenannten Expertensysteme auch eine "ars inveniendi",
oder
zumindest eine unmittelbare Unterstützung dafür, darstellen
können
und sollen, bleibe offen. Die "ars quaerendi" bezieht sich hier auf den
Prozeß des Fragens im Hinblick auf die Auffindung
(möglicherweise) relevanter Fachinformationen. Am Beispiel
der
bibliographischen
Datenbasen wollen wir den hermeneutischen Hintergrund des
Retrieval-Prozesses
in Zusammenhang mit:
a)
der Konstitution des Online-Dialogs,
b)
der "Search-and-Find"-Methode,
c)
der Frage nach der Relevanz des Retrievalergebnisses,
erörtern."
(S. 165-167)
"a)
Die hermeneutische Konstitution des Online-Dialogs
Obwohl
der Ausdruck "Online-Dialog" längst in der Praxis des Information
Retrieval eingebürgert ist, könnte der Einwand erhoben
werden,
daß der ursprüngliche Ort des Begriffs "Dialog" wohl das
zwischenmenschliche
Verhältnis ist. Für die Hermeneutik besteht aber eine
leitende
Gemeinsamkeit zwischen dem Textverständnis und der
Verständigung
im Gespräch. Dieses besteht darin, daß es in beiden
Fällen
um ein Verständnis über eine Sache geht und daß
dieses Verständnis, wie wir oben gezeigt haben, sich als Frage
im medium der Sprache vollzieht (Vgl. H.G. Gadamer: Wahrheit
und
Methode, op.cit. S. 344 ff; vgl. II.2.c)
Wir
können diese leitende Gemeinsamkeit im Hinblick auf den
Zusammenhang
zwischen dem Fragenden und der im Computer gespeicherten Datenbasis
ausweiten,
indem hier eine eigene Dynamik nicht nur von Seiten des Fragenden,
sondern
auch von der des Textes zustande kommt, die sich dadurch von der
Erfahrung
des Verständnisses eines gedruckten Textes unterscheidet. Diese
Dynamik
ist der des zwischenmenschlichen Dialogs vergleichbar, indem hier das
System
eine dem verobjektivierten Vorverständnis gemäße
"Antwort"
gibt.
Diese
Gemeinsamkeit sollte aber nicht als eine Anthropomorphisierung dieses
Vorganges
gedeutet werden, denn, wie Oeser mit Recht bemerkt, "der
informationsverarbeitende
Automat ist in Analogie zum Menschen gebaut und nicht umgekehrt." (E.
Oeser:
Wissenschaft und Information, op.cit. S. 68). Die hermeneutische
Situation
gegenüber Texten unterscheidet sich von der des
zwischenmenschlichen
Gesprächs u.a. dadurch, daß der Text stets des Interpreten
bedarf,
um "zu Worte zu kommen" (H.G. Gadamer: Wahrheit und Methode, op.cit. S.
365). Auch Datenbasen bedürfen des Interpreten und bei ihrer
Befragung
findet jene Verbindung aufgrund der gemeinsamen Sache statt, die auch
das
wirkliche Gespräch charakterisiert. So wie im Falle des Textes von
einem "hermeneutischen Gespräch" die Rede ist, so scheint es auch
hier berechtigt, von einem "Online-Dialog" zu sprechen. Die dem
Online-Dialog eigene Dynamik wird aber dadurch möglich,
daß
hier bestimmte
Vorverständnisse fixiert werden, die den Rahmen und die
Grenzen
des "antwortenden" Systems bilden. Indem der Fragende die Datenbasis
befragt,
bringt er sein Vorverständnis der thematisierten Sachverhalte, das
er mit der jeweiligen Fachgemeinschaft mit-teilt, ins Spiel. Erst im
Licht
dieses "Profils", werden die gespeicherten Daten zu Fachinformation,
indem sie in einen bestimmten Mitteilungsprozeß einbezogen und
von
diesem "geformt" werden
Vgl.
E. Garfield: What Are Facts (Data) and What is Information? In: ibid.:
Essays of an Information Scientist, Philadelphia 1977, Vol. II, S.
47ff,
der in diesem Zusammenhang auf den etymologischen Ursprung des
Informationsbegriffs
hinweist; vgl. v.V.: Information,
München 1978.
Die
Zusammenkunft zwischen einem Fragenden und einem (Informations-)System
ist als ein hermeneutischer Prozeß zu deuten, in dessen Verlauf
der
offene Horizont des Fragenden und der fixierte Horizont des Systems
sich
vorläufig "verschmelzen", d.h. das verobjektivierte
Vorverständnis
erscheint jeweils als (mögliche) Antwort auf eine Frage und wird
somit
verstehend im Online-Dialog wiedergewonnen. Bei dieser
"Horizontverschmelzung"
zeigt sich zugleich die Identität und die Differenz der sich auf-
bzw. abhebenden Horizonte.
|
"Horizontverschmelzung"
("hermeneutischer Zirkel")
|
|
Fachgemeinschaft
Bedeutungen und
Verweisungen
|
objektivierte Vorverständnisse:
Klassifikationen, Thesauri
Kurzfassungen
|
Auf
der einen Seite haben wir den offenen
Horizont des Fragenden,
eingebettet
im Vorverständnis der Fachgemeinschaft. Aus der
Auseinandersetzung
mit den Sachverhalten in ihren vielfältigen Bedeutungs- und
Verweisungszusammenhängen
entspringen die jeweiligen Fragen bzw. Probleme unterschiedlicher Art.
Wir sahen, daß Belkin den Begriff des "anomalous state of
knowledge"
(ASK-Zustand) als Bezeichnung für den Zustand eines
Noch-nicht-verstehens
vor dem Hintergrund eines bereits gewonnenen Vorverständnisses
prägte.
Ein solcher Zustand ist immer schon, wie Belkin mit Recht betont (N.J.
Belkin, R.N. Oddy, H.M. Brooks.: ASK for Information Retrieval.
In:Journal
of Documentation 38 (1982) 2, S. 61ff), durch die Interaktion mit
unseren
Mitmenschen sowie mit der Welt, die wir gemeinsam mit-teilen,
vermittelt.
Auf
der anderen Seite steht der fixierte
Horizont des Systems. Dieser ist
zwar
ausbau- (bzw. "lern-")fähig, d.h. er kann und wird ständig
erweitert
und aktualisiert, bleibt aber stets auf die ihm aus dessen Umgebung
zufließenden
und bereits in ihrer Bedeutung als potentielle Fachinformation
vorverstandenen
Daten angewiesen. Das gilt sowohl für die "Zielinformationen"
selbst,
also in unserem Fall für die Literaturhinweise, als auch für
die unterschiedlichen Suchmittel (Thesaurus, Klassifikation usw.).
Beim
Online-Dialog vollzieht sich eine mehrfache "Horizontver- schmelzung" auf
unterschiedlichen Ebenen: so z.B. auf einer "kontextfreien" Ebene, in
der
die Fachbegrifflichkeit des Fragenden, die eine offene und
"diachronische"
ist, mit den fixierten "synchronischen" Thesaurusbegriffen
zusammenkommt.
Die Deskriptoren werden zwar "kontextfrei" aber nicht "horizontfrei"
angeboten,
wenn wir den Thesaurus als Ganzes als einen (fixierten) Sinnhorizont
auffassen.
Da sie aber wiederum auf die entsprechenden Texte verweisen bzw. den
Zugang
zu ihnen ermöglichen, sind sie auch nicht völlig
"kontextfrei"
und erlauben deshalb eine weitere Stufe der "Horizontverschmelzung"
z.B.
mit dem Titel der Dokumente oder mit den Kurzfassungen.
Im
Falle eines auf der "natürlichen Sprache" basierenden
Retrieval-Systems
bilden zum einen das jeweilige Fachgebiet und zum anderen das
tatsächlich
gespeicherte und "invertierte" Textmaterial einen Horizont, der sich
dem
Fragenden unter Umständen nur allmählich als Gegenstand einer
möglichen "Verschmelzung" anbietet, so daß wir am Anfang vor
einem Grenzfall dieses Phänomens stehen und deshalb nur bedingt
von
"Horizontverschmelzung" sprechen können.
Die
Grenzen einer "Horizontveschmelzung" sind außerdem im Falle von
bibliographischen
Datenbasen offensichtlich: Literaturhinweise sind ein zu dürftiger
Anhaltspunkt, als daß sie dem reichhaltigen Horizont des
Fragenden
entsprechen könnten. Sie können aber zugleich auf die
Möglichkeit
einer solchen Entsprechung aufmerksam machen und somit den dynmaischen
Vorgang der Horizontbildung unterstützen, beschleunigen,
vereinfachen
usw.
Das
Gelingen der unterschiedlichen "Horizontverschmelzungen" hängt
natürlich
im beträchtlichen Maße davon ab, ob der Fragende selbst den
Online-Dialog durchführt oder ob ein anderer für ihn sucht
bzw.
fragt. Ein erfahrener "Searcher" aber, der das System und die
jeweilige
Datenbasis kennt, kann u.U. eine notwendige vermittelnde Rolle
einnehmen
und tritt dabei als zusätzliche Interpretationsinstanz zwischen
dem
System und dem Fragenden ein. Der stattfindende Verstehensprozeß
zwischen dem Fragenden und dem "Searcher" ist dann Gegenstand der
allgemeinen
Hermeneutik. Die hier beschriebene "ideale" Situation ist die des sich
mit dem System auskennenden Fragenden, der selbst den Online-Dialog
durchführt
("end user"). In der Praxis ist man heute häufig auf eine
vermittelnde
Instanz ("intermediary") angewiesen." (S. 167-172)
"b)
Die "Search-and-Find"-Methode als ein hermeneutischer Prozeß
Der
Online-Dialog
ist ein Suchprozeß, den ursprünglich der Fragende selbst
durchführt
und der somit stets auf seinen Fragehorizont bezogen bleibt. Das Fragen
ist aber wiederum weder als "innerpsychischer Zustand" eines
"Subjektes",
noch als ein anonym auf ein "für sich bestehendes Fach" bezogen,
zu
deuten. Im ersten Fall lösen wir den Fragenden von der
Fachgemeinschaft
bzw. vom Miteinandersein ab, im zweiten hypostasieren wir Fachgebiete
bzw.
den Horizont einer Fachgemeinschaft.
Mit
Recht kritisiert D.R. Swanson (D.R. Swanson: Information Retrieval as a
Trial-and-Errof-Process. In: Information Storage & Retrieval 6,
1970,
S. 351-361) die Vorstellung des Retrieval-Prozesses als eine bloß
auf den Horizont eines Fachgebietes ("topic") bezogene Suche. Er
vergleicht
in diesem Zusammenhang das Information Retrieval mit dem (Popperschen)
Modell der wissenschaftlichen Forschung als einen Prozeß von
"Versuch-und-Irrtum"
("trial-and-error"). Kreative wissenschaftliche Forschung, erklärt
Swanson, geht nicht von einem "Fachgebiet", sondern von einem "Problem"
aus, d.h. es wird eine Vermutung (bzw. eine "Theorie") aufgestellt und
auf ihren Wahrheitsgrad geprüft. Es handelt sich dabei um einen
interaktiven
bzw. rekursiven Prozeß.
Wir
bemerkten schon, daß "Fachgebiet" und "Problem" nicht
antagonistisch
aufzufassen sind. Es wäre ebenso einseitig, sich "Probleme an
sich",
d.h. losgelöst von einem mit-geteilten "Fachgebiet" (im oben
angedeuteten
Sinne) vorzustellen. Swanson meint aber offenbar einen solchen
Antagonismus
nicht, sondern hebt den Bezug auf den Horizont des Fragenden hervor.
Die
Analogie zwischen der "trial-and-error"-Methode und dem Information
Retrieval
gründet darin, daß in beiden Fällen ein Fragender von
einer
von ihm bestimmten Frage (bzw. "Vermutung") ausgeht und die
gefundenen
Antworten bzw. "Lösungen" nicht "absolut", sondern als Quelle
neuen
Fragens versteht.
Damit
ist der beiden Prozessen gemeinsame hermeneutische Charakter
des
Fragens angesprochen. Die Analogie kommt aber in verschiedener Hinsich
im Retrieval-Prozeß zu kurz. Wir sagten oben, daß das Ziel
dieses Prozesses nicht die Prüfung der Wahrheit einer
Aussage
bzw. Theorie, sondern die Suche nach relevanten bzw.
"nützlichen"
Erkenntnissen ist. Der Fragende sucht mögliche im Hinblick auf
seine
Fragestellung relevante Erkenntnisse, wobei er nur Hinweise auf
diese am Bildschirm unmittelbar zu sehen bekommt. Aber auch wenn er
zugleich
den Originaltext oder, im Falle von Faktendatenbasen, die gesuchte
Angabe
finden würde, wäre ein solcher Prozeß nicht dem einer
automatisierten
"ars inveniendi" gleiczusetzen. Im Falle der wissenschaftlichen
Forschung
geht es um "Wahrheit" und "Irrtum", freilich als ein offener
Prozeß,
ohne "absolute" Kriterien. In diesem engen Sinne von "Irrtum" bzw.
"Fehler"
kann aber beim Information Retrieval nicht gesprochen werden, da die
Suche
nach Literaturhinweisen nicht dazu führt (und sie ist auch nicht
notwendigerweise
im Hinblick darauf erfolgt) den Wahrheitsgehalt der Frage (oder den der
Frageformulierung) zu bestätigen oder zu widerlegen.
Außerdem
stellt dieses Modell ein Ziel, nämlich das einer
bestimmten
Form wissenschaftlicher Forschung, in den Vordergrund, während es
in Wahrheit,wenn wir z.B. an die berufliche Praxis denken, eine
Vielfalt
von Zielen für einen solche Suche geben kann. In diesem Sinne
schränkt
z.B. S.P. Harter diesees Modell als Analogon der Online-Suche ein (S.
P.
Harter: Scientific Inquiry: A Model for Online Searching. In: Journal
of
the American Soc. for Inf. Science 35, 1984, 2, S. 110-117). Gefundene
aber nicht relevante Literaturhinweise sind somit schwerlich als
"Fehler"
zu kennzeichnen und eine entsprechende Modifizierung der Frage
(vielleicht
zunächst und zumeist nur der Frageformulierung) bedeutet nicht,
daß
man ihren Wahrheitsgehalt testet. Der Begriff "Fehler" ist hier relativ
zum Zweck und im Rahmen von Relevanz zu sehen. Wir werden im
nächsten
Abschnitt auf den Relevanzbegriff eingehen.
Der
offene Charakter des Retrieval-Prozesses sowie sein Bezug auf den
Horizont
des Fragenden, der sein Vorverständnis ins Spiel bringt und dabei
unterschiedliche Zwecke verfolgen kann, läßt sich demnach
allgemein
als ein hermeneutischer Prozeß deuten und dessen
wiederkehrender
und "stimulierender" Charakter als eine besondere Ausformung des
"hermeneutischen
Zirkels" erkennen. Da es sich hier um einen allgemeinen, d.h. in bezug
auf verschiedene Motivationen offenen Prozeß des Suchens und
Findens
(von Hinweisen auf Erkenntnisse) handelt, soll nicht, wenn schon nach
einer
"Formel" gesucht wird, von "trial-and-error", sondern von
"search-and-find"
die Rede sein. Damit hat aber "das Gefundene" nicht die Funktion, den
Suchprozeß
abzuschließen, genausowenig wie im Falle von "trial-and-error"
die
"Fehler" einen bloß negativen Charakter haben. Durch die
gefundenen
Hinweise sowie auch durch den Suchprozeß selbst, kann das
Vorverständnis
des Fragenden in vieler Hinsicht erweitert, bereichert, verändert
werden
und stellt sich somit als neue Grundlage für das weitere Suchen
dar.
Wir lernen nicht nur aus unseren "Fehlern", sondern auch aus unseren
"Erfolgen"."
(S. 173-175)
"c)
Die Frage nach der Relevanz des Retrievalergebnisses
Im
Mittelpunkt
des suchenden Fragens steht die Relevanz bzw. Nützlichkeit der
Retrievalergebnisse.
Es ist der Fragende selbst, der ursprünglich die Relevanzfrage
stellt
und beantwortet. Das Urteil des Nutzers ist aber, wie G. Salton mit
Recht
betont, für die Evaluierung des Informationssystems von
entscheidender
Bedeutung, wenn man davon ausgeht, daß Informationssysteme keinen
Selbstzweck erfüllen, sondern ein Mitteilungsmodus der
Fachgemeinschaft
sind (G. Salton, M.J. McGill: Introduction to Modern Information
Retrieval,
New York 1983, S. 161; Vgl. T. Saracevic: Relevance, In:
M.J.
Voigt, M.H. Harris Eds.: Advances in Librarianship, New York 1976, S.
79-138).
Von
allen Paramatern, die bei der Bewertung eines Retrievalsystems eine
Rolle
spielen, ist die Frage nach der Relevanz der Ergebnisse die wohl
entscheidenste.
Obwohl hier von Retrievalergebnissen die Rede ist, liegen die im
folgenden zu differenrenzierenden Ebenen dem Suchprozeß
selbst
zugrunde, besonders wenn dieser vom Fragenden selbst, d.h. vom
tatsächlichen
Nutzer, durchgeführt wird, und wenn er diesen Prozeß durch
die
Zwischenbewertung der Literaturhinweise bestimmt.
Die
Suche nach "objektiven" Bewertungs- bzw. Relevanzkriterien und die
Tatsache,
daß öfter Literaturrecherchen von einem Vermittler
durchgeführt
werden, geben zunächst Anlaß, die Relevanzfrage ohne
Rücksicht
auf den Nutzer zu stellen. Man spricht von "systemorientierter
Bewertung"
oder von "objective view" (Salton), im Gegensatz zur "subjective view"
bzw. "benutzerorientierten Bewertung".
Die
systemorientierte Bewertung berücksichtigt das Verhältnis
zwischen
dem thematischen Horizont der Frage und dem der gefundenen
Literaturhinweise.
Der Fragende kann sich aber auch auf dieser Ebene bewegen und lediglich
auf die "topische Relevanz" (Swanson) achten, ohne über die
"problemspezifische"
Relevanz zunächst zu entscheiden.
Zur
systemorientierten Bewertung gehört auch der Vorgang des
Vergleichs
("matching") z.B. zwischen der Suchformulierung und der betreffenden
verobjektivierten
Suchsprache. Man kann diese Ebene als eine Vorstufe betrachten und erst
dann von Relevanz sprechen, wenn aufgrund der Ergebnisse des
Vergleichsprozeses,
der Fragende bzw. der Vermittler ein Urteil bezüglich der
Zugehörigkeit
der Literaturhinweise zur angesprochenen Thematik ausspricht. Wenn das
System diese zweite Ebene als das entscheidende Relevanzkriterium
ansieht
und die tatsächliche Beurteilung des Nutzers ausklammert, kommt es
zu der von Swanson, Harter, Möhr u.a. angesprochenen Verzerrung
des
Relevanzproblems. Die Relevanzebenen sind also wohl zu differenzieren,
ohne sie aber gegeneinander auszuspielen.
Die
benutzerorientierte Bewertung findet im Horizont eines erfolgreichen
"matching"
sowie einer bestimmten Thematik bzw. eines Fachgebeites statt. Das
Verhältnis
des Retrievalergebnisses zur spezifischen Einbettung der Frage ins
Vorverständnis
des Nutzers bildet die dritte Relevanzebene. Lancaster, Salto u.a.
sprechen
hier nicht von Relevanz, sondern von Pertinenz. Entscheidend ist dabei
die Einsicht, daß die Pertinenz vom Horizont des Fragenden
konstituiert
wird. Von der Pertinenz aus gesehen ist die "Objektivität" der
Relevanz
lediglich eine Abstraktion. Da wiederum das Ergebnis des
Retrieval-Prozesses
Literaturhinweise sind, gewinnt das Pertinenzurteil erst seinen vollen
Gehalt, wenn die Dokumente selbst in die Betrachtung einbezogen werden,
und wenn eine Aussage über deren tatsächliche Verwertung
gemacht
wird bzw. gemacht werden kann.
Zur
Quantifizierung der Relevanz des Retrievalergebnisses verwendet man
gewöhnlich
zwei Parameter, nämlich die Rückgewinnungsquote oder "recall"
und die Trefferquote oder "precision". Diese Parameter sollen jeweils
folgende
Verhältnisse zum Ausdruck bringen:
"Recall"
=
Zahl
der relevanten ausgegebenen Dokumenten
Zahl
der relevanten Dokumente im Speicher
"Precision"
=
Zahl
der relevanten ausgegebenen Dokumenten
Zahl
der insgesamt ausgegebenen Dokumente
Diese
Quoten sind in verschiedener Hinsicht problematisch. Zunächst
muß
hervorgehoben werden, daß der Relevanzbegriff in diesen
Parametern
meistens undifferenziert bleibt bzw. lediglich im Sinne der (topischen)
Relevanz und nicht der Pertinenz gebraucht wird. Ferner könnten
diese
Parameter auch im Hinblick auf die Vorstufe des "Vergleichs"
("matching")
angewandt werden. Der Referenzrahmen ist dann jeweils:
- die Suchformulierung
bzw. die Suchtaktik,
- der thematische
Horizont der Frage,
- der konkrete
Horizont des Fragenden.
Die
Parameter
werden ferner in ihrer Aussagekraft eingeschränkt, wenn lediglich
die Literaturhinweise als Grundlage der Relevanz bzw.
Pertinenzentscheidung
zugrundegelegt werden. (....)
Daß
der Begriff des "nicht-relevanten Dokumentes" ("Ballast", "fall-out")
auch
entsprechend relativiert werden muß, ist offensichtlich. Salton
nennt
drei charakteristische Pertinenz-Parameter:
- Die Neuigkeitsquote,
d.h. das Verhältnis der gefundenen und, aus der Sicht des Nutzers,
relevanten Dokumente zu den ihm davon unbekannten ("novelty ratio").
- Das Verhältnis
aller für den Nutzer relevanten gefundenen Dokumente zu den ihm
bereits
bekannten und relevanten ("coverage ratio").
- Das Verhältnis
aller vom Nutzer analysierten relevanten Dokumente, zu der Gesamtzahl
relevanter
Dokumente, die er gern hätte analysieren wollen ("sought recall")
(G. Salton, op.cit. S. 176 ff)
(....)
Die
Erörterung der Relevanzfrage beim Information Retireval kann
als ein spezieller Fall einer allgemeinen Untersuchung des
Grundphänomens
der Relevanz im Sinne eines dauernden Vorganges, der in der Bildung und
Infragestellung von individuellen und sozialen Vorverständnissen
besteht.
In diesem Zusammenhang sei auf die maßgeblichen
phänomenologischen
Analysen von Alfred Schütz hingewiesen (A. Schütz:
Reflections
on the Problem of Relevance, New Haven 1970).
Die
von Schütz erörteten Relevanzarten, nämlich: "topische",
"motivierte" und "interpretative" Relevanz, weisen jeweils auf den
thematischen
Horizont des Fragenden, auf seinen Erwartungshorizong sowie auf den
Bewertungsprozeß
hin, wordurch er die "Pertinenz" der Antworten thematisch und
"zweckmäßig"
analysiert und somit zur Bildung eines neuen Horizontes kommt." (S.
180-185)