Schattenblick →INFOPOOL →BUCH → FAKTEN

BIBLIOTHEK/441: Zwischen Zettelkatalog und Google (impulse - Uni Bremen)


Universität Bremen - impulse aus der Forschung Nr. 1/2010

Zwischen Zettelkatalog und Google
Suchmaschinenentwicklung an der Staats- und Universitätsbibliothek Bremen

Von Martin Blenkle


Neben den klassischen gedruckten Werken bieten Bibliotheken heute eine Vielzahl elektronischer Medien an. Oft müssen die Nutzer verschiedene Online-Kataloge zu Rate ziehen, ehe sie die gewünschten Quellen finden. Die E-LIB der Staats- und Universitätsbibliothek Bremen vereint die unterschiedlichen Kataloge und bietet den Bibliothekskunden schnelle Übersicht über gedruckte und elektronische Medien.


Trotz der noch relativ kurzen Geschichte der Universität Bremen blickt die Staats- und Universitätsbibliothek Bremen (SuUB) im Jahr 2010 bereits auf eine 350-jährige Geschichte zurück. Die Bibliothek, die sich vom klassischen Bücherarchiv früherer Tage längst zu einem modernen Lern- und Arbeitsort entwickelt hat, nahm ihren Ursprung in der 1660 eröffneten Bibliotheca Bremensis des Gymnasiums Illustre im ehemaligen Katharinenkloster.

Seit ihren Anfängen im 17. Jahrhundert haben sich die Betätigungsfelder der Bibliothek erheblich erweitert. Neben der Bewahrung des historisch gewachsenen Bestandes an wertvollen Handschriften und kostbaren Frühdrucken und dem Aufbau eines bedarfsgerechten wissenschaftlichen Medienbestandes haben insbesondere im letzten Jahrzehnt innovative Entwicklungen aus den Bereichen Wissensmanagement, Digitalisierung und Suchmaschinentechnik einen festen Platz im Aufgabenspektrum der Staats- und Universitätsbibliothek erhalten.


Hybrider Medien-Mix

Nachdem früher einzig die Bibliotheken auf der Grundlage ihrer umfangreichen Sammlungen vor Ort den Zugang zum Wissen vermitteln konnten, ging dieses Monopol in den letzten Jahren durch die vielfältigen Wege der Informationsbeschaffung im Internet verloren. Auch im Angebot der Bibliotheken spielen die online verfügbaren elektronischen Medien neben den gedruckten Ausgaben eine immer wichtigere Rolle. Bei diesen Medien handelt es sich vor allem um elektronische Parallelausgaben von gedruckten Fachzeitschriften und zunehmend auch von Büchern renommierter Verlage. Dieses Material wird von den Bibliotheken größtenteils bei wissenschaftlichen Verlagen kostenpflichtig lizenziert und universitären Nutzern bereitgestellt.

Das "hybride" Angebot an klassischen Printmedien einerseits und elektronischen Dokumenten anderseits sowie die erhebliche, stetig wachsende Vielfalt an Medientypen und Zugangsvarianten stellen die elektronischen Kataloge der Bibliotheken vor große Herausforderungen. Zur Erschließung des Medien-Mixes bedarf es neuer, moderner Suchsysteme. Im Vergleich zur rasanten Entwicklung der Suchmaschinentechnik im Internet haben sich jedoch die weitgehend auf Printmedien ausgerichteten Online-Kataloge der Bibliothekswelt in den letzten 10 Jahren kaum weiterentwickelt.

In den meisten Bibliotheken ist es seit Jahren üblich, den Nachweis und die Präsentation der Online-Angebote über unterschiedliche Systeme abzuwickeln. So gibt es neben dem Bibliothekskatalog, in dem die Printmedien zu finden sind, häufig ein zweites System zum Nachweis elektronischer Zeitschriften, ein drittes System zum Nachweis elektronischer Bücher und ein weiteres System zum Nachweis elektronischer Datenbanken. Ein solches komplexes Netzwerk verschiedener Quellen und Zugänge ist für die Bibliothekskunden nur schwer durchschaubar.


Eine Suche für alle Kataloge

Während die Welt der professionellen Fachinformation aus dem Umfeld der Bibliotheken und wissenschaftlichen Verlage auf den universitären Nachwuchs heterogen, komplex und erklärungsbedürftig wirkt, erscheint die Informationsbeschaffung mit Suchmaschinen wie Google verlockend einfach. Die von ihren Sucherfahrungen im Internet geprägten Bibliothekskunden erwarten heute ein einheitliches Suchinterface für alle Medien und den direkten Online-Zugang zum Volltext.

Obwohl die wissenschaftlichen Informationssysteme der Bibliotheken gegenüber Suchmaschinen wie Google den eindeutigen Vorteil der Beschränkung auf rein wissenschaftliche und professionell kontrollierte Inhalte aufweisen, können sie zukünftig nur konkurrenzfähig sein, wenn sie den Suchraum ihrer Recherchesysteme erweitern und neben den konventionellen Printmedien auch die verfügbaren Online-Dokumente einbeziehen. Als Suchraum wird in der Fachsprache die Gesamtheit aller verfügbaren Informationen eines Kataloges oder die Wissensbasis einer Suchmaschine bezeichnet.

Die Staats- und Universitätsbibliothek Bremen hat die Notwendigkeit, eine solche integrierte Sicht auf das hybride Bibliotheksangebot zu bieten, bereits früh erkannt und beschäftigt sich im Rahmen der Elektronischen Bibliothek (E-LIB) nunmehr seit 10 Jahren mit der Entwicklung moderner bibliothekarischer Suchtechnologie. Die E-LIB ist dabei gleichzeitig Entwicklungsumgebung und Produktionssystem und wickelt täglich 10.000 bis 15.000 Suchanfragen ab.


E-LIB Bremen

Die E-LIB verfolgt das Ziel, alle verfügbaren Medien im Sinne eines "One-Stop-Shop-Portals" über eine Oberfläche anzubieten, um die heterogenen Quellen der unterschiedlichen Medientypen soweit wie möglich aufzulösen. In diesem von der Bibliothek kontrollierten Suchraum finden sich derzeit etwa 24 Millionen Nachweise - davon über 80 Prozent elektronische Volltexte aus Online-Zeitschriften bekannter Wissenschaftsverlage. Dazu gehören sowohl die von der SuUB gekauften und lizenzierten Medien als auch circa fünf Millionen elektronische Ressourcen, die von der Deutschen Forschungsgemeinschaft im Rahmen der sogenannten "Nationallizenzen" bundesweit zur Verfügung gestellt werden.

Beim Aufbau dieser Online-Kollektion ist es der SuUB ein besonderes Anliegen, auch wissenschaftliche Veröffentlichungen, die auf universitären Online-Archiven weltweit kostenfrei angeboten werden - sogenannte Open-Access-Dokumente - zu verzeichnen. Um die Sichtbarkeit dieses Materials zu erhöhen und für diese Publikationsform zu werben, werden derzeit etwa drei Millionen Titel aus ausgewählten Quellen bereitgestellt.

Diese Form des gemeinsamen Nachweises von Print- und E-Medien mit direktem Volltextzugang in einem Bibliothekskatalog - der E-LIB - ist immer noch bundesweit ein einmaliges Angebot, da die bibliothekarische Standardsoftware den eigenständigen Aufbau einer solchen gemischten Kollektion in der Regel nicht ermöglicht. Für das Konzept der einheitlichen Suche und der Service-orientierten Architektur wurde die E-LIB beim bundesweiten Wettbewerb "Bibliotheksinnovation 2006" anlässlich des Informatikjahres mit dem 1. Preis ausgezeichnet.


Assistenten helfen bei der Suche

Die Suche in einem großen Medienangebot führt allerdings häufig zu wenig überschaubaren Trefferzahlen. Parallel zur Erweiterung der Wissensbasis müssen daher auch Lösungen zur Unterstützung des Suchvorgangs entwickelt werden. Die Literatursuche in der E-LIB wird durch "automatische Assistenten" begleitet, die das Suchergebnis intelligent analysieren und helfen, den Prozess der Literatursuche erfolgreicher zu gestalten.

Der Bibliothekskatalog emanzipiert sich dabei vom simplen Abfrageinstrument in Richtung eines Navigationssystems zur Unterstützung von assoziativen Entdeckungsprozessen. Nicht nur das Prinzip der Serendipity, also das Phänomen der Zufallsfunde, die sich als neue und überraschende Entdeckungen erweisen können, erfährt dabei eine systematische Unterstützung. Das vom Nutzer beim ersten Suchschritt verwendete Vokabular erweist sich oftmals während der nachfolgenden Suchschritte als nicht optimal zur Beschreibung des angestrebten thematischen Zusammenhangs. Um in dieser Situation zu helfen, analysiert die E-LIB das Thema einer Anfrage und liefert Vorschläge zur Modifikation der Recherche. Dazu wird das semantische Umfeld der Suchanfragen optisch aufbereitet und in Form einer sogenannten Tag Cloud (Wort-Wolke) visualisiert.

Thematisch verwandte Begriffe laden dazu ein, das Anfragevokabular zu modifizieren oder die Suche direkt in einen anderen Teilbereich eines Fachgebietes zu verzweigen. Ist für hochspezielle Anfragen nur wenig relevantes Material verfügbar, kann das System nach einer automatischen Fachzuordnung der Suchanfrage die dafür geeigneten, von der Bibliothek bereitgestellten bibliographischen Datenbanken empfehlen, um so eine Fortsetzung der Suche zu ermöglichen.


Nichts gefunden - was nun?

In jedem Suchsystem wird der Nutzer irgendwann mit der Situation konfrontiert, keine Treffer zu finden. Die Analyse und geeignete Behandlung solcher "Null-Treffer"-Ergebnisse ist ein besonders vielversprechendes Einsatzgebiet für Rechercheassistenten. Leider stehen entsprechende Funktionen in bibliothekarischen Standardsystemen bisher kaum zur Verfügung.

Keine oder nur geringe Trefferzahlen sind in der Regel entweder auf das Fehlen entsprechender Titel in der Datenbasis oder auf Rechtschreibfehler in den Eingabebegriffen zurückzuführen. Nach einschlägigen Untersuchungen stellen unbemerkte Rechtschreibfehler bei der Eingabe tatsächlich eines der häufigsten Probleme dar. Bereits bei der Eingabe schlägt die E-LIB daher eine mögliche Vervollständigung des Begriffes vor. Erfolgt die Eingabe dennoch fehlerhaft, ist es in vielen Fällen möglich, den Fehler während des Suchprozesses automatisch zu erkennen und die richtige Schreibweise vorzuschlagen. Die automatische Korrektur erfolgt jedoch nur dann, wenn für den korrigierten Begriff tatsächlich auch Treffer produziert werden können.

Wenn die gesuchten Medien in der E-LIB nicht vorhanden sind, ist das System sogar in der Lage, automatisch überregional verfügbare Nachweise anderer Bibliotheken als Treffer anzubieten. Die einzelnen Titel können per Knopfdruck bestellt werden. Handelt es sich dabei um elektronische Medien, stehen die Volltexte sofort zur Verfügung.

Die E-LIB bietet eine breite Palette von Möglichkeiten. Interessante Zusatzfunktionen müssen jedoch nicht nur technisch entwickelt, sondern auch nutzerfreundlich gestaltet werden. Bei der Weiterentwicklung des Systems werden deshalb die Aspekte der Bedienbarkeit und des positiven Rechercheerlebnisses ["user experience"] einen zentralen Raum einnehmen.

Neben der Aufnahme weiterer interessanter Inhalte wird sich die Entwicklung in Zukunft mit der verbesserten Integration von Servicefunktionen in den Suchprozess beschäftigen.


Martin Blenkle, Bibliothekar und Chemiker, leitet seit 1998 die Abteilung Informationstechnik an der Staats- und Universitätsbibliothek Bremen und widmet sich seit dieser Zeit dem Aufbau elektronischer Bibliotheksdienste als Bausteine für eine integrierte Informationsinfrastruktur auf dem Campus.


*


Quelle:
Universität Bremen - impulse aus der Forschung
Nr. 1/2010, Seite 6-9
Herausgeber: Rektor der Universität Bremen
Redaktion: Eberhard Scholz (verantwortlich)
Universitäts-Pressestelle
Postfach 330440, 28334 Bremen
Telefon: 0421/218-60 150, Fax: 0421/218-98 60 150
E-Mail: presse@uni-bremen.de
Internet: www.uni-bremen.de


veröffentlicht im Schattenblick zum 21. Juli 2010