Google Buchsuche

Das Volltextarchiv von Google Book Search nimmt so langsam Konturen an. In dem Oktober 2004 gestarteten Digitalisierungsprojekt werden massenhaft gemeinfreie, aber auch urheberrechtlich gechützte Bücher gescannt und teilweise via Volltextsuche zugänglich gemacht. Während das Projekt in den ersten Jahren vor allem durch quasi nutzlose Fragmente und den Hinweis, dass man das zu dem Schnipsel gehörige Buch vielleicht auch noch irgendwo kaufen könnte scheint Google nun umgeschwenkt zu sein und sich stärker auf vollständig gemeinfreies Material zu konzentrieren. Dadurch stehen die zu den Sucheregebnissen gehörenden Texte öfter komplett zur Verfügung, außerdem scheinen mittlerweile auch verstärkt deutschsprachige Werke unter die Scanner zu kommen.

Folgende Großdigitalisierungen sind geplant:

  • Bibliothek der University of Michigan (über 7 Millionen Bände)
  • Universitätsbibliotheken von Harvard und Stanford,
  • New York Public Library
  • Bodleian Library der Oxford University
  • Bibliotheken von Universitäten in Virginia, Wisconsin-Madison, Princeton, Kalifornien sowie in Texas-Austin,
  • Biblioteca de Catalunya in Barcelona, die Nationalbibliothek von Katalonien (seit 2006),
  • Bibliothek der Universidad Complutense Madrid (seit 2006),
  • Bayerische Staatsbibliothek in München (ab 2007).

Was sich derzeit bereits findet, sind beispielsweise Fragmente aus historischen Lexika, beispielsweise Teile aus

  • Universal-Lexicon der Gegenwart und Vergangenheit von H. A. Pierer; verfügbar ist etwa ein Drittel der 2. Auflage sowie einige wenige Bände der 3. Auflage;
  • einige Bände aus der Allgemeinen Enzyklopädie der Wissenschaften und Künste von Ersch/Gruber (um 1860);
  • Brockhaus Allgemeine deutsche Real-Encyklopädie, einige Bände zwischen 1830 und 1850;
  • Brockhaus Conversation-Lexikon, einige Bände um 1830.

Daneben finden sich eine Reihe klassischer Übersetzungen von Aelian, Aischylos, Aristoteles, Arrian, Euripides, Hesiod, Homer, Pausanias, Oppian, Plutarch, Sophokles, Vergil und Xenophon. Von Oppians Kynegetika gibt es praktisch keine Spuren, außer der Teilübersetzung von Max Miller, die zwar nachgewiesen wird, jedoch nicht im Volltext indexiert ist.

Im naturwissenschaftlichen Bereich existieren Bruchstücke aus Okens Allgemeine Naturgeschichte für alle Stände sowie den sehr interessanten Teilband Fauna der Wirbelthiere Deutschlands, Bd. 1: Säugethiere von Blasius (1857). Eher exotisch ist Buffons englischsprachige Natural History (1797) und The Naturalists Library von Jardine (1839). Irgendwelche Spuren von Veröffentlichungen aus dem Bibliographischen Institut (Meyers Konversation-Lexikon, Brehms Thierleben u.a.) konnte ich bisher leider noch nicht ausmachen.

Es gelten auch weiterhin die bekannten Einschränkungen: Ein Großteil der Digitalisate ist nutzlos, da lückenhaft, unvollständig oder unleserlich digitalisiert; vielfach sieht man umblätternde Hände oder halb umgeschlagene Seiten; besonders ärgerlich sind durcheinandergeratene Paginierungen, bei denen man dan riesige PDF-Dateien nach dem Folge-Faksimile durchsuchen muß (das meist komplett fehlt). Die bibliografische Erschließung der Digitalisate ist indiskutabel; bei mehrbändigen Werken sind Auflagen oder gar Ausgaben kaum auseinanderzuhalten, ohne die Faksimiles selbst einzusehen.

Dennoch stellen die Digitalisate bei allen Mängeln einen einzigartigen Schatz dar; viele der Werke sind sonst selbst in Staats- und Nationalbibiotheken nicht verfügbar (aus Gründen des Bestandsschutzes, wegen Restaurierungsarbeiten oder Kriegsverlusten etc.) - mit der Google-Buchsuche erhält man immerhin eine Chance auf Zufallsfunde. Und wer sagt, dass die Arbeit mit großen Textmengen so einfach und unkompliziert sein muß wie bei Zeno.org ;-)

Netmarks

Inhalt abgleichen