ebib 
Nr 3/2008 (94), Biblioteki bez papieru. Badania, teorie, opinie
 poprzedni artykuł następny artykuł   

 


Renata Mateusiak
Biblioteka Uniwersytetu Śląskiego w Katowicach

Dostęp do pełnych tekstów książek w Google Book Search


Współczesny czytelnik ma do dyspozycji coraz więcej pełnotekstowych publikacji umieszczonych w Internecie. Możliwość czytania cyfrowych dzieł oferuje także najpopularniejsza światowa wyszukiwarka internetowa Google. W 2004 r. w ramach projektu światowej biblioteki sieciowej uruchomiła ona usługę Google Print, nazwaną od listopada 2005 r. Google Book Search.

Wspomniana inicjatywa dostępna na stronie: http://books.google.com/[1], a od grudnia 2007 r. także pod adresem polskim http://books.google.pl/[2], to wyszukiwarka książek wykorzystująca technologię OCR. Umożliwia przeszukiwanie treści kilkuset tysięcy pozycji znajdujących się w największych bibliotekach i księgarniach na świecie[3]. Wyszukiwanie jest możliwe w trzech wariantach: „wszystkie książki”, „ograniczony podgląd”, „pełny widok”, zaś jego wyniki są wyświetlane w czterech kategoriach:

  1. Pełny widok (full view);
  2. Ograniczony podgląd (limited preview);
  3. Widok krótkiego opisu (snippet view);
  4. Podgląd niedostępny (no preview available).

Książki można czytać i przeszukiwać w kilku językach[4]. Pochodzą one z dwóch źródeł:

  1. Projektu bibliotecznego – za jego pośrednictwem firma Google nawiązała współpracę z 18 bibliotekami z całego świata (w tym sześcioma z Europy) oraz konsorcjum Committee on Institutional Cooperation (CIC)[5]. Google pomaga przetwarzać na postać cyfrową ich księgozbiory, które potem są indeksowane i w różny sposób udostępniane, w tym w tzw. „pełnym widoku”. W przypadku, gdy dzieło chronią prawa autorskie, uzyskujemy tylko ogólne informacje na jego temat oraz podgląd do kilku wycinków z treści, a także wskazówkę, jakie biblioteki bądź księgarnie posiadają daną pozycję.
  2. Programu partnerskiego, w którym uczestniczy około 10 tysięcy wydawców z całego świata, przekazujących firmie Google swoje publikacje do przetworzenia na postać cyfrową i umieszczenia ich on-line w formie podglądu, dającego ograniczony dostęp do treści (limited)[6], bez możliwości zapisu i wydruku tekstu.

Wśród zasobów projektu bibliotecznego znalazły się także polskie książki udostępnione w pełnych tekstach. Celem artykułu jest zaprezentowanie propozycji ich wyszukiwania, jak również wskazanie konkretnych tytułów (ich tematyki, metody opisu bibliograficznego). Są to pozycje wydawnicze zaliczane do światowego dziedzictwa kulturowego, do których wygasły już prawa autorskie, czyli przeważnie druki z XIX w. i początków XX w. Od sierpnia 2006 r. takie publikacje można ściągnąć w formacie PDF na własny komputer (download PDF). Wcześniej można je było jedynie czytać i przeszukiwać, lecz nie było możliwości pobrania czy wydrukowania. Każda pobierana książka opatrzona jest znakiem Digitalized by Google (digitalizacja dokonana przez Google), a na dwóch pierwszych stronach podano warunki dotyczące użytkowania tekstów, a więc:

  1. Wykorzystywanie plików w celach niekomercyjnych;
  2. Nieautomatyzowanie zapytań;
  3. Zachowywanie przypisań;
  4. Przestrzeganie prawa.

Firma Google zawiadamia, że współpracuje z bibliotekami w ramach projektu światowej biblioteki sieciowej, gdyż ma na celu zachowanie dziedzictwa piśmienniczego dla przyszłych pokoleń oraz uporządkowanie światowych zasobów informacji, aby stały się powszechnie dostępne i użyteczne.

Jednym ze sposobów dotarcia do książek jest wpisanie na stronie głównej wyszukiwarki http://books.google.com/ albo jej polskiego odpowiednika (pod adresem: http://books.google.pl/) szukanego wyrazu (np. Polska) bądź frazy (m.in. „dzieje Polski”). Przykładowo dla hasła – Polska w marcu 2008 r. odnaleziono ponad 15 tysięcy wyników zawierających to słowo. Po zawężeniu do limited pojawiło się 9200 rezultatów (przy czym wyświetlone wyniki to zarówno limited, jak i full), a do pełnego widoku – już 2132 pozycji (w wersji polskiej 1940). Warto wspomnieć, że we wrześniu ubiegłego roku wyniki identycznego wyszukiwania były uboższe. Wtedy w limited ukazało się 3700 rezultatów, a w pełnym widoku – 619 pozycji.

[Rozmiar: 20997 bajtów]

Bardziej dociekliwym warto polecić „szukanie zaawansowane”, w którym można łączyć kilka kategorii wyszukiwawczych, takich jak: autor, tytuł, wydawca, albo też ograniczać wyniki m.in. do lat wydania. Odpowiednikiem tego jest wpisanie bezpośrednio na stronie głównej wyszukiwarki odpowiednich komend, np.:
intitle:kronika date:1830-1850
inauthor:Czartoryski date:1800-1860
"dzieje narodu" date:1840-1850
inpublisher:Żupańskiego
subject:"Polish literature"
intitle:Polska inpublisher:Żupańskiego

[Rozmiar: 60143 bajtów]

Na stronie http://books.google.com/ zobaczymy wówczas:
[Rozmiar: 17737 bajtów]

[Rozmiar: 13780 bajtów]

Identyczny wynik otrzymamy także, gdy w wyszukiwaniu uwzględnimy autora, czyli przyjmiemy kryterium: intitle:Polska inauthor:Lelewel inpublisher:Żupańskiego. Przyzwyczajeni do używania operatora maskującego (*), muszą pamiętać, że w Google obowiązują symbole rozszerzające: „OR” i „+”. Gdy chcemy znaleźć druki Zawadzkiego, albo Żupańskiego, musimy wpisywać do wyszukiwarki zarówno Zawadzki (Żupański), jak i Zawadzkiego (Żupańskiego) bądź zastosować hasło złożone: inpublisher:Zawadzki OR inpublisher:Zawadzkiego.

Wiele polskich książek, w tym.: Pieśni ludu polskiego O. Kolberga (wyd. 1857 r., digitalizacja 22 listopad 2005 r.); Czasy Zygmunta Augusta. Ustęp z przeszłości. S. Gołębiowskiego (1851 r., digitalizacja listopad 2007 r.) pochodzi ze zbiorów Biblioteki Uniwersytetu Harvarda. Latem 2006 r. zeskanowano Bibliograficznych ksiąg dwoje Joachima Lelewela (1823 r., egzemplarz z Uniwersytetu Michigan), zaś w kwietniu 2007 r. Wiadomości historyczno-krytyczne do dziejów literatury polskiey, o pisarzach polskich J.M. Ossolińskiego (1822 r., z zasobu Biblioteki Uniwersytetu Kalifornijskiego).

Warto bliżej zapoznać się z ofertą dostępnych w Google Book Search polskich tytułów. Zostały tutaj umieszczone dzieła około stu pięćdziesięciu autorów polskich. Najstarszymi drukami są zapewne Życie Jerzego Ossolińskiego: kanclerza wielkiego koronnego autorstwa F. Bohomolca (1777 r.) czy też Stary kosmopolita Syrach do Konwencji Narodowej J.M. Ossolińskiego i T. Mostowskiego (1795 r.). Ponadto odnaleźć można inne polskie perełki, jak Kolumb. Pamiętnik wydany w 1828 r.[7] Natomiast osoby zainteresowane dziejami ojczystymi napotkają wiele cennych źródeł, takich jak kroniki (m.in. Kronika emigracji polskiej, 1863 r.), pamiętniki, dzieła historyków polskich. Nie brakuje w Google Book Search beletrystyki i dzieł pisarzy znanych z kanonu literatury pięknej (np. poezje Brodzińskiego, Garczyńskiego), a także pozycji, które można polecić badaczom literatury polskiej (przykłady zob. tabela).

Znajdziemy tu także słowniki dziedzinowe (Pławski A.: Słownik wyrazów botanicznych. Wilno: Józef Zawadzki, 1830 r.), druki religijne (Zbiór nabożeństwa dla Chrześcian Katolików, 1848 r.), czasopisma – „Biblioteka Ossolińskich: pismo historyi, literaturze, umiejętnościom i rzeczom narodowym poświęcone” z 1863 r., „Przyjaciel ludu czyli Tygodnik…” (1848 r.), „Rocznik literacki” (1844 r.).

Wyniki wyszukiwania wyświetlają się według schematu: miniatura strony tytułowej (bądź okładki) oraz wskazówki identyfikacyjne dzieła z odesłaniem do szczegółowych danych. Opis dokumentu zawiera podstawowe elementy bibliograficzne, czyli: tytuł, autor, rok wydania, objętość (bądź numer konkretnej strony zawierającej szukane słowo), hasła przedmiotowe (np. Poland, Polish literature). Więcej danych otrzymamy po kliknięciu about this book. Są to m.in.: informacje dotyczące digitalizacji (skąd pochodzi oryginał, data ucyfrowienia), słowa kluczowe (wydają się być przypadkowymi wyrazami z treści dokumentu – na co zwrócono uwagę na forum EBIB-u), wydawca (nakładca, drukarz). Czasami zamiast słów kluczowych jest krótka adnotacja formalna bądź treściowa, jak również odsyłacze do innych wydań. Można również uzyskać wskazówkę, jakie biblioteki (poprzez linki do katalogów centralnych – WorldCat, NUKAT) bądź księgarnie posiadają daną pozycję. Ponadto załączane są spisy treści, wybrane strony oraz cytowane najpopularniejsze fragmenty.

Od połowy 2007 r. użytkownicy kont serwisu Google mogą zapisywać swoje książki – służy do tego opcja add to my library. Usługa ta posiada funkcje charakterystyczne dla biblioteki wirtualnej, w literaturze przedmiotu nazywanej Biblioteką 2.0, takie jak: tworzenia etykiet, ocenianie i recenzowanie oraz wykonywanie pełnotekstowego wyszukiwania w wybranych przez siebie książkach. Takie kolekcje działają w trybie on-line, a dostęp do nich jest możliwy z dowolnego miejsca, w którym zalogujemy się na konto Google. Utworzoną biblioteką można podzielić się ze znajomymi, wysyłając im do niej link[8]. Poniżej przykłady pozycji wprowadzonych do indywidualnej kolekcji.

[Rozmiar: 35077 bajtów]

Książki dostępne w Google Book Search w postaci full view są w dużej części wprowadzone do naszych rodzimych bibliotek cyfrowych m.in.: Słownik języka polskiego J.S. Lindego, herbarz B. Paprockiego, Dzieje Xięstwa Warszawskiego F. Skarbka (zaznaczono to także w tabeli).

Czy Google Book Search stanowi konkurencję dla naszych polskich bibliotek cyfrowych? Niekoniecznie, jest raczej interesującym źródłem, które je uzupełnia. Jeśli znajdziemy tutaj pełne teksty dzieł niezaliczanych do domeny publicznej, wówczas warto wysłać firmie Google e-mail z taką informacją[9]. Dzięki wyszukiwarkom: http://books.google.com/ i http://books.google.pl/ osoby surfujące w sieci Internet dowiadują się, że zagraniczne biblioteki posiadają cenne polonica oraz mogą w ten sposób odkryć nieznane im dotąd tytuły. Oprócz tego książki znajdziemy także poprzez główne strony wyszukiwarki Google (http://www.google.pl/, http://www.google.com/). Jeśli wpiszemy tam „Kronika polska” + Bielski, to wśród wyników wyświetlania te z Google Book Search będą poprzedzały Cyfrową Bibliotekę Narodową „Polona”. Sposoby szukania mogą być tam skomplikowane, dlatego warto korzystać ze specjalnie przygotowanej wyszukiwarki, jaką jest Google Book Search. Poza tym omawiana usługa Google oferuje pełnotekstowe przeszukiwanie książek i to nie tylko tych zaliczanych do kanonu dziedzictwa kulturowego.

Tab. Dzieła dostępne w Google Book Search. Wybór
 
Opis dzieła bezpośredni
(widoczny po wyświetleniu wyników wyszukiwania)
about this book – informacje o tej książce Biblioteki dLibra
Bielski M., Bielski J.: Kronika polska – 1829, 1830 W drukarni A. Gałęziowskiego Poland/ History/ To 1572 [Original from Stanford University Digitized May 17, 2006 ] Adnotacja – dot. autorów CBN Polona
Bohomolec F.: Życie Jerzego Ossolińskiego: kanclerza wielkiego koronnego – 1777 Oryginalny egzemplarz pochodzi z Uniwersytet Harvarda v.1 Digitalizacja 17 lipca 2007 WBC wyd. z 1860
Brodziński K.: Pisma rozmaite – 1830; 318 stron; Wg Estr. więcej tomów się nie ukazało W drukarni J. Węckiego; Oryginalny egzemplarz pochodzi z Uniwersytet Harvarda; t.1; Digitalizacja 15 Czerwca 2007, kluczowe wyrazy i wyrażenia WBC
Czajkowski M.: Powieści kozackie – 1837; 327 stron Ksiegarnia i Drukarnia Polska. Oryginalny egzemplarz pochodzi z Uniwersytet Michigan Digitalizacja 12 czerwca 2006, kluczowe wyrazy i wyrażenia -
Czartoryski A. J.: Żywot J.U. Niemcewicza... – 1860; 424 stron Księgarnia B. Behra (E Bock). Oryginalny egzemplarz pochodzi z Uniwersytetu Michigan. Digitalizacja 7 grudnia 2006 (jest też egz. z Harvardu) WBC
Dłużniewski M.: Dawna Polska ze stanowiska chrześcijańskiego – 1861, 202 stron W księgarni Nakładowej E. Deckmanna Catholic Church in Poland [Original from Stanford University Digitized May 15, 2006] -
Garczyński S.: Poezye – 1863; 199 stron F. A. Brockaus Oryginalny egzemplarz pochodzi z Uniwersytetu Michigan Digitalizacja 11 lipca, 2006, kluczowe wyrazy i wyrażenia -
Grabowski M.,  Przezdziecki A.: Zrzódła do dziejów polskich – 1843 Ofiarodawca Aleksander Przezdziecki Nakładem i drukiem J. Zawadzkiego Oryginalny egzemplarz pochodzi z Uniwersytet Harvarda v.1-2 Digitalizacja 25 czerwca 2007 WBC
Groza A.: Pamiętnik nie bardzo stary: wyciąg z notat Władysława N. Wyd. popr. – 1858, 339 stron Nakł. J. Zawadzkiego Oryginalny egzemplarz pochodzi z Uniwersytet Harvarda Digitalizacja 18 czerwca 2007, kluczowe wyrazy i wyrażenia -
Klonowicz S. F. Pisma poetyczne polskie – 1858; 258 stron Nakl. Wydawn. Biblioteki Polskiej Oryginalny egzemplarz pochodzi z Uniwersytetu Michigan Digitalizacja 12 lipca 2006 kluczowe wyrazy i wyrażenia -
Koźmian K.: Pamiętniki Kajetana Koźmiana, obejmujące wspomnienia od roku 1780 do roku 1815-1858 Nakł. J. K. Żupańskiego, Poland Oryginalny egzemplarz pochodzi z Uniwersytet Harvarda v.2 Digitalizacja 29 czerwca 2007 -
Kronika polska, przez Dzierswę w końcu wieku XII. napisana: Z dodatkiem rocznych dziejów w...  – 1823, 176 pages W druk. XX. Piiarów, Manuscripts, Polish [Original from Stanford University Digitized May 15, 2006] CBN Polona
Lelewel J.: Polska dzieje i rzeczy jej – 1863
Nakł. księg. J.K. Żupańskiego Oryginalny egzemplarz pochodzi z Uniwersytet Harvarda v.5 Digitalizacja 25 czerwca 2007, kluczowe wyrazy i wyrażenia -
Łukaszewicz L.: Rys dziejów piśmiennictwa polskiego– 1860, 834 stron Nakł. i czcionkami N. Kamieńskiego i Spółki, Polish literature; Oryginalny egzemplarz pochodzi z Uniwersytetu Michigan Digitalizacja 12 grudnia 2006, kluczowe wyrazy i wyrażenia -
Naruszewicz A. S.: Poezye – 1835 Breitkopf et Hertel Oryginalny egzemplarz pochodzi z Uniwersytetu Michigan; Digitalizacja 17 sierpnia 2007, kluczowe wyrazy i wyrażenia -
Przyborowski J.: Wiadomość o życiu i pismach Jana Kochanowskiego – 1857, 212 stron J. K. Żupański Oryginalny egzemplarz pochodzi z Uniwersytetu Harvarda Digitalizacja 27 Czerwca 2007, kluczowe wyrazy i wyrażenia -
Skarbek F.: Dzieje Xiestwa Warszawskiego – 1860
Nakł. księg. J.K. Żupańskiego Poland Oryginalny egzemplarz pochodzi z Uniwersytet Michigan Digitalizacja 21 Marca  2007; kluczowe wyrazy i wyrażenia WBC
Skarga P.: Kazania na niedziele i świeta calego ruku …, S.J.– 1843 "Nowe wydanie ... jest wiernem przedrukowaniem czwartej edycyi Krakowskiej z r. 1609." Nowe wyd. J.N. Bobrowicza Nakl. Ksiegarni Zagranicznej; Church year sermons; Oryginalny egzemplarz pochodzi z Uniwersytetu Michigan Digitalizacja 9 października 2006 Podlaska BC Wyd. z 1735
Spazier R. O.: Historja powstania narodu polskiego w roku 1830 i 1831-1833 W druk. J. Pinard, Poland [Original from Stanford University Digitized May 16, 2006] kluczowe wyrazy i wyrażenia -
Szujski J.: Dzieje Polski podług ostatnich badań – 1862 Genealogical and chronological tables Nakł. Karola Wilda, Poland Oryginalny egzemplarz pochodzi z Uniwersytetu Michigan v.1-2 Digitalizacja 12 marca 2007, kluczowe wyrazy i wyrażenia WBC
Woronicz J. P.: Dzieła poetyczne wierszem i prozą – 1853 Dzieła Nakl. Księgarni Zagranicznej Oryginalny egzemplarz pochodzi z Uniwersytet Michigan Digitalizacja 11 lipiec 2006, kluczowe wyrazy i wyrażenia -
Zaleski W., Lipiński K. J.: Pieśni polskie i ruskie ludu galicyjskiego – 1833
Vol.[2] has title: Muzyka do Pieśni polskich i ruskich ludu galicyjskiego. Do śpiewu i na fortepiano ułozył, Karol Lipinski
Nakł. Franciszka Pillera Oryginalny egzemplarz pochodzi z Uniwersytetu Oksfordzkiego Digitalizacja 2 marca 2007 11 kwietnia 2006 -

Uwaga:[Original from Stanford University. Digitized May 16, 2006] – te dane pochodzą z 2007 r.

Przypisy

[1] Poza tym na stronie http://www.google.com/ w menu: more można wybrać: books. W wyszukiwaniu zaawansowanym jest także odsyłacz do Google Book Search.

[2] ZALEWSKI, P. Google udostępniło Book Search po polsku [on-line]. [dostęp 18 grudnia 2007]. Dostępny w World Wide Web: http://www.idg.pl/news/134267.html.

[3] Google Book Search. W: Wikipedia [on-line]. [dostęp 3 marca 2007]. Dostępny w World Wide Web: http://pl.wikipedia.org/wiki/Google_Book_Search.

[4] ZALEWSKI, P. Książki do pobrania od Google. W: Internet Standard [on-line] 30.08.2006 [dostęp 31 sierpnia 2006]. Dostępny w World Wide Web: http://www.internetstandard.pl/news/98513.html.

[5] Wykaz partnerów dostępny na stronie: http://books.google.com/googlebooks/partners.html.

[6] ANAM, R. (oprac.). Google Search Book PL [on-line]. [dostęp 20 grudnia 2007]. Dostępny w World Wide Web: http://www.egospodarka.pl/26977,Google-Book-Search-PL,1,12,1.html.

[7] Cebula, (pseud.). Książki do pobrania z Google Book Search. W: Dobre programy. [on-line] 31.08.2006 [dostęp 18 listopada 2006]. Dostępny w World Wide Web: http://dobreprogramy.pl/index.php?dz=15&n=4779.

[8] Można ustawiać ze znajomymi kanały RSS, w celu otrzymywania powiadomień o dodaniu nowych książek do indywidualnych kolekcji, szczegóły zob. http://books.google.com/support/bin/answer.py?answer=75375.

[9] Informację znajdziemy na stronie: http://books.google.com/support/bin/answer.py?answer=43739&topic=9259.

 Początek stronyDostęp do pełnych tekstów książek w Google Book Search / Renata Mateusiak// W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska - Nr 3/2008 (94) kwiecień. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2010. - Tryb dostępu: http://www.ebib.info/2010/94/a.php?mateusiak. - Tyt. z pierwszego ekranu. - ISSN 1507-7187