EBIB Nr 11/2006 (81), Stan i perspektywy polskich zasobów cyfrowych w Internecie. Artykuł Poprzedni artykuNastpny artyku  

 


Katarzyna Ślaska
Joanna Potęga
Biblioteka Narodowa

Cyfrowa Biblioteka Narodowa Polona


Cyfrowa Biblioteka Narodowa Polona (www.polona.pl) została uruchomiona w październiku 2006 r. Realizuje ona, podobnie jak większość funkcjonujących na świecie bibliotek cyfrowych, dwa podstawowe cele:

  • prezentacja zasobów tradycyjnych (książki, czasopisma, rękopisy, dokumenty graficzne, mapy itp.) w postaci elektronicznej i udostępnianie ich przez Internet;
  • ochrona zbiorów przez wykonanie i długoterminowe przechowywanie ich wysokojakościowych kopii cyfrowych.

Kontekst europejski

Prace nad przygotowaniem do uruchomienia CBN Polona zbiegły się z publikacją ważnych dla prac digitalizacyjnych w całej Europie dokumentów. Na podstawie przyjętej 1 czerwca 2005 r. inicjatywy i2010: Europejskie Społeczeństwo Informacyjne w roku 2010 Komisja Europejska opublikowała w dniu 30 września 2005 r. dokument i2010: biblioteki cyfrowe[1], w którego wnioskach czytamy między innymi: Technologie informatyczne stwarzają możliwość ponownego "odkrycia" kulturowego i naukowego dziedzictwa Europy oraz udostępnienia go dla różnorodnych obecnych i przyszłych zastosowań. Zadanie to wymaga wspólnego wysiłku na poziomie Państw Członkowskich - których staraniom w zakresie digitalizacji i konserwacji cyfrowej brakuje na razie spójności - oraz na poziomie Wspólnoty. Skuteczna odpowiedź na powstałe wyzwania może przyspieszyć proces digitalizacji, ułatwić dostęp do informacji i zapewnić długookresową konserwację zasobów cyfrowych.

Sztandarową inicjatywą Komisji Europejskiej, realizowaną w ramach programu i2010: biblioteki cyfrowe, stało się utworzenie Europejskiej Biblioteki Cyfrowej. W marcu 2006 r. Komisja Europejska ogłosiła plany budowy Europejskiej Biblioteki Cyfrowej[2], która do końca roku 2006 ma objąć biblioteki narodowe krajów europejskich. W 2008 r. ma ona zawierać co najmniej dwa miliony dokumentów cyfrowych z europejskich bibliotek, archiwów i muzeów, a do końca 2010 r. będzie liczyła przynajmniej sześć milionów zdigitalizowanych obiektów.

By umożliwić realizację inicjatyw Komisji Europejskiej i stworzyć organizacyjne i prawne warunki do włączenia Polski do Europejskiej Biblioteki Cyfrowej, Minister Kultury i Dziedzictwa Narodowego Kazimierz Michał Ujazdowski powołał w dniu 24 kwietnia 2006 r. Zespół ds. digitalizacji, który jest jego organem pomocniczym[3]. Celem Zespołu jest wypracowanie jednolitej strategii digitalizacji dziedzictwa kulturowego i dorobku naukowego w Polsce, opracowanie wymagań dotyczących procesu digitalizacji, udostępniania i przechowywania materiałów cyfrowych jednolitych dla bibliotek, archiwów i muzeów oraz integracja działań podejmowanych przez biblioteki, muzea i archiwa w zakresie digitalizacji dziedzictwa kulturowego. W skład dwunastoosobowego zespołu weszli przedstawiciele bibliotek, muzeów, archiwów oraz pracownicy Ministerstwa Kultury i Dziedzictwa Narodowego.

Kolejnym ważnym dokumentem dotyczącym działań digitalizacyjnych na terenie Europy było Zalecenie Komisji Europejskiej z dnia 24 sierpnia 2006 r. w sprawie digitalizacji i udostępnienia w Internecie dorobku kulturowego oraz w sprawie ochrony zasobów cyfrowych[4], będące kolejnym krokiem realizacji strategii naszkicowanej w ramach inicjatywy i2010: biblioteki cyfrowe. Zalecenie Komisji określa już dokładniej cele ogólnoeuropejskiej działalności digitalizacyjnej: Udostępnienie w Internecie materiałów pochodzących z różnych kultur i obszarów językowych ułatwi obywatelom docenienie własnego dziedzictwa kulturowego, a także dorobku innych krajów europejskich. Zalecane działania przyczynią się do prezentacji bogatego i różnorodnego europejskiego dziedzictwa kulturowego w Internecie oraz do ochrony dóbr kultury przed bezpowrotną utratą. Poza swą podstawową wartością kulturową, dorobek ten jest ważnym materiałem wyjściowym dla nowych usług tworzących wartość dodaną. Zalecane działania przyczynią się do rozwoju pokrewnych branż o dużej wartości dodanej, takich jak turystyka, oświata i media. Zasoby cyfrowe wysokiej jakości stanowią kluczową siłę napędową dla zakrojonych na szeroką skalę działań sektora (stąd zainteresowanie największych wyszukiwarek). Digitalizacja i ochrona zasobów cyfrowych należą do działań wymagających dużej wiedzy i będą się w najbliższych latach dynamicznie rozwijać. Należy zwrócić uwagę na fakt, że oprócz przywoływanych w poprzednich dokumentach wartości kulturowych, Komisja Europejska powołała się tu również na ekonomiczne aspekty i wartości działań digitalizacyjnych.

Z całą pewnością nie są to ostatnie dokumenty unijne dotyczące bibliotek cyfrowych. We wrześniu i październiku w Brukseli pracowała, w ramach działań grupy roboczej ds. multimediów, grupa ekspertów zajmujących się digitalizacją. Ze strony polskiej prace koordynowało Ministerstwo Kultury i Dziedzictwa Narodowego. Grupa ta, wraz z przedstawicielami Komisji Europejskiej, opracowuje konkluzje dotyczące digitalizacji, które jeszcze w tym roku będą przedmiotem obrad Rady Europy.

Miejsce i rola CBN Polona

Przy opracowywaniu głównych założeń Cyfrowej Biblioteki Narodowej Polona jej twórcy starali się uwzględnić nie tylko wskazania instytucji unijnych, lecz przede wszystkim potrzeby polskich użytkowników oraz niepowtarzalny charakter zbiorów Biblioteki Narodowej. Nie sposób zaprezentować w Internecie całości siedmiomilionowych zasobów BN, z których większość podlega ograniczeniom prawa autorskiego. Dlatego też CBN Polona prezentuje przede wszystkim dokumenty stanowiące ogólnopolskie dziedzictwo kulturowe, literackie, historyczne i artystyczne. Pierwszeństwo przy publikacji w bibliotece cyfrowej mają zbiory zazwyczaj nieudostępniane czytelnikom, szczególnie chronione, takie jak: najcenniejsze rękopisy, stare druki, pierwsze wydania największych dzieł literatury polskiej czy dokumenty konspiracyjne z okresu II wojny światowej. Zamiarem twórców CBN jest umożliwienie użytkownikom z kraju i całego świata kontaktu z książkami, czasopismami i innymi typami dokumentów, które składają się na obraz polskiej kultury, a które ze względu na ich wartość, niepowtarzalność i często zły stan zachowania nie są udostępniane publicznie. Innymi słowy, CBN Polona wirtualnie otwiera przez czytelnikami magazyny i skarbce Biblioteki Narodowej. Dlatego już w pierwszych dwóch tygodniach istnienia Polony pojawiły się publikacje cyfrowe najcenniejszych zabytków języka polskiego: Kazań Świętokrzyskich oraz Psałterza Floriańskiego czy pierwodruki dzieł polskich wieszczów.

CBN Polona składa się z kolekcji tematycznych. Są to kolekcje prezentujące utwory największych polskich twórców: Mickiewicza, Słowackiego, Norwida, Kochanowskiego, pierwodruki literatury polskiej, skarby Biblioteki Narodowej, wydawnictwa konspiracyjne okresu II wojny światowej. Kolekcja nie jest jedynie zbiorem publikacji elektronicznych na dany temat, jej integralną częścią jest wprowadzenie, charakterystyka zbiorów będących tematem kolekcji i omówienie najciekawszych pozycji. Zawartość kolekcji będzie się nieustannie powiększać, a nad ich kształtem i rozwojem czuwają kustosze, których zadaniem jest dobór pozycji przeznaczonych do digitalizacji oraz tworzenie opisów kolekcji. Stopniowo będzie zwiększać się również liczba kolekcji w CBN Polona. W najbliższym czasie planowane jest założenie kolekcji dotyczącej Kresów Wschodnich Rzeczypospolitej oraz Historii Warszawy.
Fot. 1. CBN Polona - opis kolekcji Wydawnictwa konspiracyjne


Geneza i charakterystyka CBN Polona

Program planowej digitalizacji zbiorów w Bibliotece Narodowej rozpoczął się w 2003 r., a głównym jego celem było zapewnienie pełniejszej ochrony zasobów BN oraz idea popularyzowania dzieł o dużej wartości zabytkowej, kulturowej czy artystycznej. Dotyczyło to w szczególności materiałów cennych, unikalnych i szczególnie chronionych. Choć wielkość i różnorodność zbiorów BN daje duże możliwości doboru obiektów, niezbędne było określenie podstawowych priorytetów w typowaniu dokumentów oraz ustalenie kolejności w sporządzaniu ich kopii cyfrowych. Digitalizację rozpoczęto od zbiorów specjalnych, XIX i XX-wiecznych zbiorów zwartych i ciągłych oraz dokumentów życia społecznego. Skanuje się przede wszystkim oryginały, choć zdarza się również wykorzystywanie w celu digitalizacji mikrofilmów, o ile ich jakość jest wystarczająca. Ustalono, że każdy obiekt, pochodzący ze zbiorów biblioteki i podlegający digitalizacji, powinien posiadać opis bibliograficzny oraz opis zasobu w komputerowym katalogu BN INNOPAC (w przypadku zbiorów specjalnych - przynajmniej w wewnętrznych, samodzielnych bazach katalogowych MAK, które zostaną przekonwertowane do katalogu INNOPAC). Uruchamiając program digitalizacji w BN, założono:

  • bazowanie na własnym sprzęcie do skanowania zbiorów,
  • opracowanie standardów przetwarzania i archiwizacji zasobu cyfrowego,
  • prowadzenie prac nad znaczną automatyzacją procesów tworzenia zasobu cyfrowego.

W związku z tym opracowano podstawowe wymagania techniczne oraz technologiczne całego procesu. Przede wszystkim przyjęto, że oryginalny obiekt może być skanowany tylko raz, z zachowaniem wszelkich warunków bezpieczeństwa dokumentu, w wysokiej rozdzielczości, bez jakichkolwiek zmian czy manipulacji na skanie, z wyjątkiem ewentualnie niewielkich poprawek mających na celu poprawienie czytelności cyfrowej kopii. Dla celów archiwizacyjnych zdecydowano się na tworzenie pliku bazowego (archiwalnego) w formacie TIFF o rozdzielczości 600 dpi, początkowo zapisywanego na płytach CD-R oraz DVD+R[5]. Natomiast do prezentacji w Internecie czy usług reprograficznych wykorzystywana jest skompresowana kopia, zapisana w formacie JPG. Dzięki takiemu rozwiązaniu korzystanie z biblioteki cyfrowej Polona nie wymaga instalowania dodatkowego oprogramowania, ponieważ format JPG jest czytelny dla wszystkich systemów komputerowych.

Po wstępnym rozpoznaniu technologii, przetestowaniu możliwości urządzeń do skanowania i przeprowadzeniu wielu prób z obiektami w różnym stanie zachowania rozpoczęto formalne działania zmierzające do powołania Sekcji Digitalizacji Zbiorów w Zakładzie Reprografii i Digitalizacji Zbiorów Bibliotecznych Biblioteki Narodowej[6]. Przy jej tworzeniu priorytetem było przede wszystkim zapewnienie właściwych warunków obiektom poddawanym digitalizacji. Nowo powstała komórka została wyposażona w sprzęt zapewniający bezpieczeństwo dokumentów podczas skanowania oraz umożliwiający tworzenie wysokiej jakości zapisu cyfrowego[7]. Wszystkie pomieszczenia Sekcji Digitalizacji i stanowiska pracy zostały odpowiednio przygotowane, m.in. zabezpieczono je przed wpływem czynników zewnętrznych i zainstalowano urządzenia zapewniające stabilne, właściwe warunki klimatyczne. Wprowadzono również nadzór konserwatorski przy skanowaniu obiektów zabytkowych[8].

Rozpoczęty w Bibliotece Narodowej proces planowej digitalizacji zbiorów, dzięki ścisłej współpracy z Działem Przetwarzania Danych BN, został w 2004 r. wsparty przez narzędzie informatyczne automatyzujące prace digitalizacyjne - System Zbiorów Zdigitalizowanych. Celem SZZ jest komputerowe wspomaganie całej ścieżki, jaką przechodzi dokument, od momentu selekcji aż do zarchiwizowania jego cyfrowej kopii, oraz umożliwienie prezentacji cyfrowych zasobów czy wykonania reprodukcji na zamówienie. Dzięki temu znacznie zwiększyły się możliwości produkcyjne Sekcji Digitalizacji, która do końca 2006 r. utworzyła kopie cyfrowe około 5 tysięcy obiektów bibliotecznych.

Prowadzone od ponad trzech lat planowe działania digitalizacyjne: wypracowane standardy, przetestowane procedury oraz sprawdzone już wdrożenia stały się solidną bazą dla Cyfrowej Biblioteki Narodowej - biblioteki, której podstawowym celem jest zapewnienie szerokiego, powszechnego i bezpłatnego dostępu do zasobu cyfrowego oraz informacji o nim. Kolejnym etapem pracy był wybór właściwych narzędzi do prezentacji zbiorów cyfrowych w Internecie, takich, które nie ograniczałyby uniwersalności dostępu oraz funkcjonalności biblioteki cyfrowej. W związku z tym zdecydowano się na połączenie działającego w BN Systemu Zbiorów Zdigitalizowanych, który jest wykorzystywany do prezentacji obiektów cyfrowych oraz platformy dLibra, opracowanej przez Poznańskie Centrum Superkomputerowo-Sieciowe, która wspomaga zarządzanie biblioteką cyfrową.

CBN Polona działa opierając się o struktury Biblioteki Narodowej i wykorzystując cały potencjał BN związany z realizacją podstawowych zadań bibliotecznych, czyli gromadzenia, opracowania, zabezpieczania (konserwacji i digitalizacji) zbiorów. W jej tworzenie jest zaangażowanych wiele komórek biblioteki, a nad spójnością wszystkich procesów i działań czuwają wyznaczeni bibliotekarze[9]. Mają oni za zadanie sprawowanie ogólnego nadzoru merytorycznego i organizacyjnego nad Cyfrową Biblioteką Narodową Polona.

Zanim przystąpiono do umieszczania publikacji w CBN Polona należało przeprowadzić szereg niezbędnych działań, m.in. implementację platformy dLibra czy opracowanie interfejsu. Są to problemy znane wszystkim twórcom bibliotek cyfrowych. Konieczne również było opracowanie podstawowego założenia dotyczącego opisu dokumentu w CBN Polona. Uznano, że do tworzenia opisu wykorzystany zostanie schemat Dublin Core, a jego przedmiotem będzie źródło, na podstawie którego powstał zasób cyfrowy. Kolejnym ważnym założeniem było uznanie, że opis dzieła w CBN służyć ma jedynie celom identyfikacji, w związku z tym powinien być on czytelny, zwięzły i umożliwiający szybkie wyszukanie obiektu. Natomiast podstawowym miejscem, gdzie czytelnik uzyska pełną informację bibliograficzną o źródle, jest katalog komputerowy BN - INNOPAC (dostęp do danych bibliograficznych jest możliwy dzięki umieszczeniu powiązań pomiędzy rekordem w bazie INNOPAC a opisem w CBN Polona). Po przyjęciu powyższych założeń opracowano interpretację schematu Dublin Core oraz przygotowano zestaw pól formatu MARC 21, konwertowanych do opisu obiektu w CBN. Ustalono również, że wszystkie dokumenty, których wersja cyfrowa zostanie opublikowana w CBN Polona, będą z nią w katalogu komputerowym INNOPAC BN odpowiednio powiązane. Takie rozwiązanie umożliwi czytelnikom BN alternatywny dostęp do zdigitalizowanych zasobów biblioteki.
Fot. 2. CBN Polona - opis publikacji: link do rekordu bibliograficznego w katalogu komputerowym BN INNOPAC


Obecnie upubliczniono wersję testową CBN Polona, wymagającą jeszcze szczegółowego dopracowania. Mamy nadzieję, że taka prezentacja umożliwi zebranie konstruktywnych uwag i tym samym da szansę twórcom na maksymalne opracowanie i udoskonalenie funkcjonalności biblioteki cyfrowej, tak by była ona wygodnym i przyjaznym narzędziem do wirtualnego poznawania polskiego dziedzictwa kulturowego.

CBN Polona a Biblioteka Europejska

Do końca 2006 r. CBN Polona zostanie włączona do Biblioteki Europejskiej (The European Library - TEL), która poprzez portal www.theeuropeanlibrary.org oferuje dostęp do zbiorów 45 bibliotek narodowych Europy. Daje możliwość zintegrowanego przeszukiwania zarówno katalogów bibliotecznych, jak i kolekcji zawierających zbiory w postaci cyfrowej.

Biblioteka Europejska powstała w latach 2001-2004 w wyniku współpracy dziewięciu bibliotek narodowych: Finlandii, Francji, Niemiec, Włoch, Holandii, Portugalii, Słowenii, Szwajcarii oraz Wielkiej Brytanii, finansowanej przez 5. Program Ramowy Komisji Europejskiej. Serwis TEL, poszerzony o zbiory bibliotek narodowych Austrii, Chorwacji i Serbii, który został uruchomiony w 2005 r.. Wtedy też rozpoczęły się prace nad projektem TEL-ME-MOR (The European Library: Modular Extensions for Mediating Online Resources), którego celem jest włączenie do Biblioteki Europejskiej zbiorów bibliotek narodowych 10 nowych krajów członkowskich Unii Europejskiej, między innymi Polski.

Dostęp do portalu TEL jest:

  • wielojęzyczny - wyszukiwania można prowadzić w językach narodowych,
  • zintegrowany - za pomocą jednej wyszukiwarki można przeglądać dowolną liczbę bibliotek,
  • wielopoziomowy - przeszukiwać można katalogi, kolekcje zbiorów zdigitalizowanych lub ich dowolne, definiowane przez użytkownika, kombinacje. Możliwe jest również prowadzenie wyszukiwań w jednej, wybranej kolekcji,
  • powszechny - dostęp do katalogów Biblioteki Europejskiej nie podlega żadnym ograniczeniom, natomiast dostęp do niektórych obiektów zdigitalizowanych jest płatny.

Celem Biblioteki Europejskiej jest prezentacja bogactwa i różnorodności europejskiego dziedzictwa kulturowego i ułatwienie dostępu do zasobów bibliotek. Zgodnie z wspomnianymi wcześniej wytycznymi Komisji Europejskiej obecna biblioteka cyfrowa będzie fundamentem powstającej Europejskiej Biblioteki Cyfrowej, która umożliwi zintegrowany dostęp do cyfrowych zbiorów nie tylko najbardziej zasobnych bibliotek Europy, lecz również jej archiwów i muzeów.Przypisy

[1] Komunikat Komisji do Parlamentu Europejskiego, Rady, Europejskiego Komitetu Ekonomiczno-Społecznego oraz Komitetu Regionów i2010: Biblioteki Cyfrowe, COM (2005) 465 wersja ostateczna [on-line]. Bruksela: Komisja Wspólnot Europejskich, 30 września 2005 [dostęp 7 listopada 2006]. Dostępny w World Wide Web: http://europa.eu.int/information_society/activities/digital_libraries/doc/communication/pl_comm_digital_libraries.pdf.

[2] European Commission steps up efforts to put Europe`s memory on the Web via a European Digital Library [on-line]. [dostęp 5 listopada 2006]. Dostępny w World Wide Web: http://europa.eu.int/rapid/pressReleasesAction.do?reference=IP/06/253&type=HTML&aged=0&language=EN&guiLanguage=en.

[3] Elektroniczna Biblioteka - platforma cyfrowa Stowarzyszenia Bibliotekarzy Polskich [on-line]. [dostęp 4 listopada 2006]. Minister Kultury i Dziedzictwa Narodowego powołał Zespół ds. digitalizacji [on-line]. Dostępny w World Wide Web: http://www.ebib.info/news.php?288.

[4] Komunikat Komisji do Parlamentu Europejskiego, Rady, Europejskiego Komitetu Ekonomiczno-Społecznego oraz Komitetu Regionów w sprawie digitalizacji i udostępnienia w Internecie dorobku kulturowego oraz w sprawie ochrony zasobów cyfrowych. C(2006) 3808 wersja ostateczna [on-line]. Bruksela: Komisja Wspólnot Europejskich, 24 sierpnia 2006. [dostęp 7 listopada 2006]. Dostępny w World Wide Web: http://europa.eu.int/information_society/activities/digital_libraries/doc/recommendation/comm_recomm/pl.pdf.

[5] Od listopada 2004 r. taką formę archiwizowania uzupełniono zapisem plików archiwalnych na macierzy dyskowej dedykowanego serwera zlokalizowanego w serwerowni Działu Przetwarzania Danych BN.

[6] Zarządzenie nr 4 z dnia 24.02.2004 r. Dyrektora Biblioteki Narodowej.

[7] Skanery Zeutschel OS 10 000 i DigiBook 6002 RGB do digitalizacji oryginałów w kolorze i dwa skanery do mikrofilmów Canon MS 800.

[8] CZAJKA, S. Digitalizacja - aspekty kulturowe, miejsce i rola Biblioteki Narodowej. In Digitalizacja zbiorów bibliotecznych Warszawa: Wydaw. SBP, 2006.

[9] Bibliotekarz cyfrowy zbiorów specjalnych, bibliotekarz cyfrowy zbiorów nowszych.

 Początek stronyCyfrowa Biblioteka Narodowa Polona / Katarzyna Ślaska, Joanna Potęga// W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska. - Nr 11/2006 (81) grudzień/styczeń. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2007. - Tryb dostępu: http://www.ebib.info/2007/81/slaska_potega.php. - Tyt. z pierwszego ekranu. - ISSN 1507-7187