ebib 
Nr 7/2009 (107), Digitalizacja w Polsce i Europie. Komunikat
 poprzedni artykuł następny artykuł   

 


Grzegorz Janczewski
DDP Sp. z o. o.

Masowa digitalizacja XVI-wiecznych dzieł w Bawarskiej Bibliotece Państwowej




Bawarska Biblioteka Państwowa, europejski lider digitalizacji, została ufundowana w 1558 r. przez księcia Albrechta V i od tego czasu pozostaje jedną z największych bibliotek europejskich. Gromadzi zbiory z okresu od VIII do XXI w. Kolekcja zawiera ponad 10 milionów obiektów, w tym 89 tys. manuskryptów (4 pozycja na świecie), 19 tys. inkunabułów (czołowa pozycja na świecie) i 130 tys. druków XVI-wiecznych (największe zbiory w Niemczech).

W bibliotece od 1997 r. działa Monachijskie Centrum Digitalizacji będące wiodącym ośrodkiem digitalizacji w Europie. Bawarska biblioteka postawiła sobie cel skanowania i nieodpłatnego udostępniania wszystkich, nieobjętych prawem autorskim dzieł. Świetnie wyposażone Centrum dysponuje różnymi typami skanerów, za pomocą których realizuje szereg pionierskich projektów digitalizacji.

Jednym z nich jest rozpoczęty w roku 2006 projekt VD16 digital. Jego celem jest, do roku 2009, digitalizacja i udostępnienie on-line wszystkich unikatowych, XVI-wiecznych dzieł znajdujących się w zbiorach biblioteki.

Do roku 2006 digitalizacja w BSB miała charakter tradycyjny - skanowano w małych partiach, wyłącznie wyselekcjonowane dzieła. Skanowane obiekty opisywano za pomocą wielu ręcznie wprowadzanych indeksów (głębokie indeksowanie). Dużo czasu i uwagi poświęcano na kontrolę jakości wykonywanych prac. Prowadzone działania miały raczej cel poznawczy i pomogły w zdobyciu specjalistycznej wiedzy i doświadczenia.

Projekt VD16 digital był dla biblioteki ogromnym wyzwaniem. Wymagał bowiem rozpoczęcia masowej digitalizacji. Tak tylko można określić prowadzony na skalę przemysłową, w ściśle określonym czasie, proces konwersji kolekcji zawierającej miliony stron. Projekt stanowi potężne przedsięwzięcie logistyczne i informatyczne. W celu jego realizacji postanowiono wprowadzać automatyzację poszczególnych zadań wszędzie tam, gdzie to możliwe oraz zrezygnować z głębokiego indeksowania, pozostawiając to zadanie na przyszłość. W celu maksymalnej ochrony zbiorów, podczas realizacji projektu VD16 digital ekipa centrum digitalizacji współpracowała ściśle z zespołem konserwatorskim biblioteki. Specjaliści od konserwacji uczestniczyli w procesie wyboru skanerów, opracowali także zalecenia mające zapobiec uszkodzeniu dzieł podczas skanowania. Obejmowały one m.in.: ograniczenie kąta otwarcia dzieła, minimalizację poziomu naświetlenia, rezygnację z szyby dociskowej.

Projekt VD16 digital został podzielony na dwie części. W pierwszej, pilotażowej (VD16-1), obejmującej zbiory z lat 1501-1517, prowadzonej w latach 2006-2008, zdigitalizowano około miliona stron (4300 dzieł). Na podstawie doświadczeń z tej części opracowano założenia projektu VD16-2 obejmującego digitalizację w latach 2007-2009 ponad 37 000 dzieł (około 7,5 miliona stron) z lat 1518-1600.

Pierwszy etap projektu został zrealizowany przy użyciu tradycyjnych, manualnych skanerów książkowych. Stwierdzono jednak, że w przypadku masowej digitalizacji starych druków metoda ta ma istotne wady. Konieczność ścisłego dostosowania się do wymogów konserwatorskich skomplikowała skanowanie i obróbkę obrazów. Na przykład ograniczenie kąta rozwarcia siedemdziesięciu procent ksiąg do maksymalnie 90° spowodowało wydłużenie czasu niezbędnego do przygotowania dzieła oraz konieczność zastosowania specjalnego uchwytu do skanowania kart. Wykorzystanie uchwytu wymusiło z kolei trzyetapowy system skanowania. Najpierw skanowanie lewych stron, potem prawych, a następnie łączenie obrazów, co ze względu na brak paginacji w XVI-wiecznych zbiorach było przyczyną dużej liczby błędów. W efekcie nastąpił znaczny spadek wydajności. Obliczono, że średnio w czasie jednej zmiany, na jednym skanerze, możliwe było zeskanowanie tylko trzech książek.

Aby osiągnąć założone cele, konieczna była modyfikacja organizacji procesu. Rozważano zwiększenie liczby skanerów, wydłużenie czasu pracy lub istotną zmianę technologii.

Podczas przygotowań do drugiego etapu projektu postanowiono zweryfikować możliwości najnowszych, automatycznych rozwiązań oferowanych przez dostawców skanerów. W wyniku drobiazgowego porównania rozwiązań i przeprowadzonych testów nawiązano bliską współpracę z austriacką firmą Treventus, twórcą rewolucyjnego automatycznego skanera książkowego ScanRobot®. Postawiono przed nią zadanie dostosowania skanera do pracy z cennymi dziełami:

  • możliwość skanowania przy kącie rozwarcia księgi poniżej 90°,
  • stół dokumentowy pozbawiony ostrych krawędzi, wykonany z naturalnego materiału,
  • zimne oświetlenie,
  • krótki czas naświetlania,
  • głowica skanująca pracująca bez narażenia materiału na uszkodzenia.

Projektanci firmy Treventus wywiązali się z zadania, dostosowując skaner ScanRobot® do wymagań biblioteki.

Sam skaner jest konstrukcją wyjątkową, umożliwiającą całkowicie automatyczne skanowanie dzieł zwartych z prędkością dochodzącą do 2500 stron na godzinę. Do pozyskania obrazu strony wykorzystywana jest głowica z wysokiej jakości szklanym pryzmatem. Dochodzi ona do samego grzbietu dzieła, a następnie skanuje kartę aż po samą krawędź zewnętrzną. Taki niezwykły sposób skanowania pozwala uzyskać obraz całej karty, pozbawiony zniekształceń typowych dla innych metod pozyskiwania obrazów. Oprócz rewolucyjnej technologii skanowania zastosowano wiele innych rozwiązań pozwalających spełnić ostre wymagania konserwatorskie. Drewniany stół, umożliwiający rozłożenie dzieła pod kątem nieprzekraczającym 90°, lampy LED pozbawione promieniowania IR i UV, przekładanie kart przy pomocy strumienia powietrza bez żadnych elementów mechanicznych. Wszystko to czyni ze ScanRobota® idealne narzędzie do masowej digitalizacji.

Monachijskie Centrum Digitalizacji jest obecnie wyposażone w trzy takie skanery automatyczne. Dzięki ich zastosowaniu wydajność wzrosła do dziesięciu dzieł na skaner w ciągu jednej zmiany. Średnia tygodniowa wydajność procesu digitalizacji wynosi obecnie 300 ksiąg (tj. około 75 000 stron) i pozwala optymistycznie patrzeć na realizację założeń projektowych. Zauważyć przy tym należy, że digitalizacja w BSB to nie tylko skanowanie, ale proces składający się z następujących etapów:

  • pre-processing (wypożyczanie i dostawa dzieł oraz ich selekcja i przygotowywanie),
  • skanowanie i obróbka obrazów,
  • post-processing (kontrola jakości, archiwizacja i obsługa plików, archiwizacja długoterminowa).

Współpraca biblioteki z firmą Treventus ciągle się rozwija. Aktualnie trwają prace nad modyfikacjami skanera, które pozwolą podnieść tygodniową wydajność do poziomu 500 ksiąg.

Wyposażenie centrum digitalizacji w skanery automatyczne pozwoliło myśleć o innych projektach. Między innymi, na zasadach partnerstwa publiczno-prywatnego, MDZ rozpoczęło współpracę z Google przy projekcie Digital Copy. Jest to największy obecnie prowadzony projekt digitalizacji, stawiający ogromne wymagania zwłaszcza informatycznym systemom przechowywania informacji. Ale to już jest temat na odrębny artykuł…

 Początek strony



Masowa digitalizacja XVI-wiecznych dzieł w Bawarskiej Bibliotece Państwowej / Grzegorz Janczewski// W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska - Nr 7/2009 (107) październik. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2010. - Tryb dostępu: http://www.ebib.info/2010/107/a.php?janczewski. - Tyt. z pierwszego ekranu. - ISSN 1507-7187