Nr 7/2009 (107), Digitalizacja w Polsce i Europie. Artykuł |
Małgorzata Rożniakowska-Kłosińska
| |||
WstępPierwsze inicjatywy digitalizacji w bibliotekach pojawiły się w drugiej połowie lat 90. ubiegłego wieku, były to prace podejmowane z należytą rozwagą, profesjonalizmem i świadomością wagi rezultatów dla przyszłych pokoleń. Za pionierów w tej dziedzinie uważane są następujące trzy biblioteki:
Podstawową barierą intensywnego rozwoju procesu digitalizacji w bibliotekach była początkowo, a w wielu jest nadal, kwestia finansowa (kosztowność m.in. specjalistycznego sprzętu komputerowego, urządzeń skanujących lub szkoleń kadry umożliwiających nabycie przez nią specyficznych umiejętności obróbki uzyskanego materiału graficznego). Z jednej strony postęp technologiczny w dziedzinie IT jest bardzo korzystny, ponieważ wpływa na obniżenie kosztów sprzętu komputerowego i pochodnego, z drugiej jednak wymaga ciągłego śledzenia zmian w tych technologiach, oprogramowaniach i formatach. Dodatkowym "wąskim gardłem" procesu digitalizacji okazały się też postanowienia zawarte w kolejnych ustawach o prawie autorskim i prawach pokrewnych wraz z późniejszymi poprawkami i harmonizacją z prawem autorskim Unii Europejskiej. Niemal równolegle z rozwojem digitalizacji na polskim rynku pojawił się szereg firm świadczących usługi z zakresu sprzedaży profesjonalnych skanerów dziełowych, ich konserwacji oraz szkoleń operatorów. W swej ofercie firmy proponowały coraz częściej usługę skanowania, tym samym zarysował się w bibliotekach model całkowitego lub częściowego outsourcingu procesu digitalizacji zbiorów nie tylko bibliotecznych. W praktyce okazało się, że biblioteki, które jako jedne z pierwszych przeszły proces komputeryzacji i automatyzacji usług bibliotecznych (lata 80. i 90.), w sposób naturalny podążyły za światowym trendem - digitalizacją. Posiadając podstawowe narzędzia oraz kadrę o dużej woli i możliwości samokształcenia, elastyczności i chęci rozwoju nie traktowały cyfrowego wymiaru rzeczywistości w kategorii rewolucji, lecz kolejnego etapu. Dlatego też najwięcej i najwcześniej występujących inicjatyw digitalizacyjnych miało miejsce w bibliotekach naukowych, w tym akademickich. Należy jednak podkreślić, że wszystkie inicjatywy technologiczne związane z rozwojem kolekcji cyfrowych, jakie środowisko bibliotekarzy rozpoczęło w ostatnich latach, były realizowane oddolnie i z funduszy własnych instytucji bądź, w bardzo rzadkich przypadkach, Funduszy Strukturalnych UE [...][1]. I tak z upływem ostatnich dziesięciu lat kolejne biblioteki rozpoczynały swoją przygodę w świecie cyfryzacji, budując pierwsze kolekcje zasobów cyfrowych i udostępniając je już nie tylko swoim "stacjonarnym" użytkownikom, ale także użytkownikom globalnym (w tym jednemu najbardziej globalnemu, którego nazwa zaczyna się na literę "G", a kończy na ".com").
Korzystając z zaindeksowanych treści, z pomocą kilku znanych wyszukiwarek i jednego serwisu internetowego można spróbować przedstawić, w jakim rozkładzie czasowym pojawiały się w Internecie zasoby dotyczące zagadnienia digitalizacji w bibliotekach. Analizy dokonano dla ogólnego zapytania: digitalizacja, biblioteki, szukaj ze wszystkimi słowami, gdziekolwiek na stronie, dowolny format pliku, stan 9.09.2009 r. (tab. 1.). Tab. 1. Zestawienie otrzymanych wyników dla ogólnego zapytania: digitalizacja, biblioteki, szukaj ze wszystkimi słowami, gdziekolwiek na stronie, dowolny format pliku, (stan 9.09.2009 r.)
Źródło: opracowanie własne. Na podstawie uzyskanych wyników można stwierdzić, że przedstawienie rozkładu czasowego jest możliwe tylko w przypadku witryn indeksowanych przez wyszukiwarkę Google. Liczba witryn powstałych w ostatnim roku i dotyczących zagadnień digitalizacji w bibliotekach stanowi prawie 25% witryn dodanych kiedykolwiek na ten temat. Oznaczać to może, że ostatnie lata są okresem największego postępu w tworzeniu bibliotek cyfrowych, zwiększonego dynamizmu ich rozwoju, a tym samym okresem wzrostu potrzeby wymiany doświadczeń i myśli w środowisku, które współtworzy współczesne zasoby sieci. Różnice, jakie można zauważyć między uzyskanymi rezultatami dla Google, Bing, Hakia i Szukacz.pl, są spowodowane m.in. różnym mechanizmem wyszukiwawczym, algorytmami, programami analizującymi i oceniającymi, z których korzysta każda z wyszukiwarek i serwis internetowy Yahoo! Różne inicjatywy digitalizacjiPojęcie digitalizacji, w rozumieniu zamiany informacji analogowej (pochodzącej z obiektów świata rzeczywistego) na reprezentację cyfrową, nie towarzyszy tylko bibliotekom. Oczywiście stanowi ono sedno takich przykładowych projektów, jak Śląska Internetowa Biblioteka Zbiorów Zabytkowych (projekt zatwierdzony w lipcu 2009 r. przez Ministra Kultury i Dziedzictwa Narodowego do dofinansowania z Europejskiego Funduszu Rozwoju Regionalnego, Program Operacyjny "Infrastruktura i Środowisko"), konserwacja i digitalizacja zbiorów WBP w Opolu - 27 egzemplarzy starodruków i jeden kodeks piśmienny (2009 r.) czy digitalizacja całej spuścizny Zbigniewa Herberta w postaci 60 000 kart, 6500 listów i 5000 rysunków przez Bibliotekę Narodową (2008/2009 r.). Tworzenie zasobów cyfrowych i udostępnianie ich w pewnych uporządkowanych kolekcjach w Internecie jest częściowo dodawaniem cyfrowej jakości do obiektów, które dotychczas istniały tylko w świecie analogowym, a w przypadku udostępniania obiektów digital born jest prezentowaniem ich w "naturalnym" środowisku. Digitalizacja stała się procesem oczywistym w działalności wielu instytucji, niezależnie od źródła ich finansowania czy umocowania prawno-administracyjnego, i dotyczy szeregu różnorodnych instytucji: od archiwów, muzeów, fundacji po organy samorządowe, państwowe aż do wydawnictw, firm o różnym profilu, portali internetowych czy nawet osób prywatnych. Wymienione poniżej projekty są tylko niewielkim wycinkiem prac prowadzonych w ciągu ostatnich dwóch lat w naszym kraju, obrazującym różnorodność podejmowanych inicjatyw digitalizacji bądź pośrednio z nią związanych:
Dokonując wyboru wyżej przedstawionych inicjatyw, korzystano z zasobów szeregu portali tematycznych oraz stron internetowych gazet codziennych. W większości z nich, nawet przy kilkuzadaniowym albo jednoakapitowym tekście, umieszczona była, spędzająca sen z powiek niejednemu bibliotekarzowi cyfrowemu, formuła: Żadna część jak i całość utworów zawartych w dzienniku nie może być powielana i rozpowszechniania lub dalej rozpowszechniana w jakiejkolwiek formie i w jakikolwiek sposób (w tym także elektroniczny lub mechaniczny lub inny albo na wszelkich polach eksploatacji) włącznie z kopiowaniem, szeroko pojętą digitalizacją, fotokopiowaniem lub kopiowaniem, w tym także zamieszczaniem w Internecie - bez pisemnej zgody... (i TU NASTĘPUJE NAZWA WYDAWCY). Biblioteki cyfrowe w PolsceCele ogólne digitalizacji i tworzenia bibliotek cyfrowych są takie same, niezależnie od tego, czy biblioteka ma charakter regionalny, instytucjonalny czy pełni rolę prywatnego archiwum, jak Publiczne Cyfrowe Archiwum Agnieszki Osieckiej[2]:
Zróżnicowanie występuje natomiast na poziomie określania celów szczegółowych, inaczej są definiowane priorytety i zasadność działań. Biblioteka narodowa będzie kładła nacisk na zachowanie dorobku dla przyszłych pokoleń - wieczystą archiwizację, dla bibliotek szkół wyższych priorytetem będzie szybkość rozpowszechnienia publikacji naukowych pracowników ich macierzystych uczelni, wykorzystanie zasobów w dydaktyce, a w dalszej dopiero kolejności udostępnianie dzieł o charakterze dziedzictwa kulturowo-naukowo-technicznego[3][4][5]. Biblioteki cyfrowe nie tylko wpływają na popularyzację dorobku naukowego i kulturowego naszego kraju i narodu w skali globalnej (zwłaszcza przez projekty takie jak EuropeanaLocal), lecz intensyfikują także przepływ myśli ludzkiej i najlepszych dostępnych praktyk oraz kształtowanie świadomości i patriotyzmu lokalnego internautów, czyli aktywnych uczestników społeczeństwa informacyjnego. Biblioteki cyfrowe w Polsce wykorzystują do prezentacji swych zasobów głównie oprogramowanie dLibra, stworzone i rozwijane przez Poznańskie Centrum Superkomputerowo-Sieciowe (PCSS)[6]. Do sporządzenia poniższego wykresu skorzystano z danych ze strony PCSS - wdrożenia oprogramowania dLibra, gdzie ujęto biblioteki cyfrowe korzystające z oprogramowania dLibra w podziale na regionalne i instytucjonalne. Do obliczeń nie wzięto pod uwagę instalacji dydaktycznych i wewnętrznych. Dodatkowo doliczono jednak do tej statystyki następujące biblioteki cyfrowe:
Obecnie istnieją 42 biblioteki cyfrowe, z czego 23 mają charakter bibliotek instytucjonalnych, a pozostałe 19 jest bibliotekami regionalnymi. Jak widać na wykresie 2., rozkład ten jest bliski proporcji pół na pół.
Zakładając, że utrzyma się bieżący trend, jeśli chodzi o przyrost roczny bibliotek cyfrowych, to w roku 2010 powinno istnieć ich już ponad 50. Zasób bibliotek cyfrowychCałkowity zasób bibliotek cyfrowych cechuje się ogromną dynamiką, na którą ma wpływ między innymi szybko zwiększająca się liczba bibliotek cyfrowych. Większość zbiorów cyfrowych stanowią te, które można łatwo opublikować/dodać, bo nie podlegają już ochronie z tytułu praw autorskich, i dzięki temu użytkownik otrzymuje do nich pełen dostęp. Z przeprowadzonych badań[7][8] wynika, że 90% zasobu wszystkich bibliotek cyfrowych w 2008 r. stanowiły dzieła dziedzictwa kulturowego i historii rozwoju różnych dziedzin nauki, a tylko 10% dzieła wydane po 1990 r., które mogą stanowić materiały dydaktyczne, wyznaczać trendy naukowe, kierunki badań. Należy jednak pamiętać, że w dziedzinie informacji naukowo-technicznej przyjmuje się, iż informacja z zakresu nauk ścisłych i technicznych przestaje być aktualna już po trzech latach a w niektórych dziedzinach już po roku od momentu jej publicznego ogłoszenia. Dlatego pocieszającym jest fakt, że w bibliotekach cyfrowych wyższych szkół technicznych, badanych przez te same autorki, zasoby wydane po 1990 r. stanowią ponad 35% wszystkich zbiorów. Najwięcej (aż 74%) najnowszych publikacji pochodzi z przedziału lat 2005-2008 (Politechnika Łódzka, Politechnika Warszawska, Politechnika Krakowska i Politechnika Wrocławska). Jak wiadomo, do takiego stanu głównie przyczyniają się ograniczające zapisy prawa autorskiego, opór uczelnianych wydawnictw oraz brak świadomości praw i obowiązków autorów-pracowników naukowych danych uczelni macierzystych. Należy także podkreślić, że w zasobie bibliotek cyfrowych jako całości nie ma spójności metadanowej[9] chociażby np. w obrębie daty wydania. Taka ogromna różnorodność zapisu w części atrybutów schematu Dublin Core, stosowanego w bibliotekach cyfrowych do opisu obiektu cyfrowego, powoduje trudności w badaniu zasobów bibliotek cyfrowych i w wyznaczeniu skoordynowanych wytycznych i standardów. Największym jednak problemem w tej sytuacji staje się brak możliwości uzyskania informacji relewantnej przez użytkownika oraz generowanie przez to luk informacyjnych. Całkowity zasób bibliotek cyfrowych liczy około 300 000 obiektów (stan 6.09.2009 r.), zdecydowaną ich większość stanowią obiekty w formacie: DjVu - 72%, HTML - 19%, PDF - 8%, pozostałe to formaty o udziale mniejszym niż 1%. Wśród tych ostatnich dokonano analizy w celu sprawdzenia zasobów wszystkich bibliotek cyfrowych pod kątem rozkładu publikacji występujących w formatach typowo multimedialnych (AVI, FLV, MP3, SWF, VRML) obsługiwanych przez system dLibra. Liczba wszystkich obiektów multimedialnych udostępnianych przez 42 biblioteki cyfrowe wyniosła 144, co w odniesieniu do prawie 300 000 wszystkich obiektów stanowi zaledwie 0,00048% (wykr. 3.). Obiekty multimedialne zgromadziły następujące biblioteki cyfrowe:
Analizując powyższe dane, można się zastanowić: czy obiekty multimedialne będą w ogóle przyszłością bibliotek cyfrowych i czy można już wnioskować, że będą to głównie obiekty audio? Czy biblioteki cyfrowe wyspecjalizują się jednak w gromadzeniu i prezentacji obiektów dwuwymiarowych rękopiśmiennych, drukowanych w formatach tekstowych lub tekstowo-graficznych?
Kolejnym zagadnieniem, które na pewno jest istotne dla wszystkich bibliotek cyfrowych, jest archiwizacja posiadanych danych w postaci plików master oraz tzw. przetworzonych, przygotowanych do prezentacji. Część bibliotek prowadzi archiwizację na nośnikach DVD, na dyskach komputerów stacjonarnych lub zainwestowała w macierze dyskowe o dużej pojemności i rozwiązania biznesowe archiwizacji. Zasoby surowe i przetworzone Biblioteki Cyfrowej Politechniki Łódzkiej eBiPoL zarchiwizowane w latach 2005-2009 r. zajmują już około 4TB na macierzach dyskowych (wykr. 4.). Takie przyrosty danych z ostatnich dwóch lat nie byłyby możliwe, gdyby nie zakup na przełomie 2007/2008 r. skanera dziełowego A2 Zeutschel Omniscan 10 000. Wcześniej materiały biblioteczne były skanowane bądź na skanerach książkowych Plustek OpticBook 3600, bądź fotografowane aparatem cyfrowym. Kadra bibliotek cyfrowychCiekawymi poglądami dotyczącymi przyszłości zawodu bibliotekarskiego w kontekście cyfrowego środowiska nauki, publikacji i bibliotek cyfrowych podzielił się na łamach "Biuletynu EBIB" dr M. Nahotko[10]. Inwentarz ogólnych zadań, w wydzielonych we współczesnych bibliotekach sekcjach digitalizacyjnych lub w powołanych niesformalizowanych grupach pracowników bibliotek do realizacji celów digitalizacji, jest podobny niezależnie od tego, czy jest to cyfrowa biblioteka regionalna czy instytucjonalna. Natomiast rozkład postaw, obowiązków i umiejętności specyficznych dla każdego etapu procesu digitalizacji (od momentu pozyskania dzieła do jego udostępnienia i promocji w sieci) jest bardzo zróżnicowany. Można by w tym miejscu zaproponować, czysto teoretycznie, utworzenie stanowiska specjalisty do spraw digitalizacji dokumentów bibliotecznych, do którego głównych zadań należałoby wyłącznie skanowanie dokumentów bibliotecznych oraz przetwarzanie plików graficznych i tekstowych (wsadowe i jednostkowe), tak aby mogły być udostępnione w bibliotece cyfrowej[11]. Analiza poszczególnych zadań, jakie są realizowane w Sekcji Digitalizacji, utworzonej w Oddziale Systemów Informacyjnych i Digitalizacji Biblioteki Politechniki Łódzkiej, pozwoliła na wylistowanie poniżej kompetencji niezbędnych w przypadku utworzenia wspomnianego wyżej stanowiska. Należy dodać, że sekcja ta jest niezależna sprzętowo i programowo od instytucji zewnętrznych. Kompetencje specjalisty do spraw digitalizacji dokumentów bibliotecznych można przedstawić w sposób następujący:
Niewątpliwie lista wyżej wymienionych kompetencji niezbędnych u pracowników sekcji digitalizacji może być źródłem stresu lub znięchęcenia u osób nieposiadających inklinacji techniczno-informatycznych, a pracujących w sekcji o takim profilu. Dlatego w takim przypadku powinny one pełnić role związane np. z katalogowaniem, selekcją materiałów, pracami redaktora w bibliotece cyfrowej lub rzecznika PR projektu digitalizacji. ZakończenieTworzenie bibliotek cyfrowych wymaga sporych nakładów finansowych, koordynacji wielu działań i ciekawych, pełnych zapału pracowników. Selekcja materiałów bibliotecznych, ich metadanowe opracowanie, skanowanie, przetwarzanie obrazów do pełnotekstowej przeszukiwalności i do ostatecznej formy prezentacyjnej, to szereg zadań wykonywanych w bibliotekach cyfrowych na co dzień. To praca wykonywana profesjonalnie i miarowo bez względu na dyskusje toczące się we właściwych określonym bibliotekom ministerstwach. Przypisy[1] BEDNAREK-MICHALSKA, B. Biblioteki cyfrowe w Polsce. Stan w roku 2006 [on-line]. Toruń: Biblioteka Główna Uniwersytetu Mikołaja Kopernika, 2007 [Dostęp 1 września 2009]. Dostępny w World Wide Web: http://kpbc.umk.pl/dlibra/doccontent?id=25657. [2] Publiczne Cyfrowe Archiwum Agnieszki Osieckiej [on-line]. [Dostęp 1 września 2009]. Dostępny w World Wide Web: http://www.archiwumagnieszkiosieckiej.pl/dlibra. [3] SKUBAŁA, E., KAZAN, A. Polskie biblioteki cyfrowe na platformie dLibra - zasób w kontekście tworzenia nowoczesnych kolekcji źródeł informacji dla nauk technicznych. W: II Konferencja "Informacja dla nauki a świat zbiorów cyfrowych", Świnoujście 11-13 września 2008 [on-line]. Poznań: Biblioteka Główna Politechniki Poznańskiej, 2008 [Dostęp 1 września 2009]. Dostępny w World Wide Web: http://www.ml.put.poznan.pl/konf_idn/art/1_3.pdf. [4] SKUBAŁA, E., KAZAN, A. Analiza zasobu polskich bibliotek cyfrowych w kontekście ich wykorzystania w dydaktyce. W: II Wrocławskie Spotkania Bibliotekarzy Polonijnych, Wrocław, 18-19 czerwca 2009 [on-line]. [Warszawa]: Stowarzyszenie Bibliotekarzy Polskich, K[omisja] W[ydawnictw] E[lektronicznych], Redakcja "Elektronicznej Biblioteki", 2009 [Dostęp 1 września 2009]. (EBIB Materiały konferencyjne nr 20). Dostępny w World Wide Web: http://www.ebib.info/publikacje/matkonf/mat20/skubala_kazan.php. ISBN 83-921757-6-X. [5] BUZDYGAN, D., LIPIŃSKA, D. Biblioteka Cyfrowa Politechniki Krakowskiej - repozytorium i forma udostępniania publikacji z zakresu nauk technicznych. W: II Konferencja "Informacja dla nauki a świat zbiorów cyfrowych", Świnoujście 11-13 września 2008 [on-line]. Poznań: Biblioteka Główna Politechniki Poznańskiej, 2008 [Dostęp 1 września 2009]. Dostępny w World Wide Web: http://www.ml.put.poznan.pl/konf_idn/art/1_4.pdf. [6] MAZUREK, C., STROIŃSKI, M., WERLA, M., WĘGLARZ, J. Nowoczesne biblioteki cyfrowe w środowisku rozproszonych usług atomowych. W: II Konferencja "Informacja dla nauki a świat zbiorów cyfrowych", Świnoujście 11-13 września 2008 [on-line]. Poznań: Biblioteka Główna Politechniki Poznańskiej, 2008 [Dostęp 1 września 2009]. Dostępny w World Wide Web: http://www.ml.put.poznan.pl/konf_idn/art/1_1.pdf. [7] SKUBAŁA, E., KAZAN, A. Polskie biblioteki cyfrowe… [8] SKUBAŁA, E., KAZAN, A. Analiza zasobu polskich… [9] SKUBAŁA, E., KAZAN, A. Polskie biblioteki cyfrowe… [10] NAHOTKO, M. Bibliotekarze cyfrowi w środowisku cyfrowej nauki, biblioteki i cyfrowych publikacji. Biuletyn EBIB [on-line] 2006, nr 10 (80) [Dostęp 1 września 2009]. Dostępny w World Wide Web: http://www.ebib.info/2006/80/a.php?nahotko. ISSN 1507-7187. [11] ROŻNIAKOWSKA-KŁOSIŃSKA, M. Specyfika zatrudnienia w bibliotecznych agendach digitalizacyjnych. W: III Bałtycka Konferencja "Zarządzanie i Organizacja Bibliotek" pod hasłem "Standardy funkcjonowania bibliotek europejskich", Gdańsk, 28-29.05.2009 [materiały w druku]. Bibliografia
|
| |||