EBIB Nr 11/2006 (81), Stan i perspektywy polskich zasobów cyfrowych w Internecie. Artykuł Poprzedni artykuNastpny artyku  

 


Dominika Czyżak
Grzegorz Szturo
Małgorzata Rakowska
Biblioteka Uniwersytecka w Toruniu

Kujawsko-Pomorska Biblioteka Cyfrowa - problemy i zagadnienia związane z realizacją I etapu jej rozwoju


Mija dopiero rok od oficjalnego otwarcia Kujawsko-Pomorskiej Biblioteki Cyfrowej. To stosunkowo krótki czas, by mówić o doświadczeniach, ale wystarczająco długi, by pokusić się na pierwsze spostrzeżenia czy wnioski. KPBC powstawała jako jedna z pierwszych bibliotek cyfrowych w Polsce, stąd też od początku swego istnienia była bacznie obserwowana przez kolejne grupy bibliotekarzy zajmujących się digitalizacją zbiorów.

Gra zespołowa

Praca z licznym zespołem była dużym wyzwaniem nie tylko dla koordynatora zadania i redaktora, ale przede wszystkim dla wszystkich jego członków - na co dzień pracowników różnych oddziałów i sekcji biblioteki. Realizację projektu zaczęto od długich dyskusji, poszukując odpowiedzi na pytania, co i w jakiej kolejności należy robić. Nie wszystkim podobały się te spotkania, trudno było osobom przyzwyczajonym do samodzielnego działania, jednoosobowego podejmowania decyzji, pogodzić się z racjami innych. Nie był to jednak czas stracony, mimo iż nie udało się przewidzieć wszystkiego do końca - bazując na wiedzy i bibliotekarskim doświadczeniu, wypracowano reguły, które się sprawdzają i które będą służyły KPBC w dalszej perspektywie. Pomysłów było sporo - wszystkie trzeba było przedyskutować, by czasami (np. podczas kolejnego spotkania) przyznać komuś rację lub zmienić zdanie. Ważną rolę odgrywał tu, jak i w każdym innym projekcie realizowanym zespołowo - koordynator, który musiał reagować na liczne propozycje i, jak sama nazwa wskazuje, koordynować dyskusję, wybierając z niej te pomysły, które wpływały na płynną realizację harmonogramu. Zgodnie z założeniami projektu zasób KPBC tworzą trzy kolekcje: dziedzictwo kulturowe, materiały dydaktyczne i zbiory regionalne, które narzuciły dobór materiałów do digitalizacji i jednocześnie zdecydowały o składzie zespołu realizującego zadanie. W spotkaniach zespołu brali udział: koordynator, redaktorzy, katalogerzy, technicy wykonujący właściwą digitalizację, informatycy, administrator projektu oraz kustosze zbiorów specjalnych i kolekcji regionalnych, odpowiedzialni za selekcję zbiorów do ucyfrawiania.

Zarządzanie zasobem

Mając na uwadze potrzeby czytelników i biblioteki, szybko ustalono, że digitalizować należy w pierwszym rzędzie te materiały, które trzeba zabezpieczyć, które są ważne dla historiografii i jednocześnie służą poszerzaniu wiedzy o regionie oraz promocji zbiorów. Kolejne rozmowy doprowadziły do ustalenia procesów pracy: wytypowane pozycje selekcjonerzy wpisują do tabelek pełniących jednocześnie rolę listy obiektów przekazywanych do skanowania; redaktor ustala ich kolejność i przekazuje te informacje katalogerowi i technikom; zeskanowany plik przesyłany jest do dalszej obróbki i przygotowany do publikacji trafia do redaktora, który z kolei umieszcza go na platformie cyfrowej. Na koniec pozostaje oczywiście kontrola opisu bibliograficznego, czyli metadanych, kontrola jakości zasobów i całego procesu digitalizacji. Tak w dużym skrócie przedstawia się przebieg pracy, do którego praktyka dnia codziennego stopniowo dopisywała kolejne procedury.

Redaktor musi zadbać o dostęp wszystkich uprawnionych osób do wspólnego katalogu, w którym zamieszczane są tabelki. Sprawa niby prosta, ale trzeba było dopracować zasady dostępu do danych, określić, kto ma prawa tylko do odczytu danych, a kto może je także modyfikować. Mimo iż dokładnie opisano w procedurach, jak mają być nazywane tabelki, ile pozycji maksymalnie mogą liczyć - wciąż zdarzają się odstępstwa, na szczęście niezakłócające procesów pracy, ale uświadamiające wszystkim konieczność przestrzegania ustalonych reguł.

Przypominać trzeba także o ważnych sprawach związanych z typowaniem obiektów do digitalizacji - mianowicie o prawach autorskich i wydawniczych. Początkowo zakładano, iż pozyskanie praw od autorów (czy ich spadkobierców) nie będzie nastręczało wielu trudności, że wystarczy, jeśli pozycja wymagająca takich uzgodnień zostanie odpowiednio zaznaczona w tabelce, a redaktor przekaże sprawę koordynatorowi, który podejmie negocjacje z właściwymi osobami. Rzeczywistość szybko podyktowała poprawki do procedur. W chwili obecnej do tabelek muszą trafiać wyłącznie tytuły, które mają uregulowany status prawny. Jest to szczególnie ważne, gdyż pozycje z tabelek bardzo szybko są dostępne na liście obiektów planowanych do udostępnienia w KPBC.

Typując obiekty do skanowania, bibliotekarze muszą także brać pod uwagę ich stan fizyczny; te wymagające interwencji konserwatorskiej najpierw trafiają do pracowni konserwacji, a dopiero po wykonaniu odpowiednich zabiegów zabezpieczających ich stan, mogą być wpisane na listę do digitalizacji. Kolejkowanie dokumentów - będące kolejnym etapem procesu digitalizacji - wydawało się zadaniem prostym dla redaktora. Bywało jednak różnie, ustaloną kolejność trzeba było modyfikować, gdy okazywało się, iż pozycje z tabelki dopiero otrzymanej są już w pracowni digitalizacji lub np. któryś ze skanerów zepsuł się albo gdy brały górę względy "polityczne", np. udało się szybko pozyskać zgodę danego autora na publikację kilku prac, w tym podręcznika dla studentów, i nie wolno było czekać z ich udostępnieniem, by nie zniechęcać ofiarodawców i użytkowników.

Ocena jakości danych wprowadzonych do tabelek dokonywała się w pracowni digitalizacji. Tu nie było już obojętne, jak nazywa się plik zawierający tabelkę - ewentualne błędy musiał korygować redaktor, ponieważ nazwa katalogu, w którym umieszczany jest obraz cyfrowy obiektu, powstaje z połączenia nazwy tabelki i numeru obiektu, np. grafika_003_06. Jeśli redaktor chciał za moment móc szybko i poprawnie połączyć pliki z właściwym opisem bibliograficznym, musiał zachować pewien ład organizacyjny. Wbrew obawom, to nie skanowanie okazało się wąskim gardłem, a przetwarzanie plików do formatu DJVU i OCR. Są to czynności praco- i czasochłonne, dodatkowym utrudnieniem stał się fakt, że każda licencja programu służącego do wykonywania OCR (Document Express) jest przypisana do konkretnego komputera, nie każdy więc, kto "akurat ma wolną chwilę", może pliki przetwarzać. Sprawdzianem wszystkich działań jest moment publikacji. Zadaniem redaktora jest w tym momencie poprawianie literówek, uzupełnianie brakujących elementów opisu, sprawdzanie, czy są nadane prawa do przeglądania publikacji oraz czy obiekt przypisany jest do właściwej kolekcji.

Sprzęt i oprogramowanie

Szybko stało się jasne dla bibliotekarzy, jak ważne jest stabilne oprogramowanie i dobry sprzęt, a konkretnie komputery, które ma się do dyspozycji. Niektóre okazały się po prostu za słabe, niewydolne w zetknięciu z dLibrą. Czasem ich wymiana była konieczna, by pracę mógł podjąć główny kataloger. Wspólnie uczono się także terminologii stosowanej przez informatyków i techników, by wypełniając tabelki, operować tymi samymi pojęciami: jakość kopii, liczba dpi, należało też wiedzieć, kiedy stosować kolor, a kiedy odcienie szarości.

Wiele problemów pojawiających się przy publikowaniu w dLibrze wynikało z niestabilności samej platformy lub dziwnych przeciążeń sieci. Trudne chwile przeżywali twórcy KPBC tuż przed dniem jej oficjalnego otwarcia, gdy niewydolna dLibra nie była w stanie zindeksować dużej liczby nagle załadowanych plików. Zamiast hucznego otwarcia mogła się zdarzyć klapa. Jedynym rozwiązaniem okazało się zawieszenie publikowania na kilka dni przed uroczystością. Sporadycznie, ale zdarzają się w KPBC przypadki, gdy transmisja danych zawiesza się, anulowanie zadania trwa wieki, a na koniec opis trzeba tworzyć od początku, bo dLibra nie zezwala na wymianę plików bądź na przeniesienie tytułu do innej kolekcji. Niektóre ograniczenia dLibry trzeba było po prostu rozpoznać, np. to, że nie uwzględnia ona znaków diakrytycznych w wyszukiwaniu (rozwiązaniem wydaje się zakup Document Express Enterprise Edition i ręczne poprawienie stron błędnie odczytanych przez OCR). Wszystkie wykryte i rozpoznane braki oprogramowania są na bieżąco sygnalizowane autorom, stale udoskonalającym platformę. Problemy pojawiają się najczęściej przy wgrywaniu kolejnej poprawki do oprogramowania, gdy nie odnajduje się dotychczasowych funkcji w stałym miejscu (tworzenie kolekcji przenosi się z panelu redaktora do administratora).

Bardzo ciekawym zajęciem redaktora jest odpowiadanie na listy użytkowników, licznie napływające do jego skrzynki, z prośbami o pilną digitalizację konkretnych tytułów czy nadanie uprawnień do przeglądania pozycji zastrzeżonych. Jest to dobra lekcja asertywności, która pozwala dojść do wniosku, że listy pozycji planowanych powinno tworzyć się w umiarkowanym tempie, adekwatnie do możliwości.

Opracowanie formalne dokumentów

Problematyka wprowadzania metadanych do bibliotek cyfrowych jest istotna z dwóch podstawowych powodów. Opracowanie formalne dokumentów jest jednym z elementów składowych całej organizacji pracy zespołu tworzącego KPBC. Od sposobu organizacji wprowadzania opisów bibliograficznych zależą koszty udostępnienia publikacji oraz szybkość, z jaką zostają one wprowadzone. Uzgodniony w KPBC system organizacyjny pozwolił na wprowadzanie metadanych do programu dLibra, zanim dany obiekt został przetworzony technologicznie do postaci cyfrowej. Drugą kwestią ściśle związaną z wprowadzaniem metadanych jest konieczność zapewnienia odbiorcom - w miarę możliwości - ścisłej i precyzyjnej informacji o posiadanych zbiorach. Pomimo istnienia wyszukiwania pełnotekstowego nie wydaje się, aby opracowanie formalne przy tym typie zasobu straciło na znaczeniu. Umiejętność tworzenia krzyżowych wyrażeń wyszukiwawczych wykorzystujących wyszukiwanie i w tekstach publikacji, i w ich opisach bibliograficznych, w znacznym stopniu eliminuje klasyczny szum informacyjny istniejący przy zastosowaniu jedynie poszukiwań tekstowych. Kwestie jakości opisu bibliograficznego oraz szybkość i koszty związane z jego tworzeniem zaważyły na decyzji o konwertowaniu danych bibliograficznych z lokalnych katalogów bibliotecznych, a w przypadku Biblioteki Uniwersyteckiej w Toruniu również z bazy NUKAT.

KPBC gromadzi i udostępnia obecnie ponad kilkadziesiąt tysięcy publikacji. Na zasób składają się rozmaite formy wydawnicze: czasopisma i gazety, wydawnictwa zwarte oraz zbiory specjalne. Różne typy zbiorów wymagają oczywiście odmiennych zasad katalogowania. Niemniej w KPBC przyjęto ogólne zasady, których stosowanie powinno ułatwić wyszukiwanie odpowiednich dokumentów w obrębie biblioteki cyfrowej. Generalną zasadą, jaką przyjęto w KPBC, jest uznanie dokumentu oryginalnego za podstawę do opisu bibliograficznego. Inne zasady tworzenia opisu bibliograficznego w KPBC wynikają z formatu Dublin Core oraz cech charakterystycznych oprogramowania dLibra.

Format Dublin Core pojawił się już w pewnej liczbie polskich publikacji omawiających jego cechy charakterystyczne. Natomiast nadal brak pogłębionej analizy jego funkcjonalności w polskich bibliotekach cyfrowych, a przede wszystkim ogólnopolskich ujednoliconych i precyzyjnych przepisów katalogowania. Sprawa ta staje się paląca z wielu powodów. Umożliwienie wyszukiwania rozproszonego w bibliotekach cyfrowych opartych na oprogramowaniu dLibra należy do jednego z bardziej istotnych.

Opis bibliograficzny w KPBC składa się z 20 elementów: część z nich (identyfikatory, informacje o digitalizacji i przechowywaniu oryginału, miejsce wydania) została dodana do pierwotnej budowy programu dLibra. Fakt, iż każdy z elementów każdego pola może stanowić element wyszukiwawczy, a przez to gwarantować bezpośredni dostęp do katalogowanego dokumentu, miał wpływ na ustalenie ogólnych zasad budowy opisu bibliograficznego w KPBC. Zwrócono uwagę głównie na te elementy opisu bibliograficznego, które umożliwiają wyszukanie oraz jednoznaczną identyfikację danego dokumentu. Wyeliminowano w dużym stopniu to elementy klasycznego opisu bibliograficznego, które czytelnik może sprawdzić za pomocą jednego kliknięcia, np.: liczbę stron, oznaczenie materiału ilustracyjnego, występowanie bibliografii oraz indeksu, a także innych elementów ze strefy uwag.

Najczęściej występującą grupą opisów bibliograficznych w KPBC są opisy wydawnictw ciągłych (publikacje grupowe). Każdy numer gazety i czasopisma otrzymuje swój rekord bibliograficzny, podobnie jak każdy tom wydawnictwa wielotomowego. W obydwu przypadkach cały zasób uzyskuje rekord zbiorczy, odzwierciedlający cechy całego zasobu oraz podporządkowane hierarchicznie oddzielne opisy dla każdego woluminu druku zwartego lub numeru czasopisma. Drugą pod względem ilości grupą są rekordy wydawnictw zwartych. Do ich charakterystyki formalnej wykorzystano te elementy, które służą najlepiej do identyfikacji opisywanego dokumentu oraz wyszukania ze zbioru KPBC: wszelkie określenia odpowiedzialności (rozbite na pola "autor" i "współtwórca"), tytuł publikacji, data i miejsce wydania, nazwa wydawnictwa lub drukarni, tytuł serii lub cyklu wydawniczego, język dokumentu, numer ISBN. Dodatkowym wyrażeniem identyfikującym dany dokument jest typ zasobu. Odmienne funkcje pełnią pola: "digitalizacja" i "oryginał przechowuje" (wyodrębnione w ramach pola "prawa"), identyfikatory: "identyfikator oryginału" oraz "identyfikator obiektu cyfrowego". Typowo informacyjne funkcje spełniają pola "uwagi" oraz "format".

Immanentną cechą każdego komputerowego katalogu biblioteki są indeksy. Specyfika programu dLibra sprawia, iż zawartość każdego pola można przeglądać za pomocą alfabetycznych spisów występujących w nich wyrażeń. Nakłada to pewne ograniczenia dotyczące szczegółowości poszczególnych elementów opisu. Spowodowało to m.in., iż w KPBC nie stosuje się oznaczenia numeru serii. Uwzględnienie numeracji w indeksie pola "powiązania" spowodowałoby występowanie nazwy serii tyle razy, ile publikacji z jej obrębu zostałoby opublikowanych. Uniemożliwiałoby to czytelnikom przechodzenie za pomocą kliknięcia z poziomu rekordu do zasobu serii. Z tych samych względów nie stosuje się również określenia rodzaju współpracy przy hasłach autorskich dla kolejnych oznaczeń odpowiedzialności. W bibliotekach cyfrowych opartych na oprogramowaniu dLibra, w odróżnieniu od komputerowych katalogów wykorzystujących format Marc, oddzielne indeksy grupują hasła autorów i wszystkich tłumaczy, redaktorów itd. W KPBC wprowadzono poprawki, które z poziomu każdego indeksu (autor, współtwórca) umożliwiają przeglądanie wszystkich haseł autorskich. Niestety, funkcjonalność tej zmiany wymaga nadal pewnych poprawek.

Już w fazie testowania funkcjonalności programu dLibra podjęto decyzję o wykorzystaniu możliwości konwersji rekordów bibliograficznych z formatu Marc. Różny jest stopień wykorzystania zasobów lokalnych komputerowych katalogów do importowania danych bibliograficznych do biblioteki cyfrowej. W Bibliotece Uniwersyteckiej w Toruniu dzięki konwersji rekordów z formatu Marc uzyskuje się większość opisów druków zwartych, ciągłych oraz znaczną część zbiorów specjalnych (druki muzyczne oraz dokumenty życia społecznego). Jeżeli brak w bazie komputerowej opisów pozycji przeznaczonych do skanowania, są one tworzone w systemie Horizon lub kopiowane z bazy NUKAT i następnie konwertowane do KPBC. Nieco skromniejszą rolę odgrywa konwersja w pozyskiwaniu danych bibliograficznych w Bibliotece Uniwersytetu Kazimierza Wielkiego. Konwersja z różnych względów nie jest stosowana w Bibliotece Collegium Medicum. W odniesieniu do opisów nie konwertowanych, lecz tworzonych wyłącznie na potrzeby KPBC przyjęto zasadę, iż stosuje się formy haseł autorskich, nazw serii przyjętych przez Kartotekę Haseł Wzorcowych. Wzór konwersji został opracowany w Bibliotece Uniwersyteckiej w Toruniu i jest obowiązujący dla wszystkich ośrodków KPBC.

Pochodzenie metadanych występujących w rekordzie bibliograficznym konwertowanym z formatu Marc można podzielić na trzy grupy. Do pierwszej zaliczają się wszystkie metadane dziedziczone z formatu Marc (hasła autorskie, tytuł publikacji, tytuł serii, miejsce i data wydania, język dokumentu, nr ISBN). Kolejną grupą są dane generowane automatycznie przez program dLibra podczas publikowania dokumentu (format plików publikacji cyfrowej, identyfikator oai). Ostatnią zaś są dane wprowadzane samodzielnie przez redaktora biblioteki cyfrowej (typ zasobu, identyfikator oryginału oraz kopii cyfrowej, informacje o przechowywaniu oryginału i odpowiedzialności za zeskanowany obiekt).

Oddzielną kwestię stanowią w KPBC metadane z pola "temat i słowa kluczowe". Są one wprowadzane na bieżąco i dotyczą głównie dokumentów zbiorów specjalnych. Nadal nie podjęto natomiast decyzji o zasadach tworzenia (lub konwersji z haseł języka Kaba) słów kluczowych druków zwartych.

Przez długi czas w Bibliotece Uniwersyteckiej w Toruniu rekordy bibliograficzne zapisane w formacie Marc na bieżąco uzupełniano o pola dostępu elektronicznego na poziomie bazy NUKAT. Od połowy 2006 r. prace te zostały zawieszone. Istnieje szansa, iż zostaną one podjęte na początku 2007 r. Melioracja rekordów bibliograficznych w bazie NUKAT wraz z uzupełnianiem zmian, jakie zawiera ostatnia wersja przepisów katalogowania, choć z pewnością pożądana, jest czasochłonna. W żadnym z ośrodków KPBC nie istnieje wyodrębniona grupa pracowników zajmująca się jedynie pracą na rzecz biblioteki cyfrowej. Osoby biorące udział w projekcie biblioteki cyfrowej na co dzień wypełniają inne obowiązki. W Bibliotece Uniwersytetu Mikołaja Kopernika wprowadzaniem metadanych zajmuje się sześć osób. Za opisy zbiorów specjalnych odpowiedzialne są osoby, które na co dzień opiekują się zbiorami, z których pochodzą udostępniane cyfrowo dokumenty. Drukami zwartymi i ciągłymi zajmują się trzy osoby. W Bibliotece Uniwersytetu Kazimierza Wielkiego dwie osoby zajmują się katalogowaniem zbiorów specjalnych, a jedna resztą dokumentów. W Collegium Medicum UMK tworzeniem opisów zajmuje się jedna osoba. Nad przestrzeganiem ogólnych zasad opracowania formalnego czuwa jedna osoba w Bibliotece Uniwersytetu Mikołaja Kopernika.

Osobną kwestią dotyczącą metadanych w KPBC są indywidualne potrzeby ośrodków ją współtworzących. Dzięki współpracy z PCSS udało się znacznie poprawić funkcjonalność konwersji z formatu Marc. Dokonano również wyodrębnienia nowych podpól z pól występujących w oryginalnej wersji programu dLibra. Zgłaszane są do PCSS i inne poprawki mające doprowadzić do lepszego wykorzystania metadanych w wyszukiwaniu.

Administrowanie projektem

Realizacja projektu współfinansowanego przez fundusze unijne jest związana z wypełnianiem wielu skomplikowanych i pracochłonnych procedur administracyjnych. Początek prac to okres szczególnie trudny ze względu na nikłe doświadczenie zarówno beneficjentów, jak i urzędników oraz niepełne wskazówki, co do zasad i metod działania. Każdy beneficjent wie, że projekt musi być realizowany ściśle według zasad i terminów zapisanych we wniosku. Niezastosowanie się do jakiejś zasady może skutkować utratą kwoty przeznaczonej na daną kategorię wydatku, a w dalszej konsekwencji niezrealizowaniem projektu. Wydłużający się czas odpowiedzi na stawiane przez beneficjenta pytania powoduje obawę niedopełnienia formalności. Jednakże wraz z nabywaniem doświadczeń procedury stają się bardziej zrozumiałe i przyjazne. Przykładem może tu być przedstawianie sprawozdań, w których działania projektowe musiały być opisywane w rozbudowanych arkuszach, co wydawało się bardzo skomplikowane, ale gdy na koniec trwania projektu zostały uproszczone i zredukowane, okazało się, że nie jest to takie trudne.

Te doświadczenia dają pewną wiedzę, którą można się potem dzielić. W celu uniknięcia trudności podczas realizacji projektu należy zwrócić uwagę na pewne zagadnienia już na etapie pisania wniosku. Warto np. wiedzieć, że słowo refundacja oznacza, iż całość wydatków realizowana jest przez beneficjenta z własnych środków, a zwrot pieniędzy następuje dopiero po złożeniu wniosków o płatność wraz z dokumentacją potwierdzającą zgodność określonych etapów działań z wnioskiem i przepisami.

Administrowanie projektem wymaga wykonywania tej pracy systematycznie i dokładnie. Przejrzysty podział dokumentów na kategorie, zrozumiały opis segregatorów czytelny dla wszystkich członków zespołu, utworzenie specjalnych folderów w dokumentacji komputerowej, jednoznaczne nazwanie plików i dokumentów znacznie ułatwiają mozolną pracę dokumentacyjną. Nawyk drążenia poszczególnych problemów, konsekwentne ich rozwiązywanie w przypadku projektów unijnych jest jak najbardziej pożądane. Cenna jest pomoc doświadczonych pracowników administracji rządowej czy regionalnej w poszukiwaniu czytelnych i prostych rozwiązań dla skomplikowanych procedur.

Finansowe zagadki i niespodzianki

Szacując wielkość kwot potrzebnych do realizacji takich zamierzeń, jak: modernizacja pracowni, zakup mebli, zakup sprzętu, należy je określić w sposób jak najbardziej zbliżony do przeciętnych cen. Jeżeli obliczenia szacunkowe oparte zostaną o wartości katalogowe drogiego sprzedawcy, to prawdopodobnie w wyniku przetargu zostanie wyłoniony dostawca, który zaoferuje niższą cenę. Zaoszczędzona kwota, która wynika z różnicy planowanej i realizowanej wielkości, nie jest możliwa do wykorzystania, nawet w tej samej kategorii wydatku. Ta kwota przepada i o tyle zmniejsza się końcowa wartość realizowanego projektu. Przekroczenie limitu wydatków obciąża beneficjenta, gdyż kwota przyznanej dotacji nie może ulec zwiększeniu.

Przy zakupie sprzętu należy dodatkowo pamiętać, iż oprócz dokładnych parametrów nabywanych urządzeń należy też ustalić warunki gwarancji. Dla drogiego sprzętu należy wymagać kilkuletniej gwarancji, zastrzec sobie dostarczenie na czas naprawy sprzętu zastępczego, przedłużenia gwarancji o czas napraw i wymianę sprzętu na nowy po kilkakrotnych naprawach lub w przypadku niespełnienia wszystkich parametrów oferowanych przez sprzedawcę. Należy skrupulatnie przestrzegać potwierdzania wizyt ekipy serwisowej w karcie gwarancyjnej lub podobnych dokumentach, co będzie dowodem w przypadku zaistnienia konfliktu z dostawcą.

Nabywając skanery z oprogramowaniem, należy pamiętać o licencjach dla programów niezbędnych do obróbki zeskanowanych materiałów, jak również posiadać lub nabyć sprzęt, który jest w stanie je obsłużyć. Przy realizacji opisywanego projektu ten aspekt nie został do końca przewidziany, a co za tym idzie, wygenerował dodatkowe wydatki biblioteki. Zbyt mała liczba odpowiedniego sprzętu spowodowała konieczność pracy na dwie zmiany oraz dodatkowe zatrudnienie studentów, w celu realizacji założonych limitów. Niewywiązanie się z wykonania zadeklarowanych we wniosku wskaźników oznaczałoby niezrealizowanie projektu.

Jeśli ma się do czynienia z partnerami - można zastosować różne koncepcje finansowania przez nich projektu. W przypadku ponoszenia przez koordynatora wszystkich kosztów, a w dalszej kolejności obciążania poszczególnych partnerów poprzez refakturowanie, należy liczyć się z koniecznością płacenia przez partnera VAT-u. Pozytywną stroną takiego działania jest możliwość nadzorowania działań przez koordynatora. W przypadku, gdy każdy z partnerów rozlicza się oddzielnie z przyznanych kwot, lider ponosi znaczny wysiłek koordynacji działań, a przy tym występuje powielanie tych samych czynności oraz procedur. VAT w przypadku opisywanego projektu stanowił koszt kwalifikowalny. Uzyskanie zwolnienia z płacenia VAT-u na zakup sprzętu powoduje konieczność zaplanowania całej kwoty w kategorii "zakup sprzętu". Wkład własny koordynatora i partnerów stanowił zarówno koszt narzutów od wynagrodzeń, jak również czas pracy pracowników na administrowanie projektu i budowę platformy cyfrowej. Jest to składnik możliwy do oszacowania w przybliżeniu. W szerszym aspekcie jest to całość poniesionych przez beneficjenta wydatków, czyli także dodatkowe wydatki oraz praca własna.

Przy KPBC digitalizacja wykonana została przez pracowników z niewielkim udziałem studentów. Praca odbywała się po godzinach, w czasie wolnym w soboty i niedziele. Zawarte zostały umowy-zlecenia, a każda godzina zapisywana była w dzienniczkach, które wraz towarzyszącymi dokumentami (zakres obowiązków do dodatkowych zadań, oświadczenia o możliwości i warunkach wykonywania prac zleconych) i rachunkami zostały przekazane do rozliczenia.

Szacunkowa kalkulacja kosztów ogólnych projektu KPBC

Składnik kosztów Kwota planowana /zł/ Kwota zrealizowana/zł/
Wydatki kwalifikowalne   
Modernizacja pracowni 105 000,00 92 322,48
Zakup sprzętu 530 000,00 654 245,32
Zakup mebli 12 000,00 9 059,80
Promocja projektu 3000,00 4 790,96
Zakup oprogramowania 56 000,00 55 100,00
Szkolenie pracowników 6000,00 4155,35
Analizy prawne 7000,00 5788,00
Digitalizacja 114 000,00 114 000,00
VAT 138 000,00 38 789,09
Razem: 971 000,00 978 251,00
Wydatki niekwalifikowalne   
Wkład własny rozliczany w projekcie (opłaty notarialne, administrowanie projektem, budowa platformy cyfrowej, narzuty od wynagrodzeń, przekroczenie) 49 000,00 69 000,00
Razem: 1 020 000,00 1 047 251,00

Jak wynika z powyższego zestawienia, niektóre pozycje zostały zrealizowane w kwotach przybliżonych do planowanych (zakup oprogramowania, digitalizacja). Natomiast inne zostały przesunięte, przy pomocy aneksu do umowy, do innych kategorii (VAT, szkolenia). Działania powyższe wynikające z bieżących potrzeb realizacji projektu, w pewnym zakresie są możliwe.

Zestawienie szacunkowe kosztów poniesionych przez partnerów projektu

Kategoria wydatków Kwota (zł)
Wkład własny rozliczany w projekcie, przekroczenie 69 000,00
7251,00
Udział 25,13% w wydatkach kwalifikowalnych 244 000,00
Wydatki dodatkowe (praca własna, zakupy) koordynator 344 457,25
Wydatki dodatkowe (praca własna, zakupy) Partner I 16 170,00
Wydatki dodatkowe (praca własna, zakupy) Partner II 76 580,14
Razem: 757 458,39

Dofinansowanie projektu ze środków unijnych wyniosło 727 000 zł. po stronie beneficjentów była to kwota ponad 757 000 zł., więc faktyczny wkład partnerów (kosztów kwalifikowanych i niekwalifikowanych) wyniósł ponad 50%. W obliczeniach nie uwzględniono takich składników kosztów, jak: energia elektryczna, telefony, materiały biurowe, koszty eksploatacji sprzętu itp. Wielkość wkładu własnego w postaci pracy wykonywanej w zakresie etatu to oczywiście wartość przybliżona, gdyż trudno precyzyjnie określić, ile czasu dziennie poświęcono na rzecz projektu: opracowywania koncepcji, rozwiązywania problemów, szukania rozwiązań w literaturze fachowej, konsultacji itp. Szacowanie wielkości tego parametru ułatwia prowadzenie dzienniczków, w których zapisywane są przepracowane godziny. Wymagana jest tu systematyczność, gdyż trudne jest odtworzenie czynności wykonywanych tydzień wcześniej. Z całą pewnością należy liczyć się z nieprzewidzianymi wydatkami, gdyż nawet przy najlepszym planowaniu nie sposób przewidzieć wszystkich problemów, które pojawiają się podczas realizacji projektu. Szacując wymagane kwoty, należy założyć pewien margines bezpieczeństwa.

Koszt obiektu i skanu

Szacowanie kosztów digitalizacji dla jednego obiektu przy założeniu, że bierze się pod uwagę jedynie koszty pracy:

Lp. Składnik kosztów Uczelnia Kwota (zł)
1. Prace zlecone w ramach projektu wszyscy 114 000,00
2. Prace w zakresie etatów koordynator 330 624,72
3. Prace w zakresie etatów Partner I 15 840,00
4. Prace w zakresie etatów, narzuty Partner II 49 546,00
   Razem: 510 010,72

Przybliżony koszt wykonania 1 obiektu tylko w oparciu o koszty pracy w procesie digitalizacji wyniósł: 510 010,72 zł/12 000 obiektów = 42,50 zł.

Szacowanie kosztów digitalizacji dla jednego skanu dla poszczególnych partnerów przy założeniu, że bierze się pod uwagę jedynie koszty pracy:

Lp. Składnik kosztów Partner Kwota (zł) Razem Liczba obiektów Średni koszt 1 obiektu(zł) Liczba skanów Średni koszt 1 skanu
1. Praca opłacona
z projektu
koordynator 79 007,50      
2. Praca w ramach etatów koordynator 330 624,72 409 632,22 5700 71,87 200 000 2,05
3. Praca opłacona
z projektu
Partner I 7993,50      
4. Praca w ramach etatów Partner I 15 840,00 23 833,50 1000 23,83 13 000 1,83
5. Praca opłacona
z projektu
Partner II 26 999,00      
6. Praca w ramach etatów Partner II 49 546,00 76 545,00 5300 14,44 60 000 1,18
  Razem:    510 010,72 12 000 42,50 273 000 1,87

Szacowanie kosztów digitalizacji dla jednego obiektu i skanu przy założeniu, że bierze się pod uwagę wszystkie koszty pracy i koszty inwestycyjne:

Całkowita dotychczasowa kwota wydatków szacowana jest na 1.047.251,00 zł. plus dodatkowe wydatki (praca własna) 437 207,39 = 1 484 458,39 zł. Biorąc pod uwagę te wartości i chcąc wyliczyć koszty jednego obiektu, dzielimy: 1 484 458,39 zł/12 000 obiektów = 123,70 zł, natomiast koszt jednego skanu wynosi: 1 484 458,39/273 000 skanów = 5,44 zł. Są to wartości szacunkowe, ale można je uznać za obrazujące koszty całego przedsięwzięcia.

Dalsze prace (za lata 2007/2008) będą miały wartości szacowane w oparciu jedynie o koszty pracy, gdyż nie będą ponoszone wydatki inwestycyjne związane z uruchomieniem procesu. Warto pamiętać o tym, iż oprócz konkretnej liczby zdigitalizowanych obiektów biblioteki mają gotową "linię produkcyjną" i tego nie można pomijać przy obliczaniu zysków, które zostały osiągnięte podczas realizacji projektu. Po zakończeniu działań sprzęt staje się własnością bibliotek, a na beneficjentach spoczywa jedynie obowiązek składania rocznych sprawozdań, dokumentujących trwałość istnienia projektu.

W projekcie KPBC zakładano ostrożnie, że w ciągu dwóch lat zeskanuje się 10 000 obiektów, ale liczbę przekroczono o 2000: I etap projektu znajduje się jeszcze w fazie realizacji, więc ta liczba ulegnie zmianie. Wyższe koszty koordynatora (wkład własny) spowodowane były istnieniem po jego stronie większej liczby zadań związanych z organizacją pracy, ustalaniem procedur, promocją, kontrolą procesów pracy, wdrożeń informatycznych, administrowaniem projektu. Po stronie koordynatora pozostaje także cenne doświadczenie, którego nie da się w żaden sposób oszacować, bo jest to wiedza (know-how), która może zaowocować w realizacji kolejnych przedsięwzięć.

Zakończenie

Dobiega końca realizacja I etapu projektu KPBC. Oczekiwania użytkowników zostały rozbudzone, widać to we wspomnianych już listach, liczbie użytkowników, statystykach wyświetleń poszczególnych obiektów. Pytania, jakie się nasuwają, sprowadzają się do najważniejszego - co dalej? Jak organizować dalsze prace w bibliotece funkcjonującej w zastanej strukturze, jak realizować kolejne zadania, które dla większości osób zaangażowanych w digitalizację były dodatkowym zajęciem? Jak koordynować digitalizacją w skali kraju, czy nadal wykonywać tylko cyfrowe kopie materiałów regionalnych i dydaktycznych, a co ze źródłami, o które proszą historycy? Niektóre procedury mamy już przetestowane, jesteśmy gotowi do dalszej pracy, ale najpierw trzeba sobie odpowiedzieć na szereg nurtujących pytań.



Przypisy

1. Niewątpliwie największym dorobkiem może pochwalić się Marek Nahotko. Jego bibliografię można odszukać pod adresem: http://nahotko.webpark.pl/lista.htm.

 Początek strony



Kujawsko-Pomorska Biblioteka Cyfrowa - problemy i zagadnienia związane z realizacją I etapu jej rozwoju / Dominika Czyżak, Grzegorz Szturo, Małgorzata Rakowska// W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska. - Nr 11/2006 (81) grudzień/styczeń. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2007. - Tryb dostępu: http://www.ebib.info/2007/81/czyzak_szturo_rakowska.php. - Tyt. z pierwszego ekranu. - ISSN 1507-7187