Nr 5/2004 (56), Public relations w bibliotekach. Badania, teorie, wizje

Andrzej Koziara
Uniwersytet Śląski
Biblioteka Uniwersytetu Śląskiego

Model technologiczny katalogu narodowego

Kolejny rok - kolejne kłopoty. Tak właściwie można rozpocząć każde wystąpienie. Zarówno to dotyczące finansowania działalności, jak i organizacji pracy czy budowania modeli technologicznych systemów komputerowych. Tym bardziej, że kolejne lata naszej działalności ukazują, jak ważne jest prawidłowe liczenie kosztów prowadzonych przez nas przedsięwzięć. Okazuje się, że modele zarządzania oparte na filozofii TQM (Total Quality of Management - zarządzanie poprzez jakość) czy szczegółowo na zasadach liczenia kosztów TCO (Total Cost of Ownership - całkowity koszt posiadania) wymagają przygotowania bardzo szczegółowych modeli technologicznych wdrażanych przedsięwzięć. Jak pokazuje praktyka, może być to szczególnie znaczące dla przedsięwzięć o bardzo szerokim zakresie, rozproszonych we wdrażaniu, zarządzaniu, jak i zasięgu spodziewanych efektów. Przeprowadzane drobiazgowe analizy problemów informatycznych prowadzą do wniosków, że jednym z największych elementów składowych kosztów jest praca ludzka, szczególnie ta, która w sposób rozproszony jest dublowana, a więc ekonomicznie nieuzasadniona.

Szczególne miejsce w tych analizach mają prace związane z teorią i praktyką hurtowni danych. Pojęcie hurtowni danych powstało w chwili, gdy niezbędnym stało się znalezienie sposobu na jednolity dostęp do danych gromadzonych w różnych bazach danych. Wiele z problemów definiowanych w teorii hurtowni danych nie dotyczy bibliotek (może z pominięciem pomysłu scalania nienormatywnych baz katalogowych w ramach podbazy systemu NUKAT), lecz jest jeden obszar, który szczególnie nas interesuje. Jest nim utrzymanie spójności danych.

Główną inspiracją do przygotowania tegoż opracowania stały się prace studialne nad synchronizacją systemów informatycznych. Praktycznym przykładem są studia projektowe nad systemem bramek umożliwiających wymianę informacji pomiędzy systemami dziekanatowymi a systemem bibliotecznym. W związku z unormowaniami prawnymi, związanymi z ochroną danych osobowych, oraz projektami jednolitego dostępu do nich podjęliśmy studia nad możliwościami wymiany danych pomiędzy systemami bazodanowymi pracującymi z wykorzystaniem produktów różnych firm (Oracle, Progress, Microsoft czy IBM). Wnioski z podjętych prac oraz wiele innych przykładów komercyjnego upowszechniania dostępu do systemów rozpowszechniania informacji (np. wysyłanie SMS'ów przy pomocy specjalnego oprogramowania) prostą drogą prowadzi do kolejnych analiz systemowych.

Jedną z nich jest stworzenie wizji technologicznej modelowego, a co najważniejsze przygotowanego do dalszej rozbudowy systemu do obsługi katalogu narodowego. System ten, jak założyłem, powinien pełnić dwie funkcje:

pełnej narodowej bazy bibliograficznej odnotowującej zasoby bibliotek współpracujących;
źródła kompletnych rekordów wzorcowych dla katalogów lokalnych bibliotek współpracujących.

W związku z tym, w artykule nie zajmę się żadnymi aspektami bibliotekarskimi, dotyczącymi struktur definiowanych w normach. Równocześnie będę w nim wykorzystywał wszelkie ustalenia merytoryczne z pracy zespołów fachowców, które to zdefiniowały standardy informacji umieszczanej w naszym katalogu narodowym NUKAT. Artykuł ten nie ma być w żaden sposób polemiką z ich ustaleniami, lecz jego zadaniem jest tworzenie wizji narzędzia, w którym wszelkie ustalenia merytoryczne w sposób szybki i naturalny znajdowałyby swoją realizację.

Przyjęte przeze mnie priorytety decydują o tym, że podstawowymi założeniami przy tworzeniu modelu systemu informatycznego, obsługującego katalog narodowy, są:

Przyjęcie jako niezmiennej i podstawowej (jak już wspominałem, wypracowanej przez najbardziej fachowe zespoły bibliotekarskie) konstrukcji rekordów kontrolowanych równocześnie lub zamiennie przez:
- KHW NUKAT - kartoteka formalnych haseł wzorcowych i kartoteka wzorcowa języka KABA,
- KHW BN - język haseł przedmiotowych Biblioteki Narodowej,
- MESH - Medical Subject Headings - indeks bibliotek medycznych.
Zapewnienie współpracy z centralną bazą rekordów bibliograficznych wszystkich dostosowanych lub możliwych do dostosowania lokalnych systemów katalogowych, obsługiwanych przez różnorodne systemy biblioteczne.
Optymalizacja kosztów utrzymania (liczona według modelu TCO) zgodności baz lokalnych z bazą narodową wzorcową - wykorzystanie wszystkich możliwości automatyzacji procesu pobierania i synchronizowania danych.

Model funkcjonalny systemu opracowanego na bazie powyższych założeń można przedstawić następująco:

Rys. 1. Model funkcjonalny systemu informatycznego.
Źródło: opracowanie własne.

Już na pierwszy rzut oka widać, że zawiera on klasyczne elementy zaawansowanego merytorycznie i technologicznie systemu bibliotecznego oraz uzupełniające go moduły wprowadzone jako dodatkowe elementy systemu, konieczne dla przystosowania go do funkcji sprawnej dystrybucji rekordów bibliograficznych.

Jak myślę, elementy oprogramowania związane z klasycznymi funkcjami systemu bibliotecznego nie wymagają szerszego omawiania. Z rozwiązaniami funkcjonalnymi, oferowanymi przez systemy biblioteczne, możemy się zapoznać np. poprzez uważne przestudiowanie ich dokumentacji lub korzystając z marketingowych informacji firmowych.

Dla zrozumienia późniejszych rozważań pewną uwagę powinniśmy na wstępie poświęcić analizie struktury bazy bibliograficznej. Z założeń projektowych wynika, że zespół pracujący nad stworzeniem struktury bazy bibliograficznej, opartej równolegle lub zamiennie na trzech bazach pomocniczych, musiał uporać się z dużymi trudnościami merytorycznymi. Jednak wyniki jego pracy są idealną podstawą do stworzenia startowego modelu systemu katalogu narodowego.

Jak wynika z rezultatów ich pracy, rekord takiej bazy możemy bardzo ogólnie przedstawić jako zespół danych składający się z rekordu bibliograficznego, zawierającego pola będące relacyjnymi powiązaniami do rekordów pochodzących z "baz indeksowych" oraz tych, których zawartość jest wprowadzana "z palca" podczas jego opracowywania. Model ten oczywiście jest tylko schematyczny i nie oddaje rzeczywistej złożoności relacji zachodzących pomiędzy rekordem bibliograficznym a pomocniczymi "bazami indeksowymi", jak również relacji, które zachodzą w samych bazach indeksowych:

Rys. 2. Schemat relacji zachodzących pomiędzy rekordem bibliograficznym a pomocniczymi "bazami indeksowymi".
Źródło: opracowanie własne.

Problemy te, nieznajdujące się w sferze moich obecnych zainteresowań, w przyszłości mogą stanowić doskonały materiał do kolejnego opracowania analitycznego wspomagającego zmiany w systemach bibliotecznych.

Zasadniczą rolę w racjonalnym wykorzystaniu danych z baz współtworzonych przez pracowników wielu bibliotek powinny stanowić tzw. bramki dystrybucyjne. Konstrukcja oprogramowania i jego możliwości w decydujący sposób kształtują realne koszty pozyskiwania i aktualizacji jednolitej i spójnej informacji. Oczywiście jest to miejsce, gdzie nie możemy się ograniczyć tylko i wyłącznie do rozwiązań standardowych i znormalizowanych w skali światowej. Musimy tutaj podjąć bardzo ważną decyzję, decyzję opartą o analizę możliwości wykorzystania rozwiązań standardowych, implementowanych w klasyczne systemy biblioteczne (np. Z39.50). Wstępne oceny założeń, na jakich opierano konstrukcję unormowanych systemów swobodnej wymiany danych, wskazują na to, że, niestety, nie mogą one stanowić podstawy do konstrukcji systemu przystosowanego do automatycznej synchronizacji zawartości baz danych.

Jak się wydaje, rozwiązaniem tak postawionego problemu jest zaprojektowanie i wdrożenie samodzielnego systemu nazwanego przeze mnie serwerem dostępowym. Powinien on zostać wyposażony w następujące elementy:

Funkcje wyszukiwania i pobierania:
- kompletnego rekordu bibliograficznego, uzupełnionego o numery kontrolne, systemowe lub inne, jednoznaczne identyfikatory elementów z baz pomocniczych;
- alternatywnie według indywidualnie sformułowanych żądań rekordów podstawowych i elementów z nimi powiązanych z wszystkich baz pomocniczych.
Funkcje synchronizacji, tj.:
- przygotowywania i automatycznego udostępniania zbiorów kontrolnych, zawierających identyfikatory rekordów bibliograficznych i pomocniczych, które powinny być usunięte z baz (uzupełnione o identyfikatory rekordów zastępujących rekordy wadliwe);
- formułowania i przekazywania odpowiedzi na pytania o wykaz rekordów bibliograficznych i pomocniczych, aktualizowanych w okresie czasu definiowanym w zapytaniu;
- formułowania i przekazywania odpowiedzi na pytanie o daty powstania i ostatniej aktualizacji rekordów o identyfikatorach przekazanych w zapytaniu;
- automatycznego mechanizmu udostępniającego na żądanie kompletne zestawy rekordów bibliograficznych i pomocniczych.

Powstający w ten sposób system, mający tak szerokie możliwości udostępniania rezultatów współkatalogowania zbiorów, prowadzonego przez pracowników bibliotek aktywnie uczestniczących w procesie tworzenia bazy bibliograficznej, oczywiście musi zostać w prawidłowy sposób wykorzystany przez systemy biblioteczne bibliotek współpracujących z katalogiem narodowym.

Szeroki zakres możliwości dystrybuowania informacji decyduje o możliwości zdefiniowania różnych modeli pobierania i aktualizacji rekordów bibliograficznych. Będą się one różnić technologicznie i jakościowo, choćby poprzez wykorzystywane w nich pomocnicze "bazy indeksowe".

Dla zaprezentowania możliwości tak przygotowanego systemu katalogu narodowego przytoczę kilka zupełnie przypadkowo skonstruowanych trybów współpracy z nim lokalnych systemów bibliotecznych.

System biblioteczny posługujący się KHW NUKAT, korzystający z jej kopii na specjalnym serwerze.
System biblioteczny posługujący się KHW NUKAT i MESH, korzystający z ich kopii na specjalnych serwerach.
System biblioteczny posługujący się KHW NUKAT, pobierający rekordy bezpośrednio z katalogu narodowego.
System biblioteczny posługujący się KHW BN, pobierający rekordy bezpośrednio z katalogu narodowego.
System biblioteczny posługujący się MESH, pobierający rekordy bezpośrednio z katalogu narodowego.

Analizując stan Biblioteki Uniwersytetu Śląskiego na początku 2004 roku, sądzę, że modelem najbliższym dla nas byłby ten wyspecyfikowany w punkcie pierwszym. W modelu takim BUŚ i nasz system biblioteczny pracowałby w następujący sposób:

Alternatywnie uprawniony bibliotekarz importuje istniejące rekordy bibliograficzne z katalogu narodowego. Rekord zawierający numery identyfikacyjne rekordów pomocniczych umożliwia systemowi automatyczne pobranie ich z kopii KHW i automatyczne podwiązanie ich w bazie lokalnej do wcześniej zaimportowanego rekordu. Bibliotekarz do zaimportowanego rekordu wiąże rekord/rekordy zasobu (często nazywane rekordami egzemplarza).
Alternatywnie uprawniony bibliotekarz opracowuje nowo nabyte zbiory w katalogu narodowym - praca w dwóch etapach: najpierw hasła formalne, następnie rekord bibliograficzny.
Uprawniony bibliotekarz wprowadza numer kontrolny rekordu do bazy rekordów oczekujących w systemie lokalnym. Po dokonaniu automatycznego importu rekordu z niezbędnymi rekordami pomocniczymi przez lokalny system biblioteczny sygnalizuje możliwość podpinania rekordów zasobu.
Korzystając z możliwości importu tablicy stanu KHW (numery kontrolne oraz daty powstania i ostatniej aktualizacji) lub tablicy zmian, za zadeklarowany okres czasu system lokalny aktualizuje stan kopii KHW o rekordy nowe i zmienione oraz usuwa rekordy wadliwe, zastępując je prawidłowymi. W sposób automatyczny dokonuje podmiany powiązań wcześniej zaimportowanych danych bibliograficznych z rekordami KHW.
Korzystając z możliwości importu tablicy stanu bazy bibliograficznej lub tablicy jej zmian, system automatycznie dokonuje synchronizacji elementów bazy bibliograficznej lokalnej z narodową bazą wzorcową.

Tak sformułowane założenia, specyfikujące możliwości pozyskiwania rekordów z katalogu narodowego, przygotowujemy dla każdego z wcześniej wyspecyfikowanych modeli pracy.

Oczywiście jest jeszcze jeden najważniejszy warunek praktycznego zastosowania katalogu narodowego. Producenci systemów bibliotecznych muszą przygotować moduły wykorzystujące możliwości bramki importowej. Oprócz życzliwego podejścia do dodatkowych zadań, jakie narzucimy producentom systemów bibliotecznych, wiąże się to również z aspektami prawnymi, a w szczególności z zastosowaniem ustawy o prawie autorskim i prawach pokrewnych. System będzie spełniał swoją rolę tylko i wyłącznie wtedy, kiedy będzie możliwość dynamicznej zmiany cech użytkowych oprogramowania bramki. Dlatego też niezbędne jest zagwarantowanie prawne własności oprogramowania wraz z kodami źródłowymi dla instytucji zarządzającej systemem katalogu narodowego.


	Model technologiczny katalogu narodowego / Andrzej Koziara// W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska. - Nr 5/2004 (56) maj. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2004. - Tryb dostępu: http://www.ebib.pl/2004/56/koziara.php. - Tyt. z pierwszego ekranu. - ISSN 1507-7187

Andrzej Koziara Uniwersytet Śląski Biblioteka Uniwersytetu Śląskiego

Model technologiczny katalogu narodowego

Andrzej Koziara
Uniwersytet Śląski
Biblioteka Uniwersytetu Śląskiego