Internet w bibliotekach II - łączność, współpraca, digitalizacja, Wrocław, 23-26 września 2003 roku


- Spis treści - Poprzedni - Następny

   
 

Leszek Masadyński

SOKRATES-software

Przykład współtworzenia centralnej bazy bibliograficznej poprzez Internet

Sformułowanie założeń

W bibliotekach publicznych województwa łódzkiego wykorzystywane są trzy systemy biblioteczne: MAK (Biblioteka Narodowa), SOWA i SOWA-2 (firma SOKRATES-software). Wybrane biblioteki tworzą własne bazy bibliograficzne dotyczące zagadnień regionalnych. Zadanie zbudowania katalogu obejmującego wszystkie informacje bibliograficzne dotyczące województwa łódzkiego stało się jednym z elementów kontraktu wojewódzkiego realizowanego w 2002 roku. Firma SOKRATES-software uczestniczy w realizacji tego zadania przede wszystkim jako projektant i wykonawca oprogramowania Systemu Bibliografii Regionalnej, sprawuje także nadzór nad jego wdrożeniem.

W procesie przygotowania projektu rozważaliśmy dwa warianty realizacyjne: rozproszony i scentralizowany. Wariant rozproszony utrzymuje dotychczasowy stan organizacji katalogów, tzn. ich odrębność w poszczególnych bibliotekach. Poszczególne katalogi powinny zostać udostępnione on-line w sieci Internet. Informacja zbiorcza (katalog centralny) powstaje dynamicznie, przez "złożenie" rezultatów przesłanego do poszczególnych katalogów zapytania użytkownika. Wydajność serwera takiego katalogu, a więc czas oczekiwania użytkownika na odpowiedź, zależy od wydajności najsłabszego łącza internetowego. Ponieważ biblioteki uczestniczące w realizacji systemu będą dysponować stosunkowo słabymi łączami, rozwiązanie rozproszone zostało odrzucone.

W wariancie scentralizowanym informacja jest przechowywana w jednym miejscu, którym - w naszym przypadku - jest serwer zlokalizowany w siedzibie Wojewódzkiej i Miejskiej Biblioteki Publicznej w Łodzi. Poszczególne biblioteki łączą się z serwerem poprzez Internet i w ramach danej sesji mogą wprowadzać lub modyfikować dane katalogu centralnego, tworzyć zestawienia bibliograficzne według wskazanego kryterium oraz eksportować dane do plików lokalnych.

Kolejnym krokiem decyzyjnym było przyjęcie formatu danych stosowanego w katalogu centralnym Bibliografii Województwa Łódzkiego. Początkowo zaproponowaliśmy zbudowanie katalogu wieloformatowego, który umożliwia gromadzenie rekordów o wielu formatach, ze szczególnym uwzględnieniem tych, którymi dotychczas posługiwały się biblioteki województwa łódzkiego (MARC-BN, SOWA, SOWA-2/TEXT, MARC 21). Katalog wieloformatowy mógłby przejąć istniejące dane bez konieczności ich konwersji. Różnorodność formatów wewnętrznych w zasadzie może być niezauważalna przy prezentacji danych (np. w wydruku bibliografii), ale komplikuje zasady ich wprowadzania i język wyszukiwawczy. Ostatecznie przyjęto, że w ramach Bibliografii Regionalnej Województwa Łódzkiego stosowany będzie format MARC 21 zarówno dla rekordów bibliograficznych, jak i rekordów kartotek wzorcowych. Decyzja ta należała do zamawiającego.

Opis rozwiązania technicznego

W 2002 roku dysponowaliśmy oprogramowaniem, które zasadniczospełniało wymagania zamawiającego, dlatego zaproponowaliśmy realizację zadania w dwóch etapach. W pierwszym został zainstalowany serwer systemu SOWA-2 (Linux). Serwer udostępnia specjalny protokół komunikacyjny oparty na TCP/IP. Dostarczone oprogramowanie "klientów" obejmowało program podstawowy (SOWA_TCP), program importu danych MARC 21 (plik tekstowy lub ISO-2709) oraz program klienta protokołu Z39.50 zintegrowany z usługą przejmowania danych do katalogu centralnego. Oprogramowanie klienckie jest zainstalowane w wybranych bibliotekach województwa łódzkiego oraz w pracowni komputerowej WiMBP w Łodzi.

W pierwszym etapie dane były wprowadzane jedynie dla potrzeb testowania i szkolenia personelu bibliotek. Równocześnie uzgadnialiśmy jeszcze elementy formatu danych, szczególnie w zakresie pól niestandardowych (grupa 9XX). W wyniku zebranych doświadczeń musieliśmy zweryfikować budowę formularzy wprowadzania danych. Pierwotnie proponowaliśmy stosowanie różnych formularzy dla różnych rodzajów materiałów. Przyjęta w systemie SOWA/USMARC budowa formularza w zastosowaniu do różnorodnych materiałów okazała się mało elastyczna, dlatego opracowany został mechanizm dynamicznego formularza, kształtowanego przez użytkownika na bieżąco. Uzyskaliśmy w ten sposób ujednolicenie zasad wprowadzania danych dla wszystkich rekordów bibliograficznych.

Zebrane w pierwszym etapie doświadczenia zainspirowały nas do opracowania zupełnie nowego oprogramowania serwera systemu. Ponieważ założyliśmy, że baza powinna umożliwiać roczny przyrost około 70.000 rekordów, zaproponowaliśmy zrealizowanie systemu docelowego na serwerze SQL. Dla potrzeb Bibliografii Regionalnej wykorzystaliśmy darmowy system zarządzania bazą danych Postgres, ale nasze rozwiązania testowaliśmy także na innych systemach. Aby zachować zgodność z wcześniejszym oprogramowaniem klienckim, zbudowaliśmy serwer aplikacji, który bezpośrednio korzysta z SQL. Trójpoziomowa architektura systemu: klient - serwer aplikacji - system zarządzania bazą danych należy do najnowocześniejszych rozwiązań informatycznych.

W chwili przygotowywania niniejszego komunikatu (maj 2003 roku) drugi etap wdrożenia systemu jest jeszcze przed nami.

Wybrane problemy implementacyjne

Przyjęcie formatu MARC 21 dla katalogu bibliografii regionalnej było decyzją odważną, przede wszystkim dlatego, że jest on znacznie bardziej złożony od stosowanego dotychczas w katalogach bibliograficznych (zwłaszcza tych, które obsługiwane przez systemy SOWA lub SOWA-2). Sytuację komplikuje brak doświadczenia pracowników bibliotek publicznych w katalogowaniu w tym formacie. Oryginalna norma MARC 21[1] i polska literatura dotycząca tego formatu pozwala na wiele interpretacji implementacyjnych dotyczących m. in. doboru indeksów przeglądania katalogu, języka wyszukiwawczego, formatu prezentacji danych (np. w wydruku danych bibliograficznych), zasad walidacji rekordów bibliograficznych. Przewidywaliśmy, że uzgodnienie tych elementów między wykonawcą systemu a zamawiającym będzie bardzo czasochłonne.

Od samego początku uznaliśmy za zadanie pierwszoplanowe przygotowanie adaptacji MARC 21 do potrzeb bibliografii regionalnej. Przygotowaniem specyfikacji zajęli się pracownicy WiMBP w Łodzi, należy jednak zwrócić uwagę na to, że wiele szczegółów specyfikacji nie było znanych w pierwszym etapie realizacji systemu.

Pierwowzorem adaptacji było opracowanie,[2] które określa reguły tworzenia rekordów MARC 21 dla różnych rodzajów materiałów: książka lub jej fragment, wydawnictwo ciągłe, dokument kartograficzny, dokument ikonograficzny, druk muzyczny, dokument dźwiękowy, film, dokument elektroniczny, praca lub artykuł. Opracowanie określa także zasady katalogowania recenzji powyższych materiałów. Dla potrzeb Systemu Bibliografii Regionalnej wykorzystano dodatkowe pola w grupie 69X, 78X, i 9XX. Ostateczną specyfikację formatu otrzymaliśmy na początku maja 2003 roku. Przygotowaliśmy oprogramowanie umożliwiające katalogowanie zgodnie z otrzymanymi materiałami.

Ważnym elementem systemu są kartoteki wzorcowe. Początkowo przyjęliśmy format MARC 21 dla rekordu wzorcowego.[3] Dla potrzeb Systemu Bibliografii Regionalnej WiMBP w Łodzi zaproponowała oddzielne kartoteki wzorcowe dla haseł formalnych (osoby, instytucje, wydarzenia, tytuły ujednolicone) i haseł przedmiotowych (osobowych, tytuł, instytucja, impreza, forma dokumentu, dział bibliografii). Sytuację skomplikowała dodatkowo propozycja tworzenia rekordów wzorcowych dla tematów oraz dla pełnych haseł z określnikami. Różnorodność kartotek wzorcowych w systemie spowodowała konieczność uzupełnienia formatu o dodatkowe pola. Również w tym zakresie specyfikacja została przygotowana przez pracowników WiMBP w Łodzi.

W momencie powstawania tej publikacji wiele elementów systemu nie jest jeszcze ustalonych. Przewidujemy, że uzgadnianie tych elementów będzie przeprowadzane na bieżąco, podczas eksploatacji systemu. Przyjęta architektura klient-serwer pozwala na modyfikowanie oprogramowania bez zakłócania procesu wprowadzania danych

Problemy wymiany danych

Istotnym elementem Systemu Bibliografii Regionalnej są funkcje umożliwiające wymianę danych z innymi systemami. Przewidzieliśmy trzy rodzaje takich narzędzi: eksport i import plików (tekstowy lub ISO 2709), pobieranie on-line (protokół Z39.50) oraz programy konwertujące dane z formatów innych niż MARC 21. Pliki MARC 21 tekstowe lub ISO 2709 można uzyskać poprzez Internet za pomocą przeglądarki WWW (np. Karo, strony domowe Nukat, BN). Katalogi wielu dużych bibliotek dostępne są często także poprzez Z39.50, co znacznie ułatwia przejmowanie danych (jeden przycisk zamiast uruchamiania kilku odrębnych programów).

Niestety, na ogół nie są udostępniane rekordy kartotek wzorcowych. Wyjątkiem jest Słownik Języka Haseł Przedmiotowych Biblioteki Narodowej, który można otrzymać w formie pliku (nie jest dostępny on-line). Dostęp do kartotek wzorcowych Nukat mają jedynie biblioteki stowarzyszone i to wyłącznie poprzez specjalne oprogramowanie.

Wydaje się, że problemy aktualności kartotek wzorcowych Systemu Bibliografii Regionalnej można rozwiązać jedynie poprzez zapewnienie dostępu on-line do centralnej kartoteki haseł. Brak takiej kartoteki w chwili obecnej uniemożliwia automatyczne synchronizowanie katalogów. W ramach Systemu Bibliografii Regionalnej przewidujemy dostęp on-line zarówno do rekordów bibliograficznych, jak i wzorcowych. Możliwość ta zostanie w przyszłości wykorzystana przy automatycznym nanoszeniu zmian rekordów w katalogach, które zawierają kopie rekordów z katalogu centralnego.

Przypisy

[1] Marc 21 Concise Format for Bibliographic Data [on-line]. [dostęp 5 listopada 2003]. Dostęp w WWW http://www.loc.gov/marc/bibliographic/ecbdhome.html.

[2] Bartoszewicz Fabiańska Bożena, Janczewski Krzysztof, Janowska Maria, Słowik Jolanta. Adaptacja formatu MARC 21 dla potrzeb bibliografii regionalnej. [dokument elektroniczny plik Word].

[3] Paluszkiewicz Anna. Format USMARC rekordu kartoteki haseł wzorcowych: zastosowanie w centralnej kartotece haseł wzorcowych. Warszawa 1999.

   


- Spis treści - Poprzedni - Następny

(C) 2003 EBIB

Przykład współtworzenia centralnej bazy bibliograficznej poprzez Internet / Leszek Masadyński // W:Internet w bibliotekach II [Dokument elektroniczny] : łączność, współpraca, digitalizacja : Wrocław, 23-26 września 2003 roku. - Dane tekstowe. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich, K[omisja] W[ydawnictw] E[lektronicznych], Redakcja "Elektronicznej Biblioteki", 2003. - (EBIB Materiały konferencyjne). - Tryb dostępu : http://www.ebib.pl/publikacje/matkonf/iwb2/masadynski.php . - Internet w bibliotekach II. - ISBN 83-915689-5-4