Nr 8/2009 (108), Finanse w bibliotece. Komunikat |
Andrzej Koziara
| |||
„Dostosowanie zasobu Śląskiej Biblioteki Cyfrowej (ŚBC) do rozszerzonego dostępu internetowego – RID” to projekt realizowany w Bibliotece Uniwersytetu Śląskiego w Katowicach w ramach Regionalnego Programu Operacyjnego Województwa Śląskiego, Priorytet II – Społeczeństwo informacyjne, Działanie 2.2 – Rozwój elektronicznych usług publicznych. Wartość projektu: 2 059 491,63 zł, w tym koszty realizacji ze środków z Europejskiego Funduszu Rozwoju Regionalnego: 1 750 567,89 zł. Beneficjentami pośrednimi projektu będą studenci i pracownicy UŚ oraz innych szkół wyższych, mieszkańcy regionu, a także inni użytkownicy.
Celem projektu jest rozszerzenie dostępu oraz powiększenie poziomu niezawodności dostępu do Internetu czytelnikom Śląskiej Biblioteki Cyfrowej, zwłaszcza grupie osób niedowidzących i niewidzących. Celem szczegółowym jest natomiast poprawa funkcjonalności ŚBC poprzez rozszerzony mirroring zasobu ŚBC, dostosowanie zasobu do potrzeb osób niepełnosprawnych oraz digitalizacja zbiorów. Projekt wpisuje się w następujący cel szczegółowy Regionalnego Programu Operacyjnego Województwa Śląskiego na lata 2007–2013: Stworzenie warunków do rozwoju społeczeństwa informacyjnego w regionie. Projekt zapewni szeroki, publiczny i bezpłatny dostęp do literatury naukowej, fachowej i pięknej. Realizacja projektu pozwoli rozwiązać wiele problemów, z jakimi borykają się na co dzień użytkownicy informacji, a wśród nich: brak specjalistycznego oprogramowania ułatwiającego odczytywanie cyfrowego zbioru, brak dostępu do kolekcji cennych książek i zbiorów specjalnych. Przedmiotem projektu jest zakup sprzętu komputerowego oraz oprogramowania do utworzenia mirroringu systemów udostępniających zasoby ŚBC oraz umożliwienia bezprzerwowego korzystania z ŚBC szerokiej grupie czytelników, w tym osobom niepełnosprawnym z głębokimi dysfunkcjami wzroku. Podjęcie takich działań doprowadzi do znacznego wzrostu dostępności do Śląskiej Biblioteki Cyfrowej przez wytworzenie dwóch zsynchronizowanych ze sobą zasobów podłączonych do sieci Internet, znajdujących się w różnych lokalizacjach.
Śląska Biblioteka Cyfrowa to wspólne przedsięwzięcie ponad trzydziestu jednostek, uczelni i bibliotek z terenu Śląska i terenów przyległych, zainicjowane przez Bibliotekę Śląską i Bibliotekę Uniwersytetu Śląskiego, rozpoczęte 20 lipca 2006 r. ŚBC budowana jest przez uczelnie naszego regionu, biblioteki publiczne, jednostki i stowarzyszenia regionalne. Każdy z uczestników ŚBC zachowuje prawa do cyfrowej publikacji i decyduje m.in. o okresie jej udostępniania. Stan zasobu na dzień 30 września 2009 r. kształtuje się następująco:
Śląska Biblioteka Cyfrowa jest elektroniczną prezentacją kulturowego dziedzictwa Śląska w jego historycznej i współczesnej różnorodności, publikacji naukowego dorobku regionu, zasobów materiałów i dokumentów dla instytucji biznesu. ŚBC jest włączona w krajowy system bibliotek cyfrowych, dzięki czemu za jej pośrednictwem można dotrzeć bezpośrednio do publikacji umieszczonych w innych regionalnych bibliotekach cyfrowych. Opisy publikacji ŚBC są indeksowane i dostępne przez wyszukiwarki internetowe. ŚBC to repozytorium dla społeczności regionu, kraju oraz świata: uczniów, studentów, środowisk naukowych, a także zainteresowanych środowisk biznesu. Zasób Śląskiej Biblioteki Cyfrowej to jedyne w Polsce tak szerokie repozytorium cyfrowe gromadzące publikacje, których oryginały znajdują się w instytucjach rozproszonych po całym regionie. Publikacje do ŚBC oferują również osoby prywatne z własnych kolekcji, często są to rzadkie materiały – Silesiaki, których nie posiadają biblioteki. Ważny etap projektu RID to techniczne doposażenie ŚBC – zakup sprzętu i oprogramowania pozwalającego na mirroring powiązany z rozszerzeniem funkcjonalności wszystkich kolekcji zasobu ŚBC, aby przeszukiwać go bez barier technologicznych, tj. w szybkim dostępie i łatwym logowaniu dla wszystkich użytkowników chcących z niego korzystać. Publikacje ŚBC zgrupowane są w kolekcjach:
Projekt RID zakłada poprawę funkcjonalności ŚBC:
Realizacja projektu RID wpłynie na powiększenie dostępu do tworzonych zbiorów cyfrowych na odpowiednim poziomie szybkości działania oraz zapewnienie sprawności działania. Zapewnienie bezpieczeństwa danych wymaga stworzenia odpowiedniej bazy przystosowanej do zadań tego rodzaju. Czytelnicy bibliotek współtworzących ŚBC nalegają również na opracowanie systemu, który umożliwi w siedzibach tych bibliotek dostęp do utworzonej kolekcji cyfrowej posiadanych zbiorów tradycyjnych, dających ciągły dostęp do najbardziej popularnych zbiorów rozpowszechnianych na ich terenie na podstawie art. 28 ust. 3 ustawy o prawie autorskim i prawach pokrewnych. Projekt dostosowuje poziom rozwoju elektronicznych usług publicznych do potrzeb rozwoju społeczeństwa informacyjnego (rozwój e-usług publicznych spełniających specyficzne potrzeby obywateli). Jednocześnie przygotowuje środowisko, które daje możliwość prostego dotarcia do poszukiwanych tekstów. Teksty te będzie można wyszukiwać np. z domu oraz w zależności od ich statusu (praw autorskich) czytać je w dowolnym miejscu lub w jednej z czytelń systemu biblioteczno-informacyjnego Uniwersytetu Śląskiego. Dostęp do tekstu nie będzie ograniczony liczbą posiadanych egzemplarzy ani miejscem, gdzie potencjalnie są on składowane. Ze względu na zastosowane najnowocześniejsze rozwiązania związane z dynamicznym przenoszeniem i równoważeniem obciążenia, projekt ŚBC we wnioskowanej postaci zachowa swoją trwałość minimum przez pięć lat. System ŚBC po uruchomieniu stanie się jednym z integralnych elementów utrzymywanych przez zespoły administratorów logicznych i informatycznych Biblioteki Uniwersytetu Śląskiego. W utrzymaniu zasobów ŚBC uczestniczyć będą również inni pracownicy Uniwersytetu Śląskiego, dbając o systematyczne poszerzanie jej zasobów. Dodatkowym elementem decydującym o trwałości projektu będą zbiory cyfrowych wersji publikacji tradycyjnych, które w przyszłości zostaną przeniesione do projektowanych w latach późniejszych systemów. TechnologiaZ punktu widzenia infrastruktury technicznej, projekt zakłada zakup odpowiednich serwerów i skanerów oraz oprogramowania o parametrach spełniających aktualne standardy technologiczne dla niniejszego projektu. Ani sprzęt, ani oprogramowanie nie są objęte embargiem technologicznym. Nie podlegają również ograniczeniom i regulacjom prawnym w Polsce. System będzie wykorzystywać istniejącą infrastrukturę sieciową uniwersytetu, a planowaną w ramach przedsięwzięcia nową infrastrukturę techniczną będą stanowić serwery podsystemów, podłączone do aktualnie eksploatowanej w uczelni sieci. Serwery będą umiejscowione w budynku będącym własnością Uniwersytetu Śląskiego. Tu też zostanie zlokalizowane centrum zarządzania i administracji systemu, co pozwoli uniknąć problemów związanych z uzyskaniem pozwoleń na lokalizację sprzętu. Serwery będą podłączone do sieci uczelnianej Uniwersytetu Śląskiego, będącej częścią globalnej sieci Internet. Funkcje operatora uczelnianego Kampusu Uniwersytetu Śląskiego pełni „Śląska Akademicka Sieć Komputerowa”. ŚASK łączy wyższe uczelnie, instytuty naukowo-badawcze, szkoły, jednostki administracji samorządowej oraz inne przedsiębiorstwa z terenu Górnego Śląska i Zagłębia Dąbrowskiego; jest członkiem konsorcjum PIONIER – ogólnopolskiej sieci szkieletowej łączącej sieci ośrodków akademickich całej Polski. Węzły sieci ŚASK zlokalizowane są obecnie w Gliwicach, Katowicach, Sosnowcu, Zabrzu, Rybniku i Bielsku-Białej. ŚASK jest członkiem konsorcjum PIONIER – Polski Internet Optyczny. Konsorcjum jest reprezentowane w międzynarodowych organizacjach TERENA i CEENet. Uniwersytecka Sieć Komputerowa (USK – USNET), posiadająca łącza w ramach ŚASK, jako część publicznej sieci Internet stanowi tzw. System Autonomiczny (AS 8508), wraz z przydzieloną przestrzenią adresową IP: 155.158.0.0/16 typu „Provider Assigned”. Nie pojawia się żadna przeszkoda faktyczna lub prawna związana z koniecznością uzyskania wymaganych zezwoleń dotyczących budowy i eksploatacji systemu. Nowo powstały system to elastyczne i nowoczesne narzędzie do kontrolowanego publikowania w sieci zasobów cyfrowych zarówno tych, wobec których prawa autorskie już wygasły, jak i tych chronionych. Dla zapewnienia elastycznego i bezpiecznego publikowania zbiorów o różnym statusie prawnym zaplanowano wdrożenie dwóch identycznych funkcjonalnie systemów opartych na oprogramowaniu dLibra. Wyboru oprogramowania dLibra do obsługi biblioteki cyfrowej dokonano w 2006 r. i związane było to z dwoma aspektami: kompatybilnością z systemami większości bibliotek cyfrowych w Polsce oraz bardzo dobrym stosunkiem możliwości systemu do ceny jego zakupu i późniejszej jego eksploatacji. Nie bez znaczenia jest również fakt, że oprogramowanie to zostało wyposażone w funkcję wymiany danych bibliograficznych pracującą off-line z dobowym interwałem czasowym. Pozwala to na wykonywanie wyszukiwań w zasobach ŚBC jako jednokrotnego przeszukiwania bazy lokalnej wraz z replikami baz systemu bibliotek cyfrowych obsługiwanych przez to oprogramowanie. Ponieważ koszt zakupu, instalacji oraz późniejszej eksploatacji systemu dLibra jest relatywnie niski, rozwiązanie takie jest zdecydowanie bardziej optymalne (rozdzielenie obciążenia) w stosunku do ulokowania w jednym systemie publikacji wolnych i chronionych na podstawie ustawy o prawie autorskim i prawach pokrewnych. Uzupełnieniem systemu centralnego – serwerowego, służącego zdalnie całej społeczności regionu, kraju i świata, są terminale, które wykorzystując wydzielone zasoby na serwerach ŚBC zostaną tak skonfigurowane, by emulować w pełni funkcjonalne komputery PC. Głównym przeznaczeniem tych terminali będzie poszerzenie liczby udostępnionych stanowisk komputerowych w czytelniach Biblioteki Uniwersytetu Śląskiego, gdzie będzie realizowany dostęp do zbiorów elektronicznych zgodnie z art. 28 pkt 3 ustawy o prawie autorskim i prawach pokrewnych[1]. Szczegółowe zapisy w ww. ustawie stanowią, że dostęp taki jest możliwy z terminali zlokalizowanych w macierzystych bibliotekach systemu biblioteczno-informacyjnego. Przygotowywana koncepcja budowy systemu oparta została w całości na tzw. modelu Server Base Computing. Analiza wymagań wynikających z tego modelu doprowadziła nas do założenia podstawowego, tj. całkowitej koncentracji publikacji wszystkich usług w centralnym punkcie, jakim będą poszczególne logiczne serwery Śląskiej Biblioteki Cyfrowej. Model taki jest najbardziej optymalny pod względem kosztów jego wytworzenia i późniejszego utrzymania, ponieważ wszystkie główne czynności technologiczne wykonywane są w jednym punkcie, najczęściej poprzez administrowanie grupami użytkowników, co powoduje, że są one wykonywane szybko i jednolicie. Równocześnie już na tym etapie przygotowania założeń do projektowania systemu informatycznego przyjęto, że musi on spełniać jedną z najważniejszych cech, tzn. być systemem elastycznym, odpornym na zmiany obciążenia poszczególnych jego elementów – serwerów logicznych. Założenie to spowodowało wybór rozwiązania, w którym zastosowano serwery wielomodułowe i wieloprocesorowe wyposażone w systemy wydzielonych pamięci masowych. Wykorzystując przygotowane środowisko sprzętowe, po instalacji odpowiedniego oprogramowania zarządzającego jego wirtualizacją otrzymany zostanie system, który będzie mógł w sposób dynamiczny przenosić zadania pomiędzy jego elementami sprzętowymi, zapewniając maksymalnie wysoką wydajność poszczególnych jego elementów, które w danej chwili będą najbardziej obciążone. Zastosowanie takiego rozwiązania umożliwi również szybkie i dynamiczne reagowanie na problemy technologiczne. W przypadku awarii któregokolwiek z elementów systemu jego funkcje będą mogły zostać przejęte przez inne jego elementy sprzętowe, a uruchomienie systemu z przygotowanych i przechowywanych obrazów systemów operacyjnych poszczególnych serwerów logicznych można szacować w pojedynczych minutach lub, dla funkcji najbardziej skomplikowanych, w kilkunastu minutach. Funkcja, która umożliwia dynamiczne przenoszenie obciążenia pomiędzy serwerami nie tylko zabezpieczy strukturę systemu przed przestojami lecz również poprawi sprawność działania infrastruktury, co dla pojedynczego użytkownika oznaczać będzie znacznie szybsze uzyskiwanie pożądanych danych. Dostęp do wymienionych usług centralnych będzie realizowany przez segmenty sieci WAN i otwarty Internet eksploatowany przez Uniwersytet Śląski. Wysoka wydajność łącz, wewnętrznych UŚ w kampusie Bankowa oraz przyłącza do Śląskiej Akademickiej Sieci Komputerowej, zapewnia szybkość transmisji na poziomie umożliwiającym komfortowe korzystanie z systemu. Łącza te, stanowiące podstawowy szkielet dla Uniwersytetu Śląskiego, są modernizowane i utrzymywane w stałej sprawności, co zwalnia nas z konieczności wykonywania dodatkowych prac w ramach realizacji projektu ŚBC, a także w okresie jego trwania. Do podłączania terminali będą wykorzystywane już istniejące i eksploatowane instalacje wewnętrzne sieci LAN macierzystych jednostek organizacyjnych Uniwersytetu Śląskiego Dla zapewnienia odpowiedniego do planowanego zadania poziomu niezawodności pracy systemu wszelkie działania związane z jego projektowaniem oraz z późniejszym zarządzaniem i utrzymaniem oparto na zasadach wynikających ze światowego modelu Core Infrastructure Optimization zawierającego w sobie:
Właśnie analiza zagadnień szeroko pojętego bezpieczeństwa pracy systemów, a w szczególności konieczność zapewnienia najwyższego poziomu niezawodności zdecydowała o fakcie, że projekt nowej Śląskiej Biblioteki Cyfrowej oparto na tzw. modelu wirtualizacji funkcjonalnych – wirtualnych serwerów. Wykorzystanie funkcji wirtualnych oraz wykazane poniżej funkcje systemu serwerowego wymagają wykorzystania maszyn dwóch klas. Pierwszą z nich jest jednorodny, wieloprocesorowy, zorganizowany wewnętrznie w postaci osobnych płyt centralnych, wyposażonych w procesory i dedykowaną im pamięć operacyjną serwer klasy RISC (architektura Reduced Instruction Set Computers), uzupełniony odpowiednio do potrzeb zewnętrzną pamięcią dyskową (macierzą). Drugi to serwer klasy Blade, tj. maszyna klasy x86 posiadająca w swoim wnętrzu wiele serwerów dwuprocesorowych oraz zintegrowane w jednej obudowie stosunkowo małe, ale wystarczające dla potrzeb realizacji projektu macierze dyskowe oraz urządzenia archiwujące podstawowe dane systemowe. Cechy tak przygotowanego systemu pozwalają na zachowanie bardzo wysokiego stopnia bezawaryjności oraz na elastyczne zarządzanie. Dla zachowania odpowiedniego poziomu bezawaryjności w maszynach obydwóch grup zastosowano trochę inne mechanizmy bezpieczeństwa elektronicznego, związane z ich budową wewnętrzną i podłączonymi urządzeniami zewnętrznymi. W maszynie, którą wybrano dla kategorii RISC (komputerze posiadającym specyficzną konstrukcję szyny danych i szyny rozkazowej, mającym możliwość łączenia w jednym systemie wielu płyt dwuprocesorowych lub czteroprocesorowych, z liczbą rdzeni nie mniejszą niż 8), będą zastosowane układy elektroniczne wyposażone w zasilacze nadmiarowe, nadmiarowe dyski twarde do instalacji systemu operacyjnego (w tym przypadku dla mirroringu) oraz nadmiarowe kontrolery służące do komunikacji z urządzeniami zewnętrznymi. Serwer zostanie dodatkowo uzupełniony o zewnętrzną macierz dyskową wyposażoną w zduplikowany układ kontrolera do transmisji danych oraz dwukanałowy sterownik wewnętrzny oraz redundantny system zasilający. Zapewnia to bardzo wysoki poziom bezawaryjności systemu, uniezależniając działanie całego systemu od uszkodzeń jego pojedynczych elementów. Konieczność uruchomienia wielu dedykowanych (dedykowanie – pozwala na sprawne działanie infrastruktury zwiększając komfort użytkowników zewnętrznych biblioteki cyfrowej oraz zapewnia wyższą wydajność pracy dla redaktorów wprowadzających zbiory do ŚBC) serwerów do wypełniania pojedynczych funkcji, wykorzystujących oprogramowanie działające na poziomie systemów operacyjnych klasy Windows i Unix decydują o tym, że wybrano maszynę o konstrukcji typu Blade, która w jednej obudowie zewnętrznej wyposażonej w redundantny system zasilania grupuje wiele „serwerów” tej samej klasy, umożliwiając swobodne „spinanie” z nimi zainstalowanych w tej samej obudowie urządzeń zewnętrznych pamięci masowych oraz archiwujących. Jako podstawowe oprogramowanie systemowe zostanie zainstalowane kaskadowe oprogramowanie maszyn wirtualnych. Działanie tego oprogramowania polega na tym, że każdy z serwerów fizycznych maszyny Blade posiada zainstalowaną tzw. wirtualną maszynę, natomiast maszyny te są połączone logicznie przez oprogramowanie tzw. conectora, umożliwiające swobodne przenoszenie serwerów logicznych pomiędzy serwerami sprzętowymi – fizycznymi. Równocześnie dla zachowania wysokiego poziomu bezpieczeństwa zastosowane zostanie oprogramowanie automatyzujące proces archiwowania danych decydujących o działaniu systemu, a więc głównie obrazów systemów operacyjnych serwerów logicznych.
Ważną informacją w analizie technicznej jest wskazanie zakresu usług, które zostaną zlokalizowane na serwerach ŚBC. Należą do nich: usługi związane z gromadzeniem zasobów cyfrowych, usługi odpowiedzialne za bezpieczne i kontrolowane rozpowszechnianie publikacji w sieciach komputerowych posiadających do tego prawne uwarunkowania oraz te związane z obsługą terminali, na których mają być prezentowane głównie informacje objęte ochroną prawa autorskiego.
Oprogramowanie to można podzielić na część związaną z tworzeniem zasobu i opracowaniem zbiorów, część związaną z przechowywaniem i rozpowszechnianiem zasobów oraz tworzeniem środowisk terminalowych dla klientów ŚBC. W części związanej z tworzeniem zasobu znajdują się logiczne maszyny, na których będą pracowały serwery baz danych, w których gromadzone są dane bibliograficzne w systemach dLibra i Prolib oraz serwery, na których osoby opracowujące te dane będą otwierały aplikacje niezbędne do ich wprowadzania. Pozwoli to na opracowanie zasobów z dowolnych, nawet bardzo starych i niewydajnych komputerów, zlokalizowanych w sieciach bibliotek wprowadzających dane do ŚBC. Na serwerach tych posadowiona zostanie również kopia ogólnopolskiej Kartoteki Haseł Wzorcowych niezbędna do prawidłowego i jednolitego opracowania zbiorów lokowanych na platformach elektronicznych. Do systemu należą również wirtualne maszyny, na które będą przeniesione aplikacje wspomagające wprowadzanie danych do ŚBC m.in. te, na których dokonuje się konwersji plików graficznych do formatu DjVu i PDF. Drugą część stanowić będą wirtualne maszyny, na których będzie pracował tzw. „Front Office” systemu ŚBC. Należeć do tego będą serwery usług internetowych i bazodanowe obydwóch instalacji oprogramowania dLibra. Na serwerach tych zostanie zainstalowany syntetyzator mowy usprawniający pracę osobom niewidzącym (pracujący w modelu serwerowym, tj. jako nadajnik strumieniowy). Trzecią częścią systemu centralnego jest zestaw wirtualnych serwerów niezbędnych dla zapewnienia dostępu do ulokowanych w ŚBC publikacji. Wirtualne serwery zbudowane również w modelu bazującym na technologii aplikacyjnej będą dostarczały poprzez usługę sesji terminalowych (tj. otwarcie aplikacji na serwerze oraz przekazywanie pomiędzy serwerem a terminalem użytkownika trzech sygnałów: obrazu ekranu, ruchów myszki oraz naciskanych klawiszy na klawiaturze). Pozwala to uniezależnić użytkowników od platformy, z której otwierane będą zasoby ŚBC, oraz zwalnia użytkowników z instalacji oprogramowania prezentującego zasoby ŚBC (dodatki do formatów PDF i DjVu). Równocześnie model taki umożliwia ponowne wdrożenie do eksploatacji starych komputerów, których stan elektroniczny nie budził zastrzeżeń, natomiast na których współcześnie użytkowane aplikacje już nie pracują. Równocześnie pozostanie dotąd eksploatowany sposób dostępu do publikacji gromadzonych w ŚBC z klasycznych stacji roboczych opartych o komputery klasy PC (łącznie z tymi, które nie są zgodne ze specyfikacją x86), na których zainstalowano dowolny system operacyjny z przeglądarką internetową oraz dodatkowo dodatki do otwierania plików przygotowanych w standardzie DjVu lub PDF. Ze względu na rozwój technologii informatycznych w chwili uruchomienia systemu powinny zapaść decyzje związane z ich przemieszczaniem pomiędzy obydwoma serwerami systemu ŚBC. Serwer klasy RISC:
Serwer klasy Blade:
W ramach uruchomienia systemu ŚBC będą również wykorzystywane systemy operacyjne, oprogramowanie antywirusowe (tam, gdzie jest niezbędne) oraz aplikacje użytkowe, na które Uniwersytet Śląski posiada już licencje. PodsumowanieZasadniczym celem projektu RID jest rozszerzenie dostępu internetowego do zasobów Śląskiej Biblioteki Cyfrowej. Główne problemy, które zostaną rozwiązane dzięki realizacji projektu, to:
Przypis[1] Ustawa z dnia 24 lutego 1994 r. o prawie autorskim i prawach pokrewnych. Dz.U. 1994, Nr 24, poz. 83. Tekst jednolity z dnia 17 maja 2006 r. Dz.U. 2006, Nr 90, poz. 631. |
| |||