EBIB 
Nr 7/2006 (77), Technologie informacyjne. Artykuł
 Poprzedni artyku Nastpny artyku   

 


Joanna Piotrowska
Biblioteka – Ośrodek Dokumentacji
Krajowa Szkoła Administracji Publicznej

Co z tym Greenstone'm?


Greenstone jest oprogramowaniem typu Open Source przeznaczonym do tworzenia nowoczesnej elektronicznej biblioteki. Nie ma on funkcji zarządzania biblioteką, nie może być wykorzystywany jako system biblioteczny, ale pozwala na tworzenie cyfrowych baz dokumentów, baz do katalogowania, przechowywania i udostępniania cyfrowo zbiorów specjalnych, wirtualnych bibliotek pełnotekstowych czy wreszcie tworzenia katalogów elektronicznych. Dla polskiego użytkownika najważniejszym jest, że -, zgodnie z filozofią Open Source - jest to oprogramowanie darmowe. Sytuacja finansowa większości polskich bibliotek, szczególnie tych mniejszych, notorycznie nie doinwestowanych i zmuszanych do oszczędności, jest zwykle powodem, dla którego rezygnują one z unowocześniania się - ten problem rozwiązują takie programy jak Greenstone.

Aby móc z niego korzystać potrzebne są w zasadzie tylko trzy elementy: serwer, gdzie jest wyświetlana baza, komputer z dostępem do Internetu oraz Java Developer Kit. Program pozwala umieścić stworzoną bazę na serwerze lub archiwizować i zapisywać dane na CD-ROM-ach. Stworzone bazy mogą być publicznie dostępne albo też zastrzeżone hasłem dla uprawnionych użytkowników. Ciekawą możliwością jest to, że można zastrzec dostęp do bazy jako całości, albo tylko do wybranych jej elementów, np. konkretnych dokumentów.

Greenstone automatycznie obsługuje pliki: doc, gif, htm, html, jpg, jpeg, pdf, png, ps, rtf, txt, text, cfg, bak. Oznacza to, że tego typu pliki można bezpiecznie umieszczać w bazach mając pewność, że zostaną odczytane. Jeśli mamy pliki innego rodzaju, należy dodać jego format, aby był rozpoznawalny. Pamiętać także należy o skonfigurowaniu bardziej skomplikowanych plików (np. htm) z pluginami. Taka różnorodność (a nawet brak ograniczeń) obsługiwanych formatów plików pozwala tworzyć najróżnorodniejsze kolekcje - zdjęć, skanów, rekordów bibliograficznych, zbiorów prezentacji, wszelkich plików tekstowych (nie polecam jedynie tworzenia kolekcji plików txt, gdyż nie poddają się one formatowaniu - plik w bazie nie zachowuje swojego układu z Notatnika i zmienia się w jedną długą linię tekstu. Tego rodzaju plikom najlepiej zmienić po prostu format). Rzecz jasna bez problemów można tworzyć bazy mieszane, np. zdjęć i plików tekstowych.

Aby włączyć plik do kolekcji, z reguły nie trzeba go przygotowywać w żaden specjalny sposób. Zarówno pliki graficzne, jak i tekstowe mogą być "z marszu" dodawane do kolekcji. Praca nad plikiem wymagana jest jedynie wtedy, kiedy chcemy stworzyć dokument hierarchiczny, który nie będzie prezentowany jako całość, ale podzielony na sekcje - w takim wypadku należy sformatować plik do formatu htm i wprowadzić do niego odpowiednie oznaczenia podziału.

Zapoznanie się z bazą najlepiej rozpocząć od przeczytania instrukcji. Twórcy Greenstone'a oferują użytkownikowi aż dwie instrukcje (w języku angielskim): User's i Developer's Guide. Każda z nich ma, niestety, swoje wady. User's Guide, jak większość tego typu dokumentów, napisanych przez ludzi, dla których wszystko jest już jasne, jest bardzo ogólna i nie odpowiada na większość pytań pojawiających się w trakcie pracy, a niektóre zagadnienia zostały wręcz pominięte. Tekst w zasadzie ogranicza się do krótkiej prezentacji opcji programu i niewiele można znaleźć w nim odpowiedzi Jak coś zrobić. W założeniu, jak sądzę, wyjaśnić to miał Developer's Guide, czyli instrukcja dla zaawansowanych, ale ona z kolei koncentruje się na technicznej stronie zagadnień i wymaga wiedzy informatycznej na temat programowania. Dlatego niemal nieocenioną pomocą staje się lista mailingowa użytkowników Greenstone'a (również po angielsku) będąca forum wymiany doświadczeń i porad dla "prostych" użytkowników. Oto przykład: z instrukcji dowiedziałam się (a raczej wypatrzyłam na rysunku), że pliki można indeksować alfabetycznie w podziale na sekcje "literowe", np. A-K, L-R itd., co pozwala na przejrzyste i uporządkowane prezentowanie danych. Z instrukcji nie udało mi się wycisnąć odpowiedzi, jak tego dokonać - informację, że jest to opcja włączająca się automatycznie, jeśli baza posiada ponad 40 dokumentów, uzyskałam dopiero z listy mailingowej.

Pomocą mogą służyć też przykładowe, proste bazy danych znajdujące się na oficjalnej stronie projektu, choć nie za wiele można z nich uzyskać informacji z uwagi na tę właśnie prostotę. Nie od rzeczy wreszcie jest stosowanie prostej metody prób i błędów - włączanie i wyłączanie rozmaitych opcji, eksperymentowanie z ustawieniami itd. Nie zaszkodzi, a rezultaty mogą okazać się warte zachodu.

Kolekcja może być budowana za pomocą dwóch narzędzi - narzędzia GLI (Greenstone Librarian Interface) lub narzędzia Colector. Colector jest narzędziem bardziej zaawansowanym, gdyż praca koncentruje się na tworzeniu pliku konfiguracyjnego bazy, do czego potrzebna jest wiedza informatyczna, natomiast GLI ma formę okna z możliwością zaznaczania interesujących użytkownika opcji. Decyzję, w którym systemie chcemy pracować należy podjąć na początku, gdyż naprzemienne korzystanie z tych dwu narzędzi powoduje zawirowania w systemie, który nieco "głupieje" od nadmiaru funkcji i w takim wypadku może, np. gubić rekordy lub nie pozwalać na edycję danych. Osobiście polecam GLI jako narzędzie przeznaczone dla mniej zaawansowanych technologicznie użytkowników, posługujących się raczej wiedzą intuicyjną niż techniczną. GLI jest dostępne w dwóch wersjach: jako aplet Javy uruchamiany ze strony www lub aplikacja systemu Windows. Ta pierwsza wersja przeznaczona jest dla użytkowników systemu Linux i tylko w tym systemie działa prawidłowo. Użytkownicy Windowsa powinni zainstalować na swoich komputerach przeznaczoną dla tego systemu operacyjnego aplikację, aby mieć pewność, że Greenstone będzie działał prawidłowo, a podczas pracy nad programem nie wystąpią żadne nieprzyjemne niespodzianki. Greenstone nie oferuje niestety narzędzia w języku polskim, ale istnieje możliwość ustawienia polskiej wersji językowej przy prezentacji danych.

Budowanie kolekcji nie jest czynnością zbyt skomplikowaną. Nie trzeba zaczynać od zera - program oferuje standardowy interfejs, którego modyfikacja zależy tylko od potrzeb i fantazji użytkownika. Automatycznie pojawia się narzędzie wyszukiwawcze (które można zmieniać i ustawiać wedle potrzeby) oraz indeks nazw plików (możliwy do usunięcia). Tworzenie kolekcji z narzędzi GLI składa się z czterech kroków. Po zainicjowaniu tworzenia nowej kolekcji (opcja NOWA KOLEKCJA ) i wybraniu standardu opisu metadanych (polecany standard Dublin Core jako najbardziej uniwersalny i pozwalający na szczegółowy opis zasobu) system prosi o nazwanie naszej bazy danych i zdefiniowanie jej zawartości. Te informacje pojawią się na stronie przeznaczonej dla użytkownika i pozwolą mu zorientować się, jakie dane znajdują się w bazie. Nie jest konieczne wpisywanie ostatecznej wersji tegoż opisu, gdyż informacja ta może zostać później zmodyfikowana. Dalsze etapy pracy to: wybieranie plików do kolekcji (zakładka GATHER), uzupełnianie metadanych (ENRICH), modyfikowanie wyglądu i prezentacji danych w kolekcji (DESIGN) oraz zapisywanie danych i wszelkich zmian dokonanych w bazie (CREATE).

Dane (w formie plików) wprowadzane są do kolekcji (w zakładce GATHER) za pomocą prostej metody przeciągnij i upuść. Pliki mogą być czerpane zarówno z twardego dysku komputera, jak i z dysków zewnętrznych (dyskietka, CD-ROM itp.). Pliki w naszej bazie mogą istnieć "indywidualnie" lub zostać umieszczone w katalogach, porządkujących je np. tematycznie. Pozwala to później na szybszy i mniej pracochłonny opis danych, np. wprowadzając do bazy kilka lub kilkanaście plików graficznych o zawartości dotyczącej tego samego wydarzenia - zamiast kilka razy wpisywać każdemu z nich oddzielnie te same metadane, wystarczy, że zostaną one wprowadzone raz na poziomie katalogu. Należy pamiętać, że matadane nadane na poziomie katalogu są nadrzędne wobec metadanych na poziomie pliku z tego katalogu. Zadanie katalogów jest jedynie porządkujące - podczas prezentacji rekordów pliki, mimo iż znajdują się we wspólnym katalogu i mające same metadane, prezentowanie są jako oddzielne rekordy bazy. Należy zwrócić uwagę, aby pliki, które chcemy dołączyć do bazy nie miały w nazwie polskich znaków diakrytycznych, gdyż takie system po prostu zignoruje.

Po umieszczeniu plików w bazie należy przejść do zakładki ENRICH i uzupełnić metadane. Jest to ważna i niezbędna czynność, gdyż pliki nieopisane są niewidoczne dla użytkownika. Dzieje się tak, ponieważ rekordy są prezentowanie za pomocą indeksów - jeśli np. pole tytuł nie zostanie wypełnione, system nie zauważy rekordu i tym samym go nie wyświetli; nie będzie także możliwości wyszukania go. Metadane zawarte w opisie pliku są w pełni edytowalne, co znaczy, że można je zmieniać, uzupełniać, modyfikować, uaktualniać i usuwać (z wyjątkiem danych technicznych, samodzielnie uzupełnianych przez system, takich jak nazwa, rozmiar pliku itp.). Ponadto wszystkie pola opisu danych są powtarzalne. Nie jest koniecznym wypełnianie wszystkich pól opisu pliku w standardzie DC.

Dużym ułatwieniem przy wprowadzaniu metadanych jest to, iż system zapamiętuje wprowadzone już frazy i hasła, automatycznie tworząc wewnętrzne słowniki i pozwalając na bieżąco ściągać potrzebne hasła. Pozwala to na ujednolicanie haseł (np. przedmiotowych, nazwisk) w bazie, uniknięcie chaosu i bałaganu w danych oraz oszczędza czas potrzebny na uzupełnienie metadanych, co w przypadku większych baz również ma swoją wagę. Dużym plusem jest też możliwość hierarchizacji słów kluczowych i haseł przedmiotowych. Następna w kolejności zakładka DESIGN służy do konfigurowania wyglądu bazy i pozwala na indywidualne ustawienie interfejsu użytkownika. Podzielona została na kilka sekcji, w których można ustalić zakres przeszukiwania plików, stworzyć indeksy, ustawić zewnętrzny wygląd bazy.

Zakresy wyszukiwania plików i przeszukiwania ich treści definiują sekcje SEARCH TYPES oraz SEARCH INDEXES. Narzędzie wyszukiwawcze jest tworzone automatycznie przez program (SEARCH), a do użytkownika należy jedynie zdefiniowanie pól wyszukiwawczych. Zakres przeszukiwania bazy koryguje się przez wskazanie elementów (metadanych), jakie mają być brane pod uwagę przez system oraz zdefiniowanie, czy narzędzie ma jako wynik wskazywać dokumenty (jako wynik otrzymamy listę rekordów), sekcje czy akapity, gdzie występuje szukane słowo (dokładniejsze wskazania). Istnieje możliwość przeszukiwania kilku baz jednocześnie. Opcja wyszukiwania krzyżowego (CROSS_COLLECTION SEARCH) działa jednak niestety tylko wtedy, kiedy bazy mają identyczny interfejs (ujednolicony wygląd prezentacji danych), w przeciwnym wypadku, choć rekordy mogą zostać odnalezione, wygląd bazy może się "rozjechać" i korzystanie z niej będzie utrudnione.

Klasyczne indeksy tworzone są w sekcji BROWSING CLASSIFIERS. Teoretycznie można stworzyć tyle indeksów, ile jest elementów opisu. Tworzenie indeksów jest czynnością dosyć prostą - ponieważ istnieją gotowe schematy, należy po prostu wybrać jeden i wypełnić go danymi, takimi jak główny element wyszukiwawczy (np. tytuł) i element porządkujący (np. autor). Po wybraniu takich danych powstanie prosty indeks tytułowy z rekordami ułożonymi w kolejności alfabetycznej wg nazwisk autorów. Niestety, mimo dostępności polskiej wersji strony, program nie rozpoznaje polskich znaków diakrytycznych, co sprawia, że podczas szeregowania metadanych w indeksach nie bierze ich pod uwagę, układając kolejność według następnej litery (np. nazwisko Ślusarczyk znajdzie się pod literą L).

Obok indeksów prostych istnieją także indeksy hierarchiczne, gdzie prezentowane dane mogą być podzielone na hasła główne i podrzędne. Taki sposób można wybrać przy tworzeniu indeksów słów kluczowych czy haseł przedmiotowych z zastrzeżeniem, że metadane: Słowa kluczowe czy Hasła przedmiotowe również muszą być zhierarchizowane (w zakładce ENRICH). Zupełnie odrębną budowę ma indeks chronologiczny, który można konfigurować z podziałem na lata a nawet miesiące. Automatycznie "na wejście" system samoczynnie tworzy indeks nazw plików, który również można modyfikować, a w razie potrzeby usunąć bez żadnych konsekwencji.

Wygląd bazy, czyli sposób prezentacji rekordów ustala się w zakładce FORMAT FEATURES. W tym miejscu należy stworzyć formaty (schematy) wyglądu bazy, takie jak sposób prezentacji indeksów, rekordów, wyszczególnienie, jakie metadane mają być prezentowane i tym podobne. System oferuje schematy uniwersalne, które można zostawić bez zmian, ale można stworzyć własny wygląd bazy. Formaty te tworzone są w języku html. Cala praca nad stworzeniem bazy znajduje finał w ostatniej zakładce: CREATE. Tutaj buduje się kolekcję na serwerze i zapisuje wszelkie zmiany. Mimo istnienia w programie opcji SAVE bezpieczniej jest zapisywać wszelkie zmiany właśnie w tym miejscu, gdyż daje to pewność, że żadne dane na pewno się nie "zagubią".

Jeśli opis działania programu i tworzenia kolekcji wydaje się skomplikowany, to nic bardziej mylnego. Wbrew pozorom system jest, może nie rozpaczliwie prosty, ale i nie strasznie skomplikowany. Jest idealnym rozwiązaniem do tworzenia baz danych zawierających zdjęcia czy dokumenty. Pojemność opisu metadanych sprawia, że w bazie danych znajdują się wszystkie potrzebne informacje, elastyczne narzędzia wyszukiwawcze pozwalają na wyszukiwanie konkretnych danych, a możliwość regulowania dostępu do kolekcji daje pewność, że nikt niepowołany tam nie zajrzy. No i "last but not least" swoją wagę ma także fakt, że nie trzeba na system wydawać grubych tysięcy. To wszystko sprawia, że warto, moim zdaniem, zainwestować trochę czasu, aby poznać Greenstone'a i zobaczyć samemu, co potrafi i do czego może być przydatny.

Aby dowiedzieć się więcej o systemie Greenstone, zajrzyj na:

  1. Greenstone - oficjalna strona projektu - http://www.greenstone.org/cgi-bin/library
  2. New Zealand Digital Library Project - http://www.sadl.uleth.ca/nz/cgi-bin/library
  3. Podręczniki systemu Greenstone - http://greenstone.sourceforge.net/wiki/index.php/Manual
  4. Przykładowe kolekcje demo - http://greenstone.sourceforge.net/wiki/index.php/Example_collections
  5. Archiwalna kolekcja e-maili użytkowników listy mailingowej Greenstone'a - http://www.sadl.uleth.ca/nz/cgi-bin/library?a=p&p=about&c=gsarch-e
  6. UNESCO MOST Digital Library - baza stworzona za pomocą systemu Greenstone - http://digital-library.unesco.org/shs/most/gsdl/cgi-bin/library?c=most&a=p&p=about

 Początek strony



Co z tym Greenstone'm? / Joanna Piotrowska// W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska. - Nr 7/2006 (77) lipiec. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2006. - Tryb dostępu: http://www.ebib.info/2006/77/piotrowska.php. - Tyt. z pierwszego ekranu. - ISSN 1507-7187