Nr 7/2006 (77), Technologie informacyjne. ArtykuĹ

Joanna Piotrowska
Biblioteka â OĹrodek Dokumentacji
Krajowa SzkoĹa Administracji Publicznej

Co z tym Greenstone'm?

Greenstone jest oprogramowaniem typu Open Source przeznaczonym do tworzenia nowoczesnej elektronicznej biblioteki. Nie ma on funkcji zarzÄdzania bibliotekÄ, nie moĹźe byÄ wykorzystywany jako system biblioteczny, ale pozwala na tworzenie cyfrowych baz dokumentĂłw, baz do katalogowania, przechowywania i udostÄpniania cyfrowo zbiorĂłw specjalnych, wirtualnych bibliotek peĹnotekstowych czy wreszcie tworzenia katalogĂłw elektronicznych. Dla polskiego uĹźytkownika najwaĹźniejszym jest, Ĺźe -, zgodnie z filozofiÄ Open Source - jest to oprogramowanie darmowe. Sytuacja finansowa wiÄkszoĹci polskich bibliotek, szczegĂłlnie tych mniejszych, notorycznie nie doinwestowanych i zmuszanych do oszczÄdnoĹci, jest zwykle powodem, dla ktĂłrego rezygnujÄ one z unowoczeĹniania siÄ - ten problem rozwiÄzujÄ takie programy jak Greenstone.

Aby mĂłc z niego korzystaÄ potrzebne sÄ w zasadzie tylko trzy elementy: serwer, gdzie jest wyĹwietlana baza, komputer z dostÄpem do Internetu oraz Java Developer Kit. Program pozwala umieĹciÄ stworzonÄ bazÄ na serwerze lub archiwizowaÄ i zapisywaÄ dane na CD-ROM-ach. Stworzone bazy mogÄ byÄ publicznie dostÄpne albo teĹź zastrzeĹźone hasĹem dla uprawnionych uĹźytkownikĂłw. CiekawÄ moĹźliwoĹciÄ jest to, Ĺźe moĹźna zastrzec dostÄp do bazy jako caĹoĹci, albo tylko do wybranych jej elementĂłw, np. konkretnych dokumentĂłw.

Greenstone automatycznie obsĹuguje pliki: doc, gif, htm, html, jpg, jpeg, pdf, png, ps, rtf, txt, text, cfg, bak. Oznacza to, Ĺźe tego typu pliki moĹźna bezpiecznie umieszczaÄ w bazach majÄc pewnoĹÄ, Ĺźe zostanÄ odczytane. JeĹli mamy pliki innego rodzaju, naleĹźy dodaÄ jego format, aby byĹ rozpoznawalny. PamiÄtaÄ takĹźe naleĹźy o skonfigurowaniu bardziej skomplikowanych plikĂłw (np. htm) z pluginami. Taka rĂłĹźnorodnoĹÄ (a nawet brak ograniczeĹ) obsĹugiwanych formatĂłw plikĂłw pozwala tworzyÄ najrĂłĹźnorodniejsze kolekcje - zdjÄÄ, skanĂłw, rekordĂłw bibliograficznych, zbiorĂłw prezentacji, wszelkich plikĂłw tekstowych (nie polecam jedynie tworzenia kolekcji plikĂłw txt, gdyĹź nie poddajÄ siÄ one formatowaniu - plik w bazie nie zachowuje swojego ukĹadu z Notatnika i zmienia siÄ w jednÄ dĹugÄ liniÄ tekstu. Tego rodzaju plikom najlepiej zmieniÄ po prostu format). Rzecz jasna bez problemĂłw moĹźna tworzyÄ bazy mieszane, np. zdjÄÄ i plikĂłw tekstowych.

Aby wĹÄczyÄ plik do kolekcji, z reguĹy nie trzeba go przygotowywaÄ w Ĺźaden specjalny sposĂłb. ZarĂłwno pliki graficzne, jak i tekstowe mogÄ byÄ "z marszu" dodawane do kolekcji. Praca nad plikiem wymagana jest jedynie wtedy, kiedy chcemy stworzyÄ dokument hierarchiczny, ktĂłry nie bÄdzie prezentowany jako caĹoĹÄ, ale podzielony na sekcje - w takim wypadku naleĹźy sformatowaÄ plik do formatu htm i wprowadziÄ do niego odpowiednie oznaczenia podziaĹu.

Zapoznanie siÄ z bazÄ najlepiej rozpoczÄÄ od przeczytania instrukcji. TwĂłrcy Greenstone'a oferujÄ uĹźytkownikowi aĹź dwie instrukcje (w jÄzyku angielskim): User's i Developer's Guide. KaĹźda z nich ma, niestety, swoje wady. User's Guide, jak wiÄkszoĹÄ tego typu dokumentĂłw, napisanych przez ludzi, dla ktĂłrych wszystko jest juĹź jasne, jest bardzo ogĂłlna i nie odpowiada na wiÄkszoĹÄ pytaĹ pojawiajÄcych siÄ w trakcie pracy, a niektĂłre zagadnienia zostaĹy wrÄcz pominiÄte. Tekst w zasadzie ogranicza siÄ do krĂłtkiej prezentacji opcji programu i niewiele moĹźna znaleĹşÄ w nim odpowiedzi Jak coĹ zrobiÄ. W zaĹoĹźeniu, jak sÄdzÄ, wyjaĹniÄ to miaĹ Developer's Guide, czyli instrukcja dla zaawansowanych, ale ona z kolei koncentruje siÄ na technicznej stronie zagadnieĹ i wymaga wiedzy informatycznej na temat programowania. Dlatego niemal nieocenionÄ pomocÄ staje siÄ lista mailingowa uĹźytkownikĂłw Greenstone'a (rĂłwnieĹź po angielsku) bÄdÄca forum wymiany doĹwiadczeĹ i porad dla "prostych" uĹźytkownikĂłw. Oto przykĹad: z instrukcji dowiedziaĹam siÄ (a raczej wypatrzyĹam na rysunku), Ĺźe pliki moĹźna indeksowaÄ alfabetycznie w podziale na sekcje "literowe", np. A-K, L-R itd., co pozwala na przejrzyste i uporzÄdkowane prezentowanie danych. Z instrukcji nie udaĹo mi siÄ wycisnÄÄ odpowiedzi, jak tego dokonaÄ - informacjÄ, Ĺźe jest to opcja wĹÄczajÄca siÄ automatycznie, jeĹli baza posiada ponad 40 dokumentĂłw, uzyskaĹam dopiero z listy mailingowej.

PomocÄ mogÄ sĹuĹźyÄ teĹź przykĹadowe, proste bazy danych znajdujÄce siÄ na oficjalnej stronie projektu, choÄ nie za wiele moĹźna z nich uzyskaÄ informacji z uwagi na tÄ wĹaĹnie prostotÄ. Nie od rzeczy wreszcie jest stosowanie prostej metody prĂłb i bĹÄdĂłw - wĹÄczanie i wyĹÄczanie rozmaitych opcji, eksperymentowanie z ustawieniami itd. Nie zaszkodzi, a rezultaty mogÄ okazaÄ siÄ warte zachodu.

Kolekcja moĹźe byÄ budowana za pomocÄ dwĂłch narzÄdzi - narzÄdzia GLI (Greenstone Librarian Interface) lub narzÄdzia Colector. Colector jest narzÄdziem bardziej zaawansowanym, gdyĹź praca koncentruje siÄ na tworzeniu pliku konfiguracyjnego bazy, do czego potrzebna jest wiedza informatyczna, natomiast GLI ma formÄ okna z moĹźliwoĹciÄ zaznaczania interesujÄcych uĹźytkownika opcji. DecyzjÄ, w ktĂłrym systemie chcemy pracowaÄ naleĹźy podjÄÄ na poczÄtku, gdyĹź naprzemienne korzystanie z tych dwu narzÄdzi powoduje zawirowania w systemie, ktĂłry nieco "gĹupieje" od nadmiaru funkcji i w takim wypadku moĹźe, np. gubiÄ rekordy lub nie pozwalaÄ na edycjÄ danych. OsobiĹcie polecam GLI jako narzÄdzie przeznaczone dla mniej zaawansowanych technologicznie uĹźytkownikĂłw, posĹugujÄcych siÄ raczej wiedzÄ intuicyjnÄ niĹź technicznÄ. GLI jest dostÄpne w dwĂłch wersjach: jako aplet Javy uruchamiany ze strony www lub aplikacja systemu Windows. Ta pierwsza wersja przeznaczona jest dla uĹźytkownikĂłw systemu Linux i tylko w tym systemie dziaĹa prawidĹowo. UĹźytkownicy Windowsa powinni zainstalowaÄ na swoich komputerach przeznaczonÄ dla tego systemu operacyjnego aplikacjÄ, aby mieÄ pewnoĹÄ, Ĺźe Greenstone bÄdzie dziaĹaĹ prawidĹowo, a podczas pracy nad programem nie wystÄpiÄ Ĺźadne nieprzyjemne niespodzianki. Greenstone nie oferuje niestety narzÄdzia w jÄzyku polskim, ale istnieje moĹźliwoĹÄ ustawienia polskiej wersji jÄzykowej przy prezentacji danych.

Budowanie kolekcji nie jest czynnoĹciÄ zbyt skomplikowanÄ. Nie trzeba zaczynaÄ od zera - program oferuje standardowy interfejs, ktĂłrego modyfikacja zaleĹźy tylko od potrzeb i fantazji uĹźytkownika. Automatycznie pojawia siÄ narzÄdzie wyszukiwawcze (ktĂłre moĹźna zmieniaÄ i ustawiaÄ wedle potrzeby) oraz indeks nazw plikĂłw (moĹźliwy do usuniÄcia). Tworzenie kolekcji z narzÄdzi GLI skĹada siÄ z czterech krokĂłw. Po zainicjowaniu tworzenia nowej kolekcji (opcja NOWA KOLEKCJA ) i wybraniu standardu opisu metadanych (polecany standard Dublin Core jako najbardziej uniwersalny i pozwalajÄcy na szczegĂłĹowy opis zasobu) system prosi o nazwanie naszej bazy danych i zdefiniowanie jej zawartoĹci. Te informacje pojawiÄ siÄ na stronie przeznaczonej dla uĹźytkownika i pozwolÄ mu zorientowaÄ siÄ, jakie dane znajdujÄ siÄ w bazie. Nie jest konieczne wpisywanie ostatecznej wersji tegoĹź opisu, gdyĹź informacja ta moĹźe zostaÄ pĂłĹşniej zmodyfikowana. Dalsze etapy pracy to: wybieranie plikĂłw do kolekcji (zakĹadka GATHER), uzupeĹnianie metadanych (ENRICH), modyfikowanie wyglÄdu i prezentacji danych w kolekcji (DESIGN) oraz zapisywanie danych i wszelkich zmian dokonanych w bazie (CREATE).

Dane (w formie plikĂłw) wprowadzane sÄ do kolekcji (w zakĹadce GATHER) za pomocÄ prostej metody przeciÄgnij i upuĹÄ. Pliki mogÄ byÄ czerpane zarĂłwno z twardego dysku komputera, jak i z dyskĂłw zewnÄtrznych (dyskietka, CD-ROM itp.). Pliki w naszej bazie mogÄ istnieÄ "indywidualnie" lub zostaÄ umieszczone w katalogach, porzÄdkujÄcych je np. tematycznie. Pozwala to pĂłĹşniej na szybszy i mniej pracochĹonny opis danych, np. wprowadzajÄc do bazy kilka lub kilkanaĹcie plikĂłw graficznych o zawartoĹci dotyczÄcej tego samego wydarzenia - zamiast kilka razy wpisywaÄ kaĹźdemu z nich oddzielnie te same metadane, wystarczy, Ĺźe zostanÄ one wprowadzone raz na poziomie katalogu. NaleĹźy pamiÄtaÄ, Ĺźe matadane nadane na poziomie katalogu sÄ nadrzÄdne wobec metadanych na poziomie pliku z tego katalogu. Zadanie katalogĂłw jest jedynie porzÄdkujÄce - podczas prezentacji rekordĂłw pliki, mimo iĹź znajdujÄ siÄ we wspĂłlnym katalogu i majÄce same metadane, prezentowanie sÄ jako oddzielne rekordy bazy. NaleĹźy zwrĂłciÄ uwagÄ, aby pliki, ktĂłre chcemy doĹÄczyÄ do bazy nie miaĹy w nazwie polskich znakĂłw diakrytycznych, gdyĹź takie system po prostu zignoruje.

Po umieszczeniu plikĂłw w bazie naleĹźy przejĹÄ do zakĹadki ENRICH i uzupeĹniÄ metadane. Jest to waĹźna i niezbÄdna czynnoĹÄ, gdyĹź pliki nieopisane sÄ niewidoczne dla uĹźytkownika. Dzieje siÄ tak, poniewaĹź rekordy sÄ prezentowanie za pomocÄ indeksĂłw - jeĹli np. pole tytuĹ nie zostanie wypeĹnione, system nie zauwaĹźy rekordu i tym samym go nie wyĹwietli; nie bÄdzie takĹźe moĹźliwoĹci wyszukania go. Metadane zawarte w opisie pliku sÄ w peĹni edytowalne, co znaczy, Ĺźe moĹźna je zmieniaÄ, uzupeĹniaÄ, modyfikowaÄ, uaktualniaÄ i usuwaÄ (z wyjÄtkiem danych technicznych, samodzielnie uzupeĹnianych przez system, takich jak nazwa, rozmiar pliku itp.). Ponadto wszystkie pola opisu danych sÄ powtarzalne. Nie jest koniecznym wypeĹnianie wszystkich pĂłl opisu pliku w standardzie DC.

DuĹźym uĹatwieniem przy wprowadzaniu metadanych jest to, iĹź system zapamiÄtuje wprowadzone juĹź frazy i hasĹa, automatycznie tworzÄc wewnÄtrzne sĹowniki i pozwalajÄc na bieĹźÄco ĹciÄgaÄ potrzebne hasĹa. Pozwala to na ujednolicanie haseĹ (np. przedmiotowych, nazwisk) w bazie, unikniÄcie chaosu i baĹaganu w danych oraz oszczÄdza czas potrzebny na uzupeĹnienie metadanych, co w przypadku wiÄkszych baz rĂłwnieĹź ma swojÄ wagÄ. DuĹźym plusem jest teĹź moĹźliwoĹÄ hierarchizacji sĹĂłw kluczowych i haseĹ przedmiotowych. NastÄpna w kolejnoĹci zakĹadka DESIGN sĹuĹźy do konfigurowania wyglÄdu bazy i pozwala na indywidualne ustawienie interfejsu uĹźytkownika. Podzielona zostaĹa na kilka sekcji, w ktĂłrych moĹźna ustaliÄ zakres przeszukiwania plikĂłw, stworzyÄ indeksy, ustawiÄ zewnÄtrzny wyglÄd bazy.

Zakresy wyszukiwania plikĂłw i przeszukiwania ich treĹci definiujÄ sekcje SEARCH TYPES oraz SEARCH INDEXES. NarzÄdzie wyszukiwawcze jest tworzone automatycznie przez program (SEARCH), a do uĹźytkownika naleĹźy jedynie zdefiniowanie pĂłl wyszukiwawczych. Zakres przeszukiwania bazy koryguje siÄ przez wskazanie elementĂłw (metadanych), jakie majÄ byÄ brane pod uwagÄ przez system oraz zdefiniowanie, czy narzÄdzie ma jako wynik wskazywaÄ dokumenty (jako wynik otrzymamy listÄ rekordĂłw), sekcje czy akapity, gdzie wystÄpuje szukane sĹowo (dokĹadniejsze wskazania). Istnieje moĹźliwoĹÄ przeszukiwania kilku baz jednoczeĹnie. Opcja wyszukiwania krzyĹźowego (CROSS_COLLECTION SEARCH) dziaĹa jednak niestety tylko wtedy, kiedy bazy majÄ identyczny interfejs (ujednolicony wyglÄd prezentacji danych), w przeciwnym wypadku, choÄ rekordy mogÄ zostaÄ odnalezione, wyglÄd bazy moĹźe siÄ "rozjechaÄ" i korzystanie z niej bÄdzie utrudnione.

Klasyczne indeksy tworzone sÄ w sekcji BROWSING CLASSIFIERS. Teoretycznie moĹźna stworzyÄ tyle indeksĂłw, ile jest elementĂłw opisu. Tworzenie indeksĂłw jest czynnoĹciÄ dosyÄ prostÄ - poniewaĹź istniejÄ gotowe schematy, naleĹźy po prostu wybraÄ jeden i wypeĹniÄ go danymi, takimi jak gĹĂłwny element wyszukiwawczy (np. tytuĹ) i element porzÄdkujÄcy (np. autor). Po wybraniu takich danych powstanie prosty indeks tytuĹowy z rekordami uĹoĹźonymi w kolejnoĹci alfabetycznej wg nazwisk autorĂłw. Niestety, mimo dostÄpnoĹci polskiej wersji strony, program nie rozpoznaje polskich znakĂłw diakrytycznych, co sprawia, Ĺźe podczas szeregowania metadanych w indeksach nie bierze ich pod uwagÄ, ukĹadajÄc kolejnoĹÄ wedĹug nastÄpnej litery (np. nazwisko Ĺlusarczyk znajdzie siÄ pod literÄ L).

Obok indeksĂłw prostych istniejÄ takĹźe indeksy hierarchiczne, gdzie prezentowane dane mogÄ byÄ podzielone na hasĹa gĹĂłwne i podrzÄdne. Taki sposĂłb moĹźna wybraÄ przy tworzeniu indeksĂłw sĹĂłw kluczowych czy haseĹ przedmiotowych z zastrzeĹźeniem, Ĺźe metadane: SĹowa kluczowe czy HasĹa przedmiotowe rĂłwnieĹź muszÄ byÄ zhierarchizowane (w zakĹadce ENRICH). ZupeĹnie odrÄbnÄ budowÄ ma indeks chronologiczny, ktĂłry moĹźna konfigurowaÄ z podziaĹem na lata a nawet miesiÄce. Automatycznie "na wejĹcie" system samoczynnie tworzy indeks nazw plikĂłw, ktĂłry rĂłwnieĹź moĹźna modyfikowaÄ, a w razie potrzeby usunÄÄ bez Ĺźadnych konsekwencji.

WyglÄd bazy, czyli sposĂłb prezentacji rekordĂłw ustala siÄ w zakĹadce FORMAT FEATURES. W tym miejscu naleĹźy stworzyÄ formaty (schematy) wyglÄdu bazy, takie jak sposĂłb prezentacji indeksĂłw, rekordĂłw, wyszczegĂłlnienie, jakie metadane majÄ byÄ prezentowane i tym podobne. System oferuje schematy uniwersalne, ktĂłre moĹźna zostawiÄ bez zmian, ale moĹźna stworzyÄ wĹasny wyglÄd bazy. Formaty te tworzone sÄ w jÄzyku html. Cala praca nad stworzeniem bazy znajduje finaĹ w ostatniej zakĹadce: CREATE. Tutaj buduje siÄ kolekcjÄ na serwerze i zapisuje wszelkie zmiany. Mimo istnienia w programie opcji SAVE bezpieczniej jest zapisywaÄ wszelkie zmiany wĹaĹnie w tym miejscu, gdyĹź daje to pewnoĹÄ, Ĺźe Ĺźadne dane na pewno siÄ nie "zagubiÄ".

JeĹli opis dziaĹania programu i tworzenia kolekcji wydaje siÄ skomplikowany, to nic bardziej mylnego. Wbrew pozorom system jest, moĹźe nie rozpaczliwie prosty, ale i nie strasznie skomplikowany. Jest idealnym rozwiÄzaniem do tworzenia baz danych zawierajÄcych zdjÄcia czy dokumenty. PojemnoĹÄ opisu metadanych sprawia, Ĺźe w bazie danych znajdujÄ siÄ wszystkie potrzebne informacje, elastyczne narzÄdzia wyszukiwawcze pozwalajÄ na wyszukiwanie konkretnych danych, a moĹźliwoĹÄ regulowania dostÄpu do kolekcji daje pewnoĹÄ, Ĺźe nikt niepowoĹany tam nie zajrzy. No i "last but not least" swojÄ wagÄ ma takĹźe fakt, Ĺźe nie trzeba na system wydawaÄ grubych tysiÄcy. To wszystko sprawia, Ĺźe warto, moim zdaniem, zainwestowaÄ trochÄ czasu, aby poznaÄ Greenstone'a i zobaczyÄ samemu, co potrafi i do czego moĹźe byÄ przydatny.

Aby dowiedzieÄ siÄ wiÄcej o systemie Greenstone, zajrzyj na:

Greenstone - oficjalna strona projektu - http://www.greenstone.org/cgi-bin/library
New Zealand Digital Library Project - http://www.sadl.uleth.ca/nz/cgi-bin/library
PodrÄczniki systemu Greenstone - http://greenstone.sourceforge.net/wiki/index.php/Manual
PrzykĹadowe kolekcje demo - http://greenstone.sourceforge.net/wiki/index.php/Example_collections
Archiwalna kolekcja e-maili uĹźytkownikĂłw listy mailingowej Greenstone'a - http://www.sadl.uleth.ca/nz/cgi-bin/library?a=p&p=about&c=gsarch-e
UNESCO MOST Digital Library - baza stworzona za pomocÄ systemu Greenstone - http://digital-library.unesco.org/shs/most/gsdl/cgi-bin/library?c=most&a=p&p=about


	Co z tym Greenstone'm? / Joanna Piotrowska// W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska. - Nr 7/2006 (77) lipiec. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2006. - Tryb dostępu: http://www.ebib.info/2006/77/piotrowska.php. - Tyt. z pierwszego ekranu. - ISSN 1507-7187

Joanna Piotrowska Biblioteka â OĹrodek Dokumentacji Krajowa SzkoĹa Administracji Publicznej

Co z tym Greenstone'm?

Joanna Piotrowska
Biblioteka â OĹrodek Dokumentacji
Krajowa SzkoĹa Administracji Publicznej