EBIB 
Nr 6/2004 (57), Informacja w sieci. Artykuł
  Poprzedni artykuł Następny artykuł   

 


Lidia Derfert-Wolf
Akademia Techniczno-Rolnicza w Bydgoszczy
Biblioteka Główna

Serwisy tematyczne o kontrolowanej jakości w Internecie - subject gateways


Początki korzystania z Internetu to etap entuzjazmu nad niewiarygodnymi możliwościami komunikowania, publikowania i wyszukiwania informacji w sieci. Ci, którzy nabyli umiejętności odnajdywania dokumentów, poznali działanie wyszukiwarek i wiedzą, ile cennych informacji jest poza ich zasięgiem, przekonali się szybko, że narzędzia typu Google nie wystarczają do tematycznego przeszukiwania sieci. Ponadto pojawił się problem porządkowania i jakości informacji, szczególnie potrzebnej dla nauki i edukacji. We wczesnej fazie rozwoju Internetu rozwiązaniem były katalogi tematyczne typu directory (np. Yahoo!), grupujące witryny według popularnych dziedzin. Doborem witryn zajmowali się ludzie, którzy na podstawie przeglądu strony decydowali o jej umieszczeniu w danej kategorii. Narzędzia te rejestrowały zasoby całej sieci i nie posługiwały się określonymi kryteriami doboru źródeł czy ich opisu i klasyfikacji. Rzadko również uwzględniały zasoby tzw. sieci ukrytej (deep web, invisible web), która pod względem wielkości ok. 500-krotnie przewyższa sieć "widoczną" (surface web) [2]

Równolegle do katalogów tematycznych, które obecnie przekształciły się w wielkie portale, powstawały niezależne listy linków uporządkowanych według tematów lub rodzajów informacji (katalogi biblioteczne, encyklopedie, informatory). Najwięcej z nich do tej pory spotkać można w witrynach bibliotek, również polskich [4] [6] [9]. Ich jakość niekiedy pozostawia wiele do życzenia, a metodologia doboru linków, ich opisu i aktualizacji jest bardzo zróżnicowana i rzadko opisana w serwisie. Działy tematyczne najczęściej odzwierciedlają dziedziny reprezentowane w danej uczelni bądź wszystkie tematy, jeśli wykaz tworzy biblioteka publiczna [6]. Do rzadkości należy możliwość wyszukiwania poprzez zadawanie pytań. Najczęściej mamy do wyboru jedynie wertowanie według tematów. Ciekawe rozwiązanie zastosowano w witrynie Działu Informacji Bibliografii WiMBP w Łodzi (http://www.wimbp.lodz.pl/informacja), gdzie linki uporządkowane są według UKD, zaopatrzone w krótkie adnotacje i jednocześnie można je przeszukiwać, zadając pytania prostej wyszukiwarce [6]. Tworzenie i stałe aktualizowanie tego typu przewodników jest z pewnością bardzo pracochłonne i obecny ich kształt nie spełnia do końca wymagań profesjonalnych narzędzi, posługujących się np. kontrolowanym słownikiem haseł przedmiotowych. Warto byłoby z pewnością połączyć wysiłki np. w ramach uczelni o podobnym profilu kształcenia i tworzyć jeden serwis krajowy z danej dziedziny, bazując oczywiście na najlepszych wzorcach i już istniejących wykazach. Podobnie jak to zrobiliśmy w przypadku jednego wykazu witryn i katalogów bibliotek w EBIB.

Kolejnym etapem w światowym Internecie było projektowanie i rozwijanie przewodników po sieci, później portali tematycznych, współtworzonych głównie przez bibliotekarzy. W odróżnieniu od katalogów typu Yahoo!, serwisy te zawierają w większości krótkie opisy cytowanych źródeł sieciowych oraz często są uporządkowane według określonej klasyfikacji. Najstarszy tego typu katalog WWW Virtual Library (http://www.vlib.org/) jest tworzony przez wolontariuszy z całego świata i zawiera 312 odrębnych, tematycznych „bibliotek wirtualnych”. Kolejne indeksy - Librarian’s Index to the Internet czy BUBL LINK / 5:15 - zostaną omówione w dalszej części, ponieważ są przykładami serwisów typu subject gateways, omawianymi w niniejszym artykule. Tego typu serwisy różnią się od wspomnianych wyżej przede wszystkim poziomem jakości prezentowanych linków oraz strukturą organizacyjną i metodami gromadzenia danych.

"Subject gateways” - pojęcia ogólne, definicje

W odpowiedzi na zapotrzebowanie na uporządkowany tematycznie dostęp do wysokiej jakości źródeł, głównie dla środowisk naukowych, powstały nowe typy serwisów, nazywane ogólnie subject gateways. Są to dziedzinowe przewodniki (miejsca startowe) po zasobach internetowych (dokumentach, obiektach, witrynach, serwisach), uporządkowane według dziedzin. Zasoby są selekcjonowane, oceniane, opisywane i katalogowane przez bibliotekarzy lub ekspertów z danej dziedziny. Subject gateways są najczęściej ukierunkowane na dziedziny związane z obszarami zainteresowań akademickich. Linki zgromadzone w tych serwisach dobiera się zgodnie z oficjalnie opublikowaną listą kryteriów oceny jakości, a później kataloguje się je i opisuje również według powszechnie stosowanych systemów klasyfikacyjnych.

W porównaniu z ogólnymi i niekiedy przypadkowymi wykazami linków subject gateways są bardziej pracochłonne, ale w rezultacie dają zbiór (bazę danych) o kontrolowanej jakości, przeszukiwany według słów kluczowych i/lub do wertowania według kategorii tematycznych. Rezultaty zawierają standardowe opisy, które umożliwiają użytkownikom ocenę przydatności informacji. Ogólnie rzecz ujmując, tego typu serwisy pomagają w wyszukiwaniu informacji tematycznej i dają gwarancję odnajdywania źródeł o wysokiej jakości.

Termin subject gateways, przyjęty dla potrzeb niniejszego artykułu w oryginale z powodu braku dobrego, polskiego tłumaczenia, jest pewnym uproszczeniem. Podana wyżej krótka charakterystyka odnosi się do serwisów, których przykłady podano poniżej, zwanych w literaturze również: subject-based information gateways (SBIGs), quality-controlled subject gateways, subject-based gateways, subject index gateways, virtual libraries, clearing houses, subject trees. Najczęściej spotykanym i zdaje się najwłaściwszym jest pojęcie subject-based information gateways (SBIGs), wprowadzone w trakcie realizacji projektu DESIRE (opis poniżej). Natomiast najczęściej cytowana definicja tego typu serwisów jest autorstwa T. Kocha i ujmuje ona quality-controlled subject gateways jako serwisy internetowe, wykorzystujące bogaty zestaw wskaźników jakości, pomagający systematycznie wyszukiwać źródła. Do zapewnienia doboru źródeł, zgodnie z kryteriami jakościowymi oraz ich opisu na podstawie standardowych metadanych, wkłada się znaczny trud intelektualny. Natomiast gwarancją regularnej aktualizacji i kontroli linków jest profesjonalne zarządzanie ich kolekcją. Głównym celem tych serwisów jest umożliwienie dziedzinowego dostępu do źródeł o wysokiej jakości poprzez indeksowanie zasobów Internetu przy pomocy słowników kontrolowanych oraz poprzez organizację linków według głębokiej struktury tematycznej, umożliwiającej jej przeglądanie (wertowanie) oraz przeszukiwanie [8]

Dla zobrazowania charakterystyki subject gateways na poniższych rysunkach przedstawiono witrynę przykładowego serwisu (rys. 1) oraz rekord bibliograficzny z tego samego serwisu, opisujący źródło internetowe (rys. 2). Ilustracje te będą z pewnością pomocne przy lekturze dalszej części artykułu.



Rys. 1. Witryna serwisu EEVL - The Internet Guide to Engineering, Mathematics and Computing.



Rys. 2. Rekord bibliograficzny źródła internetowego w serwisie EEVL - The Internet Guide to Engineering, Mathematics and Computing.

Cechy charakterystyczne i metodologia tworzenia

Szczegółowa charakterystyka subject gateways wymagałaby kilku publikacji. Niniejszy artykuł wskazuje jedynie w dużym skrócie na najważniejsze aspekty ich funkcjonowania,. W literaturze krajowej brak dokładnych i analitycznych opracowań na ten temat. Materiał zebrano na podstawie literatury zagranicznej [1] [3] [5] [8] i przeglądu witryn internetowych.

Przykładowe serwisy typu subject gateways opisano w dalszej części. Pełniejsze zestawienie adresów umieszczono w niniejszym numerze Biuletynu EBIB w dziale „Warto wiedzieć”: Serwisy tematyczne o kontrolowanej jakości w Internecie - subject gateways. Wykaz, gdzie znaleźć można adresy wszystkich cytowanych subject gateways i projektów międzynarodowych. Omówione poniżej cechy stanowiły podstawę wypracowania przez T. Kocha definicji serwisów quality-controlled subject gateways oraz stanowią zestaw kryteriów, według których można stwierdzić, czy jakikolwiek serwis, grupujący linki do ciekawych stron internetowych, spełnia wymagania subject gateways, a dokładniej quality-controlled subject gateways czy subject-based information gateways (SBIGs) [8]

1) Zakres, wielkość baz danych, zawartość

Subject gateways są w większości tworzone na terenie jednego kraju/regionu bądź przez pojedyncze instytucje. W przeważającej liczbie gromadzą źródła anglojęzyczne i/lub źródła w języku danego kraju. Najczęściej reprezentowane typy indeksowanych źródeł to: pełne teksty dokumentów, witryny organizacji, bazy danych, spisy linków, serwisy, materiały komercyjne, oprogramowania, książki elektroniczne, dokumenty multimedialne. Dominującym formatem dokumentów jest HTML. Serwisy liczą od ok. 2 tys. do ponad 10 tys. linków. Większość z nich nie ogranicza doboru do miejsca posadowienia dokumentu (terytorium). Tematyka jest zazwyczaj ograniczona do jednej dziedziny wiedzy, np. rolnictwa, medycyny. Rzadziej spotykane są indeksy ogólne.

2) Zarządzanie kolekcją linków

Zarządzanie kolekcją jest w tym przypadku pojęciem bardzo szerokim i obejmuje zarówno gromadzenie źródeł (wyszukiwanie w sieci), jak i opracowanie oraz utrzymanie zbioru opisów bibliograficznych w bazie danych. W tym miejscu warto wspomnieć o tym, kto tworzy subject gateways. Pierwsze tego typu serwisy powstawały w wielkich bibliotekach z inicjatywy bibliotekarzy (BUBL, LII). Ze względu na wymaganą wysoką jakość przy wyszukiwaniu i katalogowaniu źródeł do współpracy przystąpili eksperci z odpowiednich dziedzin. Wiele serwisów umożliwia zgłaszanie źródeł przez użytkowników sieci, którzy muszą podać adres URL, krótki opis oraz słowa kluczowe. Jednak zawsze w takim przypadku zgłoszenie jest weryfikowane, opis uzupełniany i dodawane dodatkowe elementy do rekordu bibliograficznego. Zajmują się tym redaktorzy serwisów. Korzystając z takiej możliwości, zgłoszono np. polską bazę danych BAZTECH do kilku prestiżowych subject gateways z zakresu nauk technicznych (rys. 2). Odpowiedzialnymi za tworzenie są najczęściej uczelnie, a finansowanie pozostaje w gestii odpowiednich ministerstw, agencji rządowych czy fundacji i dodatkowo sponsorów. Bardzo dużo subject gateways powstało lub było wspieranych metodologicznie w ramach projektów finansowanych przez UE. Polityka gromadzenia i opracowania źródeł internetowych oraz utrzymania zbioru opisów opiera się na opublikowanych zasadach (niekoniecznie dostępnych w sieci). Należy pamiętać, że selekcja zasobów nie odbywa się automatycznie, ale manualnie - ludzie gromadzą i oceniają dokumenty. Jeśli chodzi o dobór źródeł, zasady dotyczą głównie kompletności i zakresu kolekcji, biorąc pod uwagę odbiorców, dla których jest serwis tworzony. Należy sprecyzować zakres tematyczny, akceptowane typy dokumentów, poziom prezentowanej informacji, rodzaj dostępu (koszty, wymagane hasła), stosowane w witrynach technologie, terytorium, język. Kolejne ważne dokumenty i instrukcje koncentrują się wokół jasnych i klarownych kryteriów oceny dokumentów. Najczęściej są to:

  • kryteria oceny zawartości (ocena informacji zawartych w źródle) - wiarygodność, autorstwo i reputacja, dokładność, kompletność, unikalność, układ i organizacja treści, aktualność, zgodność z wymaganą tematyką;
  • kryteria oceny formy - łatwość nawigacji, pomoce dla użytkowników, korzystanie ze standardowych rozwiązań technicznych, estetyka.

Z kolei polityka utrzymywania kolekcji linków i ich opisów powinna gwarantować aktualność całego serwisu. Dotyczy to systematycznego sprawdzania rekordów pod kątem zmian i kontroli, czy opis jest nadal adekwatny do źródła (np. uzupełniania adnotacji o nowości w wyszukanych źródłach), regularnego aktualizowania kolekcji (dodawania nowych linków z określoną częstotliwością), sprawdzania linków już zarejestrowanych w bazie.

3) Oprogramowanie

Wdrożenie i eksploatacja subject gateways wymaga korzystania ze specjalistycznych programów do przechowywania danych (niekiedy kopii witryn), indeksowania źródeł oraz wyszukiwania. W zależności od serwisu są to programy darmowe lub komercyjne. Większość europejskich systemów wykorzystuje pakiet opracowany w ramach projektu ROADS, o którym będzie mowa w dalszej części artykułu. Opisy (adnotacje, abstrakty, symbole klasyfikacyjne) przechowywane są w bazie danych. Wyszukiwanie odbywa się zazwyczaj przy pomocy interfejsu opartego na przeglądarkach WWW i daje do dyspozycji użytkownikom kilka poziomów zaawansowania oraz techniki przypominające wyszukiwanie w profesjonalnych bazach danych. Witryny będące rezultatem wyszukiwania są najczęściej w języku HTML lub Java.

4) Metadane i opis zawartości

Źródła sieciowe w subject gateways są katalogowane pod względem formalnym (np. autor/twórca, tytuł, data, adres URL, typ dokumentu, język, data skatalogowania, nazwisko katalogującego) według standardowych formatów. Zwykle jest to Dublin Core albo RDF [10] [11] [12]. Nie wszystkie serwisy ujawniają to w swoich witrynach. W niektórych można po wyszukaniu opisu źródła wybrać opcję wyświetlania rekordu w formacie np. Dublin Core, podobnie jak w systemach bibliotecznych - MARC. Opis przedmiotowy tworzony jest dla indywidualnego źródła również zgodnie ze standardami, ale o zdecydowanie wyższej jakości niż ma to miejsce w przypadku stron internetowych, gdzie w dokumencie HTML, w polu "keywords" czy "description" wpisywane są dowolne treści, niekiedy nie mające związku z dokumentem. W subject gateways obowiązują publikowane zasady opisu dokumentu (źródła sieciowego), który jest przeważnie sformalizowaną i spójną adnotacją, streszczeniem lub recenzją opracowywaną zawsze przez specjalistę z danej dziedziny. To właśnie jedna z cech odróżniających te serwisy od zwykłych wyszukiwarek, gdzie opisem jest najczęściej uzyskiwany automatycznie początek albo fragment tekstu dokumentu. Większość metadanych w subject gateways jest wyświetlana jako rezultat wyszukiwania (opis bibliograficzny źródła) i już na tym etapie - zanim połączymy się ze wskazanym źródłem - możemy na podstawie metadanych ocenić wstępnie jego wartość i przydatność do dalszej pracy.

5) Dostęp dziedzinowy

Jako minimalne wymaganie dla przedmiotowego opisu źródła i dostępu do źródeł w subject gateways uważa się wysoki poziom jakościowy kategorii tematycznych, porządkujących zasób i dostępnych dla użytkownika do ich przeglądania. Drugim podstawowym warunkiem jest indeksowanie źródeł według niekontrolowanych słów kluczowych, wspomagających proces wyszukiwania. Głęboka struktura hierarchiczna oparta na znanych systemach klasyfikacyjnych i indeksowanie na podstawie kontrolowanych słowników (np. tezaurusy, biblioteczne systemy klasyfikacyjne) wskazuje na wysoki poziom subject gateways [8] [16]. Do najczęściej wykorzystywanych klasyfikacji należą:

  • klasyfikacje uniwersalne, np. Uniwersalna Klasyfikacja Dziesiętna, Klasyfikacja Dziesiętna Deweya, Klasyfikacja Biblioteki Kongresu,
  • ogólne klasyfikacje narodowe, np. holenderska Nederlandse Basisclassificatie, szwedzka Sveriges Allmänna Biblioteksförening,
  • klasyfikacje specjalistyczne, np. klasyfikacja NLM (National Library of Medicine), Ei Engineering Information Classification Codes, MSC Mathematics Subject Classification.

Natomiast najpowszechniej stosowanymi tezaurusami są: Ei thesaurus (nauki techniczne), HASSET thesaurus (nauki społeczne), MeSH thesaurus (medycyna), Arts and Architecture Thesaurus (architektura i sztuka), Thesaurus of Geographic Names, hasła przedmiotowe Biblioteki Kongresu LCSH i CAB (rolnictwo).

6) Dodatkowe możliwości

Większość subject gateways umożliwia zarówno wyszukiwanie według terminów, jak również przeglądanie bazy danych opisów źródeł. Końcowym rezultatem jest bezpośrednie połączenie (link) do określonej witryny czy serwisu. Podstawowe techniki wyszukiwania są zbliżone do technik powszechnie stosowanych w wyszukiwarkach. Jednakże na poziom danego subject gateway wpływa umożliwienie wyszukiwania przy pomocy złożonych zapytań z użyciem operatorów Boole’a, możliwość „maskowania” końcówek, korzystania z tezaurusów, ograniczania rezultatów do ściśle określonego terytorium, języka czy typu dokumentu. Niektóre pozwalają nawet ograniczyć wybór do poziomu źródła, czyli wybrać materiały odpowiednie dla uczniów, studentów czy naukowców. Do innych możliwości i elementów wybranych subject gateways, poza interfejsem do wyszukiwania, należą:

  • lokalne przechowywanie kopii skatalogowanych źródeł internetowych (dotyczy to wyłącznie statycznych witryn),
  • podręczniki on-line na tematy wyszukiwania informacji w sieci,
  • listy dyskusyjne dla użytkowników, kalendarze wydarzeń, linki do witryn ekspertów,
  • linki do księgarń, serwisów o pracy i wiele innych.

7) Współdziałanie

Kolejnym etapem w rozwoju subject gateways jest tworzenie wspólnych "bramek" wyszukiwawczych dla kilku serwisów. Istnieje już kilka projektów (np. Renardus, RDN), jednoczących subject gateways i tworzących serwisy typu cross-searching, których celem jest jednoczesne przeszukiwanie kilku gateway [7] [13]. Może to się odbywać na poziomie krajowym albo tematycznym. Współpraca polega albo wyłącznie na umożliwianiu wyszukiwania w kilku bazach jednocześnie, albo dodatkowo na współkatalogowaniu zasobów internetowych. W pierwszym przypadku poszczególne serwisy nie zmieniają zasad swojego funkcjonowania i nadal pozostają niezależne. Jednak dla użytkowników w wielu sytuacjach może być cenniejszy dostęp do wielu indeksów z jednego miejsca. Podstawowym i koniecznym warunkiem do współdziałania różnych serwisów jest stosowanie standardowych metod opisów danych (np. Dublin Core czy RDF) oraz standardów umożliwiających jednoczesne wyszukiwanie (np. Z39.50). Wymieniane niżej europejskie projekty (ROADS, DESIRE) dotyczyły wypracowywania metod i narzędzi programowych, pomocnych w tworzeniu wspólnych interfejsów dla kilku samodzielnych subject gateways.

Projekty wspomagające tworzenie subject gateways, współpraca międzynarodowa

Pierwsze typowe serwisy subject gateways z określonej dziedziny wiedzy powstawały w Europie w latach 90. głównie w Wielkiej Brytanii w ramach programu eLib (ADAM, EEVL, Sosig) czy w Szwecji (Engineering E-Library, EELS). W celu ujednolicenia prac, wspomagania ich rozwoju oraz opracowywania wskazówek dla twórców nowych serwisów realizowano kilka ważnych projektów międzynarodowych [15] Poniżej omówione zostaną cztery z nich: ROADS, DESIRE, IMesh oraz Renardus.

ROADS http://www.ilrt.bris.ac.uk/roads/
Program był realizowany w ramach eLib przy współpracy Wydziału Informatyki na Politechnice w Loughborough, Instytutu Kształcenia i Badań na Uniwersytecie w Bristol oraz UKOLN (UK Office for Library and Information Networking) na Uniwersytecie w Bath i miał następujące cele:

  • opracowanie pakietu oprogramowania i narzędzi do tworzenia i utrzymania subject-specific gateways,
  • opracowanie metod tworzenia serwisów typu cross-searching i współdziałania pomiędzy gateways,
  • udział w rozwijaniu standardów indeksowania, katalogowania i wyszukiwania tematycznego źródeł internetowych.

Oprogramowania ROADS są wykorzystywane przez wiele europejskich subject gateways, m.in. ADAM, Biz/ed, EELS, Finnish Virtual Library, OMNI, Sosig. Mimo że projekt został zakończony, narzędzia i metody wypracowane w trakcie jego realizacji nadal służą wszystkim nowym twórcom subject gateway i są udostępniane poprzez witrynę internetową.

DESIRE http://www.desire.org
Projekt DESIRE (Development of a European Service for Information on Research and Education), realizowany był w latach 1998-2000 w ramach EU Telematics Application Programme, we współpracy 10 instytucji z krajów europejskich (Holandia, Norwegia, Szwecja i Wielka Brytania). Skupiał się na promowaniu, ulepszaniu i łączeniu istniejących sieci informacyjnych dla użytkowników z obszarów nauki w Europie. Badania prowadzono w trzech kierunkach: przechowywanie kopii dokumentów on-line najczęściej wykorzystywanych przez użytkowników (caching), łączenie manualnego katalogowania zasobów sieciowych z automatycznym indeksowaniem WWW (resource discovery) oraz łączenie niezależnych subject gateways w serwisy na wielką skalę dające jeden punkt startowy do wyszukiwania informacji (directory services). Z jednej strony rezultaty DESIRE mają dać naukowcom efektywny dostęp do zasobów sieciowych o wysokiej jakości, a z drugiej - "miejsce startowe" dla bibliotekarzy i instytucji zainteresowanych problemami katalogowania, indeksowania zasobów sieciowych oraz w ogóle tworzenia subject gateways i ich międzynarodowych sieci [18] Opracowano bogatą kolekcję narzędzi programowych, raportów, procedur i poradników, które są bezpłatnie dostępne w sieci. Do godnych polecenia i wykorzystania należą m.in.:

  • DESIRE Information Gateways Handbook http://www.desire.org/handbook/ - podręcznik dla twórców portali sieciowych o kontrolowanej jakości, składający się z trzech części: zagadnienia strategiczne dla zarządzających i sponsorów, zagadnienia związane z gromadzeniem i opracowaniem informacji dla ekspertów dziedzinowych i specjalistów ds. informacji, zagadnienia techniczne. W podręczniku są też wymienione kryteria oceny jakości źródeł (Quality selection: ensuring the quality of your collection http://www.desire.org/handbook/2-1.html) oraz zasady zarządzania kolekcją linków (Collection management http://www.desire.org/handbook/2-6.html).
  • Podręcznik on-line „Internet Detective” o tym, jak szukać i jak oceniać informacje w sieci http://www.sosig.ac.uk/desire/internet-detective.html.

IMesh: International Collaboration on Internet Subject Gateways http://www.imesh.org
Międzynarodowa inicjatywa powstała w celu wspierania komunikacji i współpracy pomiędzy twórcami subject gateway i innymi grupami instytucji. Skupia się na następujących działaniach i inicjatywach:

Renardus http://www.renardus.org
Renardus umożliwia wyszukiwanie wśród zebranych i dokładnie opisanych przez subject gateways z różnych krajów europejskich źródeł internetowych. Szukać można poprzez zadawanie pytań albo przeglądanie według kategorii tematycznych, uporządkowanych na podstawie UKD. Pytania kierowane są do bazy opisów źródeł (metadanych), a nie ich pełnych tekstów. W rezultacie wyszukiwania otrzymujemy tytuł źródła, hasła przedmiotowe, niekiedy hasło UKD, język, kraj, typ dokumentu, adres URL, opis, nazwa serwisu subject gateway, który źródło zindeksował (rys. 3). Specjalną funkcją serwisu Renardus jest opcja przeglądania (Browse by Subject) według kategorii i podkategorii tematycznych w wersji tekstowej i graficznej. Serwisy uczestniczące w projekcie Renardus (m.in. DutchESS, Danmarks Elektroniske Forskningsbibliotek, Finnish Virtual Library, Geo-Guide, History Guide, MathGuide, NOVAGate, Online theses - Germany, RDN Resource Discovery Network) dostarczają łącznie ok. 64 000 źródeł sieciowych, w przeważającej części zdigitalizowanych, z prawie wszystkich dziedzin nauki, głównie w języku angielskim. Serwis powstał w ramach projektu finansowanego przez Komisję Europejską i jest utrzymywany przez Niedersächsische Staats- und Universitätsbibliothek Göttingen, Germany. Biblioteki uczestniczące tworzą obecnie konsorcjum, którego grupę zarządzającą stanowią: Niedersächsische Staats- und Universitätsbibliothek w Getyndze, NetLab przy szwedzkim Uniwersytecie w Lund, Biblioteka Uniwersytecka w Jyväskylä w Finlandii oraz Institute for Learning and Research Technology w Uniwersytecie w Bristolu.



Rys. 3. Rekordy bibliograficzne źródeł internetowych w serwisie typu cross-searching Renardus.

Przykłady subject gateways

Dla zobrazowania materiału zawartego w niniejszym artykule warto przedstawić bliżej kilka serwisów typu subject gateways. Nie ma oczywiście żadnych wykazów w sieci rejestrujących wszystkie systemy. Zainteresowanych najważniejszymi odsyłam do załącznika Serwisy tematyczne o kontrolowanej jakości w Internecie - subject gateways. Nie ma również standardowej typologii tych serwisów, zwłaszcza że wiele z nich można zaliczyć do kilku grup. Poza tym niektóre działają niezależnie i jednocześnie są częściami systemów typu cross-searching, np. RDN. subject gateways można dzielić według tematyki, języka, terytorium, współpracy i wielu innych. W zakresie tematyki będą to serwisy rejestrujące źródła ogólnodziedzinowe (np. BUBL, LII, ScoutReport, DutchESS) lub dotyczące jednej dziedziny (np. SOSIG, AVEL, Agrigate, Biz/ed). W zakresie terytorium można je dzielić z kolei na takie, które są tworzone na terenie jednego kraju we współpracy kilku instytucji i rejestrują zasoby światowe (np. DutchESS) lub wyłącznie z danego kraju (np. AVEL, Agrigate). Stosując podział według rodzaju współpracy, wyróżnić można serwisy, w których dokonano podziału pracy (dobór, katalogowanie) w ramach jednego subject gateway (np. NOVAGate, DutchESS) albo współpraca dotyczy jedynie wspólnego interfejsu do wyszukiwania w kilku serwisach (np. RDN, Renardus). Poniższe przykłady są najciekawszymi, zdaniem autorki, serwisami, zarówno pod względem tworzenia, jak i współpracy międzynarodowej.

BUBL Information Service http://bubl.ac.uk/
Serwis tworzony przez bibliotekarzy (Centre for Digital Library Research, Strathclyde University, UK), składający się z dwóch modułów:

  • BUBL LINK - linki do wybranych źródeł internetowych ze wszystkich dziedzin wiedzy akademickiej, skatalogowanych według Klasyfikacji Dziesiętnej Deweya i sprawdzanych co miesiąc.
  • BUBL 5:15 - alternatywny interfejs bazujący na hasłach przedmiotowych, opartych na hasłach Biblioteki Kongresu. Nazwa 5:15 pochodzi od założenia, żeby do każdej dziedziny było przypisanych przynajmniej 5 źródeł, ale nie więcej niż 15, mimo że ten ostatni warunek nie zawsze udaje się spełnić.

Oczywiście jest również dostępna opcja wyszukiwania według słów i wyrażeń na trzech poziomach zaawansowania oraz opcja przeglądania według typów dokumentów oraz krajów. W katalogu BUBL zarejestrowanych jest obecnie ponad 11 000 źródeł.

LII, Librarian's Index to the Internet http://lii.org/
Serwis tworzony przez bibliotekarzy amerykańskich (przede wszystkim ze stanu Kalifornia) i finansowany głównie przez US Institute of Museum and Library Services. Rejestruje ponad 14 000 źródeł internetowych dla potrzeb użytkowników bibliotek publicznych w układzie przedmiotowym. Wyszukiwanie ułatwia interfejs do zadawania pytań według dziewięciu różnych kryteriów formalnych i rzeczowych oraz przeglądania zasobów.

RDN, Resource Discovery Network http://www.rdn.ac.uk/
RDN jest wspólnym projektem ponad 70 brytyjskich instytucji naukowych i edukacyjnych oraz Natural History Museum i British Library tworzonym na podstawie subject gateways finansowanych przez JISC's (Joint Information Systems Committee) w ramach programu eLib. RDN jest siecią składającą się z centralnej instytucji - Resource Discovery Network Centre (RDNC) oraz kilku niezależnych serwisów zwanych hubami. Należy wspomnieć, że huby są tworzone również we współpracy wielu uniwersytetów. System RDN jest dostępny bezpłatnie dla wszystkich użytkowników sieci. Poprzez dostęp do ośmiu hubów umożliwia wyszukiwanie spośród ponad 30 000 dokumentów. Gromadzi on źródła starannie selekcjonowane, indeksowane i opisywane przez specjalistów z danej dziedziny. RDN wspiera ponadto współpracujące subject gateways w ich rozwoju, wypracowuje wspólne dokumenty i standardy, dba o promocję oraz szkolenia. Na witrynie RDN znaleźć można m.in. bardzo interesujący zestaw podręczników on-line dla studentów i pracowników szkół wyższych na temat wyszukiwania informacji w Internecie według kilkudziesięciu dziedzin, zaopatrzony w quizy i testy[17]. Najważniejszą funkcją dostępną na stronie RDN jest wyszukiwanie jednoczesne we wszystkich współpracujących hubach (subject gateways) poprzez zadawanie pytań. W rezultacie otrzymujemy rekordy z opisem źródła i wskazaniem jego pochodzenia z danego serwisu. Nie ma w RDN możliwości przeglądania zasobów według dziedzin. Wykonanie tej operacji jest możliwe wyłącznie poprzez wybór odpowiedniego subject gateways (rys. 4):



Rys. 4. Witryna serwisu RDN Resource Discovery Network.

DutchESS, Dutch Electronic Subject Service http://www.kb.nl/dutchess/index.html
Holenderski narodowy subject gateway, ukierunkowany na środowisko akademickie, utworzony przez Bibliotekę Narodową (Koninklijke Bibliotheek) w 1998 r. W projekcie uczestniczy siedem bibliotek akademickich na podstawie porozumienia, które mogą podpisywać kolejne biblioteki. DutchESS uczestniczy i korzysta z rezultatów projektów: DESIRE, ROADS i Renardus. Źródła internetowe są dobierane i klasyfikowane według Nederlandse Basisclassificatie przez specjalistów dziedzinowych z bibliotek współpracujących. W zasadzie nie ma żadnych ograniczeń co do języka czy kraju pochodzenia źródeł, ale szczególną dbałość przywiązuje się do kompletności w zakresie źródeł naukowych z Holandii. Wyszukiwanie w serwisie odbywa się poprzez zadawanie pytań (słowa z dokumentu, opisu, autor, URL, symbol klasyfikacji i jego słowny odpowiednik) albo przeglądanie struktury hierarchicznej według ww. klasyfikacji. Ciekawą opcją jest anonsowanie w odrębnym dziale nowych źródeł dodanych do serwisu w ciągu ostatniego tygodnia.

VASCODA (Niemcy) http://www.vascoda.de/
Portal zaprojektowany w celu integracji niemieckich bibliotek wirtualnych, subject guides również tworzonych przez biblioteki oraz czasopism elektronicznych (Elektronische Zeitschriftenbibliothek EZB) w ogólny i łatwy w użytkowaniu interdyscyplinarny system [14]. VASCODA różni się od innych serwisów tym, że w przyszłości zamierza stać się ogólnonarodową biblioteką cyfrową (Digitale Bibliothek Deutschland), udostępniającą informacje nie tylko z zasobów subject gateways, ale również dającą dostęp do licencjonowanych serwisów czasopism elektronicznych i baz danych dla uprawnionych uczestników projektu. Łącznie w projekcie finansowanym przez Deutsche Forschungsgemeinschafts uczestniczy ponad 30 instytucji naukowych, głównie bibliotek akademickich. Obecnie można wyszukiwać jednocześnie w 36 subject guides, spośród których wszystkie nadal pozostają niezależnymi serwisami i tworzone są indywidualnie przez poszczególne biblioteki albo konsorcja.

Australian Subject Gateways Forum (ASGF) http://www.nla.gov.au/initiatives/sg/gateways.html
Utworzona w 2000 r. grupa zrzeszająca instytucje tworzące subject gateways dla środowiska szkół wyższych w Australii. Celem ASGF jest ułatwianie wymiany informacji pomiędzy istniejącymi i powstającymi serwisami oraz rozwiązywanie wspólnych problemów. Działalność grupy jest koordynowana przez Bibliotekę Narodową Australii. Nie istnieje na razie wspólny interfejs wyszukiwawczy, ale pod ww. adresem wymienione są wszystkie uczestniczące serwisy, do których można uzyskać bezpośrednie połączenie.

Zakończenie

Podsumowując, warto przypomnieć główne cechy subject gateways:

  • zazwyczaj ograniczenie do jednej dziedziny wiedzy;
  • rekordy bibliograficzne źródeł internetowych tworzone są manualnie i zawierają m.in. bogaty opis źródła z adekwatnymi informacjami;
  • współkatalogowanie - rozproszona grupa specjalistów dziedzinowych zasila bazę danych;
  • kryteria jakości - powinien istnieć oficjalny dokument wyjaśniający, według jakich kryteriów oceniane są źródła (najlepiej dostępny dla użytkowników);
  • system klasyfikacji - wykorzystywany jako podstawa do przeglądania zasobów;
  • stosowanie ogólnodostępnych standardów w celu umożliwienia współpracy z innymi serwisami np. cross searching.

Jednym z wniosków nasuwających się na podstawie tej charakterystyki - niezbyt budującym - jest stwierdzenie, że nie mamy żadnego krajowego systemu tego typy, ani ogólnodziedzinowego, ani dotyczącego wybranej tematyki. Pierwsze subject gateways powstawały ze zwykłych list typu bookmark, tworzonych przez bibliotekarzy i przekształcanych potem w "polecane linki". Tych ostatnich mamy na witrynach polskich bibliotek bardzo dużo - niektóre na wysokim poziomie kompletności. Warto byłoby na wzór przedstawionych tu przykładów połączyć wysiłki i stworzyć prawdziwe subject gateways. Zwłaszcza że kraje bardziej zaawansowane w tej dziedzinie wypracowały metody i środki techniczne, które w większości są bezpłatnie dostępne w sieci. Poza tym można dołączyć do wielu projektów międzynarodowych. Jak zwykle dyskusyjna pozostaje kwestia finansowania. W wielu krajach czynią to odpowiednie ministerstwa lub agencje rządowe. Jednak najważniejsza jest inicjatywa, która wzorem dobrych przykładów (NUKAT, Sympo, BazTech) może pochodzić z jakiejkolwiek biblioteki lub grupy bibliotek. Mamy dobre doświadczenia we współpracy i należy je wykorzystać w kolejnym wyzwaniu dla bibliotekarzy. W tym miejscu należy przyznać rację Markowi Nahotko, który stwierdził, że [...] lawinowo rosnąca ilość publikacji internetowych i wszelkich tzw. Informacji "wirtualnych" otwiera nowe i ciekawe możliwości pracy dla bibliotekarzy. Ktoś bowiem musi zapanować nad chaosem, który obecnie cechuje Internet i twierdzę, że będą to bibliotekarze, którzy dysponują prawie gotowymi narzędziami [...]. Zmieni się też pewnie kąt widzenia bibliotekarzy - z dbałości o własne, lokalne zasoby na pracę w ogólnoświatowej, wirtualnej „bibliotece” zasobów sieciowych [12]

Bibliografia

1. BAWDEN, David, ROBINSON, Lyn. Internet subject gateways revised. International Journal of Information Management 2002, nr. 22, s. 157-162.
2. BERGMAN, Michael K. The Deep web: surfacing hidden value. In The Journal of Electronic Publishing [on-line]. August 2001 Volume 7 Issue 1 [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://www.press.umich.edu/jep/07-01/bergman.html.
3. BRÜMMER, Anna. Subject based information gateways [on-line]. December 1997 February 2000 [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://www.lub.lu.se/desire/sbigs.html.
4. CZAPNIK, G. Bibliotekarskie katalogi tematyczne. Zagadnienia Informacji Naukowej 2003, nr 1 (81), s. 64-77.
5. FRANCO, Adrienne. Gateways to the Internet: Finding quality information on the Internet. Library Trends 2003, nr 2, s. 228-246.
6. GAWROŃSKI, Andrzej, DYNKOWSKI, Maciej. Biblioteczne portale albo wirtualne warsztaty informacyjne. In Biuletyn EBIB [on-line]. 2000 nr 7 (15) [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://ebib.oss.wroc.pl/arc/e015-02.html.
7. KIRRIEMUIR, John, WELSH, Susan, KNIGHT, Jon. Cross-Searching Subject Gateways. The Query Routing and Forward Knowledge Approach. In D-Lib Magazine [on-line]. 1998 January [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://www.dlib.org/dlib/january98/01kirriemuir.html.
8. KOCH, Traugott. Quality-controlled subject gateways: definitions, typologies, empirical overview. Manuscript of the article published. In Online Information Review [on-line] 2000 Vol. 24/1 [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://www.lub.lu.se/tk/publ/OIR-SBIG.html.
9. MALESZA, Ewa. Ogólna charakterystyka stron WWW polskich bibliotek. In Biutetyn EBIB [on-line]. 1999 nr 7 (listopad) [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://ebib.oss.wroc.pl/arc/e007-02.html.
10. NAHOTKO, Marek. Metadane. In Biuletyn EBIB [on-line]. 2000 nr 6 (14) [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://ebib.oss.wroc.pl/arc/e014-02.html.
11. NAHOTKO, Marek. Metadane jako narzędzie opracowania elektronicznych zasobów sieciowych. Zagadnienia Informacii Naukowej 2003, nr 2 (82), s. 101-117.
12. NAHOTKO, Marek. RDF jako narzędzie uporządkowania zasobów internetowych. Praktyka i Teoria Informacji Naukowej 2002, nr 2, s. 3-6.
13. NEUROTH, Heike, KOCH Traugott. Cross-browsing and cross-searching in a distributed network of subject gateways: Architecture, data model, and classification. In Renardus - The Academic Subject Gateway Service in Europe [on-line]. 2001 19 May [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://renardus.sub.uni-goettingen.de/conferences/elag2001/neuroth_koch_elag2001.html.
14. PIANOS, Tamara. Vascoda - a portal for scientific resource collection created by German libraries and information centres. In 65th IFLA Council and General Conference, Bangkok, Thailand [on-line]. 1999 August 20 - August 28 [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://www.ifla.org/IV/ifla69/papers/055e-Pianos.pdf.
15. PLACE, Emma. International Collaboration on Internet Subject Gateways. In 65th IFLA Council and General Conference, Bangkok, Thailand [on-line]. 1999 August 20 - August 28 [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://www.ifla.org/IV/ifla65/papers/009-143e.htm.
16. SOSIŃSKA-KALATA, Barbara. Struktury klasyfikacyjne w organizacji zasobów informacyjnych Internetu. In III Krajowa Konferencja pt. Multimedialne i Sieciowe Systemy Informacyjne [on-line]. 2002 19-20 września [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://www.zsi.pwr.wroc.pl/zsi/missi2002/pdf/s403.pdf.
17. Virtual Training Suite by RDN [on-line] 2004 March 08 [dostęp 21 czerwca 2004]. Dostępny w World Wide Web: http://www.vts.rdn.ac.uk/.
18. WORSFOLD, Emma. Subject gateways: fulfilling the DESIRE for knowledge. Computer Networks and ISDN Systems 1998, nr 30, s. 1479-1489.

 Początek strony



Serwisy tematyczne o kontrolowanej jakości w Internecie - subject gateways / Lidia Derfert-Wolf// W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska. - Nr 6/2004 (57) czerwiec/lipiec. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2004. - Tryb dostępu: http://www.ebib.pl/2004/57/derfert.php. - Tyt. z pierwszego ekranu. - ISSN 1507-7187