Nr 5/2007 (86), Współpraca zagraniczna bibliotek. Badania, teorie wizje |
Jarosław Pacek
| |||
WstępBiblioteki podejmując starania o zajęcie należnego im miejsca w społeczeństwie informacyjnym, stają obecnie przed problemem koniecznych zmian w sposobie postrzegania i ujmowania dokumentu. Nadążanie za zmianami otoczenia informacyjnego może decydować o przyszłości bibliotek, które powinny dostosować swoje funkcje, zadania, profil zbiorów, rodzaj i jakość usług do potrzeb użytkowników. Jacek Wojciechowski zauważa, że bibliotekarstwo powinno przedłożyć społeczeństwu ofertę, która maksymalnie, do końca, wykorzysta wszystkie możliwości bibliotek [...], zaoferować zasoby elektroniczne. Własne, cudze i sieciowe, darmowe i wściekle drogie, na nośnikach przemieszczalnych oraz online. To jest warunek przetrwania: oferta bezdyskusyjnie musi być mieszana, multisemiotyczna, wielokomunikacyjna[1]. Wydaje się, że aby te postulaty mogły zostać spełnione, biblioteki muszą pełniej otworzyć się na nowe rodzaje źródeł wiedzy, często wręcz zupełnie abstrakcyjne w zestawieniu z tradycyjnymi i uznać je za równoprawne. Należy również szerzej wykorzystywać narzędzia pozwalające na sprawniejsze przetwarzanie i udostępnianie informacji o już zgromadzonych przez biblioteki zbiorach. Od dokumentu do rozmowy na czacieDokument, jak pisze Marta Grabowska, w XX wieku jest głównym przedmiotem opisu bibliograficznego[2]. Dokument, choć przejawiający się w różnych postaciach materialnych, jest również ściśle z tą materią związany. Jak podkreśla Słownik encyklopedyczny informacji, języków i systemów informacyjno-wyszukiwawczych dokumentem jest informacja wraz z materiałem, nośnikiem, w którym została utrwalona[3]. Bardzo zasadne obecnie są dyskusje na temat optymalnej jednostki opisu, na której bazować miałyby współczesne procesy informacyjno-wyszukiwawcze. Tradycyjnie rozumiana jednostka może nie spełniać wymagań stawianych przez elektroniczne systemy, a także nie wykorzystywać możliwości, jakimi one już dysponują. Możliwe, że geneza obowiązującego dziś pojęcia jednostki opisu wiąże się z przywiązaniem tradycyjnego bibliotekarstwa i bibliografii do dokumentu, rozumianego jako przedmiot materialny, fizyczna całość albo nawet poszyt, klocek złożony z wielu piśmienniczych całości, lecz funkcjonujących fizycznie razem. Zadaniem bibliotekarstwa było przede wszystkim ocalenie owej całości, z jej tytułem, informacjami o autorze i innymi danymi formalnymi, przed zagubieniem w mrokach historii. Inne przejawy funkcjonowania dokumentu były w zasadzie wynikiem podziału większej całości metodą hierarchiczną na elementy krótsze, węższe. Barbara Sosińska-Kalata pisze: Badacze odwołujący się do teorii intertekstualności wskazują zatem, że optymalnymi jednostkami analizy i opisu powinny być związki intertekstualne. Jednostka opisu dla nowoczesnych systemów nie powinna być wyodrębniana metodą hierarchicznej dekompozycji, lecz właśnie odpowiednio do analizy tego, jak cały dokument lub jego części odnoszą się do innych tekstów dotyczących tego samego tematu czy problemu[4]. Dotychczas wyodrębniane jednostki mogą nie spełniać wszystkich wymagań współczesnego użytkownika. Dla społeczeństwa informacyjnego, tworzącego globalną wioskę, istotna jest nie sama książka rozumiana jako obiekt fizyczny, nie czasopismo, nie kaseta, dyskietka czy płyta, ale informacja na nich zapisana, np. pojedynczy utwór z płyty (przykładem na to, że to utwór, a nie cała płyta czy album, stanowi obiekt pożądania są sklepy internetowe sprzedające odrębne utwory np. do telefonów komórkowych, odtwarzaczy MP3, iPodów itp.). Jadwiga Woźniak-Kasperek w odniesieniu do omawianych problemów tradycyjnego katalogowania pisze, że były one powodowane kilkoma czynnikami, wśród których znaczenie zapewne miały istniejące wzorce, utarte ścieżki opisywania tego typu dokumentów, konieczność utrzymania katalogu kartkowego w rozsądnym rozmiarze, przewidywane problemy z meliorowaniem coraz większego zbioru informacyjnego itp. Rozwiązania z katalogów kartkowych przeniesiono na katalogi komputerowe, a w pierwszej kolejności na format MARC. Skutkiem tego realizacja pewnych poszukiwań staje się, jeśli nie niemożliwa, to bardzo trudna[5]. Tendencje postrzegania wiedzy, zgromadzonej w różnych dokumentach i miejscach, jako sieci połączeń są szczególnie zauważalne w coraz dynamiczniej rozwijającej się teorii tzw. Semantycznego Webu. Została ona zaproponowana przez Tima Bernersa-Lee[6] i jego współpracowników na przełomie XX i XXI wieku. Sieć zgodnie z tą wizją ma realizować takie funkcje, jak: inteligentna nawigacja i wyszukiwanie informacji, zautomatyzowane wykorzystanie rozproszonych źródeł informacji oraz usługi przetwarzania wiedzy[7]. Sieć przyszłości ma więc umożliwiać przemieszczanie się pomiędzy zrozumiale i efektywnie opisanymi dokumentami (z punktu widzenia człowieka i maszyny) połączonymi za pomocą relacji ukazujących związki tematyczne i treściowe. Użytkownik dostawałby w odpowiedzi na swe pytanie nie wykaz odpowiednio wysoko pozycjonowanych[8] linków, ale logicznie zorganizowaną listę czy mapę, na której węzłowymi punktami byłyby dokumenty dotyczące określonych grup tematycznych. Uzyskiwać można by w ten sposób wskazania na pełne teksty przechowywane w sieciowych repozytoriach, opracowania, dokumenty związane przedmiotowo, dokumenty cytujące, odpowiednie materiały graficzne czy multimedialne, których rola jako źródła wiedzy jest bardzo istotna. Tak zorganizowana odpowiedź oprócz olbrzymich korzyści informacyjno-wyszukiwawczych może posiadać również walor edukacyjny, może ukazywać pewien istotny kontekst, w którym funkcjonuje pojedynczy dokument, ale też wiedza w nim zapisana. Należy jednak tę wizję uzupełnić stwierdzeniem, że mapa, semantyczny wzorzec, bez względu na to, jak gęsto byłby usłany cennymi liniami połączeń, jeśli wciąż ostatecznie wskazywać będzie na dokument taki, jakim go jeszcze dziś, chyba już nieco anachronicznie, pojmujemy, może pomóc rozwiązać problem jedynie częściowo. To informacja i wiedza są dziś głównym obiektem pożądania, w mniejszym zaś stopniu nośnik, forma, w której treść została zachowana. Cenna jest myśl, choćby krótka, choćby krótki fragment z opasłego tomu, który zawiera poszukiwaną informację. Użytkownik pragnący szybko i efektywnie zaspokoić swe potrzeby informacyjne najprawdopodobniej nie zdecyduje się na przeczytanie całej książki, by potwierdzić przeczucia, że owa, istotna dla niego myśl gdzieś tam, na którejś stronicy jest zapisana. Jednostka wyodrębniająca pewien fragment rzeczywistości na podstawie jego znaczenia i zawartości treściowej, uniezależniona od postaci fizycznej, w której się przejawia, mogłaby sprawnie pomóc w zaspokojeniu głodu wiedzy społeczeństwa informacyjnego. Byłoby bardzo dobrym rozwiązaniem umieszczenie owych jednostek w wyżej wspomnianej sieci kontekstowych zależności. Bardzo interesującym okazuje się fakt, że podobne koncepcje głoszono już pod koniec XIX wieku. Według Małgorzaty Góralskiej szczególnie wiele swej uwagi poświęcał tym zagadnieniom Paul Otlet. W swoich pierwszych pracach wyrażał przekonanie, że sama fizyczna postać książki była mniej istotna wobec faktu, że zawarte w niej dane, źródła, wnioski wpisują się w ogólną strukturę wiedzy. Otlet widział konieczność wydobywania tych informacji z książek (w szczególności zaś: faktów, interpretacji faktów, statystyki i źródeł), tworzenia z nich znormalizowanych komunikatów, a następnie utrwalania ich na osobnych nośnikach tworzących kolekcje, które pod względem funkcjonalności przypominałyby dzisiejsze bazy danych. W ramach takich zbiorów informacje mogłyby podlegać dalszemu podziałowi lub podporządkowaniu sieci wzajemnych tematycznych powiązań[9]. Autorka powołując się na opracowania dotyczące kariery i biografii P. Otleta, zauważa, że wyraźnie rozgraniczał on formę książki od jej treści. Bywa także wiązany z koncepcją hipertekstu, jaki dziś rozwinął się dzięki Internetowi. Podobne problemy rozważał również Herbert George Wells, pomysłodawca projektu Permanent World Encyclopaedia[10]. Wspomnieć należy również o interesującym projekcie o nazwie Xanadu (http://xanadu.com), którego realizacja rozpoczęła się w 1960 r. Projekt zakładał stworzenie oprogramowania, swoistego procesora tekstu, który byłby w stanie gromadzić różne wersje dokumentu, ułatwiałby zarządzanie nimi, porównanie, automatyczne wskazywanie na źródła w przypadku cytatów itp. Autorem projektu jest Theodor Holm Nelson, uważany również za twórcę terminu hipertekst. Realizacja projektu nie została nigdy doprowadzona do końca, jednak wiele z pomysłów Xanadu zastosowano w sieci WWW, kanałach RSS, budowie dokumentów HTML – zdaniem T. Nelsona w sposób niedoskonały. Dokonanie przełomu w rozumieniu jednostki opisu wymaga głębokich systemowych zmian, zarówno w teorii, jak i działalności informacyjnej i nie jest możliwe do przeprowadzenia w krótkim czasie, choć technicznymi środkami już dysponujemy. Rozwijające się obecnie nowoczesne formaty i języki opisu, przybliżające realizację wizji Semantycznego Webu, już z problemem podstawy opisu dość skutecznie sobie radzą, wcale nie czekając na zmiany paradygmatu w tradycyjnych dyscyplinach związanych z informacją. Odchodzi się już nieco od pojęcia dokumentu, na rzecz jednostki (encji) lub obiektu. W przestrzeni wirtualnej informacja przybrała nową postać, pojawiły się nowe rodzaje źródeł godne opisania. Zmienił się sposób prezentacji tekstu: rozwinął się nielinearny hipertekst oraz liternet, poprzez łącza internetowe przekazywane są leksje, ale też obrazy, zdjęcia, animacje, filmy, dźwięk, wpisy na forach dyskusyjnych, rozmowy na czatach itp. zawierające olbrzymi ładunek informacyjny. Zmienia się również jakość odbioru, ponieważ dokument staje się w większym stopniu interaktywny, odbiorca edytując go, może mieć wpływ na kształt oraz treść przekazu. Może ingerować w jego strukturę, prawie dowolnie go przekształcając, np. może dzielić go na mniejsze fragmenty, które również mają szansę funkcjonować później samodzielnie. Odbiorca może zmieniać kolejność tych elementów, usuwać je, może dodawać nowe, własne lub zaczerpnięte z innych jeszcze dokumentów, może tworzyć nieskończoną liczbę kopii i rozpowszechniać je dalej[11]. Odbiorca dokumentu staje się w efekcie wręcz jego współautorem i włącza się w proces intertekstualnego budowania przekazu. Zacytujmy tu jeszcze raz rozważania J. Wojciechowskiego: na miejscu, na wynos oraz jeszcze zdalnie, trzeba będzie udostępniać (organizować dostęp) wszystko, co zawiera treści – niezależnie od nośnika[12]. Leksje, encje, obiekty informacyjneTytułowe terminy pojawiają się obecnie bardzo często w kontekście sieciowych technologii informacyjnych, warto w tym miejscu poświęcić im nieco uwagi. W najprostszym rozumieniu leksja stanowi podstawową jednostkę hipertekstu. Jest zwykle zamkniętą, spójną całością, niezbyt długą, powinna stanowić akapit. Ciekawe informacje na ten temat przedstawia np. internetowy serwis Techsty. Hurtownia elektro literacka. Literatura i nowe media. Zacytujmy te interesujące rozważania: Leksja (lub tekston, tekstron, pole pisma) to podstawowa jednostka hipertekstu. Względnie spójna i niepodzielna jednostka tekstu i obrazu, nazywana często hipertekstowym węzłem lub stroną. W sieci WWW, wiele stron jest leksjami, lecz niektóre są tak długie, że przekraczają ramy niepodzielności i spójności. […] By powstał hipertekst, leksje muszą się z sobą łączyć. Leksja różni się od klasycznie pojmowanego fragmentu. Jej cechą musi być spójność i bardziej niż względna autonomiczność. Autorzy hipertekstów muszą się bowiem liczyć z tym, że fragmenty ich utworów będą czytane w różnych i zmieniających się w trakcie lektury kontekstach. Konteksty te zmieniają się nie tylko na skutek interakcji czytelnika z tekstem. Ich zmianę może wywoływać wpisany w tekst mechanizm sterowany przez program komputerowy. Skrajnym przypadkiem jest tutaj mechanizm losowego dostępu, wykorzystywany najczęściej w hipertekstowej poezji, ale obecny w hipertekstach dystrybuowanych na dyskietkach lub CD-ROM-ach. Leksje muszą więc być na tyle spójnymi całostkami tekstu, by wraz z zerwaniem toku narracji nie zerwany został tok lektury […]. Zawartością leksji może być nie tylko tekst, ale również grafika i film[13]. Wydaje się, że leksję można usankcjonować jako nowy typ jednostki bibliograficznej, podobnie jak jest nim np. fragment. Leksja rozumiana jako spójna, o wyraźnie wyodrębnionej treści, całość może odpowiadać stawianym wyżej postulatom posługiwania się jednostkami ze względu na wiedzę w nich zawartą i jako taka może być poddawana typowym dla bibliotekarstwa procedurom opisu (funkcja wskazująca), a także przechowywania czy udostępniania. Internet oczywiście niesie w sobie wartości i zasoby nie tylko stricte informacyjne. Można powiedzieć, że udomowiła go sobie lub też została przezeń udomowiona literatura piękna. Przypomnijmy tu pojęcie liternetu, od kilku lat już goszczące w polskich opracowaniach naukowych od. Jest to, zdaniem Piotra Mareckiego, pojęcie dość szerokie i obejmuje wszystkie możliwe związki literatury z internetem, w ramach którego mieszczą się pomniejsze działy. Obejmuje zatem szerokie zjawisko „literatury w sieci”, czyli literatury, która bądź to funkcjonuje już wcześniej w formie drukowanej i w celach promocyjnych, archiwalnych czy dystrybucyjnych uzyskała postać cyfrową, bądź premierę swoją miała w Internecie, nic jednak nie stałoby na przeszkodzie, żeby ujrzeć ją na kartce papieru[14]. Znaleźć można w Internecie wiele przykładów wysokiej klasy twórczości literackiej, np. w popularnych blogach internetowych. Wszystko to stanowi cenny materiał do badań np. literaturoznawczych, istotne staje się więc właściwe przygotowanie informacji typu bibliograficznego umożliwiającej takie badania. W polskim Internecie niestety trudno jest znaleźć solidne zestawienia obejmujące zjawisko liternetu. Niepokoił ten stan rzeczy P. Mareckiego w 2002 r., do dzisiaj praktycznie nie ma tych opracowań wcale. Biblioteki, bibliotekarze dzięki swemu przygotowaniu są właściwą instancją do tworzenia właściwych katalogów czy baz. Interesującym i dobrze już skodyfikowanym jest pojęcie encji (ang. entity – jednostka, wyodrębniona całość; istnienie, byt). Encja to, mówiąc pokrótce, element świata rzeczywistego, obiekt, który można nazwać i opisać za pomocą pewnych cech, atrybutów. Wywodzi się ono z teorii baz danych i organizacji danych według modelu jednostka-relacja (ang. entity-relationship, ER) opisanego w 1976 r. przez P. Chena[15]. Występuje również w terminologii języków opartych na SGML (Standard Generalized Markup Language), w których encje są używane w celu zastąpienia dowolnego tekstu innym, zazwyczaj krótszym, tekstem poprzez odwołanie zawierające nazwę konkretnej encji zastępującej dany tekst. Obecnie pojęcie encji staje się bardzo popularne, przenika do nauk humanistycznych zwłaszcza związanych z informacją. Bardzo istotne jest, że pojęcie to włącza do swojego obszaru znaczeniowego takie zjawiska, których dotychczas bibliotekarstwo nie opisywało, ponieważ nie miało ku temu odpowiednich narzędzi. Obiekt wskazywany przez encję może być więc materialny, fizyczny (przykładowo karta płatnicza, której atrybuty to np. numer, imię i nazwisko posiadacza, limit przeprowadzanych dziennie operacji itp.; książka, której atrybuty to np. autor, tytuł, data wydania; czytelnik z atrybutami np. imię, nazwisko, numer karty bibliotecznej), ale również niematerialny, może to być nawet pojęcie, fakt czy wydarzenie (np. konto bankowe, którego atrybuty to np. numer, posiadacz, dopuszczalny debet itp.; wypożyczenie książki, czego atrybuty to np. imię i nazwisko wypożyczającego, numer karty bibliotecznej, data wypożyczenia itp.; konferencja, której atrybuty to np. temat, data, organizator itp.). Mamy więc do czynienia z nowoczesnym i użytecznym pojęciem pozwalającym na wprowadzenie do paradygmatu zainteresowań biblioteki i bibliotekarzy zjawisk wcześniej w nim niewystępujących lub jeszcze nie „oswojonych”. Wyróżnienie wydarzenia jako jednostki daje bardzo wymierne korzyści cenne szczególnie w kontekście zmian formy i sposobu funkcjonowania dokumentów. Pozwala opisać również proces powstawania dzieła, miejsce i czas tego tworzenia. Jak wskazano wyżej, dokumenty elektroniczne cechuje bardzo duża podatność na przekształcenia, wprowadzenie jednostki wydarzenia pozwala na śledzenie tychże zmian, cyklu życia dokumentu cyfrowego i relacji ewentualnie wiążących go z dokumentem oryginalnym – drukowanym lub pomiędzy różnymi wersjami tego dokumentu. Problem i możliwości zastosowania jednostki wydarzenia szczegółowiej omawia w swojej książce Marek Nahotko[16]. Kolejne pojęcie, obiekt informacyjny, bywa różnie rozumiane i definiowane, zależnie od nauki, na której terenie występuje. W informatyce funkcjonuje jednak jako termin dość ogólny, abstrakcyjny. Oznacza grupę danych stanowiących logiczną całość, może również zawierać atrybuty będące innymi obiektami informacyjnymi, np. teczka z dokumentami związanymi z danym klientem[17], czy też cokolwiek, co może być zaadresowane i przekształcane przez człowieka lub system jako byt dyskretny. Niezależnie od swej formy posiada trzy określone cechy: zawartość, kontekst, strukturę[18]. Ze zrozumiałych względów nowe pojęcia i potrzebna terminologia tworzone są i funkcjonują również w opracowaniach dotyczących rozwoju bibliotek cyfrowych i metod przechowywania tego rodzaju informacji. Przewodnik tworzenia bibliotek cyfrowych zaproponowany przez NISO (National Information Standards Organization), któremu odrębny artykuł poświęcił M. Nahotko, rozróżnia dwa rodzaje obiektów informacyjnych: takie, które powstają na bazie dokumentów oryginalnych, tradycyjnych, np. drukowanych; ich surogaty oraz obiekty oryginalne, powstałe już jako cyfrowe, czytelne maszynowo. Przewodnik proponuje następującą definicję obiektu: Obiekt może zawierać się w jednym pliku (np. raport wydany jako plik PDF) lub składać się z wielu plików połączonych ze sobą (np. strona HTML i powiązane z nią obrazki) lub też może on obejmować wiele plików oraz metadanych strukturalnych, niezbędnych do powiązania ich w całość (np. książka zdigitalizowana jako obrazy stron). W takim sensie obiekty są konceptualnymi odpowiednikami jednostek w zbiorach bibliotecznych, kolekcjach muzealnych i zasobach archiwalnych[19]. Praktyczne rozróżnienie na obiekt cyfrowy (data object) oraz obiekt informacyjny (information object) wprowadza OAIS (Open Archival Information System) będący referencyjnym modelem organizacji i przebiegu długoterminowej archiwizacji obiektów cyfrowych, o którym pisze Aneta Januszko-Szakiel. Obiekt informacyjny w odróżnieniu od cyfrowego, oprócz samych danych cyfrowych (kod cyfrowy, zerojedynkowy), składa się także z narzędzi pozwalających na przetworzenie tych danych do postaci zrozumiałej dla użytkownika. Mamy zatem z jednej strony dane o zapisie zupełnie nieczytelnym dla większości użytkowników, ale wykorzystywanym przez komputery i oprogramowanie, z drugiej zaś ich przełożenie w formę zrozumiałą, przyjazną i znajomą. Można więc przyjąć, jak pisze autorka, że każdy dokument elektroniczny, należący do zbiorów bibliotecznych, archiwalnych, a także muzealnych, wraz z narzędziami umożliwiającymi jego odczyt będzie można określić mianem Information Object[20]. Opisana terminologia nie jest jeszcze dostatecznie usystematyzowana. Być może w odniesieniu do pojęcia obiektu wygodnym i porządkującym zabiegiem będzie potraktowanie dwóch pojęć: obiektu informacyjnego i cyfrowego jako związanych relacją hierarchiczną. W ten sposób za obiekt informacyjny można rozumieć każdy dokument należący do zbiorów bibliotecznych itp. niezależnie od jego postaci, formy, nośnika czy metody zapisu. Książka bowiem, tradycyjna, drukowana również jest źródłem informacji; nie warto chyba ograniczać znaczenia obiektu informacyjnego jedynie do dokumentów cyfrowych czy elektronicznych. Może owo pojęcie w sposób nowoczesny rozciągnąć na całość zainteresowań biblioteki, wiążąc nim tradycyjne zbiory z nowoczesnymi, których koegzystencja jest już faktem. Ta funkcja pojęcia jest również sygnalizowana w podanych wyżej przykładach tworzonych definicji. Natomiast pojęcie obiektu cyfrowego można zarezerwować właśnie już tylko dla owych elektronicznych, czytelnych maszynowo źródeł wiedzy. Jednostka w nowych modelach opisuWraz ze zmianami postaci dokumentów i sposobu ich funkcjonowania, naturalnym etapem w badaniach nad metodami porządkowania informacji było powstanie nowych standardów opisu uwzględniających owe zmiany i wprowadzających nowe pojęcia i terminy. Wyodrębniane w nich jednostki opisu oraz rodzaje źródeł nieco różnią się od dotychczas stosowanych, lecz odpowiadają realiom współczesnej działalności informacyjnej (obiekty takie jak np. zdjęcie cyfrowe, również obiekt utrwalony na zdjęciu, dźwięk, animacja, wydarzenie). Standardy takie jak Dublin Core (DC) czy Functional Requirements for Bibliographic Records (FRBR) doskonalone są już od lat, przy czym to Dublin Core jest już powszechnie stosowany zwłaszcza do opisu informacji sieciowej, natomiast próby aplikacji FRBR, będącego modelem opisu głównie danych bibliotecznych, wciąż pozostają w fazie testów i przymiarek prowadzonych przez biblioteki i inne organizacje. Wymienione poniżej nowe, lecz już popularne schematy i protokół wymiany metadanych, wprowadzają szereg nowych określeń opisujących przejawy informacji. Dublin CoreDublin Core Metadata Set (DCMES) jest zestawem elementów metadanych[21] umożliwiających opis różnego typu dokumentów i ułatwiających ich wyszukiwanie. Pierwotnie miał służyć do opisu zasobów Internetu przez samych autorów sieciowych obiektów, dzięki jednak swej prostocie i uniwersalności staje się najczęściej używanym standardem zapisu metadanych. Model Dublin Core narodził się w 1995 r., rozwijany i zarządzany jest obecnie przez Dublin Core Metadata Initiative (DCMI – http://www.dublincore.org). W tym miejscu warto zaprezentować pojęcia, jakimi posługuje się DC dla rozróżnienia typów źródeł. Do określenia rodzajów rozróżnianych przez DCMI dokumentów służy DCMI Type Vocabulary zawierający kontrolowane i rekomendowane terminy nazywające poszczególne rodzaje źródeł. Pomiędzy owymi terminami mogą występować powiązania hierarchiczne. Relacje nadrzędności i podrzędności są określone w specyfikacji każdego terminu. Obecnie DCMI wyróżnia 12 terminów słownika kontrolowanego nazywających różne rodzaje źródeł. Są to w znacznej mierze obiekty typowe dla sieci internetowej. Wyraża się w tym nowoczesność DCMES jako narzędzia wyspecjalizowanego w opisie utrwalonych osiągnięć wiedzy ludzkiej, w formie nowej z punktu widzenia tradycyjnego bibliotekarstwa. Źródłem dla DC może być w zasadzie „wszystko, co jest identyfikowalne”. Rozróżniane przez DCMI rodzaje źródeł wraz z ich definicjami to:
Jak widać, źródło informacji otwiera się na bardzo specyficzne, wydawałoby się niepodatne opisowi, przejawy komunikacji, zwłaszcza takie jak: listy, tablice, bazy danych, wydarzenia, obrazy (tu również głębsza warstwa – utrwalony na zdjęciu obiekt), systemy, serwisy interaktywne, rozmowy prowadzone w sieci komputerowej, animacje i filmy, rzeczywistość wirtualna, obiekty architektoniczne, wszelakie usługi, oprogramowanie, właściwie każdy rodzaj zarejestrowanego dźwięku, archiwa list dyskusyjnych. Usankcjonowana w ten sposób zostaje informacyjna funkcja tych zjawisk, fakt utrwalenia w nich wiedzy ludzkiej. DCMI posługuje się także terminem document-like object (DLO) – obiekt dokumentopodobny. Pojęcie to zostało rozwinięte w czasie trzecich warsztatów Dublin Core. Rozumiane jest jako jednostka w dużej mierze bazująca na dokumencie tekstowym lub dzieląca inne cechy tradycyjnego dokumentu, będzie to np. wiadomość e-mail czy arkusz kalkulacyjny. Agnieszka Filipek[23] pisze, że obiekty takie mają być dwuwymiarowe, nieruchome, chodzi tu jednak raczej o tę specyficzną cechę dokumentu, która polega na stałej, niezmiennej jego zawartości (ta sama dla każdego użytkownika), np. tekst, obraz, film, prezentacja[24]. Functional Requirements for Bibliographic RecordsFunctional Requirements for Bibliographic Records (FRBR) jest dla społeczności zajmującej się problemami związanymi z informacją i bibliotekarstwem, niejako kolejnym, naturalnym etapem w kierunku dostosowywania tej dziedziny do zmian, jakie nastąpiły w ostatnich latach w zakresie potrzeb użytkownika oraz w środowisku informacyjnym. FRBR jest funkcjonalnym modelem opisu bibliograficznego, nowoczesną alternatywą dla modeli dotychczas stosowanych. Specyfika modelu FRBR polega również na tym, że wprowadza on szereg nowych, abstrakcyjnych pojęć i terminów różnych od dotychczas funkcjonujących w International Standard Bibliographic Description (ISBD). Zamierzona ogólność i niejednoznaczność utrudniają nieco interpretację FRBR, lecz wynikają z jego charakteru – ma on spełniać rolę uniwersalnego formatu, pozwalającego na swobodną, międzynarodową wymianę informacji bibliograficznej. Jak zauważa A. Filipek, FRBR funkcjonuje na wyższym poziomie abstrakcji niż pojęcia przyjęte w ISBD. Nie można więc utożsamiać elementów opisu ISBD i jednostek modelu FRBR, można jednak – i należy – pokazać powiązania pomiędzy nimi[25], przy czym należy powtórzyć za M. Nahotko, że trzy wyróżniane przez FRBR jednostki Egzemplarz, Materializacja oraz Dzieło stały się podstawą wszystkich współczesnych zasad katalogowania, zarówno ISBD, jak i AACR[26]. Do ustalenia struktury FRBR wykorzystano model jednostka-relacja. Dla tematu poruszanego w niniejszym artykule najistotniejsze będzie przywołanie charakterystyki podstawowych grup jednostek służących do opisu. 1. Wytwory działalności intelektualnej lub artystycznej:
2. Jednostki odpowiedzialne za intelektualną lub artystyczną zawartość, postać fizyczną, produkcję, rozpowszechnianie lub przechowywanie jednostek pierwszej grupy:
3. Jednostki stanowiące przedmioty Dzieł:
Filozofia FRBR polega w dużej mierze na oderwaniu, a przynajmniej większej niezależności niż miało to miejsce dotychczas, od fizycznej postaci źródła. Tenże aspekt ma dużo mniejszy wpływ na strukturę opisu, w którym najważniejsza ma być koncepcja, myśl, treść. Opis staje się bardziej elastyczny. Wydaje się, że może pozwolić na łatwiejsze i szybsze opracowywanie zbiorów, jednakże jego nowa terminologia, abstrakcyjna struktura może przysporzyć nieco trudności bibliotekarzom przyzwyczajonym do drobiazgowości dotychczas tworzonych opisów bibliograficznych. Open Archives Initiative Protocol for Metadata HarvestingBardzo interesujący z perspektywy rozwoju bibliotek cyfrowych i otwartych repozytoriów tekstów jest Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH). Aby możliwe było sprawne przeszukiwanie i wykorzystywanie repozytoriów, należy zastosować wspólne standardy opisu, kodowanie, protokoły dostępu. Takim protokołem jest właśnie OAI-PMH opracowany przez organizację Open Archive Initiative (OAI, http://www.openarchives.org) i funkcjonujący obecnie w wersji 2.0. Został uznany za standard do stosowania w bibliotekach i archiwach cyfrowych. Jest także stosowany przez zespół polskich bibliotek cyfrowych opartych na systemie dLibra. Protokół używa pojęć takich jak Zasób, Egzemplarz, Rekord interpretowanych we własny, specyficzny sposób. W rozumieniu protokołu repozytorium stanowi dostępny sieciowo serwer, który potrafi przetwarzać zapytania protokołu OAI-PMH. Repozytorium udostępnia dane wyszukiwarkom. Obecnie wykorzystuje ten protokół np. wyszukiwarka Google, która za jego pomocą indeksuje zasoby internetowych repozytoriów. OAI-PMH wyróżnia trzy podstawowe jednostki repozytorium:
Rekord jest identyfikowany jednoznacznie poprzez połączenie nazwy pojedynczego egzemplarza, prefiks metadataPrefix identyfikujący format zapisu danych oraz oznaczenie daty datestamp utworzenia, modyfikacji lub usunięcia rekordu. Dane zapisane w kodzie XML zorganizowane są w trzech zasadniczych częściach:
Poniżej znajduje się opis numeru czasopisma Kurier Poznański z 1931 r. zamieszczony w Wielkopolskiej Bibliotece Cyfrowej (pracującej w systemie dLibra – http://www.wbc.poznan.pl/dlibra) zgodny z protokołem OAI-PMH i formatem Dublin Core, widoczny dla użytkownika w oknie przeglądarki. <?xml version="1.0"
encoding="utf-8"?> <responseDate>2007-02-18T21:22 <request identifier="oai:dlib.bg.pwr.wroc.pl:1531" metadataPrefix="oai_dc" verb="GetRecord"> http://dlib.bg.pwr.wroc.pl <GetRecord> <record> <header> <identifier>oai:dlib.bg.pwr.wroc.pl:1531</identifier> <datestamp>2007-02-07T13:53 <setSpec>DolnoslaskaDigitalLibr <setSpec>DolnoslaskaDigitalLibr <setSpec>DolnoslaskaDigitalLibr </header> <metadata> <oai_dc:dc xmlns:oai_dc="http://www.openarchives.org <dc:title xml:lang="pl"><![CDATA[Układ Chenga jako proekologiczne źródło energii elektrycznej i cieplnej]]></dc:title> <dc:publisher xml:lang="pl"><![CDATA[Politech <dc:creator xml:lang="pl"><![CDATA[Chrzczon <dc:contributor xml:lang="pl"><![CDATA[Jesionek <dc:rights xml:lang="pl"><![CDATA[Własność autora]]></dc:rights> <dc:rights xml:lang="en"><![CDATA[Content type information: Portable Document Format - Use Adobe Acrobat Reader to read this publication.]]></dc:rights> <dc:language xml:lang="pl"><![CDATA[pol]]>< <dc:relation xml:lang="pl"><![CDATA[Wydział Mechaniczno-Energetyczny]]>< <dc:type xml:lang="pl"><![CDATA[rozprawa doktorska]]></dc:type> <dc:subject xml:lang="pl"><![CDATA[energia - konwersja - modelowanie]]></dc:subject> <dc:subject xml:lang="pl"><![CDATA[turbiny z wtryskiem pary - modelowanie]]></dc:subject> <dc:subject xml:lang="pl"><![CDATA[układy kogeneracyjne]]></dc:subject> <dc:date xml:lang="pl"><![CDATA[2006]]> <dc:identifier><![CDATA[http://dlib.bg.pwr.wroc.pl <dc:format xml:lang="pl"><![CDATA[applicat <dc:format xml:lang="en"><![CDATA[applicat </oai_dc:dc> </metadata> </OAI-PMH> ZakończenieNowoczesne technologie komputerowe, zwłaszcza te związane z rozwojem Internetu, mogą korzystnie wpłynąć również na oblicze dzisiejszej biblioteki. Staje się ona niejako odmłodzona, dostając do ręki pojęcia i narzędzia pozwalające realizować jej dotychczasowe funkcje na poziomie spełniającym oczekiwania współczesnego użytkownika. Poprzez znaczenie takich pojęć jak: obiekt informacyjny, obiekt cyfrowy, także encja, leksja czy nawet obiekt dokumentopodobny widać tendencję do uniezależniania treści informacji od jej formy czy nośnika. FRBR, nowy schemat opisu bibliograficznego, wprowadza wyraźniejsze odróżnienie abstrakcyjnej substancji Dzieła od jego konkretnej Realizacji np. w słowach, liczbach, od fizycznej Materializacji, np. na papierze, taśmie i od Egzemplarza, czyli konkretnego, fizycznego wystąpienia obiektu. Jednostkami opisu bibliograficznego mogą być pojęcia, przedmioty żywe lub nieożywione, statyczne i ruchome, również nieistniejące, wydarzenia, miejsca, również lokalizacje pozaziemskie. Mogą być to także wiadomości e-mail, arkusze kalkulacyjne, wykresy, formularze, usługi, wirtualne pogawędki, jak w Dublin Core. Sprawny przepływ informacji o jednostkach gromadzonych w cyfrowych bibliotekach czy repozytoriach i wyszukiwanie w nich ułatwiają specjalne nowe protokoły. By sprawnie posługiwać się nowymi schematami opisu, konieczna jest również znajomość języków prezentacji danych, jak XML czy standardu RDF, w których te opisy są bardzo często tworzone. Uwolnienie wiedzy od jej dotychczasowych ograniczeń, swobodny przepływ i dostęp do niej mają stanowić jeden z podstawowych atrybutów społeczeństwa informacyjnego. Zanim jednak bibliotekarstwo i bibliografia całkowicie zaadaptują nowe formy i pojęcia, wiele z tych zjawisk należy dokładnie opisać i zdefiniować. Trzeba jednak zauważyć, że nowe koncepcje kodyfikowane są już nie tylko na poziomie przestrzeni wirtualnej, stają się także zalecanymi do stosowania przez normy międzynarodowe. Przykładem jest PN-ISO 15836:2006. Informacja i dokumentacja – Zestaw elementów metadanych Dublin Core. Obecne przeobrażenia oraz, jak się wydaje, przyspieszona ewolucja biblioteki są odpowiednim momentem dla zintensyfikowania dyskusji i prac nad optymalną jednostką opisu, którą będziemy posługiwać się w XXI wieku. Przypisy[1] WOJCIECHOWSKI, J. Czy ten zawód zniknie? Bibliotekarz 2006, nr 12, s. 3. [2] GRABOWSKA, M. Bibliografia u progu XXI wieku. In Biuletyn EBIB [on-line]. 2003, nr 10 (50) [dostęp 2 kwietnia 2007]. Dostępny w World Wide Web: http://ebib.oss.wroc.pl/2003 [3] BOJAR, B. (oprac.) Słownik encyklopedyczny informacji, języków i systemów informacyjno-wyszukiwawczych. Warszawa : Wydawnictwo SBP, 2002, s. 50. [4] SOSIŃSKA-KALATA, B. Nowe tendencje w rozwoju języków informacyjno-wyszukiwawczych. In Opracowanie rzeczowe piśmiennictwa: materiały z seminarium, Warszawa, 26 marca 2003 r. Warszawa : CEBID, 2004, s. 13. [5] KISILOWSKA, M., WOŹNIAK-KASPEREK J. Czy katalogowanie przedmiotowe ma przyszłość? Dwugłos względnie uporządkowany. In Biblioteki XXI wieku. Czy przetrwamy? Łódź, 19-21 czerwca 2006 r. Materiały Konferencyjne [on-line]. [Łódź] : Politechnika Łódzka, 2006. [dostęp 2 kwietnia 2007].
Dostępny w World Wide Web: http://www.ebib.info/publikacje [6] BERNERS-LEE, T., HENDLER, J., LASSILA, O. The Semantic Web. In Scientific American [on-line]. 2001, nr 501. [dostęp 2 kwietnia 2007]. Dostępny w World Wide Web: http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21. [7] NAHOTKO, M. Semantyczny Web i jego ontologie. In EBIB [on-line]. 2003, nr 9 (49) [dostęp 2 kwietnia 2007]. Dostępny w World Wide Web: http://ebib.oss.wroc.pl/2003 [8] Pozycjonowanie stron w wyszukiwarkach internetowych (SEO Search Engine Optimization) oznacza działania zmierzające do umieszczania odesłań do wybranych stron internetowych na jak najwyższych pozycjach w odpowiedziach wyszukiwarek, czasem są to również zabiegi nieuczciwe. [9] GÓRALSKA, M. Bibliologia wobec informatyzacji systemu komunikacji społecznej. Wybrane zagadnienia. Zagadnienia Informacji Naukowej 2005, nr 2 (86), s. 46. [10] WELLS, H. G. World Brain: The Idea of a Permanent World Encyclopaedia [on-line].
[dostęp 2 kwietnia 2007]. Dostępny w World Wide Web: http://sherlock.berkeley.edu [11] Zestawienie korzyści płynących ze stosowania nośników elektronicznych można znaleźć w pracy LEWANDOWSKI, R. Porównanie nośnika papierowego oraz elektronicznego w kontekście biblioteki cyfrowej. In Problemy i metody nauki o informacji: szkice i studia. Poznań : Sorus, 1998, s. 25-34. [12] WOJCIECHOWSKI, J. op. cit., s. 4. [13] Techsty. Hurtownia elektro literacka. Literatura i nowe media. Warsztaty: leksja. [on-line]. [dostęp 2 kwietnia 2007]. Dostępny w World Wide Web: http://techsty.pwii.pl/warsztat [14] MARECKI, P. Liternet. In Liternet: literatura i Internet. Kraków : Rabid, 2002, s. 6. [15] CHEN, P. P.-S. The entity-relationship model - toward a unified view of data. ACM Transactions on Database Systems. Vol. 1, Issue: 1, pp. 9-36. [16] NAHOTKO, M. Opis dokumentów elektronicznych: teoretyczny model i możliwości jego aplikacji. Kraków : Wydawnictwo Uniwersytetu Jagiellońskiego, 2006, s. 143-149. [17] MOMOTKO, M. Office Objects Workflow – komponent wspierający zarządzanie procesami pracy. In III Krajowa Konferencja Inżynierii Oprogramowania KKIO01, Otwock, 17-20 października 2001. [on-line]. Rodan Systems, 2001. [dostęp 2 kwietnia 2007]. Dostępny w World Wide Web: http://www.rodan.pl/badania [18] RENK, R., ADAMCZYK, A., HOŁUBOWICZ, W. Metoda wstępnej analizy polegająca na tworzeniu słowników metadanych w projektach budowy analitycznych hurtowni danych. In X Konferencja PLOUG Kościelisko, październik 2004 [on-line]. PLOUG - Polish Oracle User Group, 2004. [dostęp 2 kwietnia 2007]. Dostępny w World Wide Web: http://www.ploug.org.pl/konf_04/materialy/pdf/metoda_wstepnej_analizy.pdf. [19] NAHOTKO, M. Zasady tworzenia bibliotek cyfrowych. In Biuletyn
EBIB [on-line]. 2006, nr 4 (74) [dostęp 2 kwietnia 2007].
Dostępny w World Wide Web: http://www.ebib.info/2006/74 [20] JANUSZKO-SZAKIEL, A. Open Archival Information System – standard w zakresie archiwizacji publikacji elektronicznych. Przegląd Biblioteczny 2005, r. 73, nr 3, s. 342. [21] ustrukturyzowane, czytelne maszynowo dane, zawierające charakterystykę cyfrowych obiektów informacyjnych, służącą ich efektywnemu oraz trafnemu wyszukiwaniu, szczególnie w wielkich zasobach informacji w Internecie, zarządzaniu nimi i ich wartościowaniu. NAHOTKO, M. Metadane: sposób na uporządkowanie Internetu. Kraków : Wydaw. Uniwersytetu Jagiellońskiego, 2004, s. 15. [22] Na podstawie:
DCMI Metadata Terms [on-line]. Dublin Core Metadata Initiative [dostęp
2 kwietnia 2007]. Dostępny w World Wide Web: http://dublincore.org/documents [23] FILIPEK, A. Dublin Core, czyli metadane w nowej formie. Zagadnienia Informacji Naukowej 2006, nr 2 (88), s. 50-58. [24] Por.:
DCMI Glossary [on-line]. Dublin Core Metadata Initiative [dostęp
2 kwietnia 2007]. Dostępny w World Wide Web: http://dublincore.org/documents [25] FILIPEK, A. Opis bibliograficzny dokumentu – FRBR a ISBD. Zagadnienia Informacji Naukowej 2006, nr 1 (87), s. 26-41. [26] NAHOTKO, M. Opis dokumentów elektronicznych..., s. 70. [27] Na podstawie: Functional Requirements for Bibliographic Records: Final Report
[on-line]. München: IFLA Study Group on the Functional Requirements
for Bibliographic Records, 1998, s. 16-27 [dostęp 2 kwietnia
2007]. Dostępny w World Wide Web: http://www.ifla.org/VII/s13 [28] Na podstawie:
The Open Archives Initiative Protocol for Metadata Harvesting
[on-line]. The Open Archives Initiative, 2002. [dostęp 2
kwietnia 2007]. Dostępny w World Wide Web: http://www.openarchives.org |