A. Liber, Czy można obiektywnie zmierzyć potrzeby czytelnika i jakość usług biblioteki elektronicznej?

Problem pomiaru potrzeb jest typowym problemem współczesnego rynku dóbr materialnych i informacyjnych. Większość stosowanych obecnie metod pomiaru potrzeb człowieka opiera się na statystycznej obróbce ankiet wypełnianych przez losowo wybranych przedstawicieli małych grup. Metody ankietowe mają szereg powszechnie znanych wad. Do najważniejszych wad należy zaliczyć: subiektywizm przy opracowywaniu pytań, subiektywizm i możliwość wygenerowania nieprawdziwej odpowiedzi przez odpowiadającego na pytania. Statystyczne opracowywanie tego typu badań ogranicza się do wyliczenia parametrów statystycznych dla wybranej grupy reprezentantów i w istotny sposób zależy od metody wyboru takiej grupy. Podobnie jak przy badaniu potrzeb można badać jakość usług.

Ewolucja klasycznej biblioteki w kierunku biblioteki elektronicznej w istotny sposób zmienia zasady korzystania ze zbiorów. Klient biblioteki elektronicznej jest de facto użytkownikiem specjalizowanego elektronicznego systemu informacyjnego. Można postawić pytanie - czy w odniesieniu do niego nie można stosować innych mechanizmów oceny potrzeb i satysfakcji z usług niż metody stosowane w odniesieniu do biblioteki tradycyjnej?

Informacja w bibliotece elektronicznej i jej przepływ pomiędzy czytelnikiem a zasobami biblioteki

Co to jest informacja? To proste pytanie stwarza często problemy z udzieleniem precyzyjnej i wyczerpującej odpowiedzi. Odpowiedzi oparte na potocznym rozumieniu tego terminu sprawiają wrażenie, że informacja jest czymś wieloznacznym, o niewyraźnych granicach pojęciowych, trudnym lub niemożliwym do zmierzenia. Intensywnie rozwijająca się w ubiegłym wieku teoria informacji stworzyła matematyczne podstawy jej pomiaru i opisu jej przetwarzania [1]. Zgodnie z teorią informacji możliwe jest dokonanie pomiaru i oceny ilości informacji, niezależnie od jej postaci oraz źródła. Warunkiem koniecznym pomiaru jest wybór symboli używanych do jej reprezentacji. Symbole związane z przesyłaniem informacji mogą być związane praktycznie z dowolnymi zjawiskami fizycznymi, wykorzystywanymi w procesie komunikacji. W przetwarzaniu informacji w bibliotece elektronicznej najczęściej używanymi symbolami są znaki liter i symboli pisarskich. W przypadku literatury naukowej i ilustracyjnej zbiór symboli może być rozszerzony o symbole tworzące wzory i zależności matematyczne, chemiczne, fizyczne czy też obrazy. Zakładając, że przekazywana informacja tworzy ciąg takich symboli x=x₁x₂x₃...x_n, można wyznaczyć miarę związaną z występowaniem każdego z symboli w wiadomości. Najprostszą taką miarą może być prawdopodobieństwo wystąpienia symbolu w treści wiadomości p(x_i). Ilość informacji zawartej w rozważanym ciągu określa wielkość zwana entropią informacji:

Entropijna miara ilości informacji może być użyta nie tylko do określania własności zasobów informacyjnych, lecz również przy pomiarach procesów informacyjnych, zachodzących pomiędzy czytelnikiem a zasobami elektronicznymi biblioteki. W praktycznych realizacjach pomiarów wymiany informacji pomiędzy biblioteką a czytelnikiem jako symbole x_i mogą być przyjmowane całe zespoły symboli, takie jak np. słowa kluczowe, nazwisko i imię autora, tytuł, rok wydania, kategoria tematyczna itp.

Czytelnik biblioteki elektronicznej jest faktycznie użytkownikiem systemu informacyjnego. Cały proces komunikacji czytelnika z elektroniczną biblioteką przebiega za pomocą transakcji elektronicznych i może być opisany jako proces informacyjny zachodzący w kanale komunikacyjnym w sposób opisany w pracy Shannona [1].

Dokonując pomiaru informacjii wymienianych pomiędzy czytelnikiem a biblioteką elektroniczną, można podjąć próbę formalnego pomiaru potrzeb czytelnika. W tym celu należy przyjąć określony model działania systemu czytelnik-biblioteka oraz założyć zbiór symboli X używanych w tym systemie. Definicję działania systemu czytelnik-klient można przyjąć przez specyfikację transakcji systemu informacyjnego tworzącego bibliotekę. Zbiór symboli lub haseł X może być zadany arbitralnie przez system biblioteczny lub może być tworzony dynamicznie przez rejestrację haseł podawanych przez czytelnika podczas wymiany informacji z systemem bibliotecznym.

Pomiar potrzeb czytelnika i jakości usług

Zakładając, że czytelnik jest użytkownikiem pewnego systemu informacyjnego nazywanego biblioteką elektroniczną możemy przyjąć, że jego operacje na zasobach biblioteki są transakcjami w systemie informatycznym. W celu przedstawienia formalnego opisu procesu pomiarowego przyjmijmy dla uproszczenia, że użytkownik elektronicznej biblioteki wykonuje następujące czynności: przesyła zapytanie w postaci elektronicznej Q w celu pozyskania poszukiwanego dzieła, otrzymuje odpowiedź o wyniku realizacji zapytania A, przeprowadza operacje O na udostępnionych w wyniku odpowiedzi na zapytanie materiałach elektronicznych. Opisane czynności tworzą ciągi indeksowane identyfikatorem użytkownika id oraz numerem kolejnej operacji dokonywanej przez użytkownika k:

Q=Q_id1,1Q_id1,2...Q_id1,k1...Q_id1,n1Q_id2,1Q_id2,2...Q_id2,k2...Q_id2,n2...Q_idm,1Q_idm,2...Q_idm,km...Q_idm,nmQ,
A=A_id1,1A_id1,2...A_id1,k1...A_id1,n1A_id2,1A_id2,2...A_id2,k2...A_id2,n2...A_idm,1A_idm,2...A_idm,km...A_idm,nmA,
O=O_id1,1O_id1,2...O_id1,k1...O_id1,n1O_id2,1O_id2,2...O_id2,k2...O_id2,n2...O_idm,1O_idm,2...O_idm,km...O_idm,nmO.

W ogólnym przypadku długości tych ciągów są różne. Na długość ciągu Q wpływa ilość czytelników oraz ilość zadanych przez nich zapytań. Długość ciągu odpowiedzi może być mniejsza lub równa długości ciągu pytań. Wynika to z faktu, iż system informacyjny, jaki tworzy biblioteka, podlega procesom naturalnej eksploatacji i rozwojowi, w wyniku których następują uszkodzenia i okresowe wyłączenia. Jedną z możliwych odpowiedzi jest też odpowiedź pusta wynikająca z nieprawidłowo zadanego zapytania, braku poszukiwanych elementów w bazie danych systemu itp. Sytuacja taka powoduje konieczność powtórzenia skorygowanego zapytania. Przy badaniach potrzeb czytelnika sytuacje takie można uznać za błędne i nie uwzględniać ich w obliczeniach. Długość ciągu operacji może być mniejsza, równa lub większa od długości ciągu odpowiedzi i długości ciągu zapytań. Rodzaj relacji uwarunkowany jest przez rzeczywiste potrzeby związane z prezentacją i kolekcjonowaniem znalezionych przez czytelnika dokumentów. Możliwe jest, że po znalezieniu wyszukiwanego materiału czytelnik zrezygnuje z jego czytania, przeglądania, drukowania lub jakiejkolwiek innej operacji. Możliwe jest również, że po znalezieniu dokumentu czytelnik będzie czytał abstrakt, czytał pełny dokument, drukował dokument, zapisywał dokument na lokalnym dysku, powtarzając te operacje dla jednego dokumentu wielokrotnie itp. Analiza ciągu operacji może dać ważne informacje co do istotnych potrzeb użytkownika.

Można łatwo zauważyć, iż w większości systemów bibliotecznych postaci zapytań, odpowiedzi i operacji wykonywanych przez czytelnika są różne. Zapytanie Q w większości przypadków formułowane jest w postaci ciągu, tytułów, nazwisk, słów kluczowych lub indeksów takich słów. W praktycznym systemie bibliotecznym pytanie można zrealizować za pomocą formularza z listami wyboru ograniczającymi zbiór symboli X dostępnych dla czytelnika. Ograniczenie ilości elementów zbioru X ma znaczenie praktyczne dla procesu przetwarzania informacji ze strony bibliotekarza, umożliwiając sprawne przygotowanie materiałów udostępnianych czytelnikowi. Odpowiedzi systemu bibliotecznego najczęściej mają postać listy tytułów z krótkim opisem. Czytelnik wybiera daną pozycję z listy. Operacje, które może wykonać, w istotny sposób zależą od systemu bibliotecznego, rodzaju subskrypcji itp. Typowo dostępne są możliwości czytania abstraktu. Dla baz pełnotekstowych uzupełnione są one przez możliwości czytania pełnych tekstów, możliwości wydruku lub możliwość zapisu na lokalnym dysku.

W celu zmierzenia potrzeb czytelnika należy wyselekcjonować cechy określające te potrzeby. Potrzeby użytkownika można podzielić na dwie grupy: grupę potrzeb informacyjnych oraz grupę potrzeb materialnych. Do grupy potrzeb informacyjnych należą poszukiwane przez czytelnika zagadnienia. Zagadnienia te zawarte są w ciągach zapytań Q. Z ciągów tych można wyekstrahować takie dane jak: słowa kluczowe, tytuły, nazwy wydawnictw, nazwiska autorów itp. Stosowane do tej pory metody liczbowej oceny takich potrzeb opierają się na metodach statystycznych. W przypadku stosowania tych metod oblicza się stosunek procentowy ilości poszczególnych wyekstrahowanych elementów grup, do całkowitej ilości elementów danej kategorii zawartych w ciągu pytań Q. Przykładowo, opierając się na zadanym zbiorze słów kluczowych X, można policzyć ilość nxi wystąpień w zapytaniu każdego ze słów kluczowych x_i należących do zbioru X. Otrzymuje się wtedy pary słowo kluczowe-częstość wystąpień:

Pomiary statystyczne są łatwe do przeprowadzenia, lecz nie dają dobrej oceny własności informacyjnych procesu korzystania czytelnika z biblioteki. Wydaje się, że poprawną ocenę można uzyskać, stosując zależności wynikające z teorii informacji. Jak pokazano we wstępie, wielkością dobrze charakteryzującą procesy informacyjne jest entropia informacji. Zastosowanie entropii do oceny potrzeb czytelnika daje lepsze rezultaty mimo bardziej złożonych formuł obliczeniowych. Przykładowo w celu obliczenia entropii potrzeb informacyjnych czytelników zawartych w ciągu zapytań należy, podobnie jak przy metodach statystycznych, określić liczebności wystąpień zadanych stanów informacyjnych, wyznaczyć na ich podstawie częstości wystąpień. Częstości wystąpień można przyjąć jako prawdopodobieństwa wystąpienia symbolu znajdujące się we wzorze na entropię. Przykładowo, opierając ocenę potrzeb na zbiorze słów kluczowych, otrzymuje się:

Pomiar jakości usług jest problemem występującym we wszystkich systemach informacyjnych. Trudność wyliczenia współczynników określających jakość usług opiera się na trudności precyzyjnej specyfikacji pojedynczych usług oraz pomiaru ilości samej usługi. Oczywiste jest, że podobnie jak przy ocenie potrzeb czytelnika można przyjąć tu mierniki statystyczne. Przykładowo jakość usług można próbować obliczać przez wyznaczanie zależności pomiędzy transakcjami zrealizowanymi a zakończonymi błędem lub brakiem realizacji. Takie sposoby obliczania jakości usług są wrażliwe na sposób uwzględnienia błędów popełnianych przez czytelnika. Oczywiście można przygotować system, który w przypadku błędu będzie zwracał cokolwiek, sprawiając wrażenie poprawnego działania i w przypadku obliczania współczynników jakości usług opartych na ilościowej analizie błędów da rewelacyjne rezultaty. Pojawia się jednak pytanie, jaką metodą mierzyć jakość usług biblioteki elektronicznej, aby bez wprowadzenia absurdalnych rozwiązań otrzymać wiarygodne, porównywalne wartości. Widoczne jest, że jakość usług można mierzyć zarówno w procesie zadawania zapytań przez czytelnika, jak i uzyskiwanych odpowiedzi czy też operacji wykonywanych przez czytelnika na dostarczonym tekście. Stosując jako miarę jakości usług wartość funkcji entropii na odpowiednio dobranych grupach symboli w ciągach Q, A, i O, można otrzymać ilościową ocenę: doboru usług przez bibliotekę, jakość systemu zapytań dostępnego dla użytkownika oraz w mniejszym stopni jakość systemu odpowiedzi generowanych w wyniku zapytania użytkownika.

Przedstawiona entropijna metoda pomiaru potrzeb czytelnika oraz jakości usług biblioteki oparta jest na zjawiskach obserwowalnych w całym świecie zdarzeń fizycznych. Obliczenie wartości funkcji entropii daje nie tylko jeszcze jeden dodatkowy parametr oceny biblioteki i jej współdziałania z czytelnikiem, lecz dostarcza dodatkowe informacje istotne z punktu widzenia efektywności obrotu informacją. Do informacji tych należy informacja o sposobie poprawy systemu zapytań oraz systemu odpowiedzialnego za realizację operacji na uzyskanym przez czytelnika materiale. Miara entropijna jest łatwa w realizacji technicznej w systemach elektronicznych i umożliwia łatwą weryfikację eksperymentalną procesów informacyjnych.

Różne metody szacowania przyszłych potrzeb czytelnika i jakości usług

Przedstawiona powyżej metoda pomiaru potrzeb czytelnika oraz jakości usług biblioteki elektronicznej oparta została o pomiar entropii informacji związanej z zapytaniami, odpowiedziami systemu oraz z operacjami czytelnika, oparta jest na wykorzystaniu natury i własności samej informacji. Istotne jest to, że metoda ta jest prosta do stosowania w systemach elektronicznych. W systemach takich można bowiem śledzić na bieżąco wystąpienia symboli i wariantów informacji, obliczając entropię dla informacji indywidualnej (pojedynczego symbolu) oraz grup symboli. Przy użyciu podanych w pracy zależności można wyliczać wartości potrzeb użytkownika dla zadanych grup informacji oraz jakość usług w przeszłym lub bieżącym okresie eksploatacji biblioteki. Pojawia się pytanie, czy możliwe jest zastosowanie miary entropijnej do przewidywania zjawisk przyszłych.

Najprostszą metodą oszacowania wartości przyszłych wydaje się być metoda statystyczna oparta na analizie regresji. Metoda taka daje dobre rezultaty przy wszelkiego typu procesach losowych. Traktując jako zmienną niezależną, zmienną reprezentującą komunikaty pojawiające się w systemie transakcyjnym biblioteki (ciągi Q, A, O), a jako zmienną zależną - wartość funkcji entropii, określającą określoną grupę potrzeb czytelnika, uzyskuje się szereg par stanowiących realizację procesu stochastycznego. Zadając określoną zależność funkcyjną dla takiego procesu, można metodami regresyjnymi oszacować wartości przyszłe entropii i w dalszej kolejności przygotować system biblioteczny do realizacji zmieniających się w czasie potrzeb czytelników.

Metodę regresyjną można w prosty sposób przenieść do systemów wykorzystujących metody sztucznej inteligencji, np. sieci neuronowe. Metody takie można oprzeć na mechanizmach metaheurystycznych charakterystycznych dla metod ewolucyjnych. Porównując własności współcześnie stosowanych sieci neuronowych, najbardziej odpowiednim wydaje się przyjęcie sieci GRNN realizującej uogólnioną regresję. Autor prowadzi badania w zakresie zastosowania sieci GRNN w systemach bibliotek elektronicznych.

Wnioski

W pracy przedstawiono możliwości pomiaru potrzeb użytkownika biblioteki elektronicznej. Zaproponowano przyjęcie formalnej miary, opartej na obliczaniu wartości funkcji entropii informacji. Pomiar potrzeb czytelnika za pomocą wyliczenia wartości entropii indywidualnej i grupowej dostarcza dodatkowych informacji niedostępnych przy stosowaniu prostych miar statystycznych. Wyznaczenie wartości funkcji entropii jest łatwe do przeprowadzenia w systemach bibliotek elektronicznych przez rejestrację zdarzeń zachodzących w procesach zadawania pytań, odpowiedzi oraz operacji na dokumentach.

Pomiar jakości usług biblioteki elektronicznej przy użyciu miary entropijnej oparty jest na własnościach rzeczywistych systemów informacyjnych i daje dobre możliwości ich oceny. Wartość funkcji entropii jakości usług informacyjnych daje wskazówki co do efektywności konstrukcji systemu udostępniania zapytań czytelnika i efektywności pozyskiwania szukanych przez niego materiałów. Wartość funkcji entropii określona na zbiorze operacji dostępnych dla czytelnika pracującego nad znalezionym dokumentem, daje możliwość zwrotnej oceny jego potrzeb oraz efektywnego wpływania na konstrukcję systemów bibliotek elektronicznych.

Oparcie miary potrzeb czytelnika i jakości usług biblioteki elektronicznej na entropii daje możliwość ich obiektywnej oceny i porównania. Dobre efekty można uzyskać, stosując miary entropijne innych własności bibliotek takich, jak bezpieczeństwo danych i możliwość ukrywania w zasobach biblioteki dodatkowych niewidocznych informacji [2], [3] czy też w przygotowaniu elektronicznego materiału terapeutycznego w biblioterapii [4].

Arkadiusz Liber
Wydział Informatyki i Zarządzania, Politechnika Wrocławska

Czy można obiektywnie zmierzyć potrzeby czytelnika i jakość usług biblioteki elektronicznej?

Wprowadzenie

Informacja w bibliotece elektronicznej i jej przepływ pomiędzy czytelnikiem a zasobami biblioteki

Pomiar potrzeb czytelnika i jakości usług

Różne metody szacowania przyszłych potrzeb czytelnika i jakości usług

Wnioski

Bibliografia

Arkadiusz Liber Wydział Informatyki i Zarządzania, Politechnika Wrocławska

Czy można obiektywnie zmierzyć potrzeby czytelnika i jakość usług biblioteki elektronicznej?

Wprowadzenie

Informacja w bibliotece elektronicznej i jej przepływ pomiędzy czytelnikiem a zasobami biblioteki

Pomiar potrzeb czytelnika i jakości usług

Różne metody szacowania przyszłych potrzeb czytelnika i jakości usług

Wnioski

Bibliografia

Arkadiusz Liber
Wydział Informatyki i Zarządzania, Politechnika Wrocławska