ebib 
Nr 4/2010 (113), Cyberkłopoty i pułapki sieci. Artykuł
 poprzedni artykuł następny artykuł   

 


Piotr Tafiłowski
Uniwersytet M. Curie-Skłodowskiej w Lublinie

Etykietowanie treści w serwisie podaj.net


To lepsze niż antykwariat i biblioteka – tak reklamuje się internetowy serwis wymiany książek podaj.net (http://podaj.net/). Prezentowany tekst nie jest jednak poświęcony wymianom książek, lecz problemom wiążącym się z jedną z cech dwuzerowości tego serwisu, a mianowicie tagowaniem, czyli społecznym opisywaniem, klasyfikowaniem czy też etykietowaniem treści, dokonywanym przez użytkowników w dowolny, unikalny sposób.

Tagi są formą – bliskich sercu każdego bibliotekarza – metadanych, choć w odróżnieniu od ustrukturyzowanego opisu bibliograficznego ich specyfiką jest brak marki eksperckości oraz hierarchii, a także kolokwialność. Co za tym idzie, zazwyczaj forma tagów nie jest w żaden sposób kontrolowana, pozostając czysto intuicyjną. Niewiele jest tezaurusów zbudowanych z tagów (choć i takie istnieją), nie ma zestawu słów, których należałoby używać do etykietowania treści ani też oficjalnych podręczników pokazujących, w jaki sposób opisywać zawartość sieci. Istnieje więc niebezpieczeństwo, iż użytkownik może świadomie (lub nie) błędnie opisać dany obiekt.

Czy więc tak ryzykowny „system” jest nam do czegoś potrzebny? Czy możliwe korzyści przeważają nad uświadamianymi zagrożeniami? Tagowanie ma wielu zwolenników, którzy bez wahania odpowiedzą, iż im więcej różnorodnych grup zaangażowanych w konsultacje oraz budowanie systemu, tym dla niego lepiej. Jest to zbiorowa inteligencja, o której pisze Pierre Lévy, czyli zdolność wirtualnych społeczności do wykorzystywania połączonych uzdolnień wszystkich ich członków, ponieważ Nikt nie wie wszystkiego, każdy wie coś. Całą wiedzę ma ludzkość. Ponadto społecznościowe etykietowanie treści w środowisku cyfrowym jest immanentną cechą fenomenu Web 2.0. W odniesieniu do tego zjawiska obiegowo używa się takich określeń jak: oddawanie określonych zadań w ręce tłumu (crowdsourcing), bystry tłum (smart mobs), mądrość tłumu (crowd wisdom)[1] czy też usieciowiona inteligencja. Do bezkrytycznych entuzjastów samoorganizującej się gospodarki rozproszonej należą autorzy cytowanej tu Wikinomii.

Istnieje wszakże również znaczne grono sceptyków, którzy podkreślają niebezpieczeństwa, jakie wyniknąć mogą z „anarchistycznej”, nieujętej w żadne taksonomiczne ramy działalności internautów. Najgłośniejszym z nich jest bodaj Andrew Keen, autor książki Kult amatora: jak Internet niszczy kulturę (Warszawa 2007). W sposób syntetyczny podsumowuje te zagrożenia Kamil Stępień[2]: Mamy do czynienia z wieloznacznością fraz, synonimicznością (dla oznaczenia jednego zasobu może być użyte kilka znaczących to samo wyrazów), polisemią, bliskoznacznością i homografią. Występuje niejednolitość form gramatycznych, szczególnie liczby pojedynczej i mnogiej (np. biblioteka i biblioteki). Dość często spotykane są różne sposoby łączenia słów kluczy w kwerendach lub wyrazach wieloczłonowych (np. science fiction, science-fiction, science/fiction, ScienceFiction, science_fiction). Użytkownicy stosują także tzw. tagi osobiste, charakterystyczne i zrozumiałe wyłącznie dla jednego użytkownika np. mój samochód. Znane są przypadki „zaśmiecania” przez użytkowników systemów folksonomicznych tagami, których treść jest nieistotna, niezrozumiała bądź została użyta tylko raz, np. Pies_Angeliki_K_którego kiedyś_miała. Taggerzy, aby uzyskać pierwszą pozycję w alfabetycznym spisie etykiet, stosują tzw. „znaki specjalne” takie jak: #; *; &. Przykładowa fraza złożona z kilku słów kluczy i opisanych powyżej znaków: # jestem pierwszy(...). Innym problemem jest wprowadzanie tagów złożonych, wielowyrazowych oraz rozbieżność pisowni, na przykład open source a opensource. Stosowanie przez większość użytkowników dookreślonych fraz zamiast prawidłowych jednowyrazowych prowadzi do mylnych rezultatów podczas wyszukiwań w serwisach indeksujących tagi. Do tego katalogu dodać jeszcze należy notoryczne „gubienie” polskich znaków diakrytycznych, co wytwarza błędne wrażenie, co do liczby wprowadzonych do użytku słów kluczowych (np. miłość, milosc, miłosc, milość itd.).

Praktyczne zastosowania systemu tagów

Chciałbym, aby moje uwagi dotyczące stosowania tagów potraktowane zostały nie jako dezawuowanie dwuzerowości en bloc, lecz jedynie jako głos w dyskusji, którą tak czy inaczej należy podjąć, a do której pretekstem stać się może wyżej cytowana książka K. Stępnia.

Możliwością wpisywania tagów dysponują użytkownicy wspomnianego na początku serwisu podaj.net http://podaj.net/. Etykiety te mają w dopełniający sposób opisywać treść książki i dodawane są w specjalnym polu podczas jej udostępniania. Pole tagów znajduje się na końcu formularza i opatrzone jest etykietą Dodaj słowa najlepiej określające książkę. Ponadto twórca serwisu umieścił tu krótką instrukcję: Poszczególne słowa oddziel spacją np. komedia czytadło miłość zdrada piękno. Uwaga: słowa, nie ZDANIA. Niestety, wskazówki te są nagminnie ignorowane. Częste jest choćby oddzielanie słów przecinkami, przez co później w tymże polu opisu wyświetlany jest zdwojony przecinek (,,) lub też kilkuwyrazowych fraz średnikami – kochac [sic!] siebie; filozofia codzienności; idealista (M. Szyszkowska, Spotkania w salonie). Nierzadko również jako tagi wpisywane są zdania języka naturalnego np. bezpośrednio ze swojego pc ta [sic!] będziesz mógł wyruszyć w podróż po wirtualnym świecie! (B. Falk, Internet) lub też: wyprawa na nową planetę odkrywanie jej tajemnic aluzje do ówczesnej rzeczywistości (S. Lem, Eden) czy kryminalna powieść z ciemną stroną szwedzkiego społeczeństwa w tle (H. Mankell, Fałszywy trop).

Książka A. M. Villefranche Sekrety miłości opisana została bogatym zestawem słów kluczowych, ale także całymi zdaniami: miłość zdrada pożądanie perwersja bogactwo przepych erotyka młoda dziewczyna zabawy z chłopcami ciało jako doskonałe narzędzie manewrowania mężczyznami. Bywa również, że etykiety przejmują rolę pola podtytułu: testy i ćwiczenia łacińskie t. 1 (J. Ziabicki, Sine colloquiis colloquia) lub kształcenie w zakresie podstawowym i rozszerzonym (A. Z. Makowiecki, Pamiętajcie o ogrodach) czy też wyrażają opinię czytelnika o autorze i jego dziele: jeszcze mu daleko do wyklarowania teorii wszystkiego (J. von Buttlar, Szczelina czasu: spotkanie z niepojętym). Swoich emocji nie ukrywał użytkownik dodający etykiety do książki W. Kuczoka Gnój: dramat dziecko cierpienie sadysta rodzina. Jeszcze dalej posunęła się jedna z osób opisujących Wojnę polsko-ruską pod flagą biało-czerwoną D. Masłowskiej: bestseller awangarda żenada nuda gniot. Widać wyraźnie, że opisu książki dokonywały dwie osoby różniące się w ocenie dzieła. Inny egzemplarz tej samej pozycji opisany został jako książka dla starszej młodzieży (podkreślam, że tym samym słówko „dla” również staje się etykietą mającą opisywać treść książki). Refleksyjnie natomiast brzmią etykiety kobiety różne losy historie (M. Soból, Mojry). Czasem tagi mają również za zadanie przestrzeżenie innych użytkowników: miłość dużo wulgaryzmów (M. Gretkowska, P. Pietucha, Sceny z życia pozamałżeńskiego).

Jako etykiet używa się też tytułów serii, takich jak mroczne materie (Ph. Pullman, Magiczny nóż). Bardzo często staje się nią nazwisko autora książki, imię jej głównego bohatera lub też słowo z tytułu. W wypadku książki A nie mówiłam K. Grocholi to właśnie grochola jest jedynym tagiem (regułą jest pisanie nazw własnych małą literą). Mała apokalipsa T. Konwickiego opisana została słowami lektura konwicki apokalipsa i aż prosi się, żeby dopisać tutaj tag mała; jego pominięcie wydaje się być przeoczeniem osoby tagującej. Niektórzy użytkownicy za pomocą tagów próbują także określać gatunki literackie: bestseller dramat biografia opowieść (T. Pratchett, Ciekawe czasy), autobiografia (A. Fiedler, Mój ojciec i dęby), encyklopedyczne opracowanie (Filozofia XX wieku), komedia (M. Wolski, Agent dołu) czy też młodzież [sc. literatura młodzieżowa? – PT] fantastyka przygody przygoda [sc. literatura przygodowa? – PT] tajemnica (Ph. Pullman, Zaczarowany nóż). W tym ostatnim wypadku użytkownik podaje dwie formy jednego z gatunków, w liczbie pojedynczej i mnogiej, prawdopodobnie po to, żeby lepiej opisać książkę. Jednakże takie sztuczne mnożenie słów kluczowych raczej utrudnia innym użytkownikom korzystanie z systemu, zamiast przynosić im korzyść. Wydaje się więc konieczne ustalenie w przyszłości jakichś reguł regulujących tagowanie. Z nadmiernym mnożeniem tagów mamy do czynienia również choćby w wypadku książki J. Grzegorczyka Adieu. Przypadki księdza Grosera: grzegorczyk przypadki księdza grosera kler księża obyczajowa współczesna bestseller.

Ten sam obiekt może być opisywany na różne sposoby. Kolejne egzemplarze Alicji w krainie czarów opisane są tagami: bajka; lektura kot cheshire kapelusznik; Alicja królik fałszywy żółw kapelusznik znikający kot drzwi ciasteczka grzyb czary. Trudno nie zdawać sobie sprawy, jaki chaos wprowadzamy do systemu opisując Alicję tagami z różnych dziedzin wiedzy: kot, żółw, królik (zoologia; zwierzęta domowe) czy grzyb (botanika). Tego samego typu problem powoduje użycie tagu historia w opisie kryminału B. Akunina Pelagia i biały buldog. Użytkownicy korzystający z etykiet nadanych przez innych internautów, a poszukujący poradników czy literatury naukowej kierowani będą do pozycji, które zupełnie ich nie interesują.

Dwa różne egzemplarze Kamieni na szaniec opisane zostały tagami lektura wojna oraz historia harcerstwo. Wyraźnie widać tu, jak różne były odczucia użytkowników po lekturze, na jak różne aspekty książki zwrócili uwagę, na jak różnych płaszczyznach został odczytany tekst (wydaje się, że jest to interesujący problem dla badaczy czytelnictwa), a wreszcie – jak bardzo dwa egzemplarze tego samego dzieła literackiego nie mają ze sobą nic wspólnego w systemie folksonomii. Jeden z egzemplarzy Ferdydurke W. Gombrowicza opisany został zupełnie nic nie mówiącymi na temat książki tagami pupa parobek forma. Nie mogło także zabraknąć najbardziej gombrowiczowskiej etykiety gęba (czy też może metaetykiety, jeśli przyjmiemy, że gęba była etykietą(?) dla samego Gombrowicza). Koniec świata w Breslau M. Krajewskiego najczęściej opisywany jest zestawem tagów eberhard mock wrocław breslau (lub jakąś jego kombinacją), jednakże jeden z użytkowników nie poddał się temu nurtowi, etykietując swój egzemplarz kryminał półświatek, dzięki czemu mamy pewność, że nigdy nie odnajdzie go żaden wielbiciel sagi o wrocławskim policjancie (by jeszcze bardziej utrudnić zadanie innym użytkownikom egzemplarz ten umieszczony został w kategorii „horror”). Kolejne egzemplarze Ojca chrzestnego M. Puzo opisywane są zestawami tagów: audiobook sensacja obyczaj mafia klasyka powieść; corleone; mafia honor bestseller akcja; miłość sensacja zagadka przygoda krytyka; cosa nostra. Na tę książkę może więc natrafić osoba poszukująca np. esejów poświęconych krytyce literackiej lub też opisów obyczajów, jak choćby te autorstwa Stanisława Bystronia.

Ten chaos czasami jeszcze się powiększa przez bezmyślność użytkowników. Wśród tagów opisujących Katedrę w Barcelonie I. Falconesa znalazły się i takie: zbigniew zapasiewicz audiobook 4 5 godziny za darmo. Ktoś zatem zepsuł opis książki papierowej, dodając do niego tagi odnoszące się do audiobooka (w tym także nazwisko czytającego ją w nagraniu aktora), ubogacając go jeszcze znacznikami całkowicie bezwartościowymi (4, 5, godziny, za, darmo). Zastanawiać się wreszcie można, jaka jest rola dopisywanych przez opiekunów serwisu do etykiet własnych roboczych znaczników, mających wskazywać np. że opis bibliograficzny książki został poprawiony. Czy tagi powinny służyć również do takich celów? Obecnie brakuje w serwisie statystyk używanych tagów (kiedyś były one prezentowane na stronie głównej w postaci „chmury tagów”), jednakże można stwierdzić, że do najczęściej występujących tagów należą słowa: ciekawa, lektura, czytadło, bestseller oraz spójnik i.

Postulowana przez autorów Wikinomii oraz innych entuzjastów „mądrość tłumu” na razie pozostaje chyba jeszcze w sferze deklaratywnej. Wydaje się, że aby wykorzystać jej potencjał należy nią jakoś pokierować, nie wykazuje ona bowiem (przynajmniej obecnie) większych zdolności do samoorganizacji. Jej anarchiczna forma nie jest oczywiście żadną katastrofą i kompromitacją systemu folksonomii, z drugiej jednak strony nie dowodzi też ona obecnie swojej użyteczności, w tym także tej w zakresie uzupełniania tradycyjnych, eksperckich, taksonomicznych systemów klasyfikacji. Trzeba ją jakoś uporządkować, ponieważ ta forma całkowitej dowolności w mojej opinii niezbyt dobrze się sprawdza. Głównym problemem jest jednak chyba to, że użytkownicy bardzo często nie umieją posługiwać się narzędziami, którymi dysponują i nie rozumieją ich przeznaczenia. To użytkownicy tagują i jest to proces, który przynajmniej obecnie nie poddaje się algorytmizacji czy automatyzacji. Jacy więc będą użytkownicy, jaki poziom ich wiedzy, taka też będzie jakość nadanych przez nich etykiet.

Konieczna jest jakaś brzytwa Ockhama, która pozwoli eliminować skrajnie subiektywne zachowania użytkowników (przykłady powyżej) i jednocześnie nie pozwoli użytkownikom zajmującym się społecznościowym klasyfikowaniem treści na wykraczanie poza pewne (szeroko zakreślone) granice. Zacząć można byłoby od opracowania listy słów niedozwolonych, by etykietami nie mogły stawać się np. spójniki i partykuły. Subiektywizm ujęcia przedmiotu jest oczywiście siłą folksonomii, jednakże po przekroczeniu owych granic tagi zamiast pomagać – wprowadzają w błąd, odsyłają do niepożądanych zasobów, zaś gąszcz zbędnych czy mylnych tagów utrudnia (a z czasem może wręcz uniemożliwiać) łatwe, szybkie i skuteczne odnalezienie poszukiwanych treści. Wydaje się więc, że jakaś forma „taksonomizacji” (w znaczeniu nadania pewnego rygoru) systemów folksonomicznych jest nieuchronną koniecznością i to właśnie (obok postulatu nieustannej edukacji użytkowników) jest główną tezą artykułu.

Przypisy

[1] TAPSCOTT, D., WILLIAMS, A. D. Wikinomia : o globalnej współpracy, która zmienia wszystko, Warszawa 2008, s. 20.

[2] Stępień, Kamil, Folksonomie, czyli społecznościowe opisywanie treści. Warszawa 2010 SBP. Seria Propozycje i Materiały, nr. 81.

 Początek stronyEtykietowanie treści w serwisie podaj.net / Piotr Tafiłowski // W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska - Nr 4/2010 (113) maj. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2010. - Tryb dostępu: http://www.ebib.info/2010/113/a.php?tafilowski. - Tyt. z pierwszego ekranu. - ISSN 1507-7187