Nr 3/2006 (73), Open Access i inicjatywy pokrewne. ArtykuĹ

PaweĹ Najsarek
Biblioteka Uniwersytecka w Poznaniu

Terminologia Open Access â o czym warto wiedzieÄ?

PoczÄtek XXI wieku to czas ciÄgĹego rozwoju technologii i technik informacji. ĹšrĂłdĹa informacji pisanej, tj. ksiÄĹźka, czasopismo, sÄ nadal podstawowym sposobem poszerzania wiedzy, ale nie jedynym. RosnÄca w ostatnim czasie popularnoĹÄ Internetu wprowadza wiele zmian w dostÄpie do informacji. Od kilku lat obserwujemy rozwĂłj publikacji elektronicznych, ktĂłre ze swojÄ bogatÄ ofertÄ ĹşrĂłdeĹ naukowych trafiajÄ do ogromnej grupy zainteresowanych. Szybki i Ĺatwy dostÄp do tych informacji coraz bardziej rywalizuje z przekazem tradycyjnym (papier). Publikacje elektroniczne zamieszczane sÄ na specjalnych portalach okreĹlanych repozytoriami, do ktĂłrych sposĂłb dostÄpu nazywany jest open access.

Open Access - wolny dostÄp - oznacza nieograniczony dostÄp do darmowych publikacji. DuĹźÄ zaletÄ omawianego sposobu dostÄpu jest umieszczanie artykuĹu jako depozytu z zachowaniem praw autorskich oraz Ĺatwe ich wyszukiwanie. Zawarte w nich materiaĹy mogÄ byÄ uzupeĹniajÄcym ĹşrĂłdĹem informacji dostÄpnych w bibliotekach. MateriaĹy zamieszczane w systemach tego typu sÄ wykorzystywane przez oĹrodki naukowe bez dodatkowej zgody. Atutem jest rĂłwnieĹź dokonywana selekcja i kontrola publikacji. Sprawdzenie tekstĂłw przed publikacjÄ jest dokonywane przez ludzi. Dla uĹźytkownikĂłw i czytelnikĂłw materiaĹĂłw zamieszczonych na wyĹźej wymienionych stronach ma to swoje pozytywne odzwierciedlenie. Publikowane materiaĹy sÄ objÄte obiektywnÄ i krytycznÄ kontrolÄ, co wpĹywa na poziom i wĹaĹciwe zaklasyfikowanie materiaĹu do odpowiedniego dziaĹu, a to wpĹywa na trafnoĹÄ poszukiwaĹ.

Repozytorium oznacza miejsce przechowywania dokumentĂłw elektronicznych przeznaczonych do udostÄpniania. Zaprojektowane jest w taki sposĂłb, aby dostÄp do wszystkich zasobĂłw byĹ prosty. Dla zobrazowania terminu â repozytorium - porĂłwnaÄ moĹźna je do magazynu biblioteki, w ktĂłrym przechowywane sÄ materiaĹy. Natomiast Open Access okreĹla nam sposoby dostÄpu, ale rĂłwnieĹź reguĹy, ktĂłre sÄ narzucone przy korzystaniu z publikacji umieszczonych w repozytorium.

ChcÄc zbudowaÄ repozytorium, moĹźna skorzystaÄ z cennych wskazĂłwek, ktĂłre znajdujÄ siÄ na stronach inicjatywy powstaĹej w Uniwersytecie w Southampton www.eprints.org. PoniĹźej zostaĹ przedstawiony przykĹadowy schemat blokowy pokazujÄcy dziaĹanie repozytorium. W nawiasie podano pojÄcia zwiÄzane z danym blokiem.

Rys. 1. Schemat blokowy budowy repozytorium

Najbardziej znane oprogramowanie OA: ePrints, dSpace, Greenstone, Fedora, zob. na stronie Open Archives Initatives: http://www.openarchives.org/tools/tools.html.

OAI-PMH Protocol. To protokĂłĹ, ktĂłry za pomocÄ odpowiednich kodĂłw zbiera informacje z metadanych umieszczonych w repozytoriach â tworzÄc swoistÄ bazÄ danych z ogromnÄ moĹźliwoĹciÄ wyszukiwania informacji i odnoĹnikĂłw do publikacji.

Metadata. Struktura danych opisujÄca zasoby elektroniczne lub tradycyjne (katalogi biblioteczne). PrzykĹadem metadanych sÄ pola zawierajÄce: autora publikacji, datÄ wydania, tytuĹ itp.

Dublin Core. OgĂłlny standard metadanych. Standard ten do opisu wykorzystuje 15 nastÄpujÄcych elementĂłw:

Title (tytuĹ)
Creator (twĂłrca)
Subject and Keyword (temat i sĹowa kluczowe)
Description (opis)
Publisher (wydawca)
Contributor (wspĂłĹtwĂłrca)
Date (data)
Resource Type (typ zasobu)
Format (format)
Resource Identifier (identyfikator zasobu)
Source (ĹşrĂłdĹo)
Language (jÄzyk)
Relation (odniesienie)
Coverage (zakres)
Rights Management (zarzÄdzanie prawami)

Publikacje moĹźemy zamieszczaÄ i przeglÄdaÄ w rĂłĹźnych formatach. WiÄĹźe siÄ to z posiadaniem odpowiedniego oprogramowania, ktĂłre umoĹźliwia wĹaĹciwe gromadzenie i wykorzystanie zamieszczonych w niej materiaĹĂłw. NajczÄĹciej spotykane formaty w repozytoriach Open Access zostaĹy wymienione poniĹźej.

Formaty

.doc - najpopularniejszy format zapisu tekstu, wykorzystywany przez aplikacje Word. UmoĹźliwia autorowi zabezpieczenie tekstu przed wprowadzeniem zmian. UĹźytkownik, zabezpieczajÄc dokument, moĹźe zastosowaÄ hasĹo.

.pdf - format stworzony i promowany przez firmÄ Adobe. PrzeglÄdanie dokumentĂłw w tym formacie moĹźliwe jest za pomocÄ aplikacji Acrobat Reader (www.adobe.com) lub Ghostscript (www.cs.wisc.edu/~ghost). NarzÄdzia te sÄ darmowe i ogĂłlnie dostÄpnie dla kaĹźdego internauty. Format cieszy siÄ bardzo duĹźÄ popularnoĹciÄ. Dokument w formacie PDF jest dokumentem hipertekstowym, niezaleĹźnym od urzÄdzenia drukujÄcego/wyĹwietlajÄcego (jest wieloplatformowy). Autor, zamieszczajÄc swĂłj materiaĹ w formacie PDF, moĹźe nie tylko zabezpieczyÄ go przed wprowadzaniem zmian, ale rĂłwnieĹź przed kopiowaniem lub drukowaniem.

.djvu - format plikĂłw graficznych. DjVu posiada bardzo efektywnÄ metodÄ kompresji obrazu. Dokumenty DjVu sÄ najmniejsze ze spotykanych w zastosowaniach przemysĹowych, nawet do 1000 razy mniejsze niĹź pliki TIFF. SÄ teĹź zwyczajowo 5 do 100 razy mniejsze niĹź pliki JPEG czy PDF. ChociaĹź pliki PDF sÄ obecnie powszechnie uĹźywane, byĹy rozwijane gĹĂłwnie jako formaty stosowane do wydrukĂłw i nie sÄ najlepsze do zastosowaĹ archiwizacyjnych. Dokumenty DjVu wyĹwietlane sÄ zawsze w taki sam sposĂłb. OglÄdanie dokumentĂłw DjVu jest niezaleĹźne od platformy. Wysoka jakoĹÄ obrazu w dokumentach DjVu powoduje, Ĺźe z dobrym skutkiem stosowane sÄ w nich techniki rozpoznawania pisma OCR. Wyniki takiego rozpoznania zapisywane sÄ wewnÄtrz dokumentu DjVu na specjalnej warstwie i mogÄ byÄ poddane przeszukiwaniu lub eksportowane do pliku TXT lub XML. Dodatkowo dokumenty DjVu wygenerowane elektronicznie mogÄ pozyskaÄ warstwÄ tekstowÄ bezpoĹrednio z dokumentu ĹşrĂłdĹowego, z ktĂłrego powstaĹy. Warstwa tekstowa wĂłwczas jest wierna z oryginaĹem w 100%.

.rtf - Rich Text Format - format pliku opracowany w 1987 r. przez Microsoft do miÄdzyplatformowej wymiany informacji miÄdzy procesorami tekstĂłw.

.dvi - DeVice Independent - format pliku wynikowego w programie wydawniczym TeX. W przeciwieĹstwie do plikĂłw ze znacznikami TeX, pliki DVI nie sÄ przeznaczone do czytania przez uĹźytkownika; zawierajÄ dane binarne opisujÄce wizualny ukĹad dokumentu w sposĂłb niezaleĹźny od specyficznego formatu graficznego, monitora czy drukarki. Pliki DVI sÄ zwykle uĹźywane jako pliki wejĹciowe w innym programie (DVI driver), ktĂłry przetwarza pliki DVI na dane graficzne. Dla przykĹadu, wiÄkszoĹÄ pakietĂłw TeX zawiera program do podglÄdu plikĂłw DVI na monitorze komputera - program taki jest sterownikiem (driverem). Drivery sÄ teĹź uĹźywane do przetworzenia DVI na popularne formaty dokumentĂłw, np. PostScript, PDF, i do drukowania.

JÄzyki

.ps â PostScript - jÄzyk opisu strony dokumentu drukowanego przez drukarkÄ komputerowÄ lub naĹwietlanego przez naĹwietlarkÄ. W przygotowywanym do wydruku dokumencie sÄ umieszczane (zwykle przez edytor tekstu, program graficzny) instrukcje w jÄzyku Postscript. UĹźywa siÄ go do uzyskiwania wydrukĂłw wysokiej jakoĹci (np. ilustrowanych), zwĹaszcza w maĹej poligrafii komputerowej (desktop publishing). Zastosowanie Postscriptu wymaga drukarki wyposaĹźonej w interpreter posctscriptowy (tzw. drukarki postscriptowe); wprowadzony w 1985 r. przez amerykaĹskÄ firmÄ Adobe Systems Incorporated.

.html - jÄzyk definiowania i formatowania dokumentĂłw cyfrowych, oprac. w latach 1989â1991 przez T. Bernersa-Lee dla organizacji CERN na podstawie standardu SGML, pĂłĹşniej rozbudowywany. Zawiera m.in. instrukcje umoĹźliwiajÄce projektowanie ukĹadu strony, zamieszczanie ilustracji w tekĹcie, okreĹlanie krojĂłw pisma, definiowanie powiÄzaĹ pomiÄdzy rĂłĹźnymi dokumentami lub fragmentami tego samego dokumentu; powszechnie wykorzystywany do opracowywania stron hipertekstu w systemie WWW.

.xml - eXtensible Markup Language - standard przekazywania informacji wraz z ich opisem, wykorzystujÄcym proste znaczniki. XML to jÄzyk umoĹźliwiajÄcy tworzenie swoich wĹasnych znacznikĂłw formatujÄcych, definiowanych w tzw. schematach XML. XML i jego zastosowania prawdopodobnie w przyszĹoĹci zastÄpiÄ caĹkowicie HTML, gdyĹź XML w wersji 1.0 zostaĹ uznany za standard przez W3C - organizacjÄ, ktĂłra zajmuje siÄ ustanawianiem standardĂłw pisania i przesyĹu stron WWW. Jego rozwĂłj jest silnie wspierany przez najwaĹźniejsze firmy produkujÄce oprogramowanie, takie jak: Microsoft, Oracle, Silicon Graphics, Sun Microsystems, wiele innych. XML umoĹźliwia pisanie dokumentĂłw, ktĂłre bÄdÄ mogĹy byÄ obsĹugiwane przez najrĂłĹźniejsze urzÄdzenia i programy. XML umoĹźliwia teĹź tworzenie tzw. aplikacji - czyli zestawĂłw znacznikĂłw do konkretnych zastosowaĹ, z ktĂłrych obecnie najbardziej znane sÄ: XHTML, MathML, SVG, CML. ZaletÄ XML-a jest moĹźliwoĹÄ dowolnego mieszania tych aplikacji, co umoĹźliwia np. wĹÄczanie fragmentĂłw MathML czy SVG do dokumentĂłw napisanych w XHTML-u, tworzÄc jeden, poprawny skĹadniowo dokument XML.

Inne

OprĂłcz powyĹźszej terminologii moĹźemy spotkaÄ siÄ z mniej znanymi nazwami formatĂłw i pojÄciami wykorzystywanymi przy udostÄpnianiu informacji (RDF, RSS, P3P, URI, URL, URN).

RDF - Resource Description Framework - struktura opisu zasobĂłw do reprezentacji informacji w sieci. ZaĹoĹźeniem RDF jest opis zasobu za pomocÄ wyraĹźenia skĹadajÄcego siÄ z trzech elementĂłw: podmiotu, predykatu i obiektu. W RDF podmiot stanowi opisywany zasĂłb, predykat okreĹla, jaka jego wĹasnoĹÄ jest opisywana, zaĹ obiekt stanowi wartoĹÄ tej wĹasnoĹci. Podstawowym mechanizmem wykorzystywanym przez RDF do identyfikacji podmiotu, predykatu i obiektu jest URI. Celem RDF jest umoĹźliwienie maszynowego przetwarzania abstrakcyjnych opisĂłw zasobĂłw w sposĂłb automatyczny.

RSS - Really Simple Syndication - umowna rodzina jÄzykĂłw znacznikowych do przesyĹania nagĹĂłwkĂłw wiadomoĹci. Wszystkie w wiÄkszym lub w mniejszym zakresie bazujÄ na XML-u. Aby âobejrzeÄ kanaĹ RSS, musimy skorzystaÄ ze specjalnego programu (tzw. czytnik kanaĹĂłw). CzÄsto czytniki RSS-Ăłw sÄ zamieszczane w programach pocztowych (np. Thunderbird). RSS przypomina popularne newslettery, z tym Ĺźe wiadomoĹci docierajÄ do prenumeratora indywidualnie i natychmiast po tym, jak zostajÄ opublikowane (a nie np. raz dziennie). KorzystajÄc z RSS-Ăłw, moĹźna zebraÄ w jednym miejscu informacje z wielu ĹşrĂłdeĹ na interesujÄcy temat. ĹciÄgane jest nic wiÄcej niĹź âspis treĹciâ wybranych serwisĂłw internetowych.

P3P - Opracowana przez konsorcjum W3C technologia zapewniajÄca ochronÄ danych osobowych uĹźytkownikĂłw oraz kontrolÄ nad tym, kto zbiera o nich informacje w czasie ich korzystania z sieci. Obecnie technologia ta nie jest jeszcze specjalnie popularna i niewiele serwerĂłw wspiera jej obsĹugÄ, aczkolwiek pojawiajÄ siÄ programy realizujÄce procesy nadzoru oparte na zaĹoĹźeniach standardu P3P â np. Internet Explorer od wersji 6.0. WĹaĹciciele stron WWW wykorzystujÄcy ten standard okreĹlajÄ, jakiego rodzaju informacje pozyskujÄ od odwiedzajÄcych. Ci z kolei, dziÄki przeglÄdarkom internetowym zgodnym z P3P, mogÄ okreĹliÄ, jakiego rodzaju informacje sÄ gotowi udostÄpniÄ.

URI - Uniform Resorce Identifier - stanowi nadzbiĂłr URL i URN. MoĹźna nim zaadresowaÄ nie tylko witrynÄ, ale rĂłwnieĹź ksiÄĹźkÄ, np. urn:ISDN:83-204-2627-8.

URL - Uniform Resorce Locator - zunifikowany format odnoĹnikĂłw do zasobĂłw internetowych. URL skĹada siÄ z rodzaju zasobu, dwukropka i czÄĹci zaleĹźnej od rodzaju zasobu. Nazwy rodzaju zasobu mogÄ skĹadaÄ siÄ z maĹych liter, plusa, myĹlnika oraz kropki, np. //adres_serwera/ĹcieĹźka_dostÄpu.

URN - Uniform Resource Name - oznacza zunifikowany format nazw zasobĂłw, gĹĂłwnie ksiÄĹźek.

eprint â termin okreĹla publikacjÄ wydanÄ w formie elektronicznej:

Post-Print - okreĹla publikacjÄ, ktĂłra zostaĹa juĹź wydana w formie drukowanej.
Pre-print â takim okreĹleniem nazywamy materiaĹy, ktĂłre zamieszczane sÄ na serwisach preprintowych i repozytoriach zatwierdzone do publikacji, ale jeszcze niewydrukowane.

Samoarchiwizowanie - Self-archiving â oznacza umieszczenie przez autora publikacji na jego prywatnej stronie internetowej lub w archiwach (repozytoriach) instytucji czy teĹź w archiwach dziedzinowych.

Przedstawione w powyĹźszym artykule terminy sÄ tylko wstÄpem do bardzo obszernego tematu, jakim jest terminologia zwiÄzana z Open Access. Bibliotekarze powinni z takÄ terminologiÄ zapoznawaÄ siÄ na bieĹźÄco, gdyĹź Ĺwiat technologii sieciowych staje siÄ Ĺwiatem bibliotekarzy, obszarem ich codziennych dziaĹaĹ.

Bibliografia

1. Wielka Encyklopedia PWN [on-line]. Warszawa: Wydawnictwo Naukowe PWN S.A., 1998 [dostÄp 6 luty 2006]. DostÄpny w World Wide Web: http://encyklopedia.pwn.pl.

2. Supporting Open Access [on-line]. [dostÄp 6 luty 2006]. DostÄpny w World Wide Web: http://eprints.org oraz http://www.eprints.org/glossary/.

3. Wikipedia â wolna encyklopedia [on-line]. [dostÄp 6 luty 2006]. DostÄpny w World Wide Web: http://pl.wikipedia.org/.

4. PC Kurier [on-line]. [dostÄp 6 luty 2006]. DostÄpny w World Wide Web: http://www.pckurier.pl/.

5. French National Institute for Research in Computer Science and Automatic Control (INRIA) â Open Archive Glossary [on-line]. [dostÄp 6 luty 2006]. DostÄpny w World Wide Web: http://www.inria.fr/publications/archiveouverte/lexique.en.html.


	Terminologia Open Access â o czym warto wiedzieÄ? / PaweĹ Najsarek// W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska. - Nr 3/2006 (73) marzec. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2006. - Tryb dostępu: http://www.ebib.info/2006/73/najsarek.php. - Tyt. z pierwszego ekranu. - ISSN 1507-7187

PaweĹ Najsarek Biblioteka Uniwersytecka w Poznaniu