EBIB 
Nr 3/2006 (73), Open Access i inicjatywy pokrewne. Artykuł
 Poprzedni artyku Nastpny artyku   

 


Marta Urbaniec
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
Biblioteka Główna

Open Content Alliance – cyfrowa biblioteka dla wszystkich


Wraz z rozwojem systemów cyfrowych, komputerów i urządzeń pozwalających na pozyskiwanie, przechowywanie i udostępnianie użytkownikom zdigitalizowanych zasobów, zaczęły rozwijać się biblioteki cyfrowe. Na potrzeby finansowania tych bibliotek powoływane są międzynarodowe konsorcja. Jednym z nich jest Open Content Alliance (OCA), które zostało utworzone w wyniku porozumienia pomiędzy Internet Archive (IA), Yahoo!, Adobe System Inc., European Archive, University of Kalifornia, HP Labs, the National Archive (UK), o’Reilly Media Inc, Prelinger Archives, University of Toronto oraz wieloma innymi. Konsorcjum działa w oparciu o współpracę organizacji rządowych, non-profit, kulturalnych i technicznych z całego świata.

Początkiem współpracy była decyzja sfinansowania cyfrowej biblioteki zawierającej zdigitalizowane teksty dzieł literatury amerykańskiej, materiały z archiwów narodowych, głównie europejskich, reprezentujące kreatywną produkcję ludzkości oraz zawartość multimediów. U podłoża legło przekonanie, że bez digitalizacji zasobów oraz bez udostępniania ich szeroko rozumianej społeczności można zatracić tożsamość kulturową. OCA zostało założone w odpowiedzi na projekt Google Book Search (który oferując technologię OCR, daje możliwości przeszukiwania książek znajdujących się w największych księgarniach i bibliotekach na świecie) z tą różnicą, że OCA zachowuje prawa autorskie digitalizowanych tekstów w odniesieniu do dokumentów, do których prawa te jeszcze nie wygasły. O tym, jakie dzieła i materiały mają być archiwizowane mają, na obecnym etapie współpracy, decydować Brytyjskie Archiwum Narodowe i Archiwa Europejskie.

Cała zawartość archiwum OCA będzie dostępna bezpłatnie na stronach internetowych. Yahoo! będzie indeksował zawartość zasobów OCA tak, aby użytkownicy w prosty sposób mogli z nich korzystać. Utworzona zostanie bezpłatna platforma umożliwiająca dostęp do opisów bibliograficznych rejestrowanych tekstów, respektując jednocześnie prawa autorskie tych dzieł, które jeszcze nie weszły do obiegu publicznego. W archiwum OCA będą znajdowały się teksty, których prawa autorskie już wygasły oraz te, których autorzy wyrazili zgodę na ich digitalizację. Teksty będą dostępne w formacie PDF. Można je będzie kopiować lub drukować. Aby uzupełniać na bieżąco rozrastające się archiwum, OCA będzie zajmowało się uzyskiwaniem zgody autorów na digitalizację ich dzieł oraz będzie je chroniło. W 2006 r. OCA skoncentruje się na digitalizacji monografii i czasopism, które mają charakter ogólny lub są udostępniane na zasadzie Creative Commons Licence (publikowanie prac na licencji Creative Commons pozwala zachować autorom ich własne prawa i jednocześnie dzielić się własną twórczością z innymi).

W ramach działalności OCA utworzono grupy tematyczne, które pracują niezależnie od siebie. Każda z nich zajmuje się konkretnym zagadnieniem:

  1. Metadata and collaborative collection development working group – zajmuje się metadanymi i rozwojem kolekcji. Współpracuje z bibliotekami i innymi ofiarodawcami, którzy chcą udostępnić swoje zbiory. Grupa ta pomaga dokonać wyboru tekstów, które digitalizować, zajmuje się zasadami opisu zdigitalizowanego materiału oraz śledzi postępy digitalizacji.
  2. Digital Preservation Working Group – zajmuje się ochroną kolekcji znajdujących się w OCA. Czuwa nad przebiegiem prac prowadzonych równolegle przez biblioteki, archiwa, organizacje szkolne.
  3. Contribution Working Group – pozyskuje materiał do digitalizacji, urządzenia oraz pomoc finansową.
  4. Book Format Working Group – przygotowuje format, w jakim mają być przechowywane digitalizowane książki.
  5. Scanning Protocol – opracowuje dokumenty dla bibliotek i innych zainteresowanych współpracą z OCA, które dokładnie opisują pracę i towarzyszące koszty, jakie powstają przy skanowaniu, a następnie przy utrzymaniu kolekcji.
  6. Data Transfer Protocol – zajmuje się dokumentami opisującymi protokół, które towarzyszą transferowi danych do Internet Archive i następnie włącza je do kolekcji OCA.

Jednym z głównych założycieli konsorcjum OCA jest Internet Archive (IA). Internet Archive jest organizacją typu non-profit. Została założona i jest finansowana przez internetowego przedsiębiorcę Brewstera Kahle. Celem organizacji jest budowa biblioteki internetowej, oferującej stały dostęp do zdigitalizowanych tekstów dla naukowców, historyków, studentów. Według Kahle, dzięki technologiom cyfrowym można powszechnie udostępniać wszelkie rodzaje twórczości ludzkiej: książki, publikacje, filmy, programy telewizyjne, strony internetowe, muzykę, programy komputerowe. Marzeniem Kahle jest cyfrowe udostępnienie wszystkich dzieł świata. Wzorem dla niego jest Biblioteka Aleksandryjska, która posiadała większość dzieł, jakie zostały stworzone w ówczesnym czasie.

Obecnie archiwum udostępnia i przechowuje na swoich serwerach treści utworów opublikowanych bez ograniczeń w dostępie. Organizacja zaczęła się bardzo szybko rozwijać. Obecnie Internet Archive posiada następujące kolekcje:

  1. Texte Archive - zawiera 26 085 tekstów. Dzieli się na mniejsze kolekcje, np. Canadian Libraries – znajdują się tutaj dzieła z różnych bibliotek kanadyjskich, które przyłączyły się do projektu Internet Archive. Kolekcja zawiera 3207 tekstów.
  2. Milion Book Project – projekt ten zakłada digitalizację miliona książek. Został zainicjowany przez naukowców z Carnergie Mellon University. Pełne teksty zeskanowanych książek będą indeksowane za pomocą technologii OCR. Kolekcja liczy 10 555 tekstów.
  3. Milion Book Project – projekt ten zakłada digitalizację miliona książek. Został zainicjowany przez naukowców z Carnergie Mellon University. Pełne teksty zeskanowanych książek będą indeksowane za pomocą technologii OCR. Kolekcja liczy 10 555 tekstów. Children Library – celem tej kolekcji jest udostępnienie literatury dzieciom, aby z jej pomocą mogły poznawać otaczający je świat. Teksty w pełni odzwierciedlają prostotę i różnice w kulturze, społecznościach, zainteresowaniach, stylu życia, aspiracjach i wartościach ludzi z całego świata. Poza literaturą dziecięcą kolekcja ta zawiera ok. 400 tytułów z Literature for Children Collection University of Floryda, które były opublikowane przed 1850 rokiem aż po 1950 rok, dzieła z National Yaddish Book Center oraz książki z International Children’s Digital Library. W sumie kolekcja liczy 688 dzieł.
  4. Arpanet – kolekcja notatek, wywiadów, czasopism i innych materiałów dokumentujących rozwój Advanced Research Projekt Agency Network (Arpanet) Departamentu obrony Stanów Zjednoczonych. Kolekcja liczy 195 dzieł.
  5. Audio Archive - Zawiera 69 237 nagrań muzycznych, koncertów różnych wykonawców i zespołów. Również dzieli się na mniejsze kolekcje, np. Boxxxes – kolekcja eksperymentalnej muzyki elektronicznej.
  6. Netlabels – kolekcja muzyki elektronicznej udostępnianej w Internecie przez różne firmy i nieformalne grupy. Muzyka rozpowszechniana jest w postaci skompresowanych plików MP3 lub Ogg Vobis. Jest wydana w sposób umożliwiający swobodne rozpowszechnianie oraz wykorzystywanie utworów z jednoczesnym zachowaniem praw autora, np. na podstawie licencji Creative Common. Kolekcja zawiera 7935 utworów.
  7. Open Source Radio – kolekcja ta zawiera różne utwory muzyczne, np. blues, country, hip hop, jazz, rock, które są rozpowszechniane na podstawie licencji Creative Common. Zawiera 16 230 utworów.
  8. Presidential Recordings – kolekcja zawiera 129 utworów. Są to przemowy prezydenta Stanów Zjednoczonych i tajne rozmowy przeprowadzone w Białym Domu w latach 1940-1973.
  9. Kolekcje różnotematycznych programów radiowych, np. Democracy Now, Berkely Groks Science Radio, Rustbelt Radio.
  10. Moving Image Archive - zawiera 29 130 filmów pełno- i krótkometrażowych, nagrania kanałów telewizyjnych z całego świata, filmy animowane, filmy wideo, animacje komputerowe, gry wideo, np. Open Source Movies – zawiera 16 832 amatorskie filmy wideo. Feature Films – kolekcja filmów, Cinemocracy – 13 filmów odzwierciedlających wpływ świata polityki na film, Shaping San Francisco – studium życia w mieście. Zawiera 88 filmów. Game Videos – 4 gry wideo, German Cinema – kino niemieckie, 32 filmy.
  11. Software - kolekcja programów komputerowych oraz informacji na ich temat. Zawiera ogółem 34 275 programów. Dzieli się na: Tuscows Software Library – jest to biblioteka programów komputerowych, które są testowane i recenzowane przez Tuscow Inc. CLASP – Classic Software Preservation Project – został założony w 2004 roku przez Internet Archive jako projekt służący pomocą w przechowywaniu zdezaktualizowanych programów komputerowych z końca lat 70. po lata 90.
  12. Wayback Machine - zawiera około 55 miliardów stron internetowych zachowywanych od 1996 roku. Serwis pozwala użytkownikowi zobaczyć archiwizowane strony WWW w tak zwanym trójwymiarowym indeksie. Dzieli się na mniejsze kolekcje, np.: Hurricanes Catrina and Rita, National Archives – kolekcja stron internetowych rządu Wielkiej Brytanii archiwizowana od sierpnia 2003 roku. Election 2002 – zawiera kolekcje stron internetowych dotyczących wyborów na stanowiska senatorów i kongresmenów w Stanach Zjednoczonych. September 11th – poświęcona wydarzeniom z 11 września 2001 r.

Wynikiem projektu Open Content Alliance jest biblioteka cyfrowa Open Library. Została utworzona przez Brewstera Kahle z Internet Archive. Zamierzeniem tej biblioteki jest utworzenie ogromnego zbioru zdigitalizowanych książek z całego świata, a następnie udostępnienie ich on-line bez żadnych ograniczeń każdemu użytkownikowi. Książki te mogą być bez przeszkód kopiowane, drukowane i przesyłane. Kolekcje w Open Library są wybierane przez bibliotekarzy, którzy łączą różnotematyczne zbiory i tworzą obszerne wirtualne kolekcje, jakie w rzeczywistości nie występują. Projekt zakłada włączenie do swoich zasobów wszystkich książek, ale obecnie jest ograniczony do opracowywania bibliografii, które mają być pomocne naukowcom, nauczycielom i innym czytelnikom.

Bibliografia

1. Wikipedia the Free Encyclopedia [on-line]. [dostęp 28 lutego 2006]. Dostępny w World Wide Web: http://en.wikipedia.org/wiki.

2. Open Content Alliance [on-line]. [dostęp 28 lutego 2006]. Dostępny w World Wide Web: http://www.opencontentalliance.org.

3. Open Library [on-line]. [dostęp 3 marca 2006]. Dostępny w World Wide Web: http://www.openlibrary.org.

4. Internet Archive [on-line]. [dostęp 28 lutego 2006]. Dostępny w World Wide Web: http://www.archive.org.

 Początek strony



Open Content Alliance – cyfrowa biblioteka dla wszystkich / Marta Urbaniec// W: Biuletyn EBIB [Dokument elektroniczny] / red. naczelny Bożena Bednarek-Michalska. - Nr 3/2006 (73) marzec. - Czasopismo elektroniczne. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich KWE, 2006. - Tryb dostępu: http://www.ebib.info/2006/73/urbaniec.php. - Tyt. z pierwszego ekranu. - ISSN 1507-7187