Bibliograficzne bazy danych : kierunki rozwoju i możliwości współpracy
Ogólnopolska konferencja naukowa z okazji 10-lecia bazy danych BazTech
Bydgoszcz, 27-29 maja 2009

Poprzedni - Spis treści - Następny
            

Anna Osiewalska
Biblioteka Główna Uniwersytetu Ekonomicznego w Krakowie

Bibliografie czasopism naukowych Biblioteki Głównej UEK jako źródło danych dla analiz bibliometrycznych

Abstrakt

W artykule przedstawiono reorganizację bibliograficznych baz danych Gospodarka i Nauki Społeczne Biblioteki Głównej Uniwersytetu Ekonomicznego w Krakowie (UEK). Rozszerzenie formatu baz o pole literatury załącznikowej, a także indeksacja zawartości tego pola (przypisów bibliograficznych), rozszerzają możliwości wyszukiwania w bazie i umożliwiają przeprowadzenie analiz bibliometrycznych dokumentowanego piśmiennictwa. Na podstawie materiałów pozyskanych z baz pokazano możliwości i ograniczenia takich analiz.

Słowa kluczowe

bibliometria, cytowania, indeks Hirscha, analiza współcytowań czasopism

Abstract

Scientific journals bibliographies of the Cracow University of Economics Main Library as a data source for bibliometric analyses. In 2004, the Cracow University of Economics (CUE) Main Library enhanced its bibliographic databases by introducing citations into its bibliographies of Polish scientific journals in economics (as a subject support searching tool). In the paper we present the next step of these changes: indexing the citation for the bibliometric analyses. As examples the 4 main polish economic journals impact measures – h index (2003–2007) as well as journal co-citation analysis is presented.

Keywords

bibliometrics, citations, Hirsch index, journal co-citation analysis

pdf prezentacja

Wystąpienie na konferencji poświęconej bibliograficznym bazom danych (z okazji 10-lecia BazTech) warto rozpocząć przypomnieniem, że jedną z pierwszych bibliograficznych baz danych (o ile nie pierwszą taką bazą) jest indeks cytowań SCI, tworzony od blisko 50 lat[1]. Wzorem, do którego dzisiaj dążymy, są raczej bazy pełnotekstowe. Jednak w bazach tych upowszechnia się obecnie opcja wyszukiwania typu: „cytowane przez”. Znajdujemy ją w bazach pełnotekstowych wydawców czasopism (np. CrossRef), bazach tzw. agregatorów (np. EBSCO) czy też w repozytoriach typu open access (np. RePEc), na Google Scholar kończąc. Organizatorzy tych zasobów ogniskują specjalną uwagę na cytowaniach, mimo że pełny tekst artykułu zawiera przecież bibliografię załącznikową. Istnieje widać duże zapotrzebowanie na taki sposób wyszukiwania w bazach i taką informację.

Restrukturyzacja bibliograficznych baz własnych BG UEK

Wychodząc naprzeciw oczekiwaniom, format opisu dokumentów w prowadzonych przez Bibliotekę Główną Uniwersytetu Ekonomicznego w Krakowie (BG UEK) od 16 lat bazach Gospodarka i Nauki Społeczne, w roku 2004 rozszerzyliśmy o pole bibliografii załącznikowej i pole pełnego tekstu. Obok bibliografii i przypisów bibliograficznych z podstawowych, ogólnopolskich czasopism ekonomicznych, w bazie Gospodarka zamieszczamy (za zgodą wydawców) pełne teksty artykułów z czasopism dostępnych w Internecie. Analogicznie baza Nauki Społeczne zawiera pełne teksty artykułów z „Zeszytów Naukowych” UEK oraz bibliografię i przypisy bibliograficzne z ekonomicznych czasopism uczelnianych. Szczegóły tej operacji przedstawiano na konferencjach, których organizatorem lub współorganizatorem był PTIN[2][3]. W efekcie mamy (w przeorganizowanych bazach) funkcję wyszukiwania poprzez cytowanie w najogólniejszej postaci: wyszukiwania przez termin z pola „literatura”. To najprostsze rozwiązanie zaczęło funkcjonować już 5 lat temu i znakomicie sprawdza się do dziś.

Nowa baza BG UEK z opracowanymi cytowaniami

Przeprowadzona dość sprawnie poprawa funkcjonalności baz źródłowych pozwoliła z optymizmem myśleć o przygotowaniu cytowań do analiz bibliometrycznych, na które w naszym kraju wciąż monopol ma udostępniony po raz pierwszy 3 lata temu program Publish or Perish[4].

Publish or Perish (PoP), to aplikacja zewnętrzna na Google Scholar (GS), która dostarcza statystyk w zakresie cytowalności autorów i czasopism. Obecnie PoP jest jedynym źródłem ogólnodostępnej informacji o cytowalności polskich naukowców i polskich czasopism. Jednak pomimo stałego postępu w zakresie automatycznego przetwarzania cytowań z języków innych niż język angielski, zawiłości języka polskiego obniżają jakość podawanych statystyk. Obok zwykłych błędów związanych z przetworzeniem cytowania (trudności w identyfikacji struktur i eliminacji duplikatów) mamy dodatkowo spory szum związany z polskimi literami. Problem czasami generuje już wydawca publikacji lub jej autor, ale nie bez winy są także algorytmy przetwarzające cytowania w GS. Obniżona trafność analiz dla cytowań z polskich publikacji łączy się z mniejszym zasobem wyszukiwanych cytowań, ponieważ GS (a za nim PoP), praktycznie całą informację o cytowalności polskich naukowców i polskich czasopism w polskich publikacjach (a jest to źródło nie do pominięcia dla tych cytowań) opiera jedynie na publikacjach dostępnych w pełnym tekście w Internecie. Analogiczny zasób dla naukowców i czasopism z kręgu nauki anglosaskiej jest szerszy i wykorzystuje archiwa czołowych wydawców naukowych[5].

GS powstał w 2004 r. w związku z wyszukiwarką naukową CrossRef Search, którą wydawcy czasopism zdecydowali się oprzeć na technologii Google, udostępniając firmie swoje archiwa. CrossRef wyszukuje wyłącznie wśród zasobu wydawców, GS dodatkowo odwołuje się do zasobów udostępnianych z prywatnych stron naukowców, ze stron instytucji itp. Początkowo tylko GS, obecnie obie wyszukiwarki wykorzystują bibliografię załącznikową, tworząc sieć powiązań z artykułami cytującymi, podobnie jak SCI. Tego właśnie powiązania tekstu naukowego z jego cytowaniami brakuje w dokumentacji polskiego piśmiennictwa naukowego i dlatego – dla czasopism z zakresu nauk ekonomicznych – uzupełniamy tę lukę w bazach Biblioteki Głównej UEK. Ponieważ jest to unikalny materiał, stanowi on też źródło nowej wiedzy na temat piśmiennictwa z tej dziedziny nauki.

Ponieważ nie dysponujemy programem automatycznie przetwarzającym cytowania, opracowujemy je ręcznie w oddzielnej bazie „Cytowania”. Podjętej w 2007 r. własnej próby automatyzacji tego procesu[6] nie udało się dotąd wdrożyć, tak więc zadanie opracowania cytowań rozkładamy pomiędzy studentów, którzy pracują w Bibliotece na podstawie umowy-zlecenia, oraz studentów studiów bibliotekoznawczych, odbywających u nas praktyki. Liczba tych osób jest wystarczająca, by nikt nie był przeciążony pracą. W zakresie bazy Gospodarka przeciętny czas potrzebny na bieżące opracowanie cytowań oceniamy na około 20 godzin miesięcznie.

Problem z jakością danych

Wkrótce okazało się, że cytowania są obarczone nieprawdopodobnym szumem i że konieczna jest ich korekta, ponieważ analizy są wrażliwe na błąd. Wydaje się, że bibliografia załącznikowa podawana jest przez autorów z pamięci i bez odpowiedniego sprawdzenia. Oprócz plagi literówek, skrótów oraz całej masy niedokładności, kłopoty stwarzają także wydawnictwa seryjne i cytowania prac wieloautorskich. W tym ostatnim przypadku w jednych cytowaniach podaje się pierwszego autora – zgodnie z normą przypisu bibliograficznego, stanowiącą, że w przypadku więcej niż trzech autorów podaje się tylko autora pierwszego i dodaje się skrót "et al." bądź "i in.", w innych cytowaniach – wszystkich autorów – zgodnie ze zwyczajem respektowania równego wkładu współautorów w pracach naukowych. Problemy te występują we wszystkich bazach gromadzących cytowania, a uprzedza o tym podręcznik bibliometrii Glänzela Bibliometrics as a research field. A course on theory and application of bibliometric indicators[7], zalecając korektę danych. Odpowiednie czyszczenie danych poza bazą (przy okazji analiz bibliometrycznych) nie poprawia jakości danych w bazie. Ten sam materiał pobrany z tej samej bazy przez dwie różne osoby może więc skutkować dwoma różnymi wynikami. Nie widać niedokładności w pojedynczych przypisach bibliograficznych, błędy stają się widoczne dopiero w większej próbie, podczas analiz, przy porównywaniu wielu przypisów. Z tego powodu zasadne jest, by analizy były wykonywane przez bibliotekarzy tworzących bazy.

Problem rozwiązujemy, dokonując korekty cytowań (z konieczności tylko tej ich części, nad którą pracujemy) wyłącznie w bazie „Cytowania”. W bazach podstawowych (Gospodarka, Nauki Społeczne), przyjęliśmy zasadę zachowania cytowania w stanie, w jakim występowało w artykule, co oznacza niebagatelną walkę z błędami skanowania i przetwarzania obrazów do postaci plików tekstowych (OCR). W związku z problemem jakości danych dla każdej analizy, nawet analizy dotyczącej jakiegoś zamkniętego okresu czasu, podajemy datę pobrania materiału z bazy, uprzedzając niejako możliwość jego dalszej modyfikacji, pomimo że dopływ do bazy jest zakończony. Materiał źródłowy – w miarę ujawnionej potrzeby – zawsze powinien być przepracowany w bazie.

Proste analizy wpływu

Sprawdzenia, na ile wyniki analiz na materiale własnym różnią się od tych, które bez większego wysiłku możemy uzyskać w sieci (dzięki wspomnianemu już programowi Publish or Perish), dokonamy na kwerendzie dotyczącej czasopisma o polskim tytule „Przegląd Statystyczny”. Zaznaczmy, że w przypadku kwerendy dotyczącej autora trudności się zwielokrotniają (zwłaszcza dla popularnych nazwisk, nazwisk o trudnej pisowni, autorów używających różnej liczby imion itp.).

W PoP wyszukanie i zanalizowanie cytowań dla „Przeglądu Statystycznego” wymaga wykonania dwóch kwerend: dla wymienionego tytułu oraz dla jego wersji bez „ogonka”. Program jest bardzo przyjaźnie skonstruowany i pozwala na stosunkowo szybkie wykonanie korekty wyników wyszukiwania, zarówno w polu źródło, jak i w innych polach. W rezultacie otrzymujemy wykaz 491 cytowań z „Przeglądu Statystycznego” zebranych z ogromnego zasobu GS. Fragment takiego wyniku przedstawia tab. 1. Wynik podaje uszeregowane w kolejności liczby cytowań opisy bibliograficzne prac cytowanych o jednolitej, jawnej strukturze (z podziałem na kolumny zawierające informacje o autorach, tytule, dacie publikacji i jej źródle). W oryginalnej postaci na wynik składają się program PoP oraz GS, jako że podawane w PoP opisy bibliograficzne mają postać hipertekstową, zapewniającą przejście do listowanej przez GS bibliografii prac cytujących, w wielu przypadkach łączących się z pełnym tekstem pracy cytującej. Poniżej zamieszczono (rys. 1.) sekwencję kolejnych kroków, by pokazać trudności w pozyskaniu daty dokumentu cytującego. Teoretycznie można tę datę wydostać, praktycznie jest to bardzo czasochłonne – w naszym przypadku oznacza 491 poszukiwań (często opis dokumentu w GS nie zawiera tej daty). Wykonalnym sposobem określenia zakresu czasowego analizy jest badanie całego okresu wydawania czasopisma lub zawężenie tego okresu do ostatnich lat. W obu przypadkach analiza musi być opatrzona datą pobrania danych, jako że dane te podlegają stałej aktualizacji w Internecie.

Rozmiar: 46388 bajtów

Rys. 1. Składowe wyniku programu Publish or Perish
Źródło: opracowanie własne na podstawie programu Publish or Perish.

Poniższa tabela przedstawia fragment arkusza kalkulacyjnego z wyliczeniem indeksu Hirscha dla ujednoliconego tytułu badanego czasopisma, które opiera się na materiale zebranym z GS przez PoP w dniu 31 marca 2009 r. (sposób obliczania wskaźnika wyjaśniono w artykule pt. Mierniki oceny czasopism i naukowców[8]).

Tab. 1. Indeks Hirscha dla czasopisma „Przegląd Statystyczny” obliczony przez PoP

Rozmiar: 46388 bajtów

Analogiczne wyliczenie na cytowaniach pochodzących wyłącznie z polskich czasopism ekonomicznych indeksowanych w bazach UEK opiera się na 610 cytowaniach (stan na dzień 31 marca 2009 r.) i także określa wielkość indeksu Hirscha dla tego czasopisma jako równą 8.

Tab. 2. Indeks Hirscha dla czasopisma „Przegląd Statystyczny” na zasobie baz BG UEK

Rozmiar: 46388 bajtów

Mimo całkowitej różnicy w zasobie mamy pełną zbieżność wyniku w zakresie wielkości wskaźnika h, a nawet częściową zbieżność wyników cząstkowych, tj. artykułów, których cytowalność posłużyła do wyliczenia wskaźnika. Dla pojedynczego tytułu czasopisma mamy zatem potwierdzenie jakiegoś jego wpływu. Jednak wskaźnik ten, dla jakichkolwiek dalszych porównań, powinien być dookreślony zarówno przedziałem czasowym, jak i zasobem. Ocenę siły wpływu, jak się wydaje, powinno się przedstawiać na podobnym materiale, a tej porównywalności nie zapewnia nam PoP. Umożliwiają nam to nasze bazy. Porównanie takie, ograniczone do zasobu bazy Gospodarka, do okresu ostatnich w pełni opracowanych 5 lat (opóźnienia wydawania czasopism), przedstawiono poniżej.

Tab. 3. Podstawowe charakterystyki opisujące cytowalność głównych polskich czasopism ekonomicznych w latach 2003–2007

Rozmiar: 4828 bajtów

Interpretacja tego wyniku jest już możliwa i następująca: w okresie 2003–2007, dla tego samego zasobu ogólnopolskich czasopism z zakresu nauk ekonomicznych, czasopismem o najsilniejszym wpływie (w sensie największej liczby cytowań oraz najwyższej wartości indeksu h) jest „Ekonomista”. Niewiele mniejszą liczbą cytowań może wykazać się dostępny w Internecie „Bank i Kredyt”, o największej w badanej próbie liczbie cytowanych artykułów i drugiej co do wielkości wartości indeksu h. Szczegółowe dane zawierające fragmenty arkuszy kalkulacyjnych z wykazem artykułów, których cytowalność determinuje wielkość indeksu h w zadanym przedziale czasowym, przedstawiają tabele 4–7.

Rozmiar: 14799 bajtów

Rozmiar: 15312 bajtów

Rozmiar: 15121 bajtów

Rozmiar: 15121 bajtów

Nie jest naszym zamiarem dyskredytowanie PoP, który uważamy za ważne źródło umożliwiające śledzenie cytowalności autorów i czasopism. Chcemy jedynie pokazać, że działając na nieco innym zasobie, tj. na cytowaniach z polskich czasopism, również tych nieudostępnianych w pełnym tekście w Internecie, baza „Cytowania” jest wciąż niezastąpiona.

Analizy wielowymiarowe

Opracowanie cytowań ma jeszcze jeden ważny aspekt informacyjny. Możemy projektować analizy wielowymiarowe w zakresie relacji między dokumentami, znane jako tzw. mapy wiedzy. Jest to najbardziej znany przykład analiz wielowymiarowych, umożliwiających poznanie bazy naukowej danej dziedziny oraz jej frontów badawczych. Analizy te stanowią przedmiot bibliometrii strukturalnej, dynamicznie rozwijającego się kierunku bibliometrii, bliskiego koncepcji data mining, nazywanej także wydobywaniem wiedzy z dużych zbiorów danych. Są to analizy przeprowadzane na danych masowych, przechowywanych w bazach danych, i korzystające z wielowymiarowych technik eksploracyjnych.

Analizy wielowymiarowe opierają się na macierzowym modelu przedstawiającym relacje między publikacjami a ich cytowaniami, który został przejęty za podręcznikiem bibliometrii W. Glänzela[9]. Dzięki modelowi macierzowemu, dokumenty cytujące i cytowane uzyskują reprezentację wektorową, co pozwala zmierzyć podobieństwo między następującymi obiektami:

  • dokumentami cytującymi (jest to metoda powiązań bibliograficznych) lub
  • dokumentami cytowanymi (co w bibliometrii nazywa się analizą współcytowań).

Metody te mają już długą historię w bibliometrii. Metoda powiązań bibliograficznych datuje się na rok 1963 (M.M. Kessler), metoda współcytowań została zaproponowana 10 lat później przez dwóch niezależnie od siebie pracujących badaczy (I. Marshakova; H. Small).

Macierze podobieństwa, przekształcone następnie w macierze odległości, stanowią podstawę działania algorytmów, grupujących obiekty podobne w quasi-jednorodne skupienia[10]. Wykonanie takich analiz umożliwiają gotowe programy, w naszej pracy wykorzystujemy program Statistica. Podstawy wielowymiarowych analiz bibliometrycznych nieco dokładniej przybliżono w pracy Odkrywanie związków między obiektami analiz bibliometrycznych w indeksach cytowań[11].

Przedmiotem analiz wielowymiarowych mogą być także wybrane cechy dokumentów cytujących i cytowanych. Są to analizy typu: autor cytujący i autor cytowany (lub afiliacje tych autorów), czasopismo cytujące i czasopismo cytowane, w określonym okresie czasu lub bez takiego ograniczenia. Prowadzi to do poznania relacji między autorami, ośrodkami naukowymi lub czasopismami. Poniżej przedstawiono niepublikowane dotąd wyniki analizy opartej na cytowaniach z artykułów, które ukazały się w czterech głównych polskich czasopismach ekonomicznych w latach 2003–2007. Analizę wykonano na materiale pobranym z bazy w dniu 31 marca 2009 r.[12]. Cytowania z badanych czasopism zawierają odniesienia do 1500 czasopism, z których 806 cytowanych było jednokrotnie. Uwagę skupiono na czasopismach cytowanych co najmniej 30 razy (jest ich 47). Cytowania do tych 30 czasopism stanowią ponad połowę (4514 z 8886) cytowań odnoszących się do czasopism. Macierz powiązań między czasopismami cytującymi i cytowanymi przy podanych warunkach progowych ma zatem wymiar 4 x 47. Metodą współcytowań określono podobieństwo między czasopismami cytowanymi. Metodą powiązań bibliograficznych określono podobieństwo między czasopismami cytującymi. Najpierw jednak należy zanalizować, które czasopisma są dla autorów polskich najistotniejszym źródłem inspiracji.

Tab. 8. Periodyki cytowane w latach 2003–2007 w głównych polskich czasopismach ekonomicznych co najmniej 30 razy

Rozmiar: 31590 bajtów
Źródło: opracowanie własne.

Przede wszystkim zwróćmy uwagę, że polskie czasopisma, w liczbie 11 tytułów, stanowią prawie 1 zasobu najczęściej cytowanych czasopism. Jeśli porównamy tytuły pierwszych 47 czasopism najczęściej cytowanych w głównych polskich czasopismach z tytułami pierwszych 47 czasopism o najwyższym w roku 2007 wskaźniku IF na zasobie RePEc (stan na 31 marca 2009 r.), to okazuje się, że skład ten pokrywa się niemal w połowie (21/47). W lewej części tabeli 9., przedstawiającej odpowiedni fragment rankingu czasopism z bazy RePEc, te wspólne czasopisma wyróżniono liczbą 1 umieszczoną za IF.

Tab. 9. Czasopisma o najwyższych wskaźnikach wpływu w bazach RePEc i Scopus

Rozmiar: 39052 bajtów Rozmiar: 44255 bajtów
Źródło: opracowanie własne na podstawie: Citations in Economics [on-line]. [Dostęp 2 maja 2009]. Dostępny w World Wide Web: http://citec.repec.org/s/2007/. Źródło: opracowanie własne na podstawie: SCImago Journal & Country Rank [on-line]. [Dostęp 2 maja 2009]. Dostępny w World Wide Web: http://www.scimagojr.com.

Analogiczne porównanie z tytułami pierwszych 47 czasopism (o najwyższym w roku 2007 indeksie Hirscha) serwisu SCImago Journal & Country Rank na zasobie Scopus (stan na 31 marca 2009 r.) ukazuje jeszcze większą zgodność (24/47). W prawej części tabeli 9. przedstawiającej odpowiedni fragment rankingu czasopism z serwisu SCImago Journal & Country Rank dla czasopism z dziedziny ekonomii i ekonometrii, te wspólne czasopisma także wyróżniono liczbą 1, umieszczoną tym razem za wskaźnikiem h. Okresy, z których pochodzą wyliczenia wskaźników IF (2005–2006) oraz h (cały okres wydawania danego czasopisma), nie pokrywają się z naszym okresem badawczym, porównanie i pod tym względem ma charakter bardzo przybliżony.

Czasopisma o największej ogólnej liczbie cytowań w czterech głównych polskich czasopismach ekonomicznych (tabela 8.), w dużym stopniu pokrywają się z czasopismami pierwszymi (wg IF) z 226 czasopism rejestrowanych w specjalistycznej, ekonomicznej bazie RePEc (lewa część tabeli 9.) oraz pierwszymi (według indeksu Hirscha) z 264 czasopism z dziedziny ekonomii, które są w bazie Scopus (prawa część tabeli 9.). Mimo różnic w konstrukcji wskaźników (ogólna liczba cytowań z czasopism, IF, indeks Hirscha dla czasopism) i ich różnych zakresów czasowych, porównanie można potraktować jako dość wiarygodne wskazujące zbiory obecnie najbardziej wpływowych czasopism w zasobach, z których pochodzą. Można przypuszczać, że stwierdzona korelacja pomiędzy JIF z JCR oraz ogólną liczbą cytowań z czasopism i indeksem h z SCImago Journal & Country Rank[13], wynika z rzeczywistego podobieństwa tych miar. Obserwuje się też stabilność badanego zestawu czasopism według wymienionych wskaźników w latach 2003–2007. Wydaje się to potwierdzać tezę, że czasopisma o zasięgu międzynarodowym i dużym wpływie w dziedzinie nauk ekonomicznych w nauce światowej mają także duży wpływ na polskich autorów, publikujących w objętych badaniem głównych polskich czasopismach ekonomicznych. Fakt niskiego stopnia publikacji polskich ekonomistów w czasopismach o zasięgu międzynarodowym nie oznacza zamknięcia tego środowiska do kręgu polskiej nauki.

Skupienia czasopism cytowanych w polskich czasopismach ekonomicznych

Na podstawie tabeli 8. można utworzyć macierz odległości pomiędzy czasopismami cytowanymi. Macierz ta ma wymiar 47 x 47. Przedstawiono ją w aneksie artykułu. Wynikiem analizy skupień wykonanej metodą współcytowań z wykorzystaniem programu Statistica i algorytmu Warda jest dendrogram przedstawiony na rysunku 2. Dendrogram ten wyraźnie dzieli zbiór czasopism na grupę czasopism ogólnoekonomicznych, finansowych i ilościowych. Najmniej liczną grupę czasopism stanowią periodyki o profilu ilościowym. Czasopisma z dziedziny finansów stanowią z kolei najliczniejszą grupę. Potwierdza to obserwowany rozwój nowej problematyki badawczej nauk ekonomicznych, nazywanej "ekonometrią finansową" oraz "inżynierią finansową", dla których ważnym źródłem z teorii finansów są czasopisma skupione na dendrogramie wokół „Journal of Finance”.

Rozmiar: 24201 bajtów

Rys. 2. Wynik analizy skupień metodą współcytowań dla czasopism cytowanych w czterech głównych polskich czasopismach ekonomicznych
Źródło: opracowanie własne.

Wzajemne podobieństwo głównych polskich czasopism ekonomicznych

Macierz podobieństwa pomiędzy czasopismami cytującymi (metodą powiązań bibliograficznych) ma wymiar 4 x 4. Skonstruowaną na jej podstawie macierz odległości przedstawiono w tabeli 10.

Tab. 10. Macierz odległości pomiędzy głównymi polskimi czasopismami ekonomicznymi

Rozmiar: 4683 bajtów

Źródło: opracowanie własne.

Wynikiem analizy skupień wykonanej metodą powiązań bibliograficznych z wykorzystaniem programu Statistica i metody Warda jest dendrogram przedstawiony na rys. 3.

Rozmiar: 5364 bajtów

Rys. 3. Wynik analizy skupień metodą powiązań bibliograficznych dla głównych polskich czasopism ekonomicznych
Źródło: opracowanie własne.

    Tym razem przedstawiono dendrogram nie w celu wyodrębnienia skupień, ale zanalizowania podobieństw między czasopismami. Na podstawie odniesień do czasopism można stwierdzić wysokie podobieństwo pomiędzy „Ekonomistą” i „Gospodarką Narodową”, a także odmienność „Przeglądu Statystycznego” – zrozumiałą z powodu odmienności stosowanego aparatu badawczego. Silne podobieństwo cytowań w „Ekonomiście” i „Gospodarce Narodowej” wynika z częstego podejmowania tematyki makroekonomicznej w obu tych tytułach; najważniejsze czasopisma (najczęściej cytowane w obu, „Gospodarce Narodowej” i „Ekonomiście”) to: „American Economic Review”, „Ekonomista”, „Quarterly Journal of Economics”, „Journal of Political Economy” i „Gospodarka Narodowa” (zob. tab. 8.).

    Podsumowanie

    Przykładowe analizy, jakie przedstawiono w tej pracy, zaledwie sygnalizują możliwości, jakie w zakresie analiz bibliometrycznych daje materiał zgromadzony w bibliograficznych bazach danych. Na tych w miarę prostych, choć ważnych przykładach, autorka chciała udowodnić, że poza poprawą funkcjonalności i lepszą jakością naszych baz, drugim ważnym powodem, dla którego warto podjąć wysiłek gromadzenia i opracowania cytowań, jest wyjątkowa wartość tego materiału w analizie dokumentowanego piśmiennictwa naukowego i – na tej podstawie – samej nauki.

    Przypisy

    [1] Computerization in the 1950s was far removed from the desktop environment of today, but there was tremendous excitement over potential benefits to be derived from the application of machines to the generation and compilation of data. The U.S. government hoped that automation could mitigate or even eliminate completely the difficulties of manual indexing. A number of projects were launched by the United States with the intention of investigating these possibilities. Dr. Eugene Garfield, founder and now Chairman Emeritus of ISI®, was deeply involved in the research relating to machine generated indexes in the mid-1950`s and early 1960`s. History of Citation Indexing, Thomson Reuters [on-line]. [Dostęp 31 marca 2009]. Dostępny w World Wide Web: http://thomsonreuters.com/business_units/scientific/free/essays/history/.

    [2] OSIEWALSKA, A. Od bibliografii do indeksu cytowań. Rozwój usług informacyjnych w Bibliotece Głównej Uniwersytetu Ekonomicznego w Krakowie. Referat wygłoszony na IX Krajowym Forum Informacji Naukowej i Technicznej. Zakopane, 25–28 września 2007 (w druku).

    [3] OSIEWALSKA, A. Analiza cytowań z wybranych polskojęzycznych czasopism ekonomicznych. W: PIETRUCH-REIZES, D. (red.) Zarządzanie informacją w nauce. Katowice: Wydaw. UŚ, 2006, s. 244-256. ISSN 0208-6336.

    [4] Publish or Perish (software) [on-line]. [Dostęp 31 marca 2009]. Dostępny w World Wide Web: http://www.harzing.com/pop.htm.

    [5] OSIEWALSKA, A. Google ma już 10 lat. Biuletyn Informacyjny Biblioteki Głównej Uniwersytetu Ekonomicznego w Krakowie [on-line]. 2008, nr 3(32) [Dostęp 31 marca 2009]. Dostępny w World Wide Web: http://kangur.uek.krakow.pl/biblioteka/biuletyn/index.php?Strona= Art&Wybor=32&Art=003.

    [6] MATYJASZEK, J. Indeksowanie sposobem na skuteczne zarządzanie informacją. Biuletyn Informacyjny Biblioteki Głównej Uniwersytetu Ekonomicznego w Krakowie [on-line]. 2007, nr 1(30) [Dostęp 31 marca 2009]. Dostępny w World Wide Web: http://kangurold.uek.krakow.pl/ Biblioteka/Biuletyn/index.php?Strona=Art&Wybor=30&Art=004.

    [7] GLÄNZEL, W. Bibliometrics as a research field. A course on theory and application of bibliometric indicators [on-line]. [Budapest]: [Magyar Tudoma´nyos Akade´mia], 2003 [Dostęp 31 marca 2009]. Dostępny w World Wide Web: http://www.norslis.net/2004/Bib_Module_KUL.pdf.

    [8] OSIEWALSKA, A. Mierniki oceny czasopism i naukowców. Biuletyn EBIB [on-line]. 2008, nr 11(99) listopad [Dostęp 31 marca 2009]. Dostępny w World Wide Web: http://www.ebib.pl/2008/99/a.php?osiewalska.

    [9] GLÄNZEL, W., dz. cyt.

    [10] STANISZ, A. Przystępny kurs statystyki z zastosowaniem STATISTICA PL na przykładach z medycyny. Kraków: StatSoft, 2007, t. 3: Analizy wielowymiarowe.

    [11] OSIEWALSKA, A. Odkrywanie związków między obiektami analiz bibliometrycznych w indeksach cytowań. Referat wygłoszony na II Konferencji Naukowej pt. Zarządzanie informacją w nauce. Katowice, 18–19 listopada 2008 r.

    [12] Dzięki specjalnemu oprogramowaniu [Osiewalski, K. Cytowania (program komputerowy). Opracowanie niepublikowane, 2008], można – jak widać dość szybko – przygotowywać dane w postaci macierzowej.

    [13] BOLLEN, J. [i in.] A principal component analysis of 39 scientific impact measures [on-line]. 2009 [Dostęp 31 marca 2009]. Dostępny w World Wide Web: http://arxiv.org/PS_cache/arxiv/pdf/0902/0902.2183v1.pdf.

            

Poprzedni - Spis treści - Następny

(C) 2009 EBIB

            Bibliografie czasopism naukowych Biblioteki Głównej UEK jako źródło danych dla analiz bibliometrycznych / Anna Osiewalska, // W: Bibliograficzne bazy danych : kierunki rozwoju i możliwości współpracy. Bydgoszcz, 27-29 maja 2006. - [Warszawa] : Stowarzyszenie Bibliotekarzy Polskich, K[omisja] W[ydawnictw] E[lektronicznych], Redakcja "Elektronicznej Biblioteki", 2009. - (EBIB Materiały konferencyjne nr 19). - ISBN: 83-921757-5-1. -Tryb dostępu : http://www.ebib.pl/publikacje/matkonf/mat19/osiewalska.php