Wikipedia Citation Index

Jakiś czas temu JTy postawił problem wliczania cytowań w Wikipedii do ogólnego indeksu cytowań naukowca. Dyskusja potoczyła się w kierunku wliczania nierecenzowanych publikacji popularyzujących (jakimi są m.in. hasła Wikipedii) do dorobku naukowego oraz w kierunku tożsamości i ewentualnego nieobiektywizmu wikipedystów popularyzujących swoje wyniki. Ja chcę natomiast teraz rozwinąć właśnie problem z pierwszego zdania.

Na pierwszy rzut oka wydaje się, że cytowanie w Wikipedii mogłoby być nie najgorszym parametrem scjentometrycznym. Wady takich wskaźników są powszechnie w środowisku naukowym znane i wytykane. Tak czy inaczej, w końcu  jednak jakieś wskaźniki cytowań się wylicza i uwzględnia w ocenie naukowca, pisma lub placówki. Mnie jednak się wydaje, że wskaźnik cytowań w Wikipedii byłby jeszcze gorszym wskaźnikiem niż obecnie stosowane.

Nie wynika to wcale z tego, że Wikipedia to coś mało wartościowego. Obok artykułów wyglądających jak słabe wypracowanie gimnazjalisty, niejeden artykuł wyróżniony (w polskiej Wikipedii są dwie takie kategorie – dobry artykuł i artykuł na medal) może być najlepszą dostępną „na rynku” monografią danego tematu (wynika to również z tego, że – może niestety – często dopieszczane, a w konsekwencji – wyróżniane – są artykuły o tematach dość niszowych, o których monografie może i ktoś kiedyś wydał w nakładzie kilkuset sztuk leżących w kilku bibliotekach). O tym może jednak innym razem. Wśród wikipedystów są też naukowcy, którzy wiedzą, jak przeglądać Google Scholara i mają w swych instytucjach wykupiony dostęp do Scirusa czy innych baz artykułów naukowych.

Problem więc nie w tym. Problem w różnych celach, jakie przyświecają cytowaniom w publikacjach naukowych, a jakie w Wikipedii. Naukowiec cytuje coś, aby udowodnić, że zgłębił temat, a jednocześnie, że nie wyważa otwartych drzwi. Dlatego naukowiec stara się z jednej strony zacytować najnowsze publikacje o zbliżonym zakresie, by udowodnić, że śledzi rozwój dziedziny i nie powtarza cudzych badań oraz wie, gdzie są luki, które właśnie jego publikacja wypełni, a z drugiej strony dojść do najbardziej pierwotnej publikacji na dany temat, oczywiście w ramach pewnego rozsądku (do Arystotelesa zwykle się nie sięga, ale nawet do prac z początku XX w. raczej już rzadko).

Badania naukowca mogą dotyczyć właśnie badania publikacji (np. archiwów lub starodruków), których samo odczytanie i interpretacja wymaga wiedzy naukowej (ktoś nieznający się na rzeczy mógłby powoływać się na Arystotelesa, twierdząc, że polip to taki głowonóg, podczas gdy naukowiec wie, że starogreckie słowo przekładane dziś na polip a współczesne znaczenie słowa polip, to co innego). Tymczasem wikipedysta jest zawsze mniej lub bardziej anonimowy (nawet jeżeli jego nazwa to imię i nazwisko, a w niezależnym źródle przyznaje się do bycia tym właśnie wikipedystą), więc wyciąganie wniosków z takich publikacji byłoby uznane za niedopuszczalną „twórczość własną” (original research).

Dlatego w Wikipedii lepiej powoływać się na źródła, których interpretacja nie wymaga takiej znajomości kontekstu. Tzn. można powołać się na źródło naukowe, którego zrozumienie wymaga znajomości tylko kontekstu naukowego, a nie całego bagażu historycznego. Nawet jednak kiedy wikipedysta nie opisuje rzeczy z archiwów, tylko zwykłych naukowych publikacji, niekoniecznie musi sięgać do najpierwotniejszego źródła. Wikipedysta nie ma udowadniać, że jest ekspertem w danej dziedzinie znajomością podstawowych publikacji rzeczowych.

Wikipedysta ma przedstawić obecny stan wiedzy. Dlatego też przedstawiając dane zagadnienie równie dobrze może powołać się na artykuł przeglądowy. Stąd skoro już ma artykuł przeglądowy pod ręką, to po co ma sięgać po kilka(naście/dziesiąt) artykułów, które ktoś kompetentny przed nim zebrał i podsumował? Oczywiście, może to zrobić, ale nie musi. Dlatego w jednym haśle będzie te kilkadziesiąt źródeł, a w innym może być zgoła jedno, byle kompetentne. Ponadto naukowiec czasem w funduszach ma pozycję „kwerenda biblioteczna”, a wikipedysta zawsze polega tylko na własnych środkach (co najwyżej, pracując w systemie jakiejś placówki naukowej, korzysta z jej subskrypcji).

Dlatego z dużym prawdopodobieństwem wikipedysta będzie się powoływał nie na źródło „najlepsze” (cokolwiek to ma znaczyć), a na najłatwiej dostępne (byle kompetentne). Tysiące artykułów o roślinach ma za źródło systematyki bazę http://www.mobot.org/MOBOT/research/APweb/, a nie tysiące artykułów w pismach typu Taxon czy Journal of Linnean Society – iech naukowcy z  Angiosperm Phylogeny Group dłubią w publikacjach pierwotnych, wikipedystę zaspokoi korzystanie z wyników ich dłubaniny.

Takie źródło ma jeszcze jedną zaletę – nie trzeba przeszukiwać bibliotek na całym świecie czy wykupywać dostępu do pism wszystkich wydawnictw. Jedno, dwa kliknięcia i można zweryfikować czy ktoś podał źródło rzetelnie. W publikacjach naukowych jak ognia unika się cytowań w stylu Nowak 1956 za Kowalski 2004, bo to świadczy o tym, że naukowiec nie poruszył nieba i ziemi, żeby dotrzeć do publikacji Nowaka (nawet jeżeli Nowak opublikował to w pisemku Zeszyty Naukowe Wyższej Szkoły Pedagogicznej w Koziej Wólce zlikwidowanym w latach 80. i poza Kowalskim i paroma innymi osobami z otoczenia Nowaka, nieżyjącego zresztą od trzydziestu lat, nikt na oczy tej publikacji nie widział). W Wikipedii nie ma nic złego w powołaniu się tylko na Kowalskiego. Wikipedia nie ma honorować odkrywców, tylko ma przedstawiać wiedzę, ktokolwiek za rzetelność tej wiedzy poręczy.

Dlatego właśnie odkrywcy nie mogą liczyć na to, że właśnie oni zostaną w Wikipedii zacytowani. Zacytowani zostaną ci, którzy są akurat pod ręką. Dopóki tak będzie działać mechanizm tworzenia Wikipedii, dopóty cytowania w niej będą kiepskim wskaźnikiem scjentometrycznym.

Piotr Panek

Ilustracja jest kopią utworu, do którego prawa autorskie (nieznanego autora) wygasły, licencja Creative Commons i Public Domain (old), źródło: Biblioteka Królewska w Brukseli (za pośrednictwem Wikimedia Commons).