Ryzykowne rzeczy

Jest ryzykowny seks, ryzykowne picie, ryzykowne jeżdżenie samochodem, istnieje też ryzykowne publikowanie. Uprawiane jest przez informatyków.

W powyższych terminach „ryzykowny” jest przymiotnikiem odnoszącym się do zwykłego sposobu realizowania jakiejś potrzeby. Potrzebą naukowców jest publikowanie swoich wyników pracy (publish or perish). Z różnych powodów informatycy mają zwyczaj publikować w ryzykowny sposób, który negatywnie odbija się na ich postrzeganiu przez różne statystyczne mierniki produktywności naukowej.

Jest otóż tradycją, że w informatyce bardzo wysoko ceni się publikacje konferencyjne. W efekcie prestiż spływający na badacza z tytułu przyjęcia jego pracy na którąś z najlepszych konferencji jest większy niż z publikacji w nawet doskonałych czasopismach. Są takie konferencje, które z powodu swojej renomy zasilane są rokrocznie zgłoszeniami najlepszych prac z dziedziny po czym przyjmują poniżej 20% spośród nich, czyli jedną na ponad 5.

Z powodu typowych dla konferencji ograniczeń w objętości prace są często skróconymi doniesieniami, brak w nich pełnych dowodów w przypadku prac teoretycznych o charakterze matematycznym albo wszystkich szczegółów technicznych w razie prac bardziej inżynierskich. Z tego powodu powszechnie akceptowaną praktyką jest późniejsza publikacja pełnych, dużo dłuższych wersji w czasopismach, często pod tym samym tytułem. Dzieje się to bez pośpiechu, bo kwestia pierwszeństwa została wszak już zaklepana publikacją konferencyjną. Recenzenci też o tym wiedzą i nierzadko na odpwiedź z czasopisma czeka się rok i więcej, a sama publikacja następuje nawet po dwóch latach. Całkiem często jednak autorzy w ogóle rezygnują z publikacji w czasopiśmie, uznając prestiżową konferencję za absolutnie wystarczajacą.

Otóż te właśnie praktyki czynią publikowanie ryzykownym.

Przeanalizujmy dwa typowe wskaźniki statystyczne, służące do oceny publikacji i wpływ praktyk publikacyjnych informatyków na ich wartość.

Pierwszy to impact factor (IF), przysługujący czasopismom. Generalnie im wyższy IF, tym czasopismo uważa się za lepsze. Oblicza się go jako średnią liczbę cytowań jednego artykułu z danego czasopisma ukazujących się w tym i innych czasopismach w ciągu 2 lat od daty publikacji samego artykułu.

Drugi to indeks Hirscha (albo H-indeks), przysługujący z kolei indywidualnemu badaczowi: jest to największa możliwa liczba h taka, że ów badacz ma co najmniej h prac z co najmniej h cytowaniami każda.

Teraz wskażę, że zwyczaje publikacyjne informatyków szkodzą IF czasopism z ich dziedziny i wartościom indeksu Hirscha samych informatyków.

IF czasopism informatycznych cierpi na tym, że ukazują się w nich często prace już wcześniej znane z konferencji, na temat których dyskusja już się w zasadzie odbyła i cytowano wówczas wersję konferencyjną. Sprawa jest jakby trochę zamknięta, cytowań w wielu wypadkach będzie mniej. Może w międzyczasie na kolejnych konferencjach ukazały się prace ulepszające te wyniki (w końcu praca w recenzjach i kolejce do druku może spędzić niemało czasu). Czasami wygląda to wręcz tak, że praca w czasopiśmie ukazuje się po innych pracach, które mogłyby ją cytować. Albo z kolei zostaje zacytowana bardzo szybko na konferencjach (czego IF nie zauważa), po czym artykuły cytujące wychodzą w czasopismach z takim opóźnieniem, że limit 2 lat zostaje przekroczony i znowu IF je ignoruje.

Z kolei indeks Hirscha, nawet jeśli uwzględnia publikacje konferencyjne, to jednak jest obojętny na to, że cytowania wersji konferencyjnej i tej z czasopisma wypadałoby dodawać do siebie. Informatyk ma zatem często dwie wersje jednej pracy, każdą z jakimś fragmentem globalnej liczby cytowań, zamiast jeden z ich sumą.

Ciekawe, co przeważy: czy tradycja środowiskowa, każąca publikować ryzykownie, czy presja formalna, która wyraża się na przykład w rozporządzeniu Ministra NiSW, zgodnie z którym przy ocenie wniosku habilitacyjnego należy uwzględniać między innymi

3) sumaryczny impact factor publikacji naukowych według listy Journal Citation Reports (JCR), zgodnie z rokiem opublikowania;

i

5) indeks Hirscha opublikowanych publikacji według bazy Web of Science (WoS);

Jerzy Tyszkiewicz

Fot. tj.blackwell, Flickr (CC BY-NC 2.0)