Medale i statystyka

Po olimpiadzie media rozpoczęły dyskusję na temat małej liczby medali i zaniedbań władz. Przewijał się motyw porażki mężczyzn, obecnych w przeważającej liczbie we władzach zarządzających sportem, dostarczających natomiast znacznie mniej medali niż kobiety. Czy ten ostatni wniosek na pewno jest uzasadniony?

Nie będę udawał, że znam się na sporcie ani że temat ten jakkolwiek mnie obchodzi. Niemniej sytuację można wykorzystać do pokazania na prostym przykładzie, jak nauka weryfikuje hipotezy. Tylko po co? Na 10 medali kobiety zdobyły 8, mężczyźni 2. Czy nie widać od razu, że kobietom poszło lepiej? Otóż w nauce to, co widać na pierwszy rzut oka, zwykle nie ma wielkiego znaczenia. Spróbujmy dowieść tego wniosku naukowo.

Jak wiek temu stwierdził Popper, twierdzenia naukowe dotyczące realnego świata są niedowodliwe, tzn. nie można dowieść ich prawdziwości. Można je tylko potwierdzić bądź obalić. Na początek stawiamy więc hipotezę zerową, którą potem będziemy próbować obalić. Hipoteza zerowa zawsze mówi o braku poszukiwanego związku. W naszym przypadku brzmi następująco: kobiety i mężczyźni nie różnią się pod względem liczby zdobytych medali olimpijskich.

Badanie w postaci igrzysk 2024 na szczęście dla nas przeprowadzili za własne pieniądze Francuzi. Polska reprezentacja zdobyła N = 10 medali, z czego 8 otrzymały kobiety, a 2 mężczyźni.

Policzmy istotność statystyczną takiego wyniku. Zakładamy, zgodnie z hipotezą zerową, że między płciami nie ma żadnych różnic w zdolności do zdobywania medali olimpijskich, a różnica wynika z czystego przypadku. Liczymy prawdopodobieństwo uzyskanego rozkładu. Z uwagi na słaby wynik polskiej reprezentacji w postaci zaledwie 10 medali i stosowany w sporcie (nie bez innych omawianych problemów) rozkład płci na dwie wartości obliczenie będzie dość łatwe.

Mamy 10 medali, ustawmy je w ciąg. Każdy element może przyjmować dwie wartości. Ile takich ciągów istnieje? Dwie możliwości w pierwszym miejscu, dwie w drugim i tak dalej… W sumie 2 do potęgi 10, czyli 1024. To nasza przestrzeń, w której policzymy prawdopodobieństwo.

Teraz musimy policzyć, w ilu przypadkach otrzymamy rozkład uzyskany w badaniu bądź jeszcze skrajniejszy, jeśli wyniki rzeczywiście losujemy (hipoteza zerowa zakładała brak zależności i przypadkowość uzyskanych wyników). Tu musimy policzyć liczbę przypadków, gdy na dziesięć losowań losujemy maksymalnie dwóch mężczyzn. Podzielimy go na trzy grupy odpowiadające wynikom 0, 1 i 2 mężczyzn.

Istnieje tylko jedna możliwość niewylosowania mężczyzny – kiedy 10 razy z rzędu wyjdzie kobieta. Wynik 1 można uzyskać na 10 przypadków – w każdym z pojedynczych losowań mógł wypaść mężczyzna.

Chwilę się trzeba zastanowić nad wynikiem 2. Na ile sposobów można go zrealizować? Pierwszego medalistę możemy wylosować na 10 sposobów. Za każdym razem pozostaje nam 9 możliwych do obsadzenia medali (tego samego medalu dwa razy wygrać nie można). Mamy więc 90 możliwości (tak, 10! podzielić na (10-2)!; gdyby zachciało nam się nie uwzględniać kolejności medali, co i tak nie wpłynie na wynik, należałoby użyć symbolu Newtona 10 nad 2).

W sumie daje to 90+10+1 = 101 możliwości. Licząc w przybliżeniu, ok. 100 przez ok. 1000 to jakieś 10 proc. (na kalkulatorze wychodzi p = 0,0986). Z takim prawdopodobieństwem uzyskamy nasz wynik, jeśli postulowanej zależności nie ma.

Pytanie: czy to dużo, czy mało? W większości badań medycznych wartością graniczną pozwalającą odrzucić hipotezę zerową jest 0,05, w dobrych badaniach uzyskane wartości wynoszą mniej niż 0,001 czy nawet poniżej 0,0001.

Bardziej obrazowo: rozpatrywana sytuacja równoważna jest dwóm orłom na dziesięć rzutów monetą. Czy na tej podstawie będziemy podejrzewać, że moneta jest oszukana?

Jeszcze inaczej. Weźmy kostkę do gry, rzucamy dwa razy. Wychodzi najpierw 6, potem 4. Istotność statystyczna wynosi 1/6 razy 1/2 (prawdopodobieństwo wyniku 4 bądź większego, czyli 5 bądź 6), a więc 1/12, czyli mniej od uzyskanego przez nas wyżej. Odrzucimy taką kostkę?

Jaki więc wniosek można wyprowadzić z badania? Nie udało się odrzucić hipotezy zerowej. Dane nie pozwalają stwierdzić, że kobiety polskie uzyskują więcej medali olimpijskich niż mężczyźni, ani że uzyskany wynik na tych igrzyskach był czymś więcej niż przypadkiem, a zaobserwowana początkowo rzekoma prawidłowość powtórzy się za cztery lata.

Tutaj kolejna ważna uwaga: brak dowodu nie oznacza dowodu braku. Zbadana próba wynosiła N = 10. Dlatego należy podchodzić ostrożnie do badań na niewielkich populacjach. Niekiedy zdarza się uzyskać w ten sposób istotne statystycznie wyniki (pojedynczy medal dla mężczyzn uprawniałby już do falsyfikacji hipotezy zerowej i rzucania gromów).

Bardzo możliwe, że gdyby wziąć większą próbę (np. uwzględnić igrzyska zimowe czy rozgrywki sprzed czterech lat), udałoby się uzyskać wyniki istotne statystycznie. Dlatego w medycynie tak ważne są zbierające wyniki pojedynczych badań metaanalizy. Jeśli ktoś jest zainteresowany bądź chciałby utwierdzić się w opinii na temat polskich sportowców, zapraszam do prowadzenia własnych wyliczeń.

Marcin Nowak

Ilustracja: Iga Świątek, WTA