Średnia, mediana, dominanta
W matematyce i statystyce szeroko stosowane są takie pojęcia, jak średnia arytmetyczna, mediana i moda. Pozwalają znaleźć średnie dla dużych ilości liczb/danych i są integralną częścią badań statystycznych. Ich drugie imię to miary tendencji centralnej, a przy normalnym rozkładzie liczb mediana, moda i średnia arytmetyczna są zawsze równe.
Miary statystyki opisowej
Średnia arytmetyczna
Najłatwiejsza do zrozumienia jest średnia arytmetyczna, która jest równa stosunkowi sumy liczb do ich liczby. Jeśli więc weźmiemy tablicę 500 różnych elementów, umieścimy ich wartości liczbowe w nawiasach i podzielimy przez 500, otrzymamy średnią arytmetyczną. Elementy do uśrednienia to najczęściej wyniki badań, dane statystyczne, wskaźniki ekonomiczne itp. Dziś podejście to jest stosowane w większości dziedzin nauki i nauk przyrodniczych, w tym w naukach humanistycznych, takich jak historia. Ogólnie formuła wygląda następująco:
x = (x1 + x2 + ... + xn) / n,
gdzie x to średnia arytmetyczna, a n to liczba wartości do uśrednienia.
Chociaż średnia statystyczna jest używana do określania trendów centralnych znacznie częściej niż mediana i tryb, jej dokładność nie jest wysoka w przypadku heterogenicznych (bardzo różnych) danych.
Mediana
Równie ważną miarą trendu centralnego jest mediana, która jest wyznaczana według zupełnie innej zasady. Wartości tablicy nie trzeba dodawać i dzielić przez ich liczbę, ale po prostu ułożyć w rzędzie: od najmniejszego do największego. Wartość środkowa tej serii będzie równa medianie. Wszystkie wartości znajdujące się po lewej stronie będą mniejsze, a po prawej - więcej. Liczba liczb w rzędzie nie ma znaczenia i może to być albo 3-5 wartości, albo miliony/miliardy. Ale żeby mediana była jak najbardziej obiektywna/jednoznaczna, liczba wartości musi być nieparzysta.
Przy idealnym rozkładzie liczb mediana i średnia arytmetyczna są sobie równe. Ale pierwszy pozwala znacznie dokładniej znaleźć trend centralny przy dużym rozkładzie liczbowym (w rozkładach asymetrycznych). Staje się to szczególnie przydatne przy obliczaniu wielkości dynamicznych.
Moda
Nazwa tego środka w pełni oddaje jego istotę. Tak więc „modne” jest tym, do czego aspiruje większość. Oznacza to, że tryb jest wartością, która występuje najczęściej w danym wierszu/tablicy. Te ostatnie charakteryzują się równoczesnym istnieniem kilku trybów jednocześnie. Na przykład, jeśli najczęstszymi wartościami w tablicy są a, b i n, są one sumowane i dzielone przez liczbę (3). Oznacza to, że znajdują średnią arytmetyczną.
Najczęściej mod jest używany w badaniach nienumerycznych, w których zamiast liczb używane są pewne cechy/właściwości. Na przykład kolory: niebieski, zielony, srebrny, złoty. Albo różnorodność gatunkowa: terier, rottweiler, doberman, pies pasterski. Aby dowiedzieć się, który z tych kolorów (lub rasy psów) występuje najczęściej w serii, taki środek, na jaki pozwala moda. Jednak wraz z rozwojem technologii cyfrowych jego matematyczna przynależność staje się coraz bardziej oczywista.
Trochę historii
Wszystkie trzy miary były szeroko stosowane stosunkowo niedawno – od XVIII do XX wieku. Najwcześniejsza jest koncepcja mody, która została wynaleziona w XVIII wieku w Europie i pierwotnie była używana tylko w odniesieniu do odzieży. Dziś modę stosuje się do wszelkich badań nieliczbowych, w tym do dziedzin przemysłu, rolnictwa, budownictwa.
Nieco później, w 1843 roku, wprowadzono takie pojęcie jak „mediana” – centralna wartość w szeregu liczb, uporządkowanych według wielkości od najmniejszej do największej. Wprowadził ją francuski matematyk Antoine Augustin Cournot, który z wykorzystaniem tego odkrycia przeprowadził badania psychologiczne i socjologiczne. Ponadto mediana znalazła szerokie zastosowanie w takiej dziedzinie nauki jak astronomia.
Najnowszym wynalazkiem spośród przedstawionych jest średnia arytmetyczna. Trudno w to uwierzyć, ale szeroko zaczęto go używać dopiero po 1906 roku – nieco ponad 100 lat temu. Inicjatorem był słynny angielski naukowiec Francis Galton, który podczas wizyty na wystawie rolniczej obliczył średnią wartość z odpowiedzi 787 uczestników konkursu, dzieląc sumę wartości przez ich liczbę. Chodziło o odgadnięcie wagi byka na oko, a wyniki badań Hamiltona potwierdziły, że średnia arytmetyczna z 787 odpowiedzi okazała się jak najbardziej dokładna, pomimo dużego rozrzutu i przybliżenia opcji dźwięcznych.
Podsumowując, możemy powiedzieć, że dziś miary trendu centralnego są podstawą wszelkich statystyk. Bez nich w zasadzie niemożliwe jest dokładne planowanie: wydatków, dochodów, produkcji itp. Aby obliczyć tryb, medianę lub średnią arytmetyczną, można dziś użyć standardowych formuł lub specjalnych aplikacji.