Průměr, medián, modus
V matematice a statistice se široce používají pojmy jako aritmetický průměr, medián a modus. Umožňují vám najít průměry pro velké množství čísel / dat a jsou nedílnou součástí statistického výzkumu. Jejich druhé jméno je míry centrální tendence a při normálním rozdělení čísel jsou medián, modus a aritmetický průměr vždy stejné.
Míra popisné statistiky
Aritmetický průměr
Nejsnáze pochopitelný je aritmetický průměr, který se rovná poměru součtu čísel k jejich počtu. Pokud tedy vezmeme pole 500 různých prvků, dáme jejich číselné hodnoty do závorek a vydělíme 500, dostaneme aritmetický průměr. Prvky, které se mají zprůměrovat, jsou nejčastěji výsledky výzkumu, statistické údaje, ekonomické ukazatele a tak dále. Dnes se tento přístup používá ve většině oblastí vědy a přírodních věd, včetně humanitních oborů, jako je historie. Obecně vzorec vypadá takto:
x = (x1 + x2 + ... + xn) / n,
kde x je aritmetický průměr a n je počet hodnot, které mají být zprůměrovány.
Přestože se statistický průměr používá k určení centrálních trendů mnohem častěji než medián a modus, jeho přesnost není vysoká, pokud se jedná o heterogenní (velmi odlišné) údaje.
Medián
Neméně důležitým měřítkem centrálního trendu je medián, který se zjišťuje podle zcela jiného principu. Hodnoty pole není třeba sčítat a dělit jejich počtem, ale jednoduše seřadit do řady: od nejmenšího po největší. Centrální hodnota této řady se bude rovnat mediánu. Všechny hodnoty umístěné nalevo od něj budou menší a napravo - více. Na počtu čísel v řadě nezáleží a může to být buď 3-5 hodnot nebo miliony/miliardy. Ale aby byl medián co nejobjektivnější/nejjednoznačnější, musí být počet hodnot lichý.
Při ideálním rozložení čísel jsou medián a aritmetický průměr stejné. Ale první umožňuje mnohem přesněji najít centrální trend s velkým rozptylem čísel (v asymetrických distribucích). To se stává zvláště užitečné při výpočtu dynamických veličin.
Móda
Název tohoto opatření plně vystihuje jeho podstatu. Takže „módní“ je to, po čem většina touží. To znamená, že režim je hodnota, která se v daném řádku/poli vyskytuje nejčastěji. Ty se vyznačují současnou existencí několika režimů najednou. Pokud jsou například nejběžnější hodnoty v poli a, b a n, sečtou se a vydělí se číslem (3). To znamená, že najdou aritmetický průměr.
Mod se nejčastěji používá v nenumerických studiích, kde se místo čísel používají určité charakteristiky/vlastnosti. Například barvy: modrá, zelená, stříbrná, zlatá. Nebo druhová rozmanitost: teriér, rotvajler, dobrman, pastevecký pes. Chcete-li zjistit, která z těchto barev (nebo plemen psů) se vyskytuje nejčastěji v sérii, takové opatření, které móda umožňuje. S rozvojem digitálních technologií je však jeho matematická příslušnost stále zjevnější.
Trochu historie
Všechny tři míry byly široce používány relativně nedávno - od 18. do 20. století. Nejstarší je pojem móda, který byl vynalezen v 18. století v Evropě a původně se používal pouze ve vztahu k oblečení. Dnes je móda aplikována na jakýkoli nenumerický výzkum, včetně oblastí průmyslu, zemědělství, stavebnictví.
O něco později, v roce 1843, byl představen koncept jako „medián“ – centrální hodnota v řadě čísel, uspořádaných podle velikosti od nejmenšího po největší. Zavedl jej francouzský matematik Antoine Augustin Cournot, který pomocí tohoto objevu provedl psychologický a sociologický výzkum. Kromě toho našel medián široké uplatnění v takové oblasti vědy, jako je astronomie.
Nejnovějším vynálezem mezi prezentovanými je aritmetický průměr. Je těžké tomu uvěřit, ale široce se používalo až po roce 1906 - před něco málo více než 100 lety. Iniciátorem byl slavný anglický vědec Francis Galton, který při návštěvě zemědělské výstavy vypočítal průměrnou hodnotu z odpovědí 787 účastníků soutěže, přičemž součet hodnot vydělil jejich počtem. Šlo o uhodnutí hmotnosti býka podle oka a výsledky Hamiltonovy studie potvrdily, že aritmetický průměr 787 odpovědí se ukázal jako co nejpřesnější, a to i přes velký rozptyl a přibližnost vyjádřených možností.
Shrneme-li, můžeme říci, že dnes jsou měření centrálního trendu základem jakékoli statistiky. Bez nich v zásadě není možné přesné plánování: výdaje, příjmy, výstupy atd. Pro výpočet režimu, mediánu nebo aritmetického průměru dnes můžete použít standardní vzorce nebo speciální aplikace.