Átlag, medián, módus
A matematikában és a statisztikában széles körben használják az olyan fogalmakat, mint a számtani átlag, a medián és a módusz. Lehetővé teszik nagy mennyiségű szám/adat átlagának megtalálását, és a statisztikai kutatás szerves részét képezik. Második nevük a központi tendencia mértéke, és a számok normális eloszlása esetén a medián, a módusz és a számtani átlag mindig egyenlő.
A leíró statisztikák mérőszámai
Számtani átlag
A legkönnyebben érthető a számtani átlag, amely egyenlő a számok összegének a számukhoz viszonyított arányával. Tehát, ha veszünk egy 500 különböző elemből álló tömböt, zárójelbe tesszük a számértékeiket, és elosztjuk 500-zal, akkor megkapjuk a számtani átlagot. Az átlagolandó elemek leggyakrabban kutatási eredmények, statisztikai adatok, gazdasági mutatók stb. Ma ezt a megközelítést alkalmazzák a tudomány és a természettudomány legtöbb területén, beleértve a humán tudományokat is, például a történelemben. Általában a képlet így néz ki:
x = (x1 + x2 + ... + xn) / n,
ahol x a számtani átlag, n pedig az átlagolandó értékek száma.
Bár a statisztikai átlagot sokkal gyakrabban használják a központi trendek meghatározására, mint a mediánt és a módozatot, a pontossága nem nagy, ha heterogén (nagyon eltérő) adatokkal foglalkozunk.
Medián
A központi trend ugyanilyen fontos mérőszáma a medián, amely teljesen más elv szerint kerül megállapításra. A tömbértékeket nem kell összeadni és elosztani a számukkal, hanem egyszerűen sorba kell rendezni: a legkisebbtől a legnagyobbig. Ennek a sorozatnak a központi értéke egyenlő lesz a mediánnal. A tőle balra található összes érték kevesebb lesz, a jobb oldalon pedig több. Az egy sorban lévő számok száma nem számít, lehet 3-5 érték vagy millió/milliárd. De ahhoz, hogy a medián a lehető legobjektívebb/egyértelműbb legyen, az értékek számának páratlannak kell lennie.
A számok ideális eloszlása esetén a medián és a számtani átlag egyenlő. Az első azonban lehetővé teszi a központi trend sokkal pontosabb megtalálását nagy számszórás mellett (aszimmetrikus eloszlásban). Ez különösen dinamikus mennyiségek számításakor válik hasznossá.
Divat
Ennek az intézkedésnek a neve teljes mértékben kifejezi annak lényegét. Tehát a "divatos" az, amire a többség törekszik. Vagyis a mód az adott sorban/tömbben leggyakrabban előforduló érték. Ez utóbbiakra jellemző, hogy egyszerre több mód is létezik. Például, ha a tömb leggyakoribb értékei a, b és n, akkor ezeket összeadjuk és elosztjuk a (3) számmal. Vagyis megtalálják a számtani átlagot.
A modot leggyakrabban nem numerikus vizsgálatokban használják, ahol bizonyos jellemzőket/tulajdonságokat használnak számok helyett. Például színek: kék, zöld, ezüst, arany. Vagy a fajok sokfélesége: terrier, rottweiler, doberman, pásztorkutya. Ahhoz, hogy megtudja, melyik szín (vagy kutyafajta) fordul elő leggyakrabban egy sorozatban, olyan intézkedést kell tenni, amelyet a divat lehetővé tesz. A digitális technológiák fejlődésével azonban egyre nyilvánvalóbb a matematikai hovatartozása.
Egy kis történelem
Mindhárom mértéket viszonylag nemrégiben – a 18. és a 20. század között – széles körben használták. A legkorábbi a divat fogalma, amelyet a 18. században találtak ki Európában, és eredetileg csak a ruházattal kapcsolatban használták. Ma a divatot minden nem numerikus kutatásra alkalmazzák, beleértve az ipar, a mezőgazdaság és az építőipar területeit is.
Kicsit később, 1843-ban bevezették az olyan fogalmat, mint a „medián” – ez a központi érték egy számsorban, méret szerint a legkisebbtől a legnagyobbig. Antoine Augustin Cournot francia matematikus vezette be, aki pszichológiai és szociológiai kutatásokat végzett ezzel a felfedezéssel. Ezenkívül a medián széleskörű alkalmazást talált olyan tudományterületen, mint a csillagászat.
A bemutatottak közül a legújabb találmány a számtani átlag. Nehéz elhinni, de csak 1906 után használták széles körben – valamivel több mint 100 évvel ezelőtt. A kezdeményező a híres angol tudós, Francis Galton volt, aki egy mezőgazdasági kiállítás látogatása során a verseny 787 résztvevőjének válaszaiból számolta ki az átlagértéket, és az értékek összegét elosztotta számukkal. A bika súlyának szemről való találgatásáról volt szó, és Hamilton vizsgálatának eredményei megerősítették, hogy 787 válasz számtani átlaga a lehető legpontosabbnak bizonyult, a hangos opciók nagy elterjedése és hozzávetőlegessége ellenére.
Összefoglalva azt mondhatjuk, hogy ma a központi trend mértékei minden statisztika alapját képezik. Ezek nélkül elvileg lehetetlen a pontos tervezés: kiadások, bevételek, kibocsátás stb. A módusz, medián vagy számtani átlag kiszámításához ma már szabványos képleteket vagy speciális alkalmazásokat használhat.