Середнє значення, медіана, мода
У математиці та статистиці широко застосовуються такі поняття як середнє арифметичне, медіана та мода. Вони дозволяють знаходити усереднені показники для великих обсягів чисел/даних і є невід'ємною складовою статистичних досліджень. Їхня друга назва — заходи центральної тенденції, а за нормального розподілу чисел медіана, мода та середнє арифметичне завжди рівні.
Заходи описової статистики
Середня арифметична
Найпростішим для розуміння є середнє арифметичне значення, яке дорівнює відношенню суми чисел до їхньої кількості. Так, якщо взяти масив із 500 різних елементів, помістити їх числові значення у дужки та розділити на 500, отримаємо середнє арифметичне. Як елементи, які потрібно усереднити, найчастіше виступають результати досліджень, статистичні дані, економічні показники тощо. Сьогодні такий підхід застосовується у більшості сфер науки та природознавства, включаючи гуманітарні дисципліни, наприклад історію. Загалом формула виглядає так:
x = (x1 + x2 + ... + xn) / n,
де x — середня арифметична, а n — кількість значень, що підлягають усередненню.
Хоча середнє статистичне використовується для визначення центральних тенденцій набагато частіше, ніж медіана і мода, його точність невисока при обробці різнопланових даних.
Медіана
Не менш важливий захід центральної тенденції — медіана, яка знаходиться за зовсім іншим принципом. Значення масиву не потрібно складати і ділити на їх кількість, а досить просто розмістити їх у ряд: від найменшого до найбільшого. Центральне значення цього ряду і дорівнюватиме медіани. Усі значення, розташовані ліворуч від неї, будуть меншими, а праворуч — більшими. Кількість чисел у ряду не має значення, і це може бути як 3-5 значень, і мільйони/миллиарды. Але щоб медіана була максимально об'єктивною/однозначною, кількість значень має бути непарною.
При ідеальному розподілі чисел показники медіани та середнього арифметичного рівні між собою. Але перша дозволяє значно точніше знаходити центральну тенденцію при великому розкиданні чисел (в асиметричних розподілах). Це стає особливо корисним при підрахунках динамічних величин.
Мода
Назва цього заходу повною мірою передає його суть. Так, «модним» є те, чого прагне більшість. Тобто, мода - це значення, що найчастіше зустрічається в даному ряду/масиві. Для останніх характерне одночасне існування одразу кількох мод. Наприклад, якщо в масиві найчастіше зустрічаються значення a, b і n, їх складають між собою та ділять на кількість (3). Тобто знаходять середнє арифметичне.
Найчастіше мода застосовується у нечислових дослідженнях, де замість цифр використовуються ті чи інші характеристики/властивості. Наприклад, кольори: синій, зелений, сріблястий, золотистий. Або видова різноманітність: тер'єр, ротвейлер, доберман, вівчарка. Дізнатися, який з цих квітів (або порода собак) зустрічається в ряду найчастіше, дозволяє такий захід як мода. Втім, з розвитком цифрових технологій її математична приналежність стає дедалі очевиднішою.
Трохи історії
Усі три заходи знайшли широке застосування відносно нещодавно - з XVIII до XX століття. Найранішим є поняття моди, яку винайшли у XVIII столітті у Європі, і спочатку використовували лише щодо одягу. Сьогодні мода застосовується до будь-яких нечислових досліджень, включаючи сфери промисловості, сільського господарства, будівництва.
Трохи пізніше, в 1843 році, було введено таке поняття як «медіана» — центральне значення в ряді чисел, упорядкованих за величиною від меншого до більшого. Його ввів французький математик Антуан Огюстен Курно, який проводив з використанням цього відкриття психологічні та соціологічні дослідження. Крім того, медіана знайшла широке застосування у такій сфері науки як астрономія.
Найпізнішим винаходом серед представлених вважається середнє арифметичне. У це складно повірити, але його почали широко використовувати лише після 1906 року — трохи більше ніж 100 років тому. Ініціатором став відомий англійський вчений Френсіс Гальтон, який під час відвідин сільськогосподарської виставки вирахував середнє значення з відповідей 787 учасників змагання, розділивши суму значень на їхню кількість. Йшлося про те, щоб на око вгадати вагу бика, і результати дослідження Гамільтона підтвердили, що середня арифметична з 787 відповідей виявилася максимально точною, незважаючи на великий розкид і приблизність озвучених варіантів.
Підбиваючи підсумок, можна сказати, що сьогодні заходи центральної тенденції — основа будь-якої статистики. Без них у принципі неможливо точне планування: витрат, доходів, продукції, що випускається і т. д. Щоб розрахувати моду, медіану або середнє арифметичне, сьогодні можна використовувати стандартні формули або спеціальні додатки.