Среднее арифметическое, медиана и мода
В математике и статистике широко применяются такие понятия как среднее арифметическое, медиана и мода. Они позволяют находить усреднённые показатели для больших объёмов чисел/данных, и являются неотъемлемой составляющей статистических исследований. Их второе название — меры центральной тенденции, а при нормальном распределении чисел медиана, мода и среднее арифметическое всегда равны.
Меры описательной статистики
Среднее арифметическое
Самым простым для понимания является среднее арифметическое значение, которое равно отношению суммы чисел к их количеству. Так, если взять массив из 500 разных элементов, поместить их числовые значения в скобки и разделить на 500, получим среднее арифметическое. В качестве элементов, которые нужно усреднить, чаще всего выступают результаты исследований, статистические данные, экономические показатели и так далее. Сегодня такой подход применяется в большинстве сфер науки и естествознания, включая гуманитарные дисциплины, например — историю. В общем виде формула выглядит так:
x = (x1 + x2 + ... + xn) / n,
где x — среднее арифметическое, а n — количество значений, подлежащих усреднению.
Хотя среднее статистическое используется для определения центральных тенденций гораздо чаще, чем медиана и мода, его точность невысока при обработке разноплановых (сильно отличающихся) данных. Яркий пример — нахождение усреднённой заработной платы в той или иной компании. Если директора и учредители могут зарабатывать в месяц миллионы, то у рядовых сотрудников доходы исчисляются суммами, меньшими на несколько порядков. Очевидно, что если сложить их и разделить на количество людей, объективная картина точно не получится.
Медиана
Не менее важная мера центральной тенденции — медиана, которая находится по совсем другому принципу. Значения массива не нужно складывать и делить на их количество, а достаточно просто расположить их в ряд: от наименьшего к наибольшему. Центральное (срединное) значение этого ряда и будет равняться медиане. Все значения, расположенные слева от неё, будут меньше, а справа — больше. Количество чисел в ряду не имеет значения, и это могут быть как 3–5 значений, так и миллионы/миллиарды. Но чтобы медиана была максимально объективной/однозначной, количество значений должно быть нечётным.
При идеальном распределении чисел показатели медианы и среднего арифметического равны между собой. Но первая позволяет значительно точнее находить центральную тенденцию при большом разбросе чисел (в асимметричных распределениях). Это становится особенно полезным при подсчётах динамических величин. Например, средний доход может увеличиваться медленнее, чем среднее арифметическое дохода, и использование медианы в этом случае — предпочтительно.
Мода
Название этой меры в полной мере передаёт её суть. Так, «модным» является то, к чему стремится большинство. То есть, мода — это значение, наиболее часто встречающееся в данном ряду/массиве. Для последних характерно одновременное существование сразу нескольких мод. Например, если в массиве чаще всего встречаются значения a, b и n, их складывают между собой и делят на количество (3). То есть — находят среднее арифметическое.
Чаще всего мода применяется в нечисловых исследованиях, где вместо цифр используются те или иные характеристики/свойства. Например, цвета: синий, зелёный, серебристый, золотистый. Или видовое разнообразие: терьер, ротвейлер, доберман, овчарка. Узнать, какой из этих цветов (или порода собак) встречается в ряду наиболее часто, позволяет такая мера как мода. Впрочем, с развитием цифровых технологий её математическая/цифровая принадлежность становится всё более очевидной, так как любой объект/субъект сегодня можно представить в виде двоичного кода, и уже по нему находить и средние арифметические, и медианы, и моды.
Немного истории
Все три меры (среднее арифметическое, медиана и мода) нашли широкое применение относительно недавно — с XVIII по XX века. Самым ранним является понятие моды, которую изобрели в XVIII веке в Европе, и изначально использовали только в отношении одежды. Сегодня же мода применяется к любым нечисловым (а иногда и к числовым) исследованиям, включая сферы промышленности, сельского хозяйства, строительства.
Немного позже, в 1843 году было введено такое понятие как «медиана» — центральное значение в ряду чисел, упорядоченных по величине от меньшего к большему. Его ввёл французский математик Антуан Огюстен Курно (Antoine-Augustin Cournot), проводивший с использованием этого открытия психологические и социологические исследования. Кроме того, медиана нашла широкое применение в такой сфере науки как астрономия.
Самым поздним изобретением среди представленных считается среднее арифметическое. В это сложно поверить, но его начали широко использовать только после 1906 года — чуть больше, чем 100 лет назад. Инициатором стал известный английский учёный Фрэнсис Гальтон (Francis Galton), который во время посещения сельскохозяйственной выставки вычислил среднее значение из ответов 787 участников соревнования, разделив сумму значений на их количество. Речь шла о том, чтобы на глаз угадать вес быка, и результаты исследования Гамильтона подтвердили, что среднее арифметическое из 787 ответов оказалось максимально точным, несмотря на большой разброс и приблизительность озвученных вариантов.
Подводя итог, можно сказать, что сегодня меры центральной тенденции — основа любой статистики. Без них в принципе невозможно точное планирование: расходов, доходов, выпускаемой продукции и т. д. Чтобы рассчитать моду, медиану или среднее арифметическое, сегодня можно использовать стандартные формулы или специальные онлайн-приложения, мгновенно выдающие нужный результат.