平均数、中位数、众数
![平均数、中位数、众数](/media/images/mean_median_mode.webp)
在数学和统计学中,算术平均数、中位数和众数等概念被广泛使用。 它们使您可以找到大量数字/数据的平均值,并且是统计研究不可或缺的一部分。 他们的第二个名字是集中趋势的度量,对于数字的正态分布,中位数、众数和算术平均数总是相等的。
描述性统计量度
算术平均值
最容易理解的就是算术平均数,它等于数字之和与其个数之比。 所以,如果我们取一个包含 500 个不同元素的数组,将它们的数值放在括号中并除以 500,我们就得到了算术平均值。 要平均的元素通常是研究结果、统计数据、经济指标等。 今天,这种方法被用于科学和自然科学的大部分领域,包括历史等人文学科。 一般来说,公式如下所示:
x = (x1 + x2 + ... + xn) / n,
其中x是算术平均值,n是要平均的值的个数。
虽然统计平均值比中位数和众数更常用于确定中心趋势,但在处理异构(差异很大)数据时,它的准确性并不高。
中位数
中心趋势的一个同样重要的衡量标准是中位数,它是根据完全不同的原则找到的。 数组值不需要相加和除以它们的个数,而只是简单地排列成一行:从小到大。 该系列的中心值将等于中位数。 位于其左侧的所有值都将减少,而在右侧 - 将增加。 连续的数字个数无关紧要,可以是3-5个值,也可以是百万/十亿。 但是为了使中位数尽可能客观/明确,值的数量必须是奇数。
对于理想的数字分布,中位数和算术平均值是相等的。 但是第一个可以更准确地找到大量数字(在不对称分布中)的中心趋势。 这在计算动态数量时变得特别有用。
时尚
这项措施的名称充分传达了其实质。 所以,“时尚”是大多数人所向往的。 也就是说,众数是给定行/数组中出现频率最高的值。 后者的特点是同时存在多种模式。 例如,如果数组中最常见的值是 a、b 和 n,则将它们相加并除以数字 (3)。 也就是说,他们找到算术平均值。
大多数情况下,mod 用于非数值研究,其中使用某些特征/属性而不是数字。 例如,颜色:蓝色、绿色、银色、金色。 或物种多样性:梗犬、罗威纳犬、杜宾犬、牧羊犬。 找出这些颜色(或狗的品种)中哪种颜色最常出现在一个系列中,这是时尚允许的一种衡量标准。 然而,随着数字技术的发展,其数学归属感越来越明显。
一些历史
从 18 世纪到 20 世纪,这三种衡量标准都在最近才被广泛使用。 最早的是时尚的概念,它是18世纪在欧洲发明的,最初只用于与服装有关的方面。 今天,时尚应用于任何非数值研究,包括工业、农业、建筑领域。
稍后,在 1843 年,引入了“中位数”这样的概念 - 一系列数字的中心值,按大小从小到大排序。 它是由法国数学家安托万·奥古斯丁·古诺引入的,他利用这一发现进行了心理学和社会学研究。 此外,中位数在天文学等科学领域也有广泛的应用。
最近的发明是算术平均数。 很难相信,但它只是在 1906 年之后才被广泛使用——也就是 100 多年前。 发起人是著名的英国科学家弗朗西斯·高尔顿,他在参观一个农业展览时,从 787 名参赛者的答案中计算出平均值,用这些值的总和除以他们的数量。 这是关于通过肉眼猜测公牛的重量,汉密尔顿的研究结果证实,尽管有声选项的分布范围很大且近似,但 787 个答案的算术平均值被证明是尽可能准确的。
总而言之,我们可以说今天的中心趋势指标是任何统计数据的基础。 没有它们,原则上不可能进行准确的计划:支出、收入、产出等。要计算众数、中位数或算术平均数,今天您可以使用标准公式或特殊应用程序。