ממוצע, חציון, שכיח
![ממוצע, חציון, שכיח](/media/images/mean_median_mode.webp)
במתמטיקה וסטטיסטיקה, מושגים כמו הממוצע האריתמטי, החציון והמצב נמצאים בשימוש נרחב. הם מאפשרים לך למצוא ממוצעים עבור כמויות גדולות של מספרים/נתונים, ומהווים חלק בלתי נפרד ממחקר סטטיסטי. השם השני שלהם הוא מדדים של נטייה מרכזית, ועם התפלגות נורמלית של מספרים, החציון, המצב והממוצע האריתמטי תמיד שווים.
מדידות של סטטיסטיקה תיאורית
ממוצע אריתמטי
הכי קל להבין הוא הממוצע האריתמטי, השווה ליחס בין סכום המספרים למספרם. לכן, אם ניקח מערך של 500 אלמנטים שונים, נשים את הערכים המספריים שלהם בסוגריים ונחלק ב-500, נקבל את הממוצע האריתמטי. המרכיבים שיש לממוצע הם לרוב תוצאות מחקר, נתונים סטטיסטיים, אינדיקטורים כלכליים וכו'. כיום, גישה זו משמשת ברוב תחומי המדע ומדעי הטבע, כולל מדעי הרוח, כגון היסטוריה. באופן כללי, הנוסחה נראית כך:
x = (x1 + x2 + ... + xn) / n,
כאשר x הוא הממוצע האריתמטי ו-n הוא מספר הערכים שיש לממוצע.
למרות שהממוצע הסטטיסטי משמש לקביעת מגמות מרכזיות לעתים קרובות יותר מאשר החציון והמצב, הדיוק שלו אינו גבוה כאשר עוסקים בנתונים הטרוגניים (שונים מאוד).
חציון
מדד חשוב לא פחות למגמה המרכזית הוא החציון, שנמצא על פי עיקרון אחר לגמרי. אין צורך להוסיף ולחלק את ערכי המערך במספרם, אלא פשוט לסדר אותם בשורה: מהקטן לגדול ביותר. הערך המרכזי של סדרה זו יהיה שווה לחציון. כל הערכים הממוקמים משמאל לו יהיו פחות, ומימין - יותר. מספר המספרים בשורה אינו משנה, והוא יכול להיות 3-5 ערכים או מיליונים/מיליארדים. אבל כדי שהחציון יהיה אובייקטיבי/חד משמעי ככל האפשר, מספר הערכים חייב להיות אי זוגי.
עם התפלגות אידיאלית של מספרים, החציון והממוצע האריתמטי שווים. אבל הראשון מאפשר למצוא את המגמה המרכזית בצורה הרבה יותר מדויקת עם פיזור גדול של מספרים (בהתפלגויות א-סימטריות). זה הופך להיות שימושי במיוחד בעת חישוב כמויות דינמיות.
אופנה
שם המדד הזה מעביר במלואו את מהותו. אז, "אופנתי" זה מה שהרוב שואף אליו. כלומר, המצב הוא הערך שמופיע בתדירות הגבוהה ביותר בשורה/מערך נתון. האחרונים מאופיינים בקיום בו-זמני של מספר מצבים בו-זמנית. לדוגמה, אם הערכים הנפוצים ביותר במערך הם a, b ו-n, הם מתווספים יחד ומחלקים במספר (3). כלומר, הם מוצאים את הממוצע האריתמטי.
לרוב, המוד משמש במחקרים לא מספריים, שבהם נעשה שימוש במאפיינים/מאפיינים מסוימים במקום מספרים. לדוגמה, צבעים: כחול, ירוק, כסף, זהוב. או מגוון מינים: טרייר, רוטוויילר, דוברמן, כלב רועים. כדי לגלות איזה מהצבעים האלה (או מגזע הכלבים) מופיעים לרוב בסדרה, מידה כזו שהאופנה מאפשרת. עם זאת, עם התפתחות הטכנולוגיות הדיגיטליות, ההשתייכות המתמטית שלה הופכת ברורה יותר ויותר.
קצת היסטוריה
כל שלושת המדדים היו בשימוש נרחב יחסית לאחרונה - מהמאה ה-18 עד המאה ה-20. המוקדם ביותר הוא מושג האופנה, שהומצא במאה ה-18 באירופה, ובמקור נעשה בו שימוש רק ביחס ללבוש. כיום, אופנה מיושמת על כל מחקר לא מספרי, כולל תחומי התעשייה, החקלאות, הבנייה.
קצת מאוחר יותר, בשנת 1843, הוצג מושג כמו "חציון" - הערך המרכזי בסדרת מספרים, מסודרים בגודלם מהקטן לגדול ביותר. הוא הוצג על ידי המתמטיקאי הצרפתי אנטואן אוגוסטין קורנו, שערך מחקר פסיכולוגי וסוציולוגי באמצעות תגלית זו. בנוסף, החציון מצא יישום נרחב בתחום מדעי כמו אסטרונומיה.
ההמצאה העדכנית ביותר מבין אלו המוצגות היא הממוצע האריתמטי. קשה להאמין, אבל נעשה בו שימוש נרחב רק אחרי 1906 - לפני קצת יותר מ-100 שנה. היוזם היה המדען האנגלי המפורסם פרנסיס גלטון, שבמהלך ביקור בתערוכה חקלאית חישב את הערך הממוצע מתשובותיהם של 787 משתתפים בתחרות, תוך חלוקת סכום הערכים במספרם. זה היה על ניחוש משקלו של השור לפי עין, ותוצאות המחקר של המילטון אישרו שהממוצע האריתמטי של 787 תשובות התברר כמדויק ככל האפשר, למרות הפיזור הגדול והקירוב של האפשרויות המושמעות.
לסיכום, אנו יכולים לומר שכיום המדדים של המגמה המרכזית הם הבסיס לכל סטטיסטיקה. בלעדיהם, באופן עקרוני, תכנון מדויק בלתי אפשרי: הוצאות, הכנסות, תפוקה וכו'. כדי לחשב את המצב, החציון או הממוצע האריתמטי, כיום ניתן להשתמש בנוסחאות סטנדרטיות או יישומים מיוחדים.