نوشته و تهیه شده توسط: حسین ضرغامی

منبع: سایت های مختلف

 کارکرد کلی آمار در ساده کردن انبوه بزرگی از داده ها می باشد. ما نیازمند گزاره‌هایی هستیم که 1- اطلاعاتی درباره مقدار جایگاه مورد نظر ارائه دهد 2- مقادیری را که فعلاً نامربوطند، حذف کنند و 3- با کارایی معقولی معرف دقیق کلیت داده ها باشد. اما پیداست که هیچ مقدار واحدی به حد کافی از انعکاس تمام خصوصیات جایگاه توزیع بر نمی آید بلکه فقط می تواند یکی از خصوصیات آن را منعکس کند. هر مقداری از توزیع را می توان به مثابه معرفی کل به کار برد به شرطی که جایگاه آن، در آرایش کامل داده ها مشخص باشد اما عملاً همه مقادیر و لو با معین بودن معرف‌بودنشان، کارایی یکسانی ندارند. تقریباً مناسب ترین و سودمندترین مقادیری که می توان از جدول داده ها استخراج کرد بر دو نوع هستند: 1. مقادیر انتهایی یا حداقل و حداکثر و 2. مقادیر مرکزی یا نماینده که به متوسط ها معروفند.

 

 

 

حداقل و حداکثر به منزله اندازه جایگاه:

 

در برخی موارد، تصمیم‌گیری بهتر است برمبنای مقادیر انتهایی صورت گیرد. برای مثال، در مورد عمق یک استخر شنا، دانستن متوسط عمق ارزش و کاربردی ندارد بلکه حداکثر عمق برای تصمیم‌گیری شنا لازم است. یا مثلا برای استفاده از معلم خصوصی، دانستن معدل کاربردی ندارد بلکه مشخص ساختن درس یا دروسی که پایین‌ترین نمره را دارد در این تصمیم تاثیر اساسی دارد. در واقع، مقادیر حداقل و حداکثر برای بسیاری از تصمیمات و انتخابها، اطلاعات مفیدتری ارایه می‌کنند تا متوسط‌ها یا شاخص‌های گرایش به مرکز.

 

نکته: محقق باید در مورد این گرایش که متوسط‌ها بهترین و مناسب‌ترین اندازه جایگاه هستند محتاط باشد. کلید انتخاب یک اندازه، هدفی است که از کاربرد اندازه جایگاه  داریم.

 

 

 

مفهوم متوسط

 

هر اندازه و مقداری را می‌توان به منزله جایگاه و اندازه مربوط به آن انتخاب کرد. بسته به اطلاعاتی که داریم این انتخاب می‌تواند اندازه هریک از داده ها و اطلاعات باشد (مثل، اندازه سر جمجمه یک کشف باستانی که هر مورد مهم است) یا می‌تواند تمام اطلاعات در یک عدد خلاصه شود که این امر در اهداف آماری بیشتر مد نظر و مطلوب است. در جایی که اطلاعات درباره موردهای زیادی داریم با توصیف نقطه‌ای که داده‌ها گرد آن جمع شده‌اند، در پی اندازه تلخیص برمی‌آییم که بیانگر توزیع کل داده‌هاست. این نقطه که توزیع آماری گرد آن جمع یا متراکم شده، گرایش مرکزی توزیع یا مقدار متوسط توزیع خوانده می‌شود. متوسط مفهومی است که کاربرد عامیانه دارد ولی هیچ کس از هر لحاظ متوسط نیست. فرد متوسط وجود خارجی ندارد. این مفاهیم با دیدگاه آماری دقیق‌تر که فقط برای رشته‌ای از اندازه‌های یک متغیر به کار می‌رود مطابق نیست.

 

متوسط یک مقدار نرم یا هنجار است که مقادیر حول آن متغیرند. در برخی مواقع و برخی توزیع‌های خاص، نقطه مرکز انباشت و تراکم داده‌ها، مقادیر مشخص و نسبتا بدون ابهام قرار می‌گیرند. مثلا، در توزیع نرمال یا زنگوله‌ای شکل اینگونه است. در منحنی دونمایی این وضعیت صدق نمی‌کند. یا در توزیع چوله، نقطه‌ای که به عنوان متوسط یا مرکز انتخاب می‌شود (به دست می‌آید) معرف کامل مقادیر حد متقابل نیست. در این وضعیت‌ها، کار معرفی مناسب توزیع کل با متوسط واحد یا اندازه واحد دشوار است. در اینجا، این اندازه‌ها نمی‌توانند همه وجود توزیع را خلاصه کنند و سوال پیش می‌آید که کدام اندازه بهترین تلخیص را برای جایگاه توزیع ارایه می‌کند.

 

در آمار اجتماعی، عموما از متوسط‌ها برای مقایسه جایگاه دو یا چند توزیع استفاده می‌شود. بسیاری از متوسط‌ها معنای خاصی ندارند مگر در مقایسه با متوسط‌های دیگر در همان جمعیت یا در زمانی دیگر یا جمعیتی دیگر. مثلا نمره متوسط درس آمار دانشجویان یک کلاس به خودی خود بیانگر تبحر و مهارت آماری آنان نیست. این مقدار به وزن سوالات و سطح دشواری امتحان بستگی دارد. ولی وقتی که تفاوت بین دو کلاس وجود دارد دلیل این اختلاف باید بررسی گردد. در واقع، تقابل شدید متوسط‌ها در علوم اجتماعی نیازمند بررسی و تحقیق جامعه‌شناختی است. اینکه متوسط دستمزد زنان و مردان در مشاغل مشابه، یکسان نباشد نمونه ای از موارد متعدد است.

 

شاخص های مرکزی به مقدار یا عددی که به بهترین شکل ویژگی گروه را به عنوان یک کل نشان می دهد اشاره می کنند . مترادف شاخص مرکزی نمره ی متوسط یا معدل (average)است.بنابراین شاخص های مرکزی یا گرایش به مرکز شاخص هایی هستندکه با استفاده ازآنها مجموعه ای ازداده ها در یک مقدار یا عدد که نماینده ی آن مجموعه است خلاصه می شود . شاخص های مرکزی یا گرایش به مرکز شاخص هایی هستندکه با استفاده ازآنها مجموعه ای ازداده ها در یک مقدار یا عدد که نماینده ی آن مجموعه است خلاصه می شود .به دیگر سخن،این شاخص حد متوسط رانشان می دهد و نماینده مجموعه ی از اعداد هستند. یک متوسط عبارت است از مقدار مرکزی یا نماینده مجموعه داده‌ها. عموما احتیاج به اطلاعات بیشتری داریم تا بتوانیم متوسطها یا اندازه‌های گرایش به مرکز را تعیین نماییم. نکته مهم این  که راه‌های زیادی برای محاسبه یک اندازه گرایش به مرکز وجود دارد. انواع اندازه‌های گرایش به مرکز وجود دارد که 3 مورد مهم آن نما، میانه و میانگین می‌باشد.

 

 

 

نما Mode

 

نما فراوان‌ترین مقدار توزیع است. ساده ترین شاخص گرایش مرکزی است، نما عددی است که دارای بیشترین فراوانی است،یا عددی که بیشتر از اعداد دیگر تکرار شده است.نما ازطریق مشاهده ی توزیع فراوانی وتعیین عددی که دارای بیشترین فراوانی است تعیین می گردد.عددی که دارای بیشترین فراوانی است،غالباًنزدیک به مرکزتوزیع فراوانی قراردارد.درچنین شرایطی نما یک شاخص مرکزی است.اما نماهمیشه درمرکزتوزیع فراوانی قرارندارد به همین دلیل نمی توان به عنوان یک شاخص مرکزی به آن اطمینان داشت، در واقع نما در میان شاخص های گرایش به مرکز، شاخصی بی ثبات است. به توزیع فراوانی که فقط یک نمادارد،یک نمایی و به توزیعی که دونمادارد، توزیع دونمایی می گویند وبه توزیع بیش ازدونما، توزیع چند نمایی گفته می شود. از نما هنگامی استفاده می کنیم که مقیاس اندازه گیری اسمی باشد و یک برآورد تقریبی از ارزش های مرکزی کفایت کند. به عبارتی دیگر،نما به عنوان یک شاخص مرکزی مورد استفاده محدودی دارد. نما مخصوصا در گروه های کوچک دارای اعتبار نیست زیرا میزان آن فقط تابع چند عدد است. پژوهشگران معمولا هنگامی از نما استفاده می کنند که مایل باشند بینش کلی درباره شاخص مرکزی به دست آورند.این شاخص درباره گرایش مرکزی توزیع نمره ها اطلاعی به ما نمی دهد زیرا شاخص مرکزی یک توزیع الزاما عدد با ارزشی نیست که دارای بیشترین فراوانی باشد. نما از نظر لغوی به معنی شیوه متداول لباس پوشیدن یا آداب و رسوم است که اکثریت مردم از آن پیروی می‌کنند. از این رو نما را می‌توان محتمل‌ترین مقدار هم دانست و آن را متوسط احتمالی خواند‌. با این همه، این بیان که اکثر مقادیر در فاصله یا طبقه نما قرار دارند خطاست مگر آن که دو طبقه در بین باشد. پرشمارترین و نه لزوما اکثریت در طبقه نما قرار می‌گیرند.‌

 

نمادربین شاخص های مرکزی دارای کمترین مفروضه است.نمادرمقایسه باسایرشاخص های مرکزی به سهولت محاسبه می شود،نمااطلاعاتی کلی درباره ی فراوان ترین ارزش یاعددبه پژوهشگرمی دهد.این شاخص درباره ی گرایش مرکزی توزیع نمره ها اطلاعی به مانمی دهد،به علت عدم ثبات واعتبارنما،به ندرت ازآن به عنوان یک شاخص گرایش مرکزی استفاده می شود. مثلا با جابجا کردن حدود طبقات، می‌تواند نما نیز تغییر یابد. ازآنجاکه نما را نمی توان بصورت ریاضی دستکاری کرد،به همین دلیل ازنظرمحاسبات آماری مورداستفاده محدودی دارد. معمولا نما ملاک سنجش‌های رفتار عمومی است.

 

خلاصه ی ویژگی های نماعبارتنداز:

 

1.       نما یک شاخص اسمی است.

 

2.       عددی است که دارای بیشترین فراوانی است.

 

3.       غالباًدروسط توزیع نمره هاقراردارد.

 

4.       دربعضی ازتوزیع هابیش ازیکی وجوددارد.

 

5.       اعمال ریاضی رانمی توان باآن انجام داد.

 

6.       دارای پایداری یاثبات خیلی کمی است.

 

7.       برآوردخیلی ضعیفی ازپارامترجامعه است.

 

8.       به ندرت به کاربرده می شود.

 

کاربرد:

 

پژوهشگران معمولاًهنگامی ازنمااستفاده می کنندکه مایل باشندبینشی کلی درباره ی شاخص مرکزی به دست آورند.ازنماهنگامی استفاده می کنندکه مقیاس اندازه گیری اسمی باشد،برآوردسریعی ازارزش مرکزی نیازباشد،یک برآوردتقریبی ازارزش های مرکزی کفایت کند،وقصدتعیین متداول ترین نمره راداشته باشیم.وخلاصه اینکه کاربردنماعبارت استاز:

 

1.       وقتی که مقیاس اندازه گیری اسمی باشد.

 

2.       وقتی که پژوهشگرعلاقمندباشدعددی که بیشترتکرارشده است پیداکند.

 

3.       وقتی که پژوهشگرعلاقمنداست اطلاعات کلی وسریع درباره ی گرایش های مرکزی به دست آورد.

 

 

 

میانه Median

 

میانه نقطه ی وسط یک توزیع فراوانی است.هنگامی که نمرات توزیع فراوانیبه ترتیب ازبالاترین به پایین ترین نمره مرتب شود،نصف نمرات بالای میانه ونصف نمرات پایین میانه قرارمی گیرد.بنابراین،میانه نقطه 50درصداست.یعنی عددی است که توزیع نمره هارابه دوقسمت مساوی تقسیم می کند. هنگامی که نمرات توزیع فراوانی به ترتیب از بالاترین به پایین ترین نمره مرتب شود، نصف نمرات بالای میانه و نصف نمرات پایین میانه قرار می‏گیرد، بنابراین میانه نقطه 50درصدی است. اندازه یا حجم واحدهای اندازه‏گیری در میانه تاثیر ندارد. ثبات آن از میانگین کمتر ولی از نما بیشتراست. میانه با مقیاس های ترتیبی، فاصله ای و نسبی به کاربرده می شود.ویژگی اصلی میانه این است نسبت به اعداد کوچک و بزرگ حساس نیست. درمحاسبه ی میانه،مقداربزرگترین عددتوزیع که دربالاترین وضعیت قراردارد،درمقدارمیانه تأثیری ندارد.این ویژگی یکی ازمزایای میانه است.ازدیگرویژگی های میانه می توان به مواردذیل اشاره نمود:

 

1.       یک شاخص ترتیبی است.

 

2.       مقدارآن بوسیله ی عددی که دروسط توزیع قرارداردتعیین می شود.

 

3.       تحت تأثیرارزش عددی کلیه ی نمره هاقارندارد.

 

4.       به قالب نمره های توزیع نزدیک است.

 

5.       درمحاسبه سی آن ازعملیات ریاضی کمتری استفاده می شود.

 

6.       ثبات آن ازمیانگین کمترولی ازنمابیشتراست.

 

7.       بامقیاس های ترتیبی،فاصله ای ونسبی به کاربرده می شود.

 

کاربرد:

 

ازمیانه هنگامی استفاده می کنندکه وقت کافی برای محاسبه ی میانگین وجودندارد،توزیع نمره دارای کجی باشد،فاصله ی نمره ها ازمرکزتوزیع اهمیت نداشته باشدوتوزیع موردمطالعه کامل نباشد.همچنین چون میانه براساس نمره های رتبه بندی شده به دست می آید،بنابراین مورداستفاده آن زمانی است که مقیاس اندازه گیری رتبه ای باشد.میانه را می توان بامقیاس های فاصله ای ونسبی نیزبه کاربردامامقیاس های مذکور درمحاسبه ی میانه به کاربرده نمی شوند.درمجموع می توان گفت موارداستفاده آن عبارتنداز:

 

1.       وقتی که پژوهشگرعلاقمندباشدیافته هارابصورت ترتیبی تفسیرکند.

 

2.       وقتی که به عددی که دروسط توزیع قرارداردنیازباشد.

 

3.       وقتی که محقق به تعیین تأثیرهمه ی نمره هایااعداددراندازه گیری علاقمندباشد.

 

4.       هنگامی که درتوزیع نمره ها،اعدادخیلی بزرگ یاخیلی کوچک وجودداشته باشد.

 

هدف:

 

هدف ازمیانه عدم تأثیر نمره های فوق العاده بزرگ یاکوچک درمحاسبه ی شاخص مرکزی است.

 

میانه یک جمعیت آماری متناهی را می‌توان با مرتب کردن آن و انتخاب عددی که در وسط قرار می‌گیرد تعیین کرد. در صورتی که جمعیت برابر با عددی زوج باشد آنگاه میانه برابر است با میانگین دو عددی که در وسط قرار می‌گیرند.

 

مثال: مجموعه اعداد ‘۸، ۶، ۲، ۱، ۱۱’ را در نظر بگیرید. هنگامی که این اعداد را به صورت صعودی مرتب نمایید، دنباله اعداد به صورت ‘۱، ۲، ۶، ۸، ۱۱’ می شود. همان طور که می بینید، در این مجموعه عدد ۶ دقیقاً در مرکز قرار دارد و از این رو، این عدد مقدار میانه است. اگر تعداد جمعیت آماری زوج باشد، میانه با میانگین دو عضو جمعیت که در وسط جمعیت آماری قرار دارند، محاسبه می‌شود.

 

برای محاسبه میانه از روی جدول توزیع فراوانی ابتدا با ید مشخص کنیم میانه در کدام طبقه قرار گرفته است سپس مقدار تقریبی میانه را داخل آن طبقه به دست آوریم. با توجه به تعریف میانه می دانیم که میانه عددی است که نیمی ( 50 درصد) از مشاهدات از آن کوچکتر و نیمی از مشاهدات از آن بزرگتر است. بنابراین طبقه ای که میانه در آن قرار گرفته است اولین طبقه ای است که فراوانی تجمعی آن برابر یا بزرگتر از n/2 است. (n مجموع کل فراوانی هاست). آنرا طبقه میانه می‌گوییم و سپس با استفاده از فرمول زیر مقدار تقریبی میانه را به دست می آوریم.

 

 

 

Md=L+ ( )

 


که در آن؛

 

= L  حد پایین طبقه میانه

 


cfi-1= فراوانی تجمعی طبقه قبل از طبقه میانه

 


fi= فراوانی طبقه میانه

 


c = طول یا فاصله طبقه میانه

 


نکته: اگر به جای تعدادمطلق از درصد هم استفاده می‌کردیم در نتیجه تفاوتی ایجاد نمی‌شد. همچنین، محاسبه میانه مستلزم بسته بودن جدول فراوانی نیست. میانه در داده‌های گسسته نیز قابل محاسبه است که در این حالت، همانند داده‌های پیوسته عمل می‌کنیم. مثلا، برای محاسبه میانه تعداد فرزندان، ممکن است میانه در بین طبقات 2 و 3 وفرزندی قرار بگیرد که مثلا بشود 2.6. میانه دستکم از یک جهت معرف‌ترین متوسط‌هاست. کل فاصله میانه از تمام مقادیر کمتر از هر نقطه دیگری است. از این جهت، میانه از هر متوسط دیگری به مقادیر همراه نزدیک‌تر است.

 

 

 

چندک‌ها (چارک، پنجک، دهک و صدک)

 

چندک‌ها مقادیری با فاصله‌های مساوی هستند که از تابع توزیع تجمعی یک متغیر تصادفی انتخاب می‌شوند به شکلی که مجموعه داده‌ها را به p قسمت مساوی تقسیم می‌کنند. ساده‌ترین چندک، میانه است که داده‌ها را به ۲ قسمت مساوی تقسیم می‌کند. سایر چندک‌های معروف و پرکاربرد عبارتند از:

 

  • چارک‌ها: سه مقدار که داده‌ها را به چهار قسمت مساوی تقسیم می‌کنند.
  • پنجک‌ها: چهار مقدار که داده‌ها را به پنج قسمت مساوی تقسیم می‌کنند.
  • دهک‌ها‌: نه مقدار که داده‌ها را به ده قسمت مساوی تقسیم می‌کنند.
  • صدک‌ها: نود و نه مقدار که داده‌ها را به صد قسمت مساوی تقسیم می‌کنند.

 

چندک ها مقادیری از متغیر هستند که دامنه تغیرات را به فاصله های چندکی مورد نیاز تقسیم می کنند به طوری که فراوانی ها در هریک از این فواصل درصد معینی از فراوانی کل را دارا باشد. بنابراین اگر دامنه را به 4 قسمت تقسیم کنیم به طوری که هر یک از قسمت ها 25 درصد از فراوانی کل را در بر داشته باشد، آنها را چهارک می‌گوییم.اگر دامنه را به 10 قسمت تقسیم کنیم به طوری که هر یک از قسمت ها 10 درصد از فراوانی کل را در بر داشته باشد، آنها را دهک می گوییم. اگر دامنه را به 100 قسمت تقسیم کنیم به طوری که هر یک از قسمت ها یک درصد از فراوانی کل را در بر داشته باشد، آنها را صدک می گوییم.

 

چندک‌ها همانند میانه می‌باشند با این تفاوت که دقت بیشتری داشته و جایگاه را در فاصله‌های کوچکتری نشان می‌دهند. در نمرات گروه‌بندی شده، محاسبه آنها نیز همانند میانه صورت می‌گیرد با این تفاوت که فراوانی یا درصد مقتضی اقلام زیر نقطه مورد نظر جایگزین n/2 می‌گردد. باید چندک‌ها را اندازه های استاندارد جایگاه و مستقل از نظام اندازه گیری آنها یا مستقل از هر نوع داده دیگری به حساب آورد. این اندازه‌ها حتی از الگوی توزیع هم  مستقل هستند. چندک‌ها و به ویژه صدک‌ها برای تبدیل نمرات خام بی‌معنی به نمرات نسبی بامعنا بسیار سودمندند.

 

در نمرات گروه‌بندی نشده: برای یافتن صدک یک نمره X می‌توان تعداد نمرات کمتر از نمره مد نظر یعنی X را به تعداد کل نمرات تقسیم کرده و حاصل را در 100 ضرب نماییم. مثلا، اگر 150 نمره داشته و یکی از نمرات عدد 547 باشد و این عدد از 30 عدد دیگر در این مجموعه بیشتر باشد صدک وی برابر است با: 150/30 و حاصل ضرب در 100 که برابر است با، 21. بنابراین صدک این عدد 21 می‌باشد. البته روش‌های متفاوتی برای محاسبه صدک ها وجود دارد.

 

همچنین می‌توان نمره مربوط به هر صدک را نیز در مجموعه داده‌ها به دست آورد. در این مورد، نقطه درصدی خواسته شده را در تعداد داده‌ها یا همان n ضرب کرده و عدد به دست آمده جایگاه صدک مد نظر می‌باشد که باید در داده های مرتب شده به صورت صعودی مشخص گردد. مثلا، اگر به دنبال صدک 35 هستیم و تعداد داده‌ها 150 می‌باشد پس؛ 100/35 شده و جواب در 150 ضرب می‌کنیم که می شود 52.5 و آن را گرد می‌کنیم که می‌شود 53. رتبه 53 اعداد مرتب شده بیانگر صدک 35 می‌باشد.

 

 

 

میانگین Mean

 

در دانش آمار میانگین حسابی یا متوسط حسابی (به انگلیسیArithmetic mean) نوعی سنجش گرایش به مرکز است و عبارت است از مجموع مقادیر موجود در یک مجموعه داده‌ها تقسیم بر تعداد آن‌ها. مشهورترین و معتبرترین شاخص گرایش مرکزی ، میانگین است . میانگین پایاترین و دقیق ترین شاخص مرکزی محسوب می شود .

 

ویژگی ها :

 

از ویژگی های عمده میاگین این است که این شاخص نسبت به تک تک اعداد توزیع  فراوانی حساس است . اما این صفت در برخی از شرایط یکی از نقاط ضعف میانگین محسوب می شود . چنانچه پژوهشگری علاقمند باشد تا نمرات خیلی بزرگ یا کوچک برشاخص مرکزی تاثیر داشته باشد ، میانگین شاخص مناسبی است در غیر این صورت میانه یا نما شاخص مناسبی خواهد بود .

 

یکی دیگر از ویژگی های میانگین این است که میانگین ، نقطه ای از توزیع نمرات است که همیشه مجموع مجذور در انحراف نمرات از میانگین کوچکتر یا مساوی بامجموع مجذور در انحراف نمرات از هر عددی دیگر است و خلاصه اینکه:

 

1.       یک شاخص فاصله ای است.

 

2.       در محاسبه ی آن از عملیات ریاضی استفاده می شود.

 

3.       نمرات خیلی بزرگ وکوچک در آن تاثیر دارد.

 

4.       مجموع انحراف از میانگین همیشه صفر است.

 

5.       با ثبات ترین شاخص فزونی است.

 

6.       بهترین برآورد از میانگین جامعه است.

 

7.       با مقیاس های فاصله ای و نسبی به کار برده می شود .

 

کاربرد

 

چون میانگین به استفاده کننده های خود اجازه انجام عملیات ریاضی را می دهد ، به همین دلیل مورد استفاده زیادی در آمار استنباطی دارد . در غالب روشهای آماراستنباطی از میانگین بیشتر از شاخص های دیگر استفاده می شود.

 

میانگین حسابی تسهیل‌کننده رسای اندازه‌های سازگار گروه‌های اجتماعی با اندازه‌های بسیار متفاوت است. میانگین، مجموع را با تبدیل به مقدار سرانه نرم می‌کند و مقادیر توزیع را همچون انحراف از نرم مرکزی می‌بیند که مقدار حقیقی به شمار می‌آید. این انحرافات در دو سوی مقدار مرکزی، دوری یا خطا از نرم است. از این دیدگاه، غالبا انحرافات به منزله مقادیر تصادفی، گذرا، استثنایی یا کم‌اعتبار از مقدار مرکزی نادیده گرفته می‌شود. به زبان آماری، مقدار حقیقی زمانی به دست می‌اید که انحرافات یکدیگر را خنثی کنند یعنی مقدار خالص آنها، صفر شود. چنانچه خطایی نباشد تمام مقادیر مساوی خواهند بود. پس، میانگین، مقداری است که در صورت مساوی بودن همه مقادیر در مجموعه‌ای معین پدید می‌آید.‌

 

میانگین موزون یا وزنی:

 

در آمار، وزن هر مقدار برابر با فراوانی آن مقدار است. میانگین ساده یا حسابی زمانی به کار می رود که مشاهدات ( داده های آماری) دارای اهمیت مساوی باشند حال اگر این داده ها دارای اهمیت یکسان نباشند لازم است برای مشاهدات درجه اعتبار یا وزن خاصی قائل شویم. در دانش آمار میانگین وزنی یا میانگین حسابی وزنی یا میانگین موزون (به انگلیسیWeighted mean) نوعی سنجش گرایش به مرکز است، و عبارت است از میانگین حسابی یک مجموعه داده‌های نابرابر و ناموزون. در محاسبه میانگین وزنی یک مجموعه عامل‌های نابرابر، برای هر یک از عامل‌ها، وزن یا ارزش معینی در نظر گرفته می‌شود و سپس آن عامل در وزن معین ضرب می‌گردد. آن‌گاه جمع این ارقام به دست آمده بر مجموع وزنها تقسیم می‌شود.

 

به عنوان مثال هنگامی که قصد داریم معدل یک ترم را به دست آوریم با توجه به اینکه نمرات دروس مختلف دارای ارزش یکسانی نیستند ( مقدار واحد) مثلا درس آمار 4 واحد، زبان انگلیسی 2 واحد و ... اگر فقط نمرات را با هم جمع و بر مقدار ان ها یا تعداد واحد های ترم تقسیم کنیم میانگینی که به دست می آید، صحیح نیست. در این مواقع لازم است ابتدا هر مشاهده را در وزن یا میزان اهمیت آن ضرب و سپس نتایج را جمع و بر مجموع وزن ها تقسیم کنیم.

 

میانگین همساز یا هارمونیک

 

در دانش آمار میانگین همساز یا میانگین هارمونیک (به انگلیسیHarmonic mean) یا میانگین توافقی نوعی سنجش گرایش به مرکز است و معمولاً هنگامی کاربرد دارد که محاسبه میانگین نرخ‌ها اهمیت داشته باشد. میانگین همساز  برای محاسبه میانگین داده‌هایی است از ترکیب دو مقیاس به دست می‌آید. پس، در موارد خاص، بخصوص مواردی که شامل نرخ‌ها و نسبت‌ها است، میانگین هارمونیک صحیح‌ترین مقدار میانگین را به ما می‌دهد. برای مثال، اگر یک وسیله فاصله مشخصی را با سرعت x (مثلا ۶۰ کیلومتر بر ساعت) طی کند و سپس همان فاصله را دوباره با سرعت y (مثلا ۴۰ کیلومتر بر ساعت) طی کند، مقدار سرعت متوسط، میانگین هارمونیک x , y است (یعنی ۴۸ کیلومتر بر ساعت). همانطور که می دانید سرعت عبارت است از مسافت طی شده در واحد زمان. بنابرین واحد اندازه گیری آن ترکیبی است و بنابه توصیه باید از میانگین توافقی استفاده کرد.

 

نحوه محاسبه آن عبارت است از تعداد مقادیر بر مجموع معکوس مقادیر موجود در یک مجموعه داده‌ها.

 

نکته: در محاسبه این میانگین، صفر نمی‌تواند جزو اعداد باشد.

 

میانگین هندسی

 

میانگین هندسی در ریاضیات، برابر است با ریشه nاُم از حاصلضرب n متغیر. بطور مثال میانگین هندسی دو عدد ۲ و ۸ برابر است با 4: 

 

اساساً کاربرد میانگین هندسی برای داده‌هایی است که حالت نسبی و درصدی دارند. برای نمونه در مقایسات زوجی چون حالت معکوسی وجود دارد و برخی اعداد به صورت نسبی و معکوس هستند میانگین حسابی ساده پاسخگو نیست و باید از میانگین هندسی استفاده کرد. برای محاسبه میانگین هندسی n عدد باید اعداد را در هم ضرب کنید و سپس ریشه nام عدد حاصل را محاسبه کنید. با توجه به فرمول میانگین هندسی که آن را با π نشان می‌دهند نمی‌توانید با دست محاسبه کنید.

 

خواص میانگین هندسی

 

  1. اگر داده‌های آماری درعددی ضرب شود میانگین هندسی هم در آن عدد ضرب می‌شود.
  2. میانگین هندسی داده‌های برابر خود مقدار صفت است.

 

از میانگین هندسی زمانی استفاده می‌شود که صحبت از نرخ رشد به میان آمده باشد. مثل: نرخ رشد تولید، نرخ رشد جمعیت و یا نرخ رشد سود. میانگین هندسی اغلب در اقتصاد بازرگانی برای تعیین متوسط نرخ تغییر، متوسط نرخ رشد یا متوسط نسبت‌ها به کار می‌رود. چنین بنظر می رسد که هر گاه  ماهیت کمیت مورد نظر طوری باشد که از جمع چندین عدد حاصل شود  باید از میانگین حسابی و هر گاه ماهیت ضربی داشته باشند از میانگین هندسی استفاده کرد.

 

مثال) از نظر میزان تولید سیب قرمز در استانهای کشور به ترتیب ۲٪ و ۲۸٪ و ۴۸٪ می‌باشد. مطلوب است برآورد میانگین هندسی آنها؟ جواب ۱۳٫۳ درصد.

 

نکته: میانگین هندسی فقط برای اعداد مثبت قابل محاسبه است.

 

رابطه این 3 میانگین با یکدیگر: برای تمام مجموعه‌هایی که شامل حداقل یک جفت مقدار نامساوی هستند، میانگین هارمونیک همیشه حداقل آن سه میانگین است، در حالی که میانگین حسابی همیشه بیشترین آن سه و میانگین هندسی همیشه بین آن سه‌است.

 

میانگین مربعات

 

برای محاسبه این میانگین، ابتدا باید اعداد را مجذور نماییم و سپس با هم جمع کرده و آن را بر تعداد نمرات تقسیم کنیم.  اگر از این حاصل به دست آمده جذر بگیریم، جذر میانگین مربعات به دست می‌آید. معمولا این میانگین در فیزیک کاربرد دارد. مثلا در سیستم‌های توزیع قدرت، ولتاژها و جریان‌ها بر حسب این مقادیر بیان می‌شوند.

 

معیارهای انتخاب متوسط‌ها

 

هر متوسطی مقدار معرف واحدی است که از مزیت تراکم برخوردار است اما از عیب اختصار مبرا نیست. هر متوسطی بخشی از اطلاعات موجود را حذف می‌کنند بنابراین، هرگز نباید از به کار بردن هر سه مورد این متوسط‌ها غافل شد.

 

برای انتخاب هر کدام حداقل سه ملاک را باید مد نظر قرار دهیم:

 

  1. هدف یا مساله ای که متوسط برای آن در نظر گرفته می‌شود.
  2. الگوی توزیع داده‌ها
  3. ملاحظات فنی مختلف.

 

در مورد معیار اول، قاعده ثابتی وجود ندارد و محقق باید خود تصمیم بگیرد که کدام متوسط بهترین مورد برای برآوردن و رسیدن به هدف می‌باشد.

 

در مورد دوم، شکل توزیع داده ها متنوع است. در داده‌های چوله یا دارای کجی، نمایندگی و معرف بودن مقادیر متوسط قابل بحث است و باید در این مورد استدلال منطقی به کار برده شود. هر چه توزیعی چوله‌تر باشد تمایز مقادیر متوسط بیشتر می‌شود و مساله انتخاب متوسط حادتر.

 

در مورد ملاحظات تکنیکی هم باید گفت که ممکن است ویژگی‌های صرفا تکنیکی جدول‌بندی داده‌ها، کاربرد این یا آن متوسط را ایجاب نماید. مثلا اگر جدول دارای طبقات باز باشد و نتوان کاری برای بستن این فاصله‌های باز انجام داد ناچار باید از میانگین استفاده کرد که تحت تاثیر آن قرار نمی‌گیرد و میانگین کاربرد محدودی دارد. باید در نظر داشت که هیچ روشی برای ترکیب یا وزن دهی به میانه و نما وجود ندارد و به همین علت آنها را نمی‌توان استاندارد کرد.

 

مقایسه‌پذیری متوسط‌ها

 

متوسط‌ها برای مقایسه جایگاه گروه‌های متمایز یا توزیع هایی که روی مقیاس یکسانی قرار دارند به کار می‌رود. اما انواع مختلف متوسط، مقایسه‌پذیر نیستند. یعنی مثلا نمی‌توان میانگین را با نمای توزیع دیگری مقایسه کرد تا جایگاه نسبی آنها را در پیوستاری معین به دست آورد. تمایز ویژگی‌ متوسط ها به ویژه هنگامی که اثر چولگی بر آنها به حساب آید بیشتر می‌شود.

 

بنابراین، هرگز نباید دو یا چند متوسط را با هم مقایسه کرد مگر در شرایط یکسان یا نسبتا مشابه. متوسط‌ها مانند هر آماره دیگری توصیف ناکاملی از مجموعه‌ای از داده‌ها هستند. آنها را نباید چیز مستقلی تصور کرد بلکه محدود به داده‌هایی‌اند که از آنها حاصل شده‌‌اند.