اندازه های گرایش به مرکز و اندازه های موقعیت
نوشته و تهیه شده توسط: حسین ضرغامی
منبع: سایت های مختلف
کارکرد کلی آمار در ساده کردن انبوه بزرگی از داده ها می باشد. ما نیازمند گزارههایی هستیم که 1- اطلاعاتی درباره مقدار جایگاه مورد نظر ارائه دهد 2- مقادیری را که فعلاً نامربوطند، حذف کنند و 3- با کارایی معقولی معرف دقیق کلیت داده ها باشد. اما پیداست که هیچ مقدار واحدی به حد کافی از انعکاس تمام خصوصیات جایگاه توزیع بر نمی آید بلکه فقط می تواند یکی از خصوصیات آن را منعکس کند. هر مقداری از توزیع را می توان به مثابه معرفی کل به کار برد به شرطی که جایگاه آن، در آرایش کامل داده ها مشخص باشد اما عملاً همه مقادیر و لو با معین بودن معرفبودنشان، کارایی یکسانی ندارند. تقریباً مناسب ترین و سودمندترین مقادیری که می توان از جدول داده ها استخراج کرد بر دو نوع هستند: 1. مقادیر انتهایی یا حداقل و حداکثر و 2. مقادیر مرکزی یا نماینده که به متوسط ها معروفند.
حداقل و حداکثر به منزله اندازه جایگاه:
در برخی موارد، تصمیمگیری بهتر است برمبنای مقادیر انتهایی صورت گیرد. برای مثال، در مورد عمق یک استخر شنا، دانستن متوسط عمق ارزش و کاربردی ندارد بلکه حداکثر عمق برای تصمیمگیری شنا لازم است. یا مثلا برای استفاده از معلم خصوصی، دانستن معدل کاربردی ندارد بلکه مشخص ساختن درس یا دروسی که پایینترین نمره را دارد در این تصمیم تاثیر اساسی دارد. در واقع، مقادیر حداقل و حداکثر برای بسیاری از تصمیمات و انتخابها، اطلاعات مفیدتری ارایه میکنند تا متوسطها یا شاخصهای گرایش به مرکز.
نکته: محقق باید در مورد این گرایش که متوسطها بهترین و مناسبترین اندازه جایگاه هستند محتاط باشد. کلید انتخاب یک اندازه، هدفی است که از کاربرد اندازه جایگاه داریم.
مفهوم متوسط
هر اندازه و مقداری را میتوان به منزله جایگاه و اندازه مربوط به آن انتخاب کرد. بسته به اطلاعاتی که داریم این انتخاب میتواند اندازه هریک از داده ها و اطلاعات باشد (مثل، اندازه سر جمجمه یک کشف باستانی که هر مورد مهم است) یا میتواند تمام اطلاعات در یک عدد خلاصه شود که این امر در اهداف آماری بیشتر مد نظر و مطلوب است. در جایی که اطلاعات درباره موردهای زیادی داریم با توصیف نقطهای که دادهها گرد آن جمع شدهاند، در پی اندازه تلخیص برمیآییم که بیانگر توزیع کل دادههاست. این نقطه که توزیع آماری گرد آن جمع یا متراکم شده، گرایش مرکزی توزیع یا مقدار متوسط توزیع خوانده میشود. متوسط مفهومی است که کاربرد عامیانه دارد ولی هیچ کس از هر لحاظ متوسط نیست. فرد متوسط وجود خارجی ندارد. این مفاهیم با دیدگاه آماری دقیقتر که فقط برای رشتهای از اندازههای یک متغیر به کار میرود مطابق نیست.
متوسط یک مقدار نرم یا هنجار است که مقادیر حول آن متغیرند. در برخی مواقع و برخی توزیعهای خاص، نقطه مرکز انباشت و تراکم دادهها، مقادیر مشخص و نسبتا بدون ابهام قرار میگیرند. مثلا، در توزیع نرمال یا زنگولهای شکل اینگونه است. در منحنی دونمایی این وضعیت صدق نمیکند. یا در توزیع چوله، نقطهای که به عنوان متوسط یا مرکز انتخاب میشود (به دست میآید) معرف کامل مقادیر حد متقابل نیست. در این وضعیتها، کار معرفی مناسب توزیع کل با متوسط واحد یا اندازه واحد دشوار است. در اینجا، این اندازهها نمیتوانند همه وجود توزیع را خلاصه کنند و سوال پیش میآید که کدام اندازه بهترین تلخیص را برای جایگاه توزیع ارایه میکند.
در آمار اجتماعی، عموما از متوسطها برای مقایسه جایگاه دو یا چند توزیع استفاده میشود. بسیاری از متوسطها معنای خاصی ندارند مگر در مقایسه با متوسطهای دیگر در همان جمعیت یا در زمانی دیگر یا جمعیتی دیگر. مثلا نمره متوسط درس آمار دانشجویان یک کلاس به خودی خود بیانگر تبحر و مهارت آماری آنان نیست. این مقدار به وزن سوالات و سطح دشواری امتحان بستگی دارد. ولی وقتی که تفاوت بین دو کلاس وجود دارد دلیل این اختلاف باید بررسی گردد. در واقع، تقابل شدید متوسطها در علوم اجتماعی نیازمند بررسی و تحقیق جامعهشناختی است. اینکه متوسط دستمزد زنان و مردان در مشاغل مشابه، یکسان نباشد نمونه ای از موارد متعدد است.
شاخص های مرکزی به مقدار یا عددی که به بهترین شکل ویژگی گروه را به عنوان یک کل نشان می دهد اشاره می کنند . مترادف شاخص مرکزی نمره ی متوسط یا معدل (average)است.بنابراین شاخص های مرکزی یا گرایش به مرکز شاخص هایی هستندکه با استفاده ازآنها مجموعه ای ازداده ها در یک مقدار یا عدد که نماینده ی آن مجموعه است خلاصه می شود . شاخص های مرکزی یا گرایش به مرکز شاخص هایی هستندکه با استفاده ازآنها مجموعه ای ازداده ها در یک مقدار یا عدد که نماینده ی آن مجموعه است خلاصه می شود .به دیگر سخن،این شاخص حد متوسط رانشان می دهد و نماینده مجموعه ی از اعداد هستند. یک متوسط عبارت است از مقدار مرکزی یا نماینده مجموعه دادهها. عموما احتیاج به اطلاعات بیشتری داریم تا بتوانیم متوسطها یا اندازههای گرایش به مرکز را تعیین نماییم. نکته مهم این که راههای زیادی برای محاسبه یک اندازه گرایش به مرکز وجود دارد. انواع اندازههای گرایش به مرکز وجود دارد که 3 مورد مهم آن نما، میانه و میانگین میباشد.
نما Mode
نما فراوانترین مقدار توزیع است. ساده ترین شاخص گرایش مرکزی است، نما عددی است که دارای بیشترین فراوانی است،یا عددی که بیشتر از اعداد دیگر تکرار شده است.نما ازطریق مشاهده ی توزیع فراوانی وتعیین عددی که دارای بیشترین فراوانی است تعیین می گردد.عددی که دارای بیشترین فراوانی است،غالباًنزدیک به مرکزتوزیع فراوانی قراردارد.درچنین شرایطی نما یک شاخص مرکزی است.اما نماهمیشه درمرکزتوزیع فراوانی قرارندارد به همین دلیل نمی توان به عنوان یک شاخص مرکزی به آن اطمینان داشت، در واقع نما در میان شاخص های گرایش به مرکز، شاخصی بی ثبات است. به توزیع فراوانی که فقط یک نمادارد،یک نمایی و به توزیعی که دونمادارد، توزیع دونمایی می گویند وبه توزیع بیش ازدونما، توزیع چند نمایی گفته می شود. از نما هنگامی استفاده می کنیم که مقیاس اندازه گیری اسمی باشد و یک برآورد تقریبی از ارزش های مرکزی کفایت کند. به عبارتی دیگر،نما به عنوان یک شاخص مرکزی مورد استفاده محدودی دارد. نما مخصوصا در گروه های کوچک دارای اعتبار نیست زیرا میزان آن فقط تابع چند عدد است. پژوهشگران معمولا هنگامی از نما استفاده می کنند که مایل باشند بینش کلی درباره شاخص مرکزی به دست آورند.این شاخص درباره گرایش مرکزی توزیع نمره ها اطلاعی به ما نمی دهد زیرا شاخص مرکزی یک توزیع الزاما عدد با ارزشی نیست که دارای بیشترین فراوانی باشد. نما از نظر لغوی به معنی شیوه متداول لباس پوشیدن یا آداب و رسوم است که اکثریت مردم از آن پیروی میکنند. از این رو نما را میتوان محتملترین مقدار هم دانست و آن را متوسط احتمالی خواند. با این همه، این بیان که اکثر مقادیر در فاصله یا طبقه نما قرار دارند خطاست مگر آن که دو طبقه در بین باشد. پرشمارترین و نه لزوما اکثریت در طبقه نما قرار میگیرند.
نمادربین شاخص های مرکزی دارای کمترین مفروضه است.نمادرمقایسه باسایرشاخص های مرکزی به سهولت محاسبه می شود،نمااطلاعاتی کلی درباره ی فراوان ترین ارزش یاعددبه پژوهشگرمی دهد.این شاخص درباره ی گرایش مرکزی توزیع نمره ها اطلاعی به مانمی دهد،به علت عدم ثبات واعتبارنما،به ندرت ازآن به عنوان یک شاخص گرایش مرکزی استفاده می شود. مثلا با جابجا کردن حدود طبقات، میتواند نما نیز تغییر یابد. ازآنجاکه نما را نمی توان بصورت ریاضی دستکاری کرد،به همین دلیل ازنظرمحاسبات آماری مورداستفاده محدودی دارد. معمولا نما ملاک سنجشهای رفتار عمومی است.
خلاصه ی ویژگی های نماعبارتنداز:
1. نما یک شاخص اسمی است.
2. عددی است که دارای بیشترین فراوانی است.
3. غالباًدروسط توزیع نمره هاقراردارد.
4. دربعضی ازتوزیع هابیش ازیکی وجوددارد.
5. اعمال ریاضی رانمی توان باآن انجام داد.
6. دارای پایداری یاثبات خیلی کمی است.
7. برآوردخیلی ضعیفی ازپارامترجامعه است.
8. به ندرت به کاربرده می شود.
کاربرد:
پژوهشگران معمولاًهنگامی ازنمااستفاده می کنندکه مایل باشندبینشی کلی درباره ی شاخص مرکزی به دست آورند.ازنماهنگامی استفاده می کنندکه مقیاس اندازه گیری اسمی باشد،برآوردسریعی ازارزش مرکزی نیازباشد،یک برآوردتقریبی ازارزش های مرکزی کفایت کند،وقصدتعیین متداول ترین نمره راداشته باشیم.وخلاصه اینکه کاربردنماعبارت استاز:
1. وقتی که مقیاس اندازه گیری اسمی باشد.
2. وقتی که پژوهشگرعلاقمندباشدعددی که بیشترتکرارشده است پیداکند.
3. وقتی که پژوهشگرعلاقمنداست اطلاعات کلی وسریع درباره ی گرایش های مرکزی به دست آورد.
میانه Median
میانه نقطه ی وسط یک توزیع فراوانی است.هنگامی که نمرات توزیع فراوانیبه ترتیب ازبالاترین به پایین ترین نمره مرتب شود،نصف نمرات بالای میانه ونصف نمرات پایین میانه قرارمی گیرد.بنابراین،میانه نقطه 50درصداست.یعنی عددی است که توزیع نمره هارابه دوقسمت مساوی تقسیم می کند. هنگامی که نمرات توزیع فراوانی به ترتیب از بالاترین به پایین ترین نمره مرتب شود، نصف نمرات بالای میانه و نصف نمرات پایین میانه قرار میگیرد، بنابراین میانه نقطه 50درصدی است. اندازه یا حجم واحدهای اندازهگیری در میانه تاثیر ندارد. ثبات آن از میانگین کمتر ولی از نما بیشتراست. میانه با مقیاس های ترتیبی، فاصله ای و نسبی به کاربرده می شود.ویژگی اصلی میانه این است نسبت به اعداد کوچک و بزرگ حساس نیست. درمحاسبه ی میانه،مقداربزرگترین عددتوزیع که دربالاترین وضعیت قراردارد،درمقدارمیانه تأثیری ندارد.این ویژگی یکی ازمزایای میانه است.ازدیگرویژگی های میانه می توان به مواردذیل اشاره نمود:
1. یک شاخص ترتیبی است.
2. مقدارآن بوسیله ی عددی که دروسط توزیع قرارداردتعیین می شود.
3. تحت تأثیرارزش عددی کلیه ی نمره هاقارندارد.
4. به قالب نمره های توزیع نزدیک است.
5. درمحاسبه سی آن ازعملیات ریاضی کمتری استفاده می شود.
6. ثبات آن ازمیانگین کمترولی ازنمابیشتراست.
7. بامقیاس های ترتیبی،فاصله ای ونسبی به کاربرده می شود.
کاربرد:
ازمیانه هنگامی استفاده می کنندکه وقت کافی برای محاسبه ی میانگین وجودندارد،توزیع نمره دارای کجی باشد،فاصله ی نمره ها ازمرکزتوزیع اهمیت نداشته باشدوتوزیع موردمطالعه کامل نباشد.همچنین چون میانه براساس نمره های رتبه بندی شده به دست می آید،بنابراین مورداستفاده آن زمانی است که مقیاس اندازه گیری رتبه ای باشد.میانه را می توان بامقیاس های فاصله ای ونسبی نیزبه کاربردامامقیاس های مذکور درمحاسبه ی میانه به کاربرده نمی شوند.درمجموع می توان گفت موارداستفاده آن عبارتنداز:
1. وقتی که پژوهشگرعلاقمندباشدیافته هارابصورت ترتیبی تفسیرکند.
2. وقتی که به عددی که دروسط توزیع قرارداردنیازباشد.
3. وقتی که محقق به تعیین تأثیرهمه ی نمره هایااعداددراندازه گیری علاقمندباشد.
4. هنگامی که درتوزیع نمره ها،اعدادخیلی بزرگ یاخیلی کوچک وجودداشته باشد.
هدف:
هدف ازمیانه عدم تأثیر نمره های فوق العاده بزرگ یاکوچک درمحاسبه ی شاخص مرکزی است.
میانه یک جمعیت آماری متناهی را میتوان با مرتب کردن آن و انتخاب عددی که در وسط قرار میگیرد تعیین کرد. در صورتی که جمعیت برابر با عددی زوج باشد آنگاه میانه برابر است با میانگین دو عددی که در وسط قرار میگیرند.
مثال: مجموعه اعداد ‘۸، ۶، ۲، ۱، ۱۱’ را در نظر بگیرید. هنگامی که این اعداد را به صورت صعودی مرتب نمایید، دنباله اعداد به صورت ‘۱، ۲، ۶، ۸، ۱۱’ می شود. همان طور که می بینید، در این مجموعه عدد ۶ دقیقاً در مرکز قرار دارد و از این رو، این عدد مقدار میانه است. اگر تعداد جمعیت آماری زوج باشد، میانه با میانگین دو عضو جمعیت که در وسط جمعیت آماری قرار دارند، محاسبه میشود.
برای محاسبه میانه از روی جدول توزیع فراوانی ابتدا با ید مشخص کنیم میانه در کدام طبقه قرار گرفته است سپس مقدار تقریبی میانه را داخل آن طبقه به دست آوریم. با توجه به تعریف میانه می دانیم که میانه عددی است که نیمی ( 50 درصد) از مشاهدات از آن کوچکتر و نیمی از مشاهدات از آن بزرگتر است. بنابراین طبقه ای که میانه در آن قرار گرفته است اولین طبقه ای است که فراوانی تجمعی آن برابر یا بزرگتر از n/2 است. (n مجموع کل فراوانی هاست). آنرا طبقه میانه میگوییم و سپس با استفاده از فرمول زیر مقدار تقریبی میانه را به دست می آوریم.
Md=L+ ( )
که در آن؛
= L حد پایین طبقه میانه
cfi-1= فراوانی تجمعی طبقه قبل از طبقه میانه
fi= فراوانی طبقه میانه
c = طول یا فاصله طبقه میانه
نکته: اگر به جای تعدادمطلق از درصد هم استفاده میکردیم در نتیجه تفاوتی ایجاد نمیشد. همچنین، محاسبه میانه مستلزم بسته بودن جدول فراوانی نیست. میانه در دادههای گسسته نیز قابل محاسبه است که در این حالت، همانند دادههای پیوسته عمل میکنیم. مثلا، برای محاسبه میانه تعداد فرزندان، ممکن است میانه در بین طبقات 2 و 3 وفرزندی قرار بگیرد که مثلا بشود 2.6. میانه دستکم از یک جهت معرفترین متوسطهاست. کل فاصله میانه از تمام مقادیر کمتر از هر نقطه دیگری است. از این جهت، میانه از هر متوسط دیگری به مقادیر همراه نزدیکتر است.
چندکها (چارک، پنجک، دهک و صدک)
چندکها مقادیری با فاصلههای مساوی هستند که از تابع توزیع تجمعی یک متغیر تصادفی انتخاب میشوند به شکلی که مجموعه دادهها را به p قسمت مساوی تقسیم میکنند. سادهترین چندک، میانه است که دادهها را به ۲ قسمت مساوی تقسیم میکند. سایر چندکهای معروف و پرکاربرد عبارتند از:
- چارکها: سه مقدار که دادهها را به چهار قسمت مساوی تقسیم میکنند.
- پنجکها: چهار مقدار که دادهها را به پنج قسمت مساوی تقسیم میکنند.
- دهکها: نه مقدار که دادهها را به ده قسمت مساوی تقسیم میکنند.
- صدکها: نود و نه مقدار که دادهها را به صد قسمت مساوی تقسیم میکنند.
چندک ها مقادیری از متغیر هستند که دامنه تغیرات را به فاصله های چندکی مورد نیاز تقسیم می کنند به طوری که فراوانی ها در هریک از این فواصل درصد معینی از فراوانی کل را دارا باشد. بنابراین اگر دامنه را به 4 قسمت تقسیم کنیم به طوری که هر یک از قسمت ها 25 درصد از فراوانی کل را در بر داشته باشد، آنها را چهارک میگوییم.اگر دامنه را به 10 قسمت تقسیم کنیم به طوری که هر یک از قسمت ها 10 درصد از فراوانی کل را در بر داشته باشد، آنها را دهک می گوییم. اگر دامنه را به 100 قسمت تقسیم کنیم به طوری که هر یک از قسمت ها یک درصد از فراوانی کل را در بر داشته باشد، آنها را صدک می گوییم.
چندکها همانند میانه میباشند با این تفاوت که دقت بیشتری داشته و جایگاه را در فاصلههای کوچکتری نشان میدهند. در نمرات گروهبندی شده، محاسبه آنها نیز همانند میانه صورت میگیرد با این تفاوت که فراوانی یا درصد مقتضی اقلام زیر نقطه مورد نظر جایگزین n/2 میگردد. باید چندکها را اندازه های استاندارد جایگاه و مستقل از نظام اندازه گیری آنها یا مستقل از هر نوع داده دیگری به حساب آورد. این اندازهها حتی از الگوی توزیع هم مستقل هستند. چندکها و به ویژه صدکها برای تبدیل نمرات خام بیمعنی به نمرات نسبی بامعنا بسیار سودمندند.
در نمرات گروهبندی نشده: برای یافتن صدک یک نمره X میتوان تعداد نمرات کمتر از نمره مد نظر یعنی X را به تعداد کل نمرات تقسیم کرده و حاصل را در 100 ضرب نماییم. مثلا، اگر 150 نمره داشته و یکی از نمرات عدد 547 باشد و این عدد از 30 عدد دیگر در این مجموعه بیشتر باشد صدک وی برابر است با: 150/30 و حاصل ضرب در 100 که برابر است با، 21. بنابراین صدک این عدد 21 میباشد. البته روشهای متفاوتی برای محاسبه صدک ها وجود دارد.
همچنین میتوان نمره مربوط به هر صدک را نیز در مجموعه دادهها به دست آورد. در این مورد، نقطه درصدی خواسته شده را در تعداد دادهها یا همان n ضرب کرده و عدد به دست آمده جایگاه صدک مد نظر میباشد که باید در داده های مرتب شده به صورت صعودی مشخص گردد. مثلا، اگر به دنبال صدک 35 هستیم و تعداد دادهها 150 میباشد پس؛ 100/35 شده و جواب در 150 ضرب میکنیم که می شود 52.5 و آن را گرد میکنیم که میشود 53. رتبه 53 اعداد مرتب شده بیانگر صدک 35 میباشد.
میانگین Mean
در دانش آمار میانگین حسابی یا متوسط حسابی (به انگلیسیArithmetic mean) نوعی سنجش گرایش به مرکز است و عبارت است از مجموع مقادیر موجود در یک مجموعه دادهها تقسیم بر تعداد آنها. مشهورترین و معتبرترین شاخص گرایش مرکزی ، میانگین است . میانگین پایاترین و دقیق ترین شاخص مرکزی محسوب می شود .
ویژگی ها :
از ویژگی های عمده میاگین این است که این شاخص نسبت به تک تک اعداد توزیع فراوانی حساس است . اما این صفت در برخی از شرایط یکی از نقاط ضعف میانگین محسوب می شود . چنانچه پژوهشگری علاقمند باشد تا نمرات خیلی بزرگ یا کوچک برشاخص مرکزی تاثیر داشته باشد ، میانگین شاخص مناسبی است در غیر این صورت میانه یا نما شاخص مناسبی خواهد بود .
یکی دیگر از ویژگی های میانگین این است که میانگین ، نقطه ای از توزیع نمرات است که همیشه مجموع مجذور در انحراف نمرات از میانگین کوچکتر یا مساوی بامجموع مجذور در انحراف نمرات از هر عددی دیگر است و خلاصه اینکه:
1. یک شاخص فاصله ای است.
2. در محاسبه ی آن از عملیات ریاضی استفاده می شود.
3. نمرات خیلی بزرگ وکوچک در آن تاثیر دارد.
4. مجموع انحراف از میانگین همیشه صفر است.
5. با ثبات ترین شاخص فزونی است.
6. بهترین برآورد از میانگین جامعه است.
7. با مقیاس های فاصله ای و نسبی به کار برده می شود .
کاربرد
چون میانگین به استفاده کننده های خود اجازه انجام عملیات ریاضی را می دهد ، به همین دلیل مورد استفاده زیادی در آمار استنباطی دارد . در غالب روشهای آماراستنباطی از میانگین بیشتر از شاخص های دیگر استفاده می شود.
میانگین حسابی تسهیلکننده رسای اندازههای سازگار گروههای اجتماعی با اندازههای بسیار متفاوت است. میانگین، مجموع را با تبدیل به مقدار سرانه نرم میکند و مقادیر توزیع را همچون انحراف از نرم مرکزی میبیند که مقدار حقیقی به شمار میآید. این انحرافات در دو سوی مقدار مرکزی، دوری یا خطا از نرم است. از این دیدگاه، غالبا انحرافات به منزله مقادیر تصادفی، گذرا، استثنایی یا کماعتبار از مقدار مرکزی نادیده گرفته میشود. به زبان آماری، مقدار حقیقی زمانی به دست میاید که انحرافات یکدیگر را خنثی کنند یعنی مقدار خالص آنها، صفر شود. چنانچه خطایی نباشد تمام مقادیر مساوی خواهند بود. پس، میانگین، مقداری است که در صورت مساوی بودن همه مقادیر در مجموعهای معین پدید میآید.
میانگین موزون یا وزنی:
در آمار، وزن هر مقدار برابر با فراوانی آن مقدار است. میانگین ساده یا حسابی زمانی به کار می رود که مشاهدات ( داده های آماری) دارای اهمیت مساوی باشند حال اگر این داده ها دارای اهمیت یکسان نباشند لازم است برای مشاهدات درجه اعتبار یا وزن خاصی قائل شویم. در دانش آمار میانگین وزنی یا میانگین حسابی وزنی یا میانگین موزون (به انگلیسیWeighted mean) نوعی سنجش گرایش به مرکز است، و عبارت است از میانگین حسابی یک مجموعه دادههای نابرابر و ناموزون. در محاسبه میانگین وزنی یک مجموعه عاملهای نابرابر، برای هر یک از عاملها، وزن یا ارزش معینی در نظر گرفته میشود و سپس آن عامل در وزن معین ضرب میگردد. آنگاه جمع این ارقام به دست آمده بر مجموع وزنها تقسیم میشود.
به عنوان مثال هنگامی که قصد داریم معدل یک ترم را به دست آوریم با توجه به اینکه نمرات دروس مختلف دارای ارزش یکسانی نیستند ( مقدار واحد) مثلا درس آمار 4 واحد، زبان انگلیسی 2 واحد و ... اگر فقط نمرات را با هم جمع و بر مقدار ان ها یا تعداد واحد های ترم تقسیم کنیم میانگینی که به دست می آید، صحیح نیست. در این مواقع لازم است ابتدا هر مشاهده را در وزن یا میزان اهمیت آن ضرب و سپس نتایج را جمع و بر مجموع وزن ها تقسیم کنیم.
میانگین همساز یا هارمونیک
در دانش آمار میانگین همساز یا میانگین هارمونیک (به انگلیسیHarmonic mean) یا میانگین توافقی نوعی سنجش گرایش به مرکز است و معمولاً هنگامی کاربرد دارد که محاسبه میانگین نرخها اهمیت داشته باشد. میانگین همساز برای محاسبه میانگین دادههایی است از ترکیب دو مقیاس به دست میآید. پس، در موارد خاص، بخصوص مواردی که شامل نرخها و نسبتها است، میانگین هارمونیک صحیحترین مقدار میانگین را به ما میدهد. برای مثال، اگر یک وسیله فاصله مشخصی را با سرعت x (مثلا ۶۰ کیلومتر بر ساعت) طی کند و سپس همان فاصله را دوباره با سرعت y (مثلا ۴۰ کیلومتر بر ساعت) طی کند، مقدار سرعت متوسط، میانگین هارمونیک x , y است (یعنی ۴۸ کیلومتر بر ساعت). همانطور که می دانید سرعت عبارت است از مسافت طی شده در واحد زمان. بنابرین واحد اندازه گیری آن ترکیبی است و بنابه توصیه باید از میانگین توافقی استفاده کرد.
نحوه محاسبه آن عبارت است از تعداد مقادیر بر مجموع معکوس مقادیر موجود در یک مجموعه دادهها.
نکته: در محاسبه این میانگین، صفر نمیتواند جزو اعداد باشد.
میانگین هندسی
میانگین هندسی در ریاضیات، برابر است با ریشه nاُم از حاصلضرب n متغیر. بطور مثال میانگین هندسی دو عدد ۲ و ۸ برابر است با 4:
اساساً کاربرد میانگین هندسی برای دادههایی است که حالت نسبی و درصدی دارند. برای نمونه در مقایسات زوجی چون حالت معکوسی وجود دارد و برخی اعداد به صورت نسبی و معکوس هستند میانگین حسابی ساده پاسخگو نیست و باید از میانگین هندسی استفاده کرد. برای محاسبه میانگین هندسی n عدد باید اعداد را در هم ضرب کنید و سپس ریشه nام عدد حاصل را محاسبه کنید. با توجه به فرمول میانگین هندسی که آن را با π نشان میدهند نمیتوانید با دست محاسبه کنید.
خواص میانگین هندسی
- اگر دادههای آماری درعددی ضرب شود میانگین هندسی هم در آن عدد ضرب میشود.
- میانگین هندسی دادههای برابر خود مقدار صفت است.
از میانگین هندسی زمانی استفاده میشود که صحبت از نرخ رشد به میان آمده باشد. مثل: نرخ رشد تولید، نرخ رشد جمعیت و یا نرخ رشد سود. میانگین هندسی اغلب در اقتصاد بازرگانی برای تعیین متوسط نرخ تغییر، متوسط نرخ رشد یا متوسط نسبتها به کار میرود. چنین بنظر می رسد که هر گاه ماهیت کمیت مورد نظر طوری باشد که از جمع چندین عدد حاصل شود باید از میانگین حسابی و هر گاه ماهیت ضربی داشته باشند از میانگین هندسی استفاده کرد.
مثال) از نظر میزان تولید سیب قرمز در استانهای کشور به ترتیب ۲٪ و ۲۸٪ و ۴۸٪ میباشد. مطلوب است برآورد میانگین هندسی آنها؟ جواب ۱۳٫۳ درصد.
نکته: میانگین هندسی فقط برای اعداد مثبت قابل محاسبه است.
رابطه این 3 میانگین با یکدیگر: برای تمام مجموعههایی که شامل حداقل یک جفت مقدار نامساوی هستند، میانگین هارمونیک همیشه حداقل آن سه میانگین است، در حالی که میانگین حسابی همیشه بیشترین آن سه و میانگین هندسی همیشه بین آن سهاست.
میانگین مربعات
برای محاسبه این میانگین، ابتدا باید اعداد را مجذور نماییم و سپس با هم جمع کرده و آن را بر تعداد نمرات تقسیم کنیم. اگر از این حاصل به دست آمده جذر بگیریم، جذر میانگین مربعات به دست میآید. معمولا این میانگین در فیزیک کاربرد دارد. مثلا در سیستمهای توزیع قدرت، ولتاژها و جریانها بر حسب این مقادیر بیان میشوند.
معیارهای انتخاب متوسطها
هر متوسطی مقدار معرف واحدی است که از مزیت تراکم برخوردار است اما از عیب اختصار مبرا نیست. هر متوسطی بخشی از اطلاعات موجود را حذف میکنند بنابراین، هرگز نباید از به کار بردن هر سه مورد این متوسطها غافل شد.
برای انتخاب هر کدام حداقل سه ملاک را باید مد نظر قرار دهیم:
- هدف یا مساله ای که متوسط برای آن در نظر گرفته میشود.
- الگوی توزیع دادهها
- ملاحظات فنی مختلف.
در مورد معیار اول، قاعده ثابتی وجود ندارد و محقق باید خود تصمیم بگیرد که کدام متوسط بهترین مورد برای برآوردن و رسیدن به هدف میباشد.
در مورد دوم، شکل توزیع داده ها متنوع است. در دادههای چوله یا دارای کجی، نمایندگی و معرف بودن مقادیر متوسط قابل بحث است و باید در این مورد استدلال منطقی به کار برده شود. هر چه توزیعی چولهتر باشد تمایز مقادیر متوسط بیشتر میشود و مساله انتخاب متوسط حادتر.
در مورد ملاحظات تکنیکی هم باید گفت که ممکن است ویژگیهای صرفا تکنیکی جدولبندی دادهها، کاربرد این یا آن متوسط را ایجاب نماید. مثلا اگر جدول دارای طبقات باز باشد و نتوان کاری برای بستن این فاصلههای باز انجام داد ناچار باید از میانگین استفاده کرد که تحت تاثیر آن قرار نمیگیرد و میانگین کاربرد محدودی دارد. باید در نظر داشت که هیچ روشی برای ترکیب یا وزن دهی به میانه و نما وجود ندارد و به همین علت آنها را نمیتوان استاندارد کرد.
مقایسهپذیری متوسطها
متوسطها برای مقایسه جایگاه گروههای متمایز یا توزیع هایی که روی مقیاس یکسانی قرار دارند به کار میرود. اما انواع مختلف متوسط، مقایسهپذیر نیستند. یعنی مثلا نمیتوان میانگین را با نمای توزیع دیگری مقایسه کرد تا جایگاه نسبی آنها را در پیوستاری معین به دست آورد. تمایز ویژگی متوسط ها به ویژه هنگامی که اثر چولگی بر آنها به حساب آید بیشتر میشود.
بنابراین، هرگز نباید دو یا چند متوسط را با هم مقایسه کرد مگر در شرایط یکسان یا نسبتا مشابه. متوسطها مانند هر آماره دیگری توصیف ناکاملی از مجموعهای از دادهها هستند. آنها را نباید چیز مستقلی تصور کرد بلکه محدود به دادههاییاند که از آنها حاصل شدهاند.
وبلاگ مطالعات جمعیتی با هدف شناساندن و گسترش بیشتر حوزه مطالعات جمعیتی و زمینه های وابسته به آن ایجاد شده است. در کنار آن مطالب دیگری که مورد علاقه نویسنده می باشد نیز مطرح می شود. این وبلاگ توسط حسین ضرغامی دکتری جمعیت شناسی از دانشگاه تهران (Hossein zarghami, Ph.D of Demography, From University of Tehran, Iran) اداره می شود. لطفا با ارایه نظرات صادقانه خود، ما را در بهبود وبلاگ یاری کنید.