آزمون خی دو یا مجذور خی


1402/10/18

دسترسی سریع


 آزمون خی دو (Chi-Square Test) یکی از ابزارهای مهم و پرکاربرد در تحلیل‌های آماری است که به‌خصوص برای داده‌های دسته‌ای یا کیفی به کار می‌رود. این آزمون به طور ویژه در حوزه‌های علوم اجتماعی، پزشکی، زیست‌شناسی و بازاریابی به کار گرفته می‌شود تا به بررسی فرضیه‌های مرتبط با توزیع و استقلال داده‌ها بپردازد.

هدف اصلی آزمون خی دو، بررسی وجود رابطه معنادار بین دو متغیر دسته‌ای (کیفی) است. برای مثال، این آزمون می‌تواند نشان دهد که آیا ارتباطی بین سطح تحصیلات و نوع شغل وجود دارد یا خیر. همچنین، این آزمون برای بررسی تطابق بین توزیع مشاهده شده و توزیع مورد انتظار در داده‌ها نیز مورد استفاده قرار می‌گیرد.

آمار و ماهیت آمار استنباطی:

آمار به عنوان یک موضوع علمی، امروزه شامل مجموعه ای از مفاهیم و روش هاست که در هر زمینه پژوهش، برای گرد آوری و تعبیر اطلاعات مربوط به آن و انجام نتیجه گیری ها در شرایطی که عدم حتمیت در آن وجود دارد، به کار می رود. نقش آمار توصیفی در واقع، جمع آوری خلاصه کردن و توصیف اطلاعات کمی به دست آمده از نمونه ها یا جامعه هاست اما محقق معمولاً کار خود را با توصیف اطلاعات پایان نمی دهد، بلکه سعی می کند آنچه را که از بررسی گروه نمونه به دست آورده است به گروه های مشابه بزرگتر تصمیم دهد. از این رو محقق به شیوه هایی احتیاج دارد که بتواند با استفاده از آنها نتایج بدست آمده از مطالعه گروه های کوچک را به گروه های بزرگ تر تعمیم دهد به شیوه هایی که از طریق آن ها، ویژگی های گروه های بزرگ بر اساس اندازه گیری همان ویژگی ها در گروه های کوچک استنباط می شود، آمار استنباطی گفته می شود.

رگرسیون نیز یک ابزار قدرتمند برای تحلیل و پیشبینی داده هاست که اگر در این زمینه علاقه ایی به یادگیری بیشتر دارید میتوانید با کلیک کردن روی <رگرسیون> همه چیز راجب این موضوع را پیداکنید.

آزمون های ناپارامتر یک آمار استنباطی:

آزمون های آماری مورد استفاده جهت تجزیه و تحلیل اطلاعات بدست آمده از یک گروه کوچک (نمونه) و تعمیم آن به جامعه مورد نظر با توجه به مقیاس اندازه گیری متغیرها، به دو گروه «پارامتریک» و «ناپارامتریک» تقسیم می شوند. آزمون های پارامتریک به تجزیه و تحلیل اطلاعات در سطح مقیاس فاصله ای و نسبی می پردازند که حداقل شاخص آماری آنها میانگین و واریانس است.

در حالی که آزمون های ناپارامتریک، به تجزیه و تحلیل اطلاعات در سطح مقیاس اسمی  و رتبه ای می پردازند که شاخص آماری آنها میانه و مد است.

لازم به ذکر است، زمانی که داده های تحقیق دارای مفروضه های مقیاس اندازه گیری باشند ولی مفروضه های توزیع طبیعی و یکسانی واریانس در مورد آنها رعایت نشده است، باز هم استفاده از آزمون های آماری پارامتریک معقولانه تر است.

اگر چه آزمون های آماری ناپارامتریک در مقایسه با آزمون های پارامتریک معمولاً دارای توان یا قدرت کمتری هستند، برای دستیابی به همان سطح معنا داری مستلزم نمونه های بزرگتری هستند. از مهمترین آزمون های ناپارامتریک می توان آزمون کای دو ]خی دو[، آزمون تغییر مک نماز و آزمون دقیق فیشر نام برد.

آزمون خی دو ] کای دو[ یک متغیری یا نیکویی برازش:

این آزمون یکی از رایج ترین آزمون های ناپارامتریک است و زمانی از آن استفاده می شود که داده ها بصورت فراوانی باشند و آنها را بتوان بصورت دو یا چند طبقه تقسیم بندی کرد. آزمون مجذور کای بیش از سایر آزمون های ناپارامتریک در پژوهش های علوم انسانی بکار می رود. این آزمون زمانی به کار برده می شود که داده ها بصورت فراوانی و طبقه ای باشند (مقیاس اسمی).

هنگامی که اندازه گیری سطح ترتیبی یا فاصله ای باشد، آزمون مورد بحث مناسب نخواهد بود و بهتر است از آزمون های ناپارامتریک دیگر استفاده شود. آزمون کای دو یا خی دو، بر مبنای فراوانی (تعداد) مشاهده شده و فراوانی مورد انتظار به بررسی یک متغیر در جامعه پرداخته می شود. و از آنجا که هدف بررسی یک متغیر است، از این آزمون برای بررسی فرضیه های توصیفی استفاده می شود.

برای نمونه، محققی در صدد است میزان رضایت مشتریان یک بانک را با استفاده از این آزمون بسنجد. وی که فراوانی مشتریان در سطوح مختلف رضایت یعنی، خیلی زیاد، زیاد، متوسط، کم و خیلی کم با هم مساوی اند. ] هر سطح 20 درصد مشتریان را به خود اختصاص داده اند [ سپس این توزیع را با فراوانی (تعداد) حقیقی و مشاهده شده مقایسه می کند و این فرضیه را در مورد آزمون قرار می دهد که آیا بین توزیع فراوانی مشاهده شده و فراوانی مورد انتظارش تفاوت معنی دار وجود دارد یا خیر. حال اگر وی تفاوت بین این فراوانی ها را در سطح های مختلف نتیجه بگیرد، با مقایسه این تفاوت بین سطوح می تواند قضاوت کند که رضایتمندی در کدام سطح ها بیشتر است.

پس در واقع هدف این آزمون پاسخگویی به این سوال است که آیا فراوانی یک صفت در جامعه طبق انتظار است یا خیر و به عبارتی دیگر. آیا بین فراوانی های مشاهده شده و فراوانی های مورد انتظار اختلاف معنی دار وجود دارد یا خیر.

فرض صفر بیان می کند که بین این فراوانی ها اختلاف معنی دار وجود ندارد. بنابراین:

بین فراوانی های مشاهده شده و فراوانی های فرضی یا مورد انتظار تفاوت معنی دار وجود ندارد:

بین فراوانی های مشاهده شده و فراوانی های فرضی یا مورد انتظار تفاوت معنی دار وجود دارد

آماره آزمون یا شاخص آماری برای این فرضیه دارای توزیع خی دو با درجه آزادی (K-1) است و به صورت زیر محاسبه می شود.

علامت اختصاری درجه آزادی هم DF است.

 

همچنین اگر خی دو یا کای دو از خی دوی جدول بزرگتر باشد فرض صفر رد می شود ولی اگر خی دوی مشاهده شده از خی دوی جذول یا به اصطلاح خی دوی بحرانی کوچکتر باشد بنابراین فرض صفر هم رد نمی شود.

ضریب تصحیح تیس:

در آزمون خی دو، وقتی درجه آزادی یک باشد  منحنی توزیع نمونه گیری خی دو دارای کجی است و قادر به برآورد احتمال واقعی نیست و به عبارتی خی دو در معرض خطا قرار می گیرد. برای جلوگیری از این خطا، تیس پیشنهاد می کند که با کم کردن 5/0 از قدر مطلق فراوانی ها، خی دو بصورت زیر تصحیح می شود:

 در واقع توزیع خی دو مانند توزیع نرمال یک منحنی هموار و پیوسته نظری است ولی تغییر در مقدار فراوانی های مورد انتظار به صورت گسسته انجام می پذیرد یعنی 1، 2، 3، ... است در نتیجه ممکن است بین مقادیر منحنی هموار توزیع خی دو و مقادیر منحنی غیر همواره توزیع مشاهده شده تفاوت به وجود آید. عدم یکنواختی بین توزیع نظری و توزیع مشاهده شده فقط وقتی درجه آزادی برابر یک است بر مقدار خی دو تاثیر می گذارد.

در این حالت، برای هموار کردن شکل توزیع، روش تصحیح روی فراوانی های مشاهده شده بکار گرفته می شود. به روش تصحیح عدم یکنواختی بین توزیع نمونه گیری نظری خی دو و توزیع نمونه گیری واقعی، همانطور که در ابتدای بحث گفته شد. تصحیح تیس گفته می شود. از این رو چنین مواقعی باید از فرمول نام برده استفاده کرد.

ازمون خی دو (مجذور کا) یک موضوع وابسته به این مقاله است که ما تمامی نکات و روشهای تحلیل و بررسی آن را برای شما بصورت رایگان درسایت قراردادیم.

آزمون خی دو دو متغیری (آزمون استقلال):

مواقعی به وجود می آید که اطلاعات جمع آوری شده به فراوانی مشاهده شده و طبقات دو متغیر تعلق دارد بدین معنی که یک گروه آزمودنی بر اساس دو متغیر در طبقات مختلف طبقه بندی می شوند و سوالی که در چنین مواردی مطرح است. وجود یا عدم وجود ارتباط بین متغیرهاست. به عبارت دیگر هدف این آزمون پاسخگویی به این سوال است که آیا رابطه معنی داری بین دو متغیر که غالباً اسمی یا رتبه ای هستند، وجود دارد یا خیر.

در چنین طرح های دو متغیری آزمون خی دو، اطلاعات بدست آمده در رابطه با دو متغیر اغلب در یک جدول دو بعدی ارائه می شوند که به آن جدول توافقی گفته می شود.

در این نوع آزمون فرض صفر بیان می کند که هیچ رابطه معنی داری بین دو صفت وجود ندارد و رد آن به معنی وجود یک رابطه معنی دار بین این دو متغیر است یعنی:

بین دو متغیر رابطه معنی دار وجود ندارد

بین دو متغیر رابطه معنی دار وجود دارد.

تصحیح تیس در جدول های توافقی دو در دو:

در جدول های دو در دو، درجه آزادی برابر یک است بنابراین باید تصحیح پیوستگی برای خی دو در نظر گرفته شود. که در این حالت به جای استفاده از تصحیح تیس (5/0) خی دو را با فرمول زیر محاسبه می کنیم و تصحیح برای پیوستگی از طریق  انجام می پذیرد.

 برای استفاده از فرمول ذکر شده، ابتدا باید اطلاعات را بصورت جدول توافقی  زیر تنظیم کرد:

         

a+b

c+d

B

D

 

A

C

 
 

b+d

 

a+c

 

لازم به ذکر است که از مزیت های این فرمول، آن است که محاسبه فراوانی مورد انتظار لازم نیست بلکه فراوانی های مورد مشاهده در خانه های چهارگانه a,b,c,d نوشته می شود. به عنوان مثال:

فرضیه ای به این صورت بیان شده که مشاوران آموزشی پسران را به مشاغل تخصصی و دختران را به مشاغل غیر تخصصی هدایت می کنند. پژوهشگری 100 دانش آموز هدایت شده را انتخاب کرده و فراوانی آن ها را بصورت زیر ثبت کرده است. فرضیه را در سطح خطای 05/0 آزمون کنید؟

 

پسران

 

دختران

 

مشاغل تخصصی

مشاغل غیر تخصصی

22 b

28 d

 

a 8

c 42

 
       

100

 sdata.ir

 

با توجه به اینکه درجه آزادی  می باشد، بنابراین خی دوی بدست آمده از جدول بحرانی برابر با 84/3 در سطح معنی داری 05/0 است سپس با توجه به خی دوی بدست آمده که 028/8 می باشد و مسلّماً بزرگتر از خی دوی جدول می باشد، در نتیجه فرض صفر رد می شود.

چند نکته ضروری در آزمون های خی دو:

1. داده ها بصورت فراوانی و طبقه ای باشند و در مقیاس اسمی باشند.

2. فراوانی هر مشاهده باید از سایر مشاهدات مستقل باشند.

3. هر مشاهده باید فقط در یک طبقه قرار داده شود.

4. فراوانی مورد انتظار 80% خانه ها باید بیشتر از 5 باشد و در صورتی که درجه آزادی یک باشد باید فراوانی مورد انتظار همه خانه ها از 5 بیشتر باشد.

5. همچنین، در مواقعی که حجم نمونه کم باشد و فراوانی مورد انتظار در بیشتر 20% خانه ها کمتر از 5 باشد، باید گروه ها را با هم ادغام کنیم که فراوانی مورد انتظار هر خانه بیشتر شود و در مواقعی که درجه آزادی یک باشد حتی یک خانه هم کمتر از 5 هم نباید باشد.

نتیچه گیری

آزمون خی دو (Chi-Square Test) یک ابزار آماری قدرتمند و کاربردی است که به ویژه برای تحلیل داده‌های کیفی و دسته‌بندی شده استفاده می‌شود. این آزمون دو نوع اصلی دارد: آزمون استقلال خی دو که برای بررسی وابستگی بین دو متغیر کیفی به کار می‌رود، و آزمون برازش خی دو که تطابق بین توزیع مشاهده شده و توزیع مورد انتظار را ارزیابی می‌کند.

این آزمون به دلیل سادگی اجرا و تفسیر، در بسیاری از حوزه‌ها مانند علوم اجتماعی، پزشکی، زیست‌شناسی و بازاریابی محبوبیت دارد. مزایای آزمون خی دو شامل نیاز به فرضیات کمتر و قابلیت کاربرد برای داده‌های دسته‌بندی شده است. با این حال، برای دستیابی به نتایج معتبر، رعایت پیش‌فرض‌هایی مانند داشتن حجم نمونه کافی ضروری است.

در مجموع، آزمون خی دو یک ابزار ضروری در جعبه‌ابزار تحلیل‌گران داده است که به آن‌ها کمک می‌کند تا روابط معنادار بین متغیرهای کیفی را شناسایی کرده و اعتبار نتایج خود را افزایش دهند.

نظرات

هیچ نظری وجود ندارد.


افزودن نظر

Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved