تحلیل مؤلفه اصلی
1402/06/14
دسترسی سریع
روشی براي كاهش ميزان دادهها يا تعداد متغيّرها است. فرض كنید در یک تحقیق تعداد زيادي متغير وجود دارند كه با يكديگر همبستگي دارند. (در منابع طبیعی معمولاً شيب، جهت، ارتفاع، پوشش، بافت خاك و در تحقیقات پرسشنامه ای امتیازاتی که پرسش شوندگاه به متغیّرهای مورد تحقیق می دهند) براي اين كه قضاوتها سادهتر شوند به كمك PCA اين متغيرها به تعداد كمي مؤلفه تبديل ميشوند. تحلیل مؤلفه های اصلی مانند تحلیل عاملی برای داده های فاصله ای طرّاحی شده اگر چه می تواند برای داده های رتبه ای نیز استفاده شود ( مانند امتیازاتی که در طیف لیکرت داده می شوند). در PCA با متغیّرهای رتبه ای همانند متغیّرهای با مقیاس متریک رفتار می شود. اما برخی معتقدند این کار درست نیست و باید در تفسیرها این مسئله توضیح داده شود. متغیّرها در این روش باید همبستگی خطّی با یکدیگر داشته باشند. این مسأله را می توان با رسم اسکاترگرام برای جفت جفت آنها مورد بررسی قرار داد. حداقل یک همبستگی متوسط باید بین متغیّرها وجود داشته باشد، در غیر این صورت آزمون مؤلفه های اصلی به هدف اصلی خود که کاهش حجم داده ها (تعداد متغیّرها) است نمی رسد. البته می توان تحلیل همبستگی هم انجام داد. برای این کار در صورتی که داده ها به صورت رتبه ای باشند باید از آزمون همبستگی اسپیرمن استفاده شود. در غیر این صورت از آزمون پیرسون که پیش فرض نرم افزار SPSS است استفاده می شود.
تحليل مؤلفههاي اصلي را هم ميتوان روي دادههاي خام انجام داد و هم روی ماتريس همبستگي يا ماتريس واريانس-كوواريانس دادهها. اگر دادههاي خام استفاده شوند نرمافزار اين ماتريس را خودش ميسازد. اگر ماتريس همبستگي استفاده شوند، متغيرها استانداردسازي شده و واريانس كل برابر خواهد بود با تعداد متغيرها (زيرا پس از استانداردسازي ، واريانس هر متغير برابر 1 ميشود). اگر ماتريس واریانس-كوواريانس مورد استفاده قرار گيرد متغيرها در همان اندازه اوليه باقي ميمانند. در PCA همواره با واريانس كل سر و كار داريم. بسیاری از اوقات دادههای مورد استفاده در تحلیل مؤلفه های اصلی یا تحلیل عاملی حاصل از پر کردن پرسشنامه به وسیلۀ افراد نمونه و به صورت کدبندی در قالب طیف لیکرت هستند. اما داده های کمی پیوسته نیز میتوانند مورد آزمون قرار گیرند. به عنوان مثال فرض کنید سوال به این صورت برای اعضای تعاونی های جنگل نشین مطرح شده: حقوقی که از تعاونی میگیرید تا چه حد در تمایل شما به حفاظت از جنگل تاثیر دارد. پاسخها میتوانند به صورت زیر باشند:
1)خیلی کم 2)کم 3)متوسط 4)زیاد 5)خیلی زیاد
در نرم افزار SPSS اعداد وارد شده اما هنگام تعریف نام متغیّر، برای هر یک از سطوح آن یک برچسب مشخص میشود تا برای نرمافزار مشخص شود عدد 1 به چه معنا است و عدد 5 چه مفهومی دارد.
نحوۀ عمل:
ترکیبات متفاوتی از متغیّرهای مورد بررسی تولید میشوند که هر یک از آنها یک مؤلفۀ اصلی نامیده میشود.
رابطۀ 8-1- نحوۀ تشکیل مولفههای اصلی Zi = ai1 X1 + aI2 X2 + … + ain Xn
این مؤلفه ها همبستگی با هم ندارند. هر کدام از مؤلفه ها که واریانس بیشتری داشته باشد ترکیب بهتری است و بالاتر از سایرین قرار میگیرد. مقدار ویژه هر مؤلفه نیز در واقع همین واریانس است. مؤلفه ای که مقدار ویژه بیشتری دارد ، واریانس بیشتری دارد. برخی مؤلفه ها ممکن است مقدار ویژه صفر داشته باشند.
پس از انجام تحلیل مؤلفه های اصلی باید تصمیم بگیریم چند مؤلفه را نگاه داریم و باید گفت تنها مؤلفه هایی که مقدار ویژه ناچیز دارند حذف شده و بقیه باقی می مانند. البته برای این تصمیم گیری روشهای مختلفی وجود دارد.
- مؤلفه هایی که عامل درصد معینی از تغییرات موجود در داده ها هستند (مثلا 75 درصد) انتخاب می شوند.
- مؤلفه هایی که مقدار ویژه بیش از یک دارند انتخاب می شوند (البته در صورتی که از ماتریس همبستگی استفاده شود).
- مؤلفه هایی که در نمودار سنگریزه ای به طور شاخصی به واسطۀ داشتن مقدار ویژه بالاتر از سایرین جدا شده اند انتخاب می شوند.
معمولاً پس از انجام تحليل مؤلفههای اصلي يك تحقيق ثانويه انجام ميشود تا ببینيم يافتهها مورد تأیید قرار ميگيرند يا خير. با اين كار قابليت تعميم دادهها مشخص ميشود. اما از آن جا كه تكرار تحقيق پرهزينه است يك رويه جايگزين استفاده ميشود. به اين صورت كه دادهها به دو قسمت تقسيم ميشوند (روش دو نیمه سازی). آناليز PAC براي هر قسمت جداگانه انجام ميشود و سپس نتايج آنها با هم و با کل داده ها مقایسه ميشود . اگر نتايج يكسان بودند نشان دهنده معتبر بودن يافته ها خواهد بود. در خروجي نرمافزار جدولي به نام communalities وجود دارد. در اين جدول تمام مقادير موجود در ستون Extraction بايد بيش از 0/5 باشند. هر متغيري كه مقدار مربوط به آن كمتر از 0/5 باشد بايد حذف شود. همچنين الگوي وزنهاي مؤلفهها بايد يكسان باشد. در جدولی به نام Rotated components matrix هر متغير در چند مؤلفه وزندهي ميشود. در اين جدول علامت مثبت يا منفی اهميت ندارد و فقط مقدار وزن براي ما مهم است. اگر روند دو قسمت كردن دادهها به ما نشان داد كه نتايج یكسان نيستند چند راهحل وجود دارد:
- اگر مشكل به يك يا دو متغير بر ميگردد مي توان آنها را حذف كرده و آناليز را تكرار نمود.
- دادهها را از محل ديگري دو نیمه كرده و آناليز را تكرار نمود.
- مشاهدات خارج از رده را حذف نمود. نرم افزار spss امتياز مؤلفهها را به صوت استاندارد محاسبه ميكند. آن دسته از امتيازات كه بيش از 3± باشند خارج از رده محسوب شده و بايد حذف شوند و دوباره آناليز تكرار شود. اگر در مقادير جدولcommunalities تغييري حاصل نشد نشان ميدهد كه اين دادههای خارج از رده خيلي مؤثر نبوده اند.
یکی از شرایط معتبر بودن تحلیل مؤلفه های اصلی این است که متغيرهاي موجود در يك مؤلفه چيزهاي مشابهي را اندازهگيري كنند به طوری كه قابل جمع شدن با هم باشند. برای بررسی این شرط از آلفای كرونباخ استفاده ميشود. اگر مقدار ضريب بزرگتر يا مساوي با 0/7 باشد، وضعيت مطلوب بوده و ميتوان گفت مقياس كلي مورد استفاده براي متغيرها معتبر است.
نظرات
هیچ نظری وجود ندارد.
افزودن نظر
Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved