تحلیل مؤلفه اصلی


1402/06/14

دسترسی سریع


روشی براي كاهش ميزان داده‌ها يا تعداد متغيّر‌ها است. فرض كنید در یک تحقیق تعداد زيادي متغير وجود دارند كه با يكديگر همبستگي دارند. (در منابع طبیعی معمولاً شيب، جهت، ارتفاع، پوشش، بافت خاك و در تحقیقات پرسشنامه ای امتیازاتی که پرسش شوندگاه به متغیّرهای مورد تحقیق می دهند) براي اين كه قضاوت‌ها ساده‌تر شوند به كمك PCA اين متغير‌ها به تعداد كمي مؤلفه ‌تبديل مي‌شوند. تحلیل مؤلفه های اصلی مانند تحلیل عاملی برای داده های فاصله ای طرّاحی شده اگر چه می تواند برای داده های رتبه ای نیز استفاده شود ( مانند امتیازاتی که در طیف لیکرت داده می شوند). در PCA با متغیّرهای رتبه ای همانند متغیّرهای با مقیاس متریک رفتار می شود. اما برخی معتقدند این کار درست نیست و باید در تفسیرها این مسئله توضیح داده شود. متغیّرها در این روش باید همبستگی خطّی با یکدیگر داشته باشند. این مسأله را می توان با رسم اسکاترگرام برای جفت جفت آنها مورد بررسی قرار داد. حداقل یک همبستگی متوسط باید بین متغیّرها وجود داشته باشد، در غیر این صورت آزمون مؤلفه های اصلی به هدف اصلی خود که کاهش حجم داده ها (تعداد متغیّرها) است نمی رسد. البته می توان تحلیل همبستگی هم انجام داد. برای این کار در صورتی که داده ها به صورت رتبه ای باشند باید از آزمون همبستگی اسپیرمن استفاده شود. در غیر این صورت از آزمون پیرسون که پیش فرض نرم افزار SPSS است استفاده می شود.

تحليل مؤلفه‌هاي اصلي را هم مي‌توان روي داده‌هاي خام انجام  داد و هم روی ماتريس همبستگي يا ماتريس واريانس-كوواريانس داده‌ها. اگر داده‌هاي خام استفاده شوند نرم‌افزار اين ماتريس را خودش مي‌سازد. اگر ماتريس همبستگي استفاده شوند، متغير‌ها استاندارد­سازي شده و واريانس كل برابر خواهد بود با تعداد متغير‌ها (زيرا پس از استاندارد‌سازي ، واريانس هر متغير برابر 1 مي‌شود). اگر ماتريس واریانس-كوواريانس مورد استفاده قرار گيرد متغير‌ها در همان اندازه اوليه باقي ‌مي‌مانند. در PCA   همواره با واريانس كل سر و كار داريم. بسیاری از اوقات داده­های مورد استفاده در تحلیل مؤلفه­ های اصلی یا تحلیل عاملی حاصل از پر کردن پرسشنامه به وسیلۀ افراد نمونه و به صورت کدبندی در قالب طیف لیکرت هستند. اما داده ­های کمی پیوسته نیز می­توانند مورد آزمون قرار گیرند. به عنوان مثال فرض کنید سوال به این صورت برای اعضای تعاونی­ های جنگل نشین مطرح شده: حقوقی که از تعاونی می­گیرید تا چه حد در تمایل شما به حفاظت از جنگل تاثیر دارد. پاسخ­ها می­توانند به صورت زیر باشند:

                        1)خیلی کم        2)کم        3)متوسط        4)زیاد       5)خیلی زیاد

در نرم­ افزار SPSS اعداد وارد شده اما هنگام تعریف نام متغیّر، برای هر یک از سطوح آن یک برچسب مشخص می­شود تا برای نرم­افزار مشخص شود عدد 1 به چه معنا است و عدد 5 چه مفهومی دارد.

pca_scores

نحوۀ عمل:

ترکیبات متفاوتی از متغیّرهای مورد بررسی تولید می­شوند که هر یک از آنها یک مؤلفۀ اصلی نامیده می­شود.

رابطۀ 8-1- نحوۀ تشکیل مولفه­های اصلی                        Zi = ai1 X1 + aI2 X2 + … + ain Xn

این مؤلفه­ ها همبستگی با هم ندارند. هر کدام از مؤلفه­ ها که واریانس بیشتری داشته باشد ترکیب بهتری است و بالاتر از سایرین قرار می­گیرد. مقدار ویژه هر مؤلفه نیز در واقع همین واریانس است. مؤلفه­ ای که مقدار ویژه بیشتری دارد ، واریانس بیشتری دارد. برخی مؤلفه­ ها ممکن است مقدار ویژه صفر داشته باشند.

پس از انجام تحلیل مؤلفه­ های اصلی باید تصمیم بگیریم چند مؤلفه را نگاه داریم و باید گفت تنها مؤلفه­ هایی که مقدار ویژه ناچیز دارند حذف شده و بقیه باقی می­ مانند. البته برای این تصمیم ­گیری روش­های مختلفی وجود دارد.

  • مؤلفه­ هایی که عامل درصد معینی از تغییرات موجود در داده­ ها هستند (مثلا 75 درصد) انتخاب می­ شوند.
  • مؤلفه ­هایی که مقدار ویژه بیش از یک دارند انتخاب می­ شوند (البته در صورتی که از ماتریس همبستگی استفاده شود).
  • مؤلفه­ هایی که در نمودار سنگریزه ­ای به طور شاخصی به واسطۀ داشتن مقدار ویژه بالاتر از سایرین جدا شده­ اند انتخاب می­ شوند.

معمولاً پس از انجام تحليل مؤلفه‌های اصلي يك تحقيق ثانويه انجام مي‌شود تا ببینيم يافته‌ها مورد تأیید قرار مي‌گيرند يا خير. با اين كار قابليت تعميم داده‌ها مشخص مي‌شود. اما از آن جا كه تكرار تحقيق پرهزينه­ است يك رويه جايگزين استفاده مي‌شود. به اين صورت كه داده‌ها به دو قسمت تقسيم مي‌شوند (روش دو نیمه سازی). آناليز PAC براي هر قسمت جداگانه انجام مي‌شود و سپس نتايج آنها با هم و با کل داده­ ها مقایسه مي‌شود . اگر نتايج يكسان بودند نشان ‌دهنده معتبر بودن يافته­ ها خواهد بود. در خروجي نرم­افزار جدولي به نام communalities وجود دارد. در اين جدول تمام مقادير موجود در ستون Extraction بايد بيش از 0/5 باشند. هر متغيري كه مقدار مربوط به آن كمتر از 0/5 باشد بايد حذف شود. همچنين الگوي وزن‌هاي مؤلفه‌ها بايد يكسان باشد. در جدولی به نام  Rotated components matrix  هر متغير در چند مؤلفه وزن‌دهي مي‌شود. در اين جدول علامت مثبت يا منفی اهميت ندارد و فقط مقدار وزن براي ما مهم است. اگر روند دو قسمت كردن داده‌ها به ما نشان داد كه نتايج یكسان نيستند چند راه‌حل وجود دارد:

  • اگر مشكل به يك يا دو متغير بر مي‌گردد مي­ توان آنها را حذف كرده و آناليز را تكرار نمود.
  • داده‌ها را از محل ديگري دو نیمه كرده و آناليز را تكرار نمود.
  • مشاهدات خارج از رده را حذف نمود. نرم افزار spss امتياز مؤلفه‌ها را به صوت استاندارد محاسبه مي‌كند. آن دسته از امتيازات كه بيش از 3± باشند خارج از رده محسوب شده و بايد حذف شوند و دوباره آناليز تكرار شود. اگر در مقادير  جدولcommunalities  تغييري حاصل نشد نشان  مي‌دهد كه اين داده‌های خارج از رده خيلي مؤثر نبوده ­اند.

یکی از شرایط معتبر بودن تحلیل مؤلفه ­های اصلی این است که متغيرهاي موجود در يك مؤلفه چيزهاي مشابهي را اندازه‌گيري ‌كنند به طوری كه قابل جمع شدن با هم باشند. برای بررسی این شرط از آلفای كرونباخ استفاده مي‌‌شود. اگر مقدار ضريب بزرگتر يا مساوي با 0/7 باشد، وضعيت مطلوب بوده و مي­توان گفت مقياس كلي مورد استفاده براي متغير‌ها معتبر است.

https://www.google.com/url?sa=t&rct=j&q=&esrc=s&source=web&cd=9&cad=rja&uact=8&ved=0ahUKEwjqlPHZievJAhXE-g4KHYe_CSkQFghHMAg&url=http%3A%2F%2Fsebastianraschka.com%2FArticles%2F2014_pca_step_by_step.html&usg=AFQjCNGlb6lIpaZMNvM7_RbYn-E68AElOg&sig2=2dBzvRncc4oiXLg_YNbicw

نظرات

هیچ نظری وجود ندارد.


افزودن نظر

Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved