تحلیل مولفه های اصلی (PCA)
دسترسی سریع
- تاريخچه :
تحلیل مولفه های اصلي يكي از روش هاي كلاسيك چند متغيره و شايد قديمي ترين و معروف ترين آنها باشد. اين روش ابتدا بوسيله Pearson (1901) به عنوان وسيلهاي براي برازاندن صفحات از طريق حداقل مربعات متعامد معرفي شد و مستقلاً به وسيله Hotelling (1933) به منظور تجزيه و تحليل ساختارهاي ماتريس هاي واريانس – كواريانس و ضريب همبستگي توسعه داده شد. مثل بسياري از روش هاي چند متغيره تا قبل از اختراع رايانه ها به دليل پيچيدگي در محاسبات به طور گسترده اي مورد استفاده واقع نشد. بعد از آن از ديدگاه تئوري و كاربرد به طور وسيعي توسعه پيدا كرده و بكار برده شد.
اين نوع تجزيه را ميتوان از ديدگاههاي مختلف مورد توجه قرار داد.
- تبديل متغيرهاي وابسته به متغيرهاي غير همبسته
- يافتن تركيبات خطي با تغييرپذيري نسبي بزرگ يا كوچك
- كاهش حجم داده ها
- تفسير داده ها
اين نوع تجزيه معمولاً يك تجزيه نهايي تلقي نميشود بلكه به عنوان وسيلهاي مياني براي مطالعات و بررسي هاي بيشتر مورد استفاده قرار ميگيرد.
جنبه هاي رياضي مورد استفاده در اين روش شامل مقادير ويژه و بردارهاي ويژه ماتريس هاي هميشه مثبت متقارن است.
كاهش حجم داده ها هدف اصلي اين تجزيه را تشكيل ميدهد كه اين داده ها شامل تعداد زيادي متغيرهاي با همبستگي هاي دروني ميباشند به طريقي كه حداكثر ممكن اطلاعات موجود در داده ها محفوظ بماند. اين امر از طريق تبديل داده ها (متغيرها) به متغيرهاي جديدي است كه مولفه هاي اصلي ناميده شده و غير همبسته بوده و به ترتيبي اولويت بندي ميشوند كه تعداد اندكي از آنها اغلب تغييرات موجود در متغيرهاي اوليه را با خود به همراه دارند.
در اين روش تجزيه تركيباتي خطي از p متغير (صفت) جهت ايجاد شاخص هاي مستقل بدست ميآيد. به طوري كه اين شاخص ها به دليل استقلالشان خاصيت جمع پذيري خواهند داشت و به عبارت ديگر ميتوانند جنبه هاي متفاوتي از اطلاعات متغيرهاي اصلي (X ها) را اندازه گيري كنند. مطلوبيت اين تجزيه زماني است كه همبستگي بالايي بين متغيرهاي وجود داشته باشد در اين صورت تعداد اندكي از اين شاخص ها جنبه هاي كلي اطلاعات متغيرهاي اصلي را به همراه خواهند داشت. اما در صورتي كه همبستگي ها كم باشد اين روش تجزيه نتايج مطلوبي به همراه نخواهد داشت.
- تعريف مولفه هاي اصلي
فرض كنيد بردار X شامل p متغير بوده و بررسي و مطالعه واريانس متغيرها و كواريانس بين دوبدوي اين متغيرها مورد توجه است در شرايطي كه p كوچك باشد و يا ماتريس واريانس – كواريانس ساده باشد اين مطالعه به سادگي و با ملاحظه p واريانس و كواريانس قابل انجام است. در غير اين صورت يك روش مطلوب آن است تا تعداد اندكي متغير جديد (بسيار كمتر از p ) پيدا كرد به طوري كه شامل اكثر اطلاعات مربوط به واريانس ها و كواريانس ها باشد.
در خصوص مفهوم مولفه و در تجزيه مولفه هاي اصلي گرچه ظاهراً توجه اصلي روي واريانس متغيرها است اما با توجه به روابط بين واريانس ها و كواريانسها اين روش به طور ضمني كواريانس ها يا ضرايب همبستگي را نيز مورد توجه قرار ميدهد.
از لحاظ جبري مولفه هاي اصلي، تركيبات خطي به خصوصي از عوامل بردار X يعني ميباشند. از لحاظ هندسي تركيبات خطي به منزله انتخاب يك سيستم محورهاي جديد است كه از دوران محورهاي اوليه يعني بدست ميآيد به طوري كه محورهاي جديد جهات با بيشترين تغييرات را نشان ميدهند و توصيفي ساده تر از ساختار ماتريس واريانس – كواريانس ارائه ميدهد.
نظرات
هیچ نظری وجود ندارد.
افزودن نظر
Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved