تحلیل مولفه های اصلی (PCA)


1402/06/14

دسترسی سریع


  • تاريخچه :

تحلیل مولفه های اصلي يكي از روش هاي كلاسيك چند متغيره و شايد قديمي ترين و معروف ترين آنها باشد. اين روش ابتدا بوسيله Pearson (1901) به عنوان وسيله‌اي براي برازاندن صفحات از طريق حداقل مربعات متعامد معرفي شد و مستقلاً به وسيله Hotelling (1933) به منظور تجزيه و تحليل ساختارهاي ماتريس هاي واريانس – كواريانس و ضريب همبستگي توسعه داده شد. مثل بسياري از روش هاي چند متغيره تا قبل از اختراع رايانه ها به دليل پيچيدگي در محاسبات به طور گسترده اي مورد استفاده واقع نشد. بعد از آن از ديدگاه تئوري و كاربرد به طور وسيعي توسعه پيدا كرده و بكار برده شد.

اين نوع تجزيه را مي‌توان از ديدگاههاي مختلف مورد توجه قرار داد.

  • تبديل متغيرهاي وابسته به متغيرهاي غير همبسته
  • يافتن تركيبات خطي با تغييرپذيري نسبي بزرگ يا كوچك
  • كاهش حجم داده ها
  • تفسير داده ها

اين نوع تجزيه معمولاً يك تجزيه نهايي تلقي نمي‌شود بلكه به عنوان وسيله‌اي مياني براي مطالعات و بررسي هاي بيشتر مورد استفاده قرار مي‌گيرد.

جنبه هاي رياضي مورد استفاده در اين روش شامل مقادير ويژه و بردارهاي ويژه ماتريس هاي هميشه مثبت متقارن است.

كاهش حجم داده ها هدف اصلي اين تجزيه را تشكيل مي‌دهد كه اين داده ها شامل تعداد زيادي متغيرهاي با همبستگي هاي دروني مي‌باشند به طريقي كه حداكثر ممكن اطلاعات موجود در داده ها محفوظ بماند. اين امر از طريق تبديل داده ها (متغيرها) به متغيرهاي جديدي است كه مولفه هاي اصلي ناميده شده و غير همبسته بوده و به ترتيبي اولويت بندي مي‌شوند كه تعداد اندكي از آنها اغلب تغييرات موجود در متغيرهاي اوليه را با خود به همراه دارند.

در اين روش {x_1},{x_2},...,{x_p} تجزيه تركيباتي خطي از p متغير (صفت) جهت ايجاد شاخص هاي مستقل {y_1},{y_2},...,{y_p} بدست مي‌آيد. به طوري كه اين شاخص ها به دليل استقلالشان خاصيت جمع پذيري خواهند داشت و به عبارت ديگر مي‌توانند جنبه هاي متفاوتي از اطلاعات متغيرهاي اصلي (X ها) را اندازه گيري كنند. مطلوبيت اين تجزيه زماني است كه همبستگي بالايي بين متغيرهاي {x_1},{x_2},...,{x_p} وجود داشته باشد در اين صورت تعداد اندكي از اين شاخص ها جنبه هاي كلي اطلاعات متغيرهاي اصلي را به همراه خواهند داشت. اما در صورتي كه همبستگي ها كم باشد اين روش تجزيه نتايج مطلوبي به همراه نخواهد داشت.

  • تعريف مولفه هاي اصلي

فرض كنيد بردار X شامل p متغير بوده و بررسي و مطالعه واريانس متغيرها و كواريانس بين دوبدوي اين متغيرها مورد توجه است در شرايطي كه p كوچك باشد و يا ماتريس واريانس – كواريانس ساده باشد اين مطالعه به سادگي و با ملاحظه p واريانس و \frac{1}{2}p(p - 1) كواريانس قابل انجام است. در غير اين صورت يك روش مطلوب آن است تا تعداد اندكي متغير جديد (بسيار كمتر از p ) پيدا كرد به طوري كه شامل اكثر اطلاعات مربوط به واريانس ها و كواريانس ها باشد.

در تجزيه مولفه هاي اصلي گرچه ظاهراً توجه اصلي روي واريانس متغيرها است اما با توجه به روابط بين واريانس ها و كواريانس‌ها اين روش به طور ضمني كواريانس ها يا ضرايب همبستگي را نيز مورد توجه قرار مي‌دهد.

از لحاظ جبري مولفه هاي اصلي، تركيبات خطي به خصوصي از عوامل بردار X يعني {x_1},{x_2},...,{x_p} مي‌باشند. از لحاظ هندسي تركيبات خطي به منزله انتخاب يك سيستم محورهاي جديد است كه از دوران محورهاي اوليه يعني {x_1},{x_2},...,{x_p} بدست مي‌آيد به طوري كه محورهاي جديد جهات با بيشترين تغييرات را نشان مي‌دهند و توصيفي ساده تر از ساختار ماتريس واريانس – كواريانس ارائه مي‌دهد.

تحلیل مولفه های اصلی

نظرات

هیچ نظری وجود ندارد.


افزودن نظر

Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved