تحلیل همبستگی کانونی


1402/06/14

دسترسی سریع


تحلیل همبستگی کانونی

اين تحليل را Hotelling در سال 1936 براي يافتن رابطه سرعت و ميزان فهم رياضي با سرعت و قدرت حفظ كردن تعدادي دانش آموز براي اولين بار به كار برد. اين نوع تحليل عبارت است از ضريب همبستگي بين دو دسته متغير كه دسته اول در بردار \underline X  به عنوان متغيرهاي مستقل و دسته دوم در بردار \underline Y به عنوان متغيرهاي وابسته قرار دارند. هدف از اين نوع تحليل آن است تا دو تركيب خطي يكي از بردار \underline X ، يعني a'\underline X و ديگري از بردار \underline Y يعني \underline {b'} \underline Y پيدا كنيم به طوري كه داراي بزرگترين ضريب همبستگي باشند. اين ضريب همبستگي مي تواند به طور هم زمان درجه ارتباط خطي اين دو مجموعه از متغيرها را نشان دهد. توان دوم اين ضريب همبستگي نشان دهنده نسبتي از واريانس يك مجموعه از متغيرهاست (\underline X يا \underline Y ) كه به وسيله دسته ديگر از متغيرها (\underline Y يا \underline X ) توضيح داده مي شود.

اين نوع تحليل از يك جهت شبيه مولفه هاي اصلي است با اين تفاوت كه در مولفه هاي اصلي هدف آن است تا تركيب خطي را پيدا كنيم كه روابط دروني يك مجموعه از متغيرها را به نحو بارزي بيان كند. درحالي كه در تحليل همبستگي كانوني هدف يافتن تركيبات خطي است تا به نحو بارزي همبستگي بين دو مجموعه از متغيرها را بيان دارد. از جهت ديگر اين نوع تحليل يك حالت تعميم يافته از رگرسيون چندگانه است كه در آن متغيرها به دو گروه تقسيم شده يكي بردار \underline x شامل q متغير و ديگري مجموعه y شامل 1 = p متغير است؛ در واقع هدف از رگرسيون چندگانه يافتن تركيب خطي از \underline x است كه داراي بزرگترين ضريب همبستگي با y باشد. در تحليل كانوني بردار y شامل p \ge 1 متغير است. اگر بردار \underline x به بردار علت y تفسير شود \underline {a'} \underline x مي تواند به عنوان بهترين پيش بيني كننده و \underline {b'} \underline y  به عنوان بهترين معيار قابل پيش بيني تلقي شود. به هرحال در اين نوع تحليل هيچ ضرورتي ندارد تا يك مجموعه را علت و مجموعه ديگر را معلول بدانيم، يا يك دسته را متغيرهاي مستقل و دسته ديگر را متغيرهاي وابسته بدانيم. بلكه يك حالت متقارن بين دو مجموعه از متغيرها درنظر گرفته مي شود.

البته اين نوع تحليل مي تواند براي بيش از دو مجموعه متغير نيز به كار برده شود. اين تحليل از جهت نامگذاري روي تركيبات خطي مشابه تحليل عاملي است.

طريقه بدست آوردن متغيرهاي كانوني و ضريب همبستگي كانوني

اگر ماتريس هاي {M_2},{M_1} به صورت زير تعريف شوند،

{M_1} = \sum\nolimits_{11}^{ - 1} {\sum\nolimits_{12}^{} {\sum\nolimits_{22}^{ - 1} {\sum\nolimits_{21}^{} {} } } } و {M_2} = \sum\nolimits_{22}^{ - 1} {\sum\nolimits_{21}^{} {\sum\nolimits_{11}^{ - 1} {\sum\nolimits_{11}^{} {} } } }

موارد زير براي {M_2},{M_1} قابل بيان است:

1 . r({\sum _{12}}) = r({M_1}) = r({M_2})

2 . در صورتي كه {\sum _{12}} سطري يا ستوني رتبه كامل باشد، پس r({M_i}) = r({\sum _{12}}) = \min (p,q) = k

اين شرط با فرض عدم وجود همخطي چند گانه در درون هريک از دو مجموعه مذکور از متغيرها قابل حصول است.

3 . مقادير ويژه مثبت (و غيرصفر) ماتريس هاي {M_2},{M_1} با هم برابر هستند.

اگر بزرگترين مقدار ويژه مثبت را با {\lambda _1} نشان دهيم و {\underline \beta _1},{\underline \gamma _1} بردارهاي ويژه متناظر از {M_2},{M_1} باشند، آن گاه {\underline U _2} = {\underline {\beta '} _1}\underline y {}\nolimits_{}^{} , {}\nolimits_{}^{} {U_1} = \underline {\gamma '} _1^{}\underline x متغيرهاي كانوني اول ناميده مي شوند. يعني:  \max {}\nolimits_{}^{} Corr(\underline {a'} \underline x ,\underline {b'} \underline y ) = Corr({\underline {\gamma '} _1}\underline x ,{\underline {\beta '} _1}\underline y ) = \sqrt {{\lambda _1}}

مقدار ضريب همبستگي كانوني اول است.

مطلب فوق بدان مفهوم است كه مي توان ضرايب همبستگي كانوني دوم، سوم و … و متغيرهاي كانوني دوم، سوم و … نيز داشت.

ضريب همبستگي كانوني دوم و متغيرهاي مربوط بدين صورت تعريف مي شود كه \underline {d'} \underline y ,\underline {c'} \underline x  متغيرهاي كانوني دوم و ضريب همبستگي بين آنها ضريب همبستگي كانوني دوم ناميده مي شوند اگر:

\max {}\nolimits_{}^{} Corr(\underline {a'} \underline x ,\underline {b'} y) = Corr(\underline {d'} \underline y ,\underline {c'} \underline x )

\underline {a'} {\underline \gamma _1} = \circ {}\nolimits_{}^{} , {}\nolimits_{}^{} {\underline b ^\prime }{\underline \beta _1}             = \circ {}\nolimits_{}^{} {}\nolimits_{}^{} \underline {c'} {\underline \gamma _1} = \circ {}\nolimits_{}^{} \underline {d'} {\beta _1} = \circ

گيريم {\lambda _1} \ge {\lambda _2} \ge ... \ge {\lambda _k} \ge \circ مقادير ويژه مثبت ماتريس هاي {M_2},{M_1} و مجموعه بردارهاي {\underline \gamma _k},...,{\underline \gamma _2},{\underline \gamma _1}، بردارهاي ويژه متعامد {M_1} و  {\underline \beta _k},...,{\underline \beta _2},{\underline \beta _1} بردارهاي ويژه متعامد {M_2} باشند سپس:

\max {}\nolimits_{}^{} Corr(\underline {a'} \underline x ,\underline {b'} \underline y ) = Corr({\underline {\gamma '} _2}\underline x ,{\underline {\beta '} _2}y) = \sqrt {\lambda _2^{}}

و \underline {a'} {\underline \gamma _1} = \circ {}\nolimits_{}^{} , {}\nolimits_{}^{} \underline {b'} {\underline \beta _1} = \circ خواهدبود. بدين ترتيب {\underline {\beta '} _2}\underline y {}\nolimits_{}^{} , {}\nolimits_{}^{} {\underline {\gamma '} _2}\underline x بردارهاي كانوني دوم و \sqrt {{\lambda _2}} مقدار همبستگي كانون دوم است. در حالت كلي {V_i} = {\underline {\beta '} _i}\underline y {}\nolimits_{}^{} , {}\nolimits_{}^{} {U_i} = {\underline {\gamma '} _i}\underline x ، i امين متغيرهاي كانوني است و

Corr({U_i},{V_i}) = \sqrt {{\lambda _i}} (i = 1,2,...,k)

متغيرهاي كانوني كه بدين ترتيب بدست مي آيند، داراي خواص زير مي باشند:

  1.   Corr({U_i},{U_j}) = \left\{ {\begin{array}{ccccccccccccccc} 1&{i = j}\\ \circ &{i \ne j} \end{array}} \right.
  2. Corr({V_i},{V_j}) = \left\{ {\begin{array}{ccccccccccccccc} 1&{i = j}\\ \circ &{i \ne j} \end{array}} \right.
  3. Corr({U_i},{V_j}) = \left\{ {\begin{array}{ccccccccccccccc} {\sqrt {{\lambda _i}} }&{i = j}\\ \circ &{i \ne j} \end{array}} \right.

 مفروضات مربوط به تحليل ضرايب همبستگي كانوني

اين نوع تحليل به عنوان زيرمجموعه اي از تحليل هاي آماري وسيع تر كه مدلهاي خطي عمومي چندگانه ناميده مي شوند مبتني بر مفروضاتي به شرح زيراست.

1 - رابطه بين متغيرهاي داخل هر مجموعه از متغيرها و بين دو مجموعه متغيرهاي خطي است.

2 – همگون بودن رابطه بين دوبدوي متغيرها. البته اين فرض لازم نيست ولي اگر برقرار باشد اين نوع تحليل بسيار خوب خواهدبود.

3 – عدم وجود هم خطي چندگانه بين متغيرها

4 – هر مجموعه اي از متغيرها و مجموعه هردو گروه از متغيرها از توزيع چند متغير نرمال برخوردار هستند. اين فرض بخودي خود جهت انجام تحليل ضروري نيست ولي براي انجام آزمون فرض هاي آماري ضرورت دارد.

توجه داشته باشید که اگر متغيرها هم مقياس باشند، تحليل برمبناي ماتريس واريانس – كواريانس انجام مي شود. در غيراينصورت از ماتريس ضريب همبستگي متغيرها و ضرايب كانوني محاسبه مي شوند.

نکته مهم اين که ضرايب همبستگي کانوني براساس داده هاي واقعي و داده هاي استاندارد شده با يکديگر برابر هستند؛ هر چند متغيرهاي کانوني براساس دو ماتريس متفاوت هستند.

20111123130107-amar

نظرات

هیچ نظری وجود ندارد.


افزودن نظر

Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved