آزمون معنی داری مدل رگرسیون

1402/06/14

دسترسی سریع


برای آزمون این که آیا رابطه ی رگرسیونی ارائه شده بین متغیر پاسخ (وابسته) و متغیرهای پیشگو (مستقل) معنی دار است یا خیر با تعریف مدل رگرسیون به صورت ، {Y_i} = {\beta _0} + {\beta _1}{X_1} + {\beta _1}{X_2} + ... + {\beta _{v - 1}}{X_{v - 1}} + {\varepsilon _i}     فرضیه  {H_0} = {\beta _1} = {\beta _2} = ... = {\beta _{v - 1}} = 0 را در برابر  حداقل یکی از {\beta _i} ها مخالف صفر باشد آزمون می کنیم . با توجه به جدول تحلیل واریانس زیر آماره ی آزمون را معرفی می نماییم :   آزمون معنی داری مدل رگرسیون   آماره آزمون    {F^*} = \frac{{MSR}}{{MSE}}  می باشد. {F^*} با مقدار حاصل از جدول توزیع فیشر مقایسه می شود. اگر {F^*} \le F(1 - \alpha ,p - 1,n - p)    فرض صفر معنی داری مدل رگرسیون پذیرفته می شود .  به عبارت دیگر با اطمینان (1 - \alpha ) درصد  می توان گفت مدل ارائه شده توسط متغیرهای مستقل موجود به خوبی قادر به بیان  تغییرات متغیر وابسته می باشد . در صورتی که {F^*} \succ F(1 - \alpha ,p - 1,n - p)  

فرض صفر رد می شود . یعنی مدل تعریف شده نمی تواند مدل مناسبی برای بیان تغییرات متغیر وابسته باشد . درک بیشتر آزمون دو جمله ای نیز می تواند برای شما بسیار کاربردی باشد.

به عنوان مثال فرض کنید می خواهیم رابطه ی فشارخون سیستولیک و وزن ({x_1}) و سن ({x_2}) را برای مردانی که تقریبا قد یکسانی دارند آزمون کنیم . نتایج حاصل به کمک نرم افزار R به شرح زیر است :

Call:

Lm (formula = y ~ x1 + x2)

Coefficients:

                     Estimate     Std. Error             t value           Pr(>|t|)

(Intercept)          -23.4230      53.5795      -0.437      0.6713

x1                    0.3865        0.2188          1.766       0.1078

x2                    0.8210        0.2810          2.921       0.0153 *

---

Signif. codes:    0 ‘***’   0.001 ‘**’   0.01 ‘*’   0.05 ‘.’   0.1 ‘ ’  1

 

F-statistic: 4.885 on 2 and 10 DF,      p-value: 0.03311

 

مدل حاصل از اطلاعات فشار خون ، سن و وزن 13 نفر به صورت \hat Y =  - 23.423 + 0.386{x_1} + 0.821{x_2}

می باشد . مقدار آماره ی آزمون معنی داری مدل برابر 4.885 است که با مقدار حاصل از جدول توزیع فیشر با p-1=3-1=2 و n-p=13-3=10 درجه ی آزادی مقایسه می شود . البته با توجه به p-مقدار آزمون که برابر 0.033 بوده و کمتر از 0.05 است فرض صفر با اطمینان 0.95% درصد رد می شود یعنی مدل موجود بااطمینان 0.95% درصد معنی دار بوده و براساس داده های موجود به خوبی قادر به بیان  تغییرات فشار خون سیستولیک می باشد .

  آزمون ضرورت وجود هریک از متغیرهای پیشگو در مدل

به منظور بررسی ضرورت وجود هریک از متغیرهای مستقل در مدل فرضیه  {H_0}:{\beta _k} = 0  در برابر {H_1}:{\beta _k} \ne 0   آزمون می کنیم . آماره  آزمون به صورت {t^*} = \frac{{{b_k}}}{{s\left\{ {{b_k}} \right\}}}

تعریف می شود و در سطح 1 - \frac{\alpha }{2}  با مقدار حاصل از جدول توزیع تی استودنت با n-p درجه ی آزادی مقایسه می شود . چنانچه {t^*} \le t(1 - \frac{\alpha }{2},n - p) فرض صفر پذیرفته می شود یعنی ضرورتی برای وجود متغیر k ام در مدل وجود ندارد و احتمالا می توان این متغیر را از مدل حذف کرد. در صورتی که {t^*} \succ t(1 - \frac{\alpha }{2},n - p) فرض صفر رد شده و متغیر مستقل k ام در مدل باقی می ماند .

برای مثال فرض کنید می خواهیم رابطه ی فشارخون سیستولیک با وزن ({x_1}) و سن ({x_2}) را برای مردانی که تقریبا قد یکسانی دارند آزمون کنیم و در مورد لزوم وجود هریک از متغیرهای وزن و سن در مدل تصمیم گیری نمائیم . خروجی زیر توسط نرم افزار R بدست آمده است .

Call:

Lm (formula = y ~ x1 + x2)

Coefficients:

                     Estimate     Std. Error       t value     Pr(>|t|)

(Intercept)          -23.4230      53.5795      -0.437      0.6713

x1                    0.3865        0.2188          1.766       0.1078

x2                    0.8210        0.2810          2.921       0.0153 *

---

Signif. codes:    0 ‘***’   0.001 ‘**’   0.01 ‘*’   0.05 ‘.’   0.1 ‘ ’  1

  آماره ی آزمون مربوط به هریک از {\beta _k} ها در ستون  t value داده شده است .در سطح خطای 0.05% درصد هریک از آن ها بایستی با t(1 - \frac{\alpha }{2},n - p) = t(0.975,13 - 3 = 10)

مقایسه شوند . علاوه بر آن به کمک p-مقدار و مقایسه ی آن با α=0.05 نیز می توان در مورد قبول یا رد فرض صفر تصمیم گیری نمود . در این مثال p- مقدار مربوط به {x_2} کمتر از 0.05 می باشد و فرض صفر برای این متغیر رد می شود یعنی متغیر {x_2} در مدل باقی می ماند .ولی با اطمینان 0.95 درصد می توان گفت ضرورتی برای وجود {x_1} در مدل وجود ندارد.      

نظرات

هیچ نظری وجود ندارد.


افزودن نظر

Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved