ارزیابی تست های تشخیصی تحلیل های واریانس در نرم افزار R

1402/06/14

دسترسی سریع


در روش های پارامتری کلاسیک بررسی وجود داده های پرت؛ همسانی واریانس و بررسی توزیع نرمال، به عنوان پیش شرط های اساسی همواره مورد نظر محققان و داده پردازان بوده است. تست های چون ANOVA, ANCOVA , MANOVA به این تست ها حساسیت داشته و قبل از تحلیل نتایج این آزمون ها، بررسی تست های تشخیصی از اهمیت بالایی برخوردار هستند. بررسی این تست ها به منظور افزایش دقت آزمون ها توصیه شده است.

 به منظور بررسی داده های پرت یا دورافتاده(که تشخیص آنها علاوه بر روش های مرتبط با تحلیل واریانس در بسیاری از روش های چند متغیره نیز به عنوان مبنای انجام تحلیل است) باید از دستور aq.plot استفاده نمود. کتابخانه Mvoutlier برای این منظور توسط R پشتیبانی شده است. این تابع با استفاده از مجذور فواصل ماهالانوبیس نوع توزیع داده های تجربی موجود را بر اساس وجود داده های پرت مورد تحلیل قرار می دهد. به منظور انجام آن باید دستور زیر را وارد نمود.

library(mvoutlier) outliers <- aq.plot(mtcars[c("mpg","disp","hp","drat","wt","qsec)])

 Read استفاده می شود. وجود داده های پرت را می توان در چهار دیاگرام خروجی مورد توجه قرار داد و نسبت به مدیریت و حذف آنها از تحلیل اقدام نمود.

 مفروضه بعدی توزیع نرمال متغیر های تحقیق است. در آزمون هایی که توزیع نرمال باید مورد توجه باشد از پلات کیو استفاده می شود که به این منظور باید دستور زیر را  در کنسول R وارد نمود.

نام فایل داده <- read.csv(آدرس فایل روی سیستم) attach(نام فایل داده ای که از قبل وارد شده است) qqnorm(نام یکی از متغیر ها در فایل) qqline(نام یکی از متغیر ها در فایل)

 این خروجی نشان می دهد که وضعیت پراکنش متغیر مورد مطالعه چگونه است و تا چه حد به خط نرمال نزدیک یا دور است. به منظور بررسی دقیق تر می توان از دستور shapiro.test(x) استفاده نمود. که X یک بردار عددی است. به منظور مطالعه شرط نرمال بوده چند متغیره که در بسیاری از آزمون ها شرط اساسی به شمار می رود باید از تست هایی چون شاپیرو چند متغیره استفاده نمود که توسط Royston (1983). ابداع شده است. این روش نسبت به روش هایی که تک تک متغیر ها را به تفکیک مورد تحلیل قرار می دهند بسیار کاراتر و دقیق تر بوده و در بررسی همزمان متغیر ها شرط توزیع آنها در رابطه با سایر متغیر های مدل یا تابع بررسی می شود.

در نرم افزار R این دستور تعبیه شده است و برای محققان امکان محاسبه این تست فراهم شده است. (mshapiro.test (M این تست را انجام می دهد. که M ماتریس عددی است.

X \sim N(\mu ,\sum )

اگر p×1 بردار تصادفی نرمال چند متغیره داشته باشیم آنگاه فاصله مجذور ماهالانوبیس بین X و μ میل به توزیع کای اسکویر با P درجه آزادی دارد. به منظور بررسی این خروجی بر اساس یک دیاگرام باید از دستور استفاده شود.

x <- as.matrix(mydata) <- colMeans(x) n <- nrow(x); p <- ncol(x); cov <- cov(x) d <- mahalanobis(x,center,cov) # distances qqplot(qchisq(ppoints(n),df=p),d main="QQ Plot Assessing Multivariate Normality  ylab="Mahalanobis D2")",, abline(a=0,b=1)

به منظور بررسی تست های همسانی ورایانس نیز باید از آزمون های بارتلت و فیگنر – کیلن  استفاده می شود که دستورات زیر را باید وارد نمود.

bartlett.test(y~G, data=نام فایل داده) fligner.test(y~G, data= نام فایل داده)

 که در این دستور Y متغیر کمی و G متغیر گروهبندی است. به منظور گرافیکی سازی آن این دستور کافی است دستور زیر را که بر مبنای Brown-Forsyth طراحی شده است وارد نمود.

library(HH) hov(y~G, data= نام فایل داده) plot.hov(y~G,data= نام فایل داده)

 که در این دستور Y متغیر کمی و G متغیر گروهبندی است.

همسانی طبقات در سطوح متغیر های طبقه ای را  با استفاده از این پلات می توان مشاهده نمود. در این مقاله هدف ارائه دستور ها و کتابخانه های اساسی R در محاسبات مربوط به متداول ترین محاسبات پیش نیاز تحلیل واریانس بود که در برخی از آزمون های دیگر چند متغیره نیز کاربرد دارد. به طور کلی این نرم افزار از قابلیت های مناسبی برای پوشش نیاز های محاسباتی محققان برخوردار است.

نظرات

هیچ نظری وجود ندارد.


افزودن نظر

Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved