تمرین درس R تمرین 9
دسترسی سریع
نام دانشجو : سمانه ساعی فر
تعدادی داده داریم که برای شرکت ایران خودرو برای خودرو های مدل پژو 206 و پژو 206 صندوق دار است که می خواهیم آماره های توصیفی همبستگی متغییر ها با هم و مدل رگرسیونی و آزمون t.test را در نرم افزار R برای این داده ها انجام دهیم :
ردیف | نوع خودرو | مدل | کارکرد (کیلومتر) | کاهش قیمت (ريال) | طول عمر (سال) |
1 | پژو 206 | 80 | 197,000 | 250,000,000 | 12 |
2 | پژو 206 | 88 | 106,000 | 100,000,000 | 4 |
3 | پژو 206 | 82 | 191,000 | 201,000,000 | 10 |
4 | پژو 206 | 84 | 84,000 | 140,000,000 | 8 |
5 | پژو 206 | 83 | 178,000 | 192,000,000 | 9 |
6 | پژو 206 | 82 | 200,000 | 209,000,000 | 10 |
7 | پژو 206 | 83 | 190,000 | 195,000,000 | 9 |
8 | پژو 206 | 83 | 190,000 | 205,000,000 | 9 |
9 | پژو 206 | 83 | 118,000 | 185,000,000 | 9 |
10 | پژو 206 | 83 | 92,000 | 145,000,000 | 9 |
11 | پژو 206 | 83 | 90,000 | 195,000,000 | 9 |
12 | پژو 206 | 82 | 140,000 | 190,000,000 | 10 |
13 | پژو 206 | 88 | 34,000 | 4,630,000,000 | 4 |
14 | پژو 206 صندوق دار | 90 | 30,000 | 190,000,000 | 2 |
15 | پژو 206 صندوق دار | 90 | 70,000 | 130,000,000 | 2 |
16 | پژو 206 صندوق دار | 88 | 34,000 | 4,630,000,000 | 4 |
17 | پژو 206 صندوق دار | 90 | 30,000 | 190,000,000 | 2 |
18 | پژو 206 صندوق دار | 90 | 70,000 | 130,000,000 | 2 |
19 | پژو 206 صندوق دار | 90 | 3,000 | 60,000,000 | 2 |
20 | پژو 206 صندوق دار | 88 | 50,000 | 220,000,000 | 4 |
21 | پژو 206 صندوق دار | 89 | 59,000 | 190,000,000 | 3 |
22 | پژو 206 صندوق دار | 88 | 68,000 | 185,000,000 | 4 |
23 | پژو 206 صندوق دار | 85 | 66,000 | 270,000,000 | 7 |
24 | پژو 206 صندوق دار | 88 | 60,000 | 210,000,000 | 4 |
( noekhodro<-c(1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2< ( model<-c(80,88,82,84,83,82,83,83,83,83,83,82,88,90,90,90,88,89,88,85,88< ( karkard<-c(197,106,191,84,178,200,190,190,118,92,90,140,34,30,70,3,50,59,68,66,60< (y<-c(25,10,20.1,14,19.2,20.9,19.5,20.5,18.5,14.5,19.5,19,46.3,19,13,6,22,19,18.5,27,21< ( toleomr<-c(12,4,10,8,9,10,9,9,9,9,9,10,4,2,2,2,4,3,4,7,4<
آماره های توصیفی
برای انجام آماره های توصیفی از summary() استفاده می کنیم :
summary(noekhodro)< Min. 1st Qu. Median Mean 3rd Qu. Max. 1.000 1.000 1.000 1.429 2.000 2.000 summary(model)< Min. 1st Qu. Median Mean 3rd Qu. Max. 80.00 83.00 84.00 85.33 88.00 90.00 summary(karkard)< Min. 1st Qu. Median Mean 3rd Qu. Max. 3.0 60.0 90.0 105.5 178.0 200.0 summary(y)< Min. 1st Qu. Median Mean 3rd Qu. Max. 6.00 18.50 19.20 19.64 20.90 46.30 summary(toleomr)< Min. 1st Qu. Median Mean 3rd Qu. Max. 2.000 4.000 8.000 6.667 9.000 12.000
همانگونه که مشاهده می کنید در خروجی تابع summary() مشاهده می شود مینیمم -چارک اول -میانه-میانگین-چارک سوم و ماکسیمم گزارش شده است .
واریانس ها به صورت زیر است :
var(noekhodro)< [1] 0.2571429 var(model)< [1] 10.53333 var(karkard)< [1] 3961.962 var(y)< [1] 59.44857 var(toleomr)< [1] 10.53333
همبستگی متغییر ها با هم
( cor(model,y< [1] -0.1208848 ( cor(karkard,y< [1] 0.02002077 ( cor(toleomr,y< [1] 0.1208848 ( cor(model,karkard< [1] -0.8350232 ( cor(karkard,toleomr< [1] 0.8350232 ( cor(model,toleomr< [1] -1
آزمون T.test
ما فقط می توانیم کاهش قیمت را با نوع خودرو ازمون t.test کنیم که بدانیم بین هر مدل خودرو و کاهش قیمت رابطه معنی داری وجود دارد یا خیر ؟!
مقدار p-value کمتر از 0.05 است پس فرض h صفر را رد می کنیم یعنی بین نوع خودرو و کاهش قیمت رابطه معنی داری وجود دارد .
t.test(y,noekhodro)>
Welch Two Sample t-test
data: y and noekhodro t = 10.802, df = 20.173, p-value = 7.735e-10 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 14.69895 21.72962 sample estimates: mean of x mean of y 19.642857 1.428571
مدل رگرسیونی
در مثال زیر تابع ()lm به کار گرفته شده است تا نحوه ی اثر نوع خودرو و کارکرد و طول عمر آن بر کاهش قیمت y با استفاده از یک مدل رگرسیون ساده خطی تحلیل شود .در اینجا y متفیر وابسته (پاسخ) و noekhodro,karkard,toleomr متغیر مستقل هستند .
lm(y~noekhodro+karkard+toleomr)<
:Call lm(formula = y ~ noekhodro + karkard + toleomr)
:Coefficients (Intercept) noekhodro karkard toleomr -20.338845 16.452360 0.005846 2.379211
در مدل رگرسیونی بدست آمده coeffcients ضریب تغییر برای هر متغییر به صورت بالا گزارش شده است .
برای مشاهده ی نتایج تجزیه شامل مدل رگرسیونی ضرایب خط و آزمون های مرتبط از تابع summary() به صورت زیر استفاده می شود .
summary(lm)
Call: lm(formula = y ~ noekhodro + karkard + toleomr)
Residuals: Min 1Q Median 3Q Max -11.3418 -1.7241 -0.8158 0.8628 24.0185
Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -20.338845 14.350800 -1.417 0.1745 noekhodro 16.452360 6.029500 2.729 0.0143 * karkard 0.005846 0.046412 0.126 0.9012 toleomr 2.379211 1.030818 2.308 0.0338 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 6.847 on 17 degrees of freedom Multiple R-squared: 0.3298, Adjusted R-squared: 0.2115 F-statistic: 2.788 on 3 and 17 DF, p-value: 0.07218
همانگونه که در خروجی تابع ()summary مشاهده می شود مدل رگرسیونی به صورت y=20.338845+16.452360x با R^2=32.98% ارائه شده است .
نظرات
هیچ نظری وجود ندارد.
افزودن نظر
Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved