تمرین درس R تمرین 9

1402/06/14

دسترسی سریع


نام دانشجو : سمانه ساعی فر

تعدادی داده داریم که برای شرکت ایران خودرو برای خودرو های مدل پژو 206 و پژو 206 صندوق دار است که می خواهیم آماره های توصیفی همبستگی متغییر ها با هم و مدل رگرسیونی و آزمون t.test را در نرم افزار R برای این داده ها انجام دهیم :

ردیف نوع خودرو مدل کارکرد (کیلومتر) کاهش قیمت (ريال) طول عمر (سال)
1 پژو 206 80 197,000 250,000,000 12
2 پژو 206 88 106,000 100,000,000 4
3 پژو 206 82 191,000 201,000,000 10
4 پژو 206 84 84,000 140,000,000 8
5 پژو 206 83 178,000 192,000,000 9
6 پژو 206 82 200,000 209,000,000 10
7 پژو 206 83 190,000 195,000,000 9
8 پژو 206 83 190,000 205,000,000 9
9 پژو 206 83 118,000 185,000,000 9
10 پژو 206 83 92,000 145,000,000 9
11 پژو 206 83 90,000 195,000,000 9
12 پژو 206 82 140,000 190,000,000 10
13 پژو 206 88 34,000 4,630,000,000 4
14 پژو 206 صندوق دار 90 30,000 190,000,000 2
15 پژو 206 صندوق دار 90 70,000 130,000,000 2
16 پژو 206 صندوق دار 88 34,000 4,630,000,000 4
17 پژو 206 صندوق دار 90 30,000 190,000,000 2
18 پژو 206 صندوق دار 90 70,000 130,000,000 2
19 پژو 206 صندوق دار 90 3,000 60,000,000 2
20 پژو 206 صندوق دار 88 50,000 220,000,000 4
21 پژو 206 صندوق دار 89 59,000 190,000,000 3
22 پژو 206 صندوق دار 88 68,000 185,000,000 4
23 پژو 206 صندوق دار 85 66,000 270,000,000 7
24 پژو 206 صندوق دار 88 60,000 210,000,000 4
داده ها را بصورت زیر در  نرم افزار R وارد می کنیم:

( noekhodro<-c(1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2< ( model<-c(80,88,82,84,83,82,83,83,83,83,83,82,88,90,90,90,88,89,88,85,88< ( karkard<-c(197,106,191,84,178,200,190,190,118,92,90,140,34,30,70,3,50,59,68,66,60< (y<-c(25,10,20.1,14,19.2,20.9,19.5,20.5,18.5,14.5,19.5,19,46.3,19,13,6,22,19,18.5,27,21<  ( toleomr<-c(12,4,10,8,9,10,9,9,9,9,9,10,4,2,2,2,4,3,4,7,4<

آماره های توصیفی

برای انجام آماره های توصیفی از summary() استفاده می کنیم :

 summary(noekhodro)< Min. 1st Qu. Median Mean 3rd Qu. Max. 1.000 1.000 1.000 1.429 2.000 2.000  summary(model)< Min. 1st Qu. Median Mean 3rd Qu. Max. 80.00 83.00 84.00 85.33 88.00 90.00  summary(karkard)< Min. 1st Qu. Median Mean 3rd Qu. Max. 3.0 60.0 90.0 105.5 178.0 200.0  summary(y)< Min. 1st Qu. Median Mean 3rd Qu. Max. 6.00 18.50 19.20 19.64 20.90 46.30  summary(toleomr)< Min. 1st Qu. Median Mean 3rd Qu. Max. 2.000 4.000 8.000 6.667 9.000 12.000

همانگونه که مشاهده می کنید  در خروجی تابع  summary() مشاهده می شود مینیمم -چارک اول -میانه-میانگین-چارک سوم  و ماکسیمم گزارش شده است .

واریانس ها به صورت زیر است :

 var(noekhodro)< [1] 0.2571429  var(model)< [1] 10.53333  var(karkard)< [1] 3961.962  var(y)< [1] 59.44857  var(toleomr)< [1] 10.53333

همبستگی متغییر ها با هم

( cor(model,y< [1] -0.1208848 ( cor(karkard,y< [1] 0.02002077 ( cor(toleomr,y< [1] 0.1208848 ( cor(model,karkard< [1] -0.8350232 ( cor(karkard,toleomr< [1] 0.8350232 ( cor(model,toleomr< [1] -1

آزمون T.test

ما فقط می توانیم کاهش قیمت را با نوع خودرو ازمون t.test  کنیم  که بدانیم بین  هر مدل خودرو و کاهش قیمت رابطه معنی داری وجود دارد یا خیر ؟!

مقدار p-value کمتر از 0.05 است پس فرض h صفر را رد می کنیم یعنی بین نوع خودرو و کاهش قیمت رابطه معنی داری وجود دارد .

t.test(y,noekhodro)>

Welch Two Sample t-test

data: y and noekhodro t = 10.802, df = 20.173, p-value = 7.735e-10 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: 14.69895 21.72962 sample estimates: mean of x mean of y 19.642857 1.428571

 

مدل رگرسیونی

در مثال زیر تابع ()lm به کار گرفته شده است تا نحوه ی اثر نوع خودرو و کارکرد و طول عمر آن بر کاهش قیمت y با استفاده از یک مدل رگرسیون ساده خطی تحلیل شود .در اینجا y متفیر وابسته (پاسخ) و noekhodro,karkard,toleomr متغیر مستقل هستند .

 lm(y~noekhodro+karkard+toleomr)<

:Call lm(formula = y ~ noekhodro + karkard + toleomr)

:Coefficients (Intercept)    noekhodro      karkard      toleomr -20.338845    16.452360     0.005846     2.379211 

در مدل رگرسیونی بدست آمده coeffcients ضریب تغییر برای هر متغییر به صورت بالا گزارش شده است .

برای مشاهده ی نتایج تجزیه شامل مدل رگرسیونی ضرایب خط و آزمون های مرتبط از تابع summary() به صورت زیر استفاده می شود .

 summary(lm)

Call: lm(formula = y ~ noekhodro + karkard + toleomr)

Residuals: Min 1Q Median 3Q Max -11.3418 -1.7241 -0.8158 0.8628 24.0185

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -20.338845 14.350800 -1.417 0.1745 noekhodro 16.452360 6.029500 2.729 0.0143 * karkard 0.005846 0.046412 0.126 0.9012 toleomr 2.379211 1.030818 2.308 0.0338 * --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 6.847 on 17 degrees of freedom Multiple R-squared: 0.3298, Adjusted R-squared: 0.2115 F-statistic: 2.788 on 3 and 17 DF, p-value: 0.07218

همانگونه که در خروجی تابع ()summary مشاهده می شود مدل رگرسیونی به صورت y=20.338845+16.452360x با R^2=32.98%  ارائه شده است .

نظرات

هیچ نظری وجود ندارد.


افزودن نظر

Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved