آموزش نحوه محاسبه تابع ZTP در نرم افزار Stata

1402/06/14

دسترسی سریع


در مواقعی که داده ها بر اساس شمارش باشند نمی توان از روش هایی چون رگرسیون معمولی OLS برای به دست آوردن تابع پیش بین استفاده نمود. در این حالت استفاده از روش هایی چون تابع ZTP برای محاسبه این تابع پیش بین مناسب است. اگر در یک مطالعه محققی بخواهد تابع پیش بین تعداد روز های ماندگاری در بیمارستان را با متغیر های چون سن بیماران، نوع بیمه درمانی و وضعیت حیات بیمار در مدت بستری بودن را ارائه دهد از تابع ZTP می تواند استفاده کند. این تابع برای براورد دقیق نیازمند حجم نمونه بالای 1000 مورد است. به منظور محاسبه تابع پیش بین پواسون انقطاعی صفر یا ZTP نرم افزار STATA دارای قابلیت های مناسبی است. ابتدا با دستور زیر وضعیت متغیر تعداد روز های بستری بودن را برای بیماران یک بیمارستان که مورد مطالعه قرار گرفتند، مشخص می کنیم. summarize stay Variable |       Obs        Mean    Std. Dev.       Min        Max -------------+-------------------------------------------------------- stay |      1493    9.728734    8.132908          1         74

نتایج نشان می دهد اطلاعات 1493 بیمار در فایل داده ها موجود بوده است. میانگین روز های بستری بودن 72/9 روز برای بیماران این بیمارستان است. اطلاعات سن در قالب طبقات 9 گانه و وضعیت بیمه درمانی و وضعیت حیات بیمار به صورت باینری وجود دارند. با ورود دستور histogram stay, discrete نیز می توان دیاگرام زیر را مشاهده نمود.

با دستورات زیر وضعیت متغیر های مستقل نیز مشخص می شود:

-> tabulation of age 

  Age Group |      Freq.     Percent        Cum. ------------+----------------------------------- 1 |          6        0.40        0.40 2 |         60        4.02        4.42 3 |        163       10.92       15.34 4 |        291       19.49       34.83 5 |        317       21.23       56.06 6 |        327       21.90       77.96 7 |        190       12.73       90.69 8 |         93        6.23       96.92 9 |         46        3.08      100.00 ------------+----------------------------------- Total |      1,493      100.00

بیشترین فراوانی در مورد طبقه سنی ششم و پنجم است.

-> tabulation of hmo 

        hmo |      Freq.     Percent        Cum. ------------+----------------------------------- 0 |      1,254       83.99       83.99 1 |        239       16.01      100.00 ------------+----------------------------------- Total |      1,493      100.00

همچنین نتایج حاکی از آن است که از این تعداد 1254نفر فاقد بیمه درمانی و 239 نفر دارای بیمه درمانی بوده اند.

-> tabulation of died 

       died |      Freq.     Percent        Cum. ------------+----------------------------------- 0 |        981       65.71       65.71 1 |        512       34.29      100.00 ------------+----------------------------------- Total |      1,493      100.00

همچنین نتایج حاکی از آن است که از این تعداد 512 نفر در مدت بستری بودن فوت کرده اند و 981 نفر نیز از بیمارستان مرخص شده اند. دستور زیر برای محاسبه این تابع در پنجره Command نرم افزار STATA وجود دارد.

ztp stay age hmo died

خروجی زیر حاصل محاسبه تابع در نرم افزار STATA است.

Iteration 0:   log likelihood = -6908.7992 Iteration 1:   log likelihood = -6908.7991 

Zero-truncated Poisson regression                 Number of obs   =       1493 LR chi2(3)      =     181.13 Prob > chi2     =     0.0000 Log likelihood = -6908.7991                       Pseudo R2       =     0.0129

------------------------------------------------------------------------------ stay |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval] -------------+---------------------------------------------------------------- age |   -.014442   .0050347    -2.87   0.004    -.0243099   -.0045742 hmo |  -.1359033   .0237419    -5.72   0.000    -.1824365   -.0893701 died |  -.2037709   .0183728   -11.09   0.000     -.239781   -.1677608 _cons |   2.435808   .0273324    89.12   0.000     2.382238    2.489379

در قسمت برازش تابع مشخص می شود که تابع کای اسکویر معنی دار است لذا متغیر های مستقل توانایی پیش بینی تعداد روز های بستری شدن در بیمارستان را دارند. تمام ضرایب متغیر های مورد مطالعه نیز به لحاظ آماری معنی دار هستند. برای به دست آوردن ضرایب تدقیق شده نیز دستور زیر را وارد می کنیم:

ztp stay age hmo died, robust

که حاصل به شرح زیر است:

Iteration 0:   log pseudolikelihood = -6908.7992 Iteration 1:   log pseudolikelihood = -6908.7991 

Zero-truncated Poisson regression                 Number of obs   =       1493 Wald chi2(3)    =      25.65 Prob > chi2     =     0.0000 Log pseudolikelihood = -6908.7991                 Pseudo R2       =     0.0129

------------------------------------------------------------------------------ |               Robust stay |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval] -------------+---------------------------------------------------------------- age |   -.014442   .0121867    -1.19   0.236    -.0383276    .0094436 hmo |  -.1359033   .0520484    -2.61   0.009    -.2379163   -.0338902 died |  -.2037709   .0491608    -4.14   0.000    -.3001242   -.1074175 _cons |   2.435808   .0708745    34.37   0.000     2.296897     2.57472

آماره والد در این روش نیز نشان می دهد که تابع دارای برازش کامل است. در این روش مشخص می شود که متغیر سن معنی دار نیست و نشان می دهد سن روی روز های بستری بودن در بیمارستان تاثیری ندارد. به دیگر سخن سن بیماران روی مدت زمان بستری بودن نقشی نداشته است. لیکن داشتن بیمه درمانی اثر منفی و معنی دار بر روی تعداد روز های بستری شدن از خود نشان می دهد. این ضریب در مورد مرگ و میر  نیز صادق است. تابع ZTP را می توان با دستور Ben Jann به شرح زیر وارد پنجره دستورات نمود. پیش از بررسی مورد مربوطه، درک روش حداکثر درست نمایی نیز بسیار کاربردی است.

quietly ztp

estout, cells(b(star fmt(%8.2f)) se(par fmt(%8.2f))) stats(ll chi2, fmt(%8.2f))

در این حالت می توان خروجی زیر را مشاهده نمود که در گزارش این تابع مورد استفاده قرار می گیرد.

model stay              -0.01 (0.01) hmo               -0.14** (0.05) died              -0.20*** (0.05) constant           2.44*** (0.07)           

log psuedo- likelihood  -6908.80 chi-squared       25.65

legend: coefficient/(standard error)  *** p<0.001

بنابراین متغیر های بیمه درمانی و وضعیت حیات بیماران در طول درمان عامل اصلی در تعیین تعداد روز های بستری بودن است. به عبارت دیگر داشتن یا نداشتن بیمه درمانی و همچنین زنده ماندن بیمار در طول درمان عامل اصلی تعیین کننده وضعیت تعداد روز های بستری شدن در بیمارستان است. مقدار لگاریتم مورد انتظار برای کسانی که دارای بیمه درمانی هستند 14/0- است که نسبت به کسانی است که فاقد این بیمه هستند اختلاف تعداد روز ها 25/1 روز است. این مقدار برای افراد فوت شده در طول درمان 20/0- است که برابر با 9/1 روز است.

منبع زیر را می توان برای کسب اطلاعات بیشتر استفاده نمود:

 • Long, J. S. 1997. Regression Models for Categorical and Limited Dependent Variables. Thousand Oaks, CA: Sage Publications.

نظرات

هیچ نظری وجود ندارد.


افزودن نظر

Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved