مدل های رگرسیون پر صفر

1402/06/14

دسترسی سریع

رگرسیون پر صفر مشکل دیگری که داده های تصادفات معمولاً با آن روبه رو می شود، فزونی داده های صفر است. به سخن دیگر، شمار داده های صفر ، بیش از شمار مورد انتظار در مدل های پواسن و دو جمله ای منفی است. برای برداشتن این کاستی ، پژوهشگران به مدل های رگرسیونی تازه ای برای در نظر گرفتن این داده های پرشمار صفر روی آورده اند. فرض اساسی در توزیع پر صفر آن است که اجزای راه مانند تقاطع ها و بخش های راه، دو حالت داشته باشد: 1- حالت داده تصادف واقعاً صفر یا حالت ذاتاً ایمن. هرچند برخی آن را حالت ایمن مجازی تعریف کرده اند تا مجبور به دفاع از ادعای ایمنی کامل آن بخش از راه نشوند. 2- حالت داده غیر صفر . در این حالت ممکن است در برخی دوره های زمانی، داده های صفر هم گزارش شوند. این حالت دارای یک توزیع آماری پواسن یا دوجمله ای منفی است. در حالت نخست تنها داده های صفر وجود دارد و در حالت دوم ، شمار تصادفات مانند داده هایی با توزیع پواسن یا دوجمله ای منفی است. حالت اول با احتمال و حالت دوم با احتمال روی می دهد. داده های تصادفات معمولاً داده هایی با دو سطح است که یک سطح آن بیشتر بخش معینی از راه و سطح دیگر می تواند دوره زمانی معینی از سال باشد. اگر ${y_{ij}}$ ، شمار تصادفات رخ داده در بخش i ام راه در دورۀ زمانی j ام دارای توزیع پر صفر پواسن (ZIP) باشد، تابع جرم احتمال آن به شکل زیر است: $P({y_{ij}}) =$ ${\omega _{ij}} + (1 - {\omega _{ij}})\exp ( - {\lambda _{ij}}),,{y_{ij}} = 0$ $(1 - {\omega _{ij}})\frac{{\exp ( - {\lambda _{ij}}){\lambda _{ij}}^{{y_{ij}}}}}{{{y_{ij}}!}},,{y_{ij}} > 0$ در مدل رگرسیون ZIP ، میانگین توزیع پواسن ${\lambda _{ij}}$ با تابع پیوندی لگاریتم طبیعی به رگرسیونی از بردار متغیرهای ناوابسته ${x_{ij}}$ و احتمال فرآیند صفر ( ${\omega _{ij}}$ ) با تابع پیوندی لاجیت به رگرسیونی از بردار متغیرهای ناوابسته ${z_{ij}}$ پیوند داده می شود: $\ln {\lambda _{ij}} = {{x'}_{ij}}\beta$ $\ln \left[ {\frac{{{\omega _{ij}}}}{{(1 - {\omega _{ij}})}}} \right] = {{Z'}_{ij}}\gamma$

$\beta$ و $\gamma$ برداری از ضرایب رگرسیون است. معمولاً برای سادگی برآورد، برای بردار ${z_{ij}}$ همان متغیرهای ناوابسته بردار ${x_{ij}}$ در نظر گرفته می شود. اگر داده های تصادفات علاوه بر مشکل صفرهای زیاد، دچار پراکندگی زیاد نیز باشد، مانند آنچه در مدل های رگرسیون دو جمله ای منفی بود از مدل رگرسیون دو جمله ای منفی پر صفر (ZINB) برای مدل سازی استفاده می شود.

متغیر شمارشی ${y_{ij}}$ با توزیع دو جمله ای منفی پر صفر تابع جرم احتمال زیر را دارد: $P({y_{ij}}) =$ ${\omega _{ij}} + (1 - {\omega _{ij}}){(1 + \alpha {\lambda _{ij}})^{ - 1/\alpha }},,,{y_{ij}} = 0$ $(1 - {\omega _{ij}})\frac{{\Gamma ({y_{ij}} + 1/\alpha )}}{{{y_{ij}}!\Gamma (1/\alpha )}}{(1 + \alpha {\lambda _{ij}})^{ - 1/\alpha }}$ ${\left[ {1 + \frac{1}{{\alpha {\lambda _{ij}}}}} \right]^{ - {y_{ij}}}},,{y_{ij}} > 0$ برای ازمودن مناسب بودن استفاده از یک مدل پر صفر به جای مدل های رگرسیون پواسن یا دو جمله ای منفی از آماره وانگ استفاده می شود.

نظرات

هیچ نظری وجود ندارد.

مدل های رگرسیون پر صفر

دسترسی سریع

نظرات

افزودن نظر

آخرین مقالات