روش مونت کارلو در آزمون فرض ها

1402/06/14

دسترسی سریع


روش مونت کارلو در آزمون فرض ها

یک موضوع مهم در آزمون فرض، بررسی ادعا، گمان و حدسی درباره توزیع یا پارامترهای جامعه است. فرض کنید می خواهیم فرض {H_0} را در برابر {H_1} بیازماییم و آماره ی آزمون نیز U و مقدار مشاهده ی آن از نمونه تصادفی،{u_1} باشد. روشن است اگر توزیع آماره ی U تحت فرض {H_0} معلوم باشد، می توان پس از تعیین ناحیه بحرانی، آزمونی با اندازه آزمون (یا سطح آزمون) دلخواه انجام داد. ولی در بیشتر مسائل آزمون فرض، با مسائلی سروکار داریم که یافتن توزیع آن ها تحت فرض صفر غیرممکن و یا دشوار است. در این جا به بیان روش هایی برای چنین حالتی پرداخته می شود.

روش مونت کارلو

شبیه سازی به دو روش ایستا و پویا انجام می شود. در شبیه سازی ایستا زمان نقشی ندارد درحالی که شبیه سازی پویا در طول زمان انجام می گیرد. روش مونت کارلو، از نظر شبیه سازی یک روش ایستا بوده و برای حل مسائلی از دو نوع "غیرتصادفی" مانند محاسبه انتگرال معین و "تصادفی" مانند استنباط آماری استفاده می شود. یکی از کاربردهای روش مونت کارلو، حل مساله تصادفی آزمون فرض است که در ادامه بیان شده است:

تحت فرض {H_0}، m-1 مشاهده ی مستقل از آماره ی آزمونU شبیه سازی می کنیم، m=2,3, … و آن ها را {u_2},{u_3},...,{u_m} می نامیم. مشاهده های مرتب شده را به صورت {u_{(1)}},{u_{(2)}},...,{u_{(m)}} نشان می دهیم؛ یعنی {u_{(1)}} \le ... \le {u_{(m)}} .

روشن است در هر مساله آزمون فرض، بسته به فرض ها (یکطرفه و یا دوطرفه بودن آنها) و هم چنین آماره آزمون، ناحیه بحرانی متفاوت است. در ادامه سه دسته مهم آزمون فرض ها بررسی می شود:

دسته اول : اگر آماره ی آزمون به گونه ای باشد که با بزرگ بودن آن، انتظار رد فرض صفر را در برابر فرض مقابل داشته باشیم، منطقی است اگر رتبه {u_1} بزرگ تر از k یی در مجموعه {N_m} = \left\{ {1,...,m} \right\} شود، باید فرض صفر را در برابر فرض مقابل رد کنیم و بنابراین ناحیه بحرانی آزمون به صورت C = \{ \left. {{u_1}} \right|{u_1} \ge {u_{(k)}},\exists k \in {N_m}\} می شود.

اینک اگر بخواهیم اندازه ی آزمون برابر \alpha باشد، باید داشته باشیم : \frac{{m - k + 1}}{m} = \alpha . ولی در حالت کلی برای هر \alpha و m ای ، kیی در {N_m} پیدا نمی شود که در برابری بالا صدق کند؛ در صورتی که اگر سطح آزمون را \alpha فرض کنیم، k باید کوچک ترین عدد متعلق به مجموعه {N_m} باشد که در نابرابری k \ge m(1 - \alpha ) + 1 صدق می کند. بنابراین k = \left[ {m(1 - \alpha )} \right] + 1.

که در آن \left[ x \right] کوچک ترین عدد صحیح ناکمتر از x یا سقف x است . در نتیجه ناحیه بحرانی سطح \alpha به صورت  C = \{ \left. {{u_1}} \right|{u_1} \ge {u_{(\left[ {m(1 - \alpha )} \right] + 1)}}\}

می شود. همچنین بررسی مفهوم آزمون دو جمله ای نیز می تواند برای شما کاربردی باشد.

دسته دوم: اگر فرض های صفر و مقابل و آماره ی آزمون به گونه ای باشند که با بسیار کوچک شدن U، انتظار رد فرض صفر در برابر فرض مقابل داشته باشیم، منطقی است که {H_0} را در برابر {H_1} رد کنیم هرگاه رتبه {u_1} کوچک تر از k یی در {N_m} شود.

در این حالت ناحیه بحرانی سطح \alpha ، به صورت C = \{ \left. {{u_1}} \right|{u_1} \ge {u_{(k)}},\exists k \in {N_m}\} می شود. با استدلالی شبیه حالت اول، می توان نشان داد که k باید برابر با \left[ {m\alpha } \right] باشد؛ در نتیجه : C = \{ \left. {{u_1}} \right|{u_1} \le {u_{(\left[ {m\alpha } \right])}}\}

که در آن \left[ x \right]، جزء صحیح x، یعنی بزرگترین عدد صحیح نابیشتر از x است.

دسته سوم: فرض های صفر و مقابل و آماره ی آزمون را به گونه ای درنظر بگیرید که با بسیار کوچک و یا بزرگ شدن U، انتظار رد فرض صفر را در برابر فرض مقابل داشته باشیم. منطقی است که {H_0} را در برابر {H_1} رد کنیم هرگاه رتبه {u_1} بسیار بزرگ و یا بسیار کوچک شود. بنابراین :

C = \{ \left. {{u_1}} \right|{u_1} \le {u_{({k_1})}} \vee {u_1} \ge {u_{({k_2})}},\exists {k_1},{k_2} \in {N_m},{k_1} < {k_2}\}

در نتیجه اگر سطح آزمون را \alpha فرض کنیم، باید داشته باشیم : P({U_1} \le {U_{({k_1})}}) + P({U_1} \ge {U_{({k_2})}}) \le \alpha

بنابراین {k_1} و {k_2} باید به ترتیب بزرگ ترین و کوچک ترین عدد صحیح متعلق به {N_m} باشند که در نابرابری \frac{{{k_1}}}{m} + \frac{{m - {k_2} + 1}}{m} \le \alpha و یا هم ارزی آن، یعنی:{k_1} - {k_2} \ge m(1 - \alpha ) - 1 صدق کنند. برای گزینش درست زوج مرتب ({k_1},{k_2})، باید آگاهی کاملی درباره توزیع آماره ی U داشته باشیم. در حالت ویژه اگر دنباله ها را برابر بپنداریم، می توان نابرابری بالا را به صورت دو نابرابری \frac{{m - {k_2} + 1}}{m} \le \frac{\alpha }{2} و \frac{{{k_1}}}{m} \le \frac{\alpha }{2} نوشت. بنابراین ناحیه بحرانی سطح \alpha ، در این حالت به صورت C = \left\{ {\left. {{u_1}} \right|{u_1} \le {u_{(\left[ {m\frac{\alpha }{2}} \right])}} \vee {u_1} \ge {u_{(\left[ {m(1 - \frac{\alpha }{2}) + 1} \right])}}} \right\}

در می آید. ممکن است برای هریک از حالات ذکر شده، ناحیه بحرانی تهی به دست بیاید. برای انجام آزمون های فرض فوق می توان از "p- مقدار" نیز استفاده کرد.

در ادامه به چندین نکته در خصوص روش مونت کارلو اشاره می شود :

1- در روش مونت کارلو بر خلاف روش های کلاسیک آزمون فرض، نیازی به دانستن توزیع آماره ی آزمون تحت فرض صفر نداریم؛ تنها باید این آماره را تحت فرض صفر شبیه سازی کنیم.

2- تعداد شبیه سازی ها، m-1 ، باید در حد امکان زیاد باشد. میزان بزرگی آن به ساختار مساله بستگی دارد.

نظرات

هیچ نظری وجود ندارد.


افزودن نظر

Sitemap
Copyright © 2017 - 2023 Khavarzadeh®. All rights reserved