روش جک نایف و بوت استرپ

روشهای جک نایف، بوت استرپ و بازنمونه گیری در تحلیل داده های پیچیده

در تحلیل داده های پیچیده، معمولا الگوهای نمونه گیری ساختاری غیر i.i.d را برای داده ها در نظر می گیرند. لذا تکنیک های موجودی که برآورد نقطه ای و یا فواصل اطمینان وجود دارند معمولا برای این نوع از داده ها قابل اجرا نمی باشد. برای حل این مشکل می توان از روش های نمونه گیری مانند نمونه گیری تکراری یا بازنمونه گیری استفاده کرد که در آنها برآورد پارامتر بدون نیاز به شرط i.i.d بودن داده ها انجام می گیرد. از این روش ها می توان با قدرت محاسباتی زیاد همچنین دوری جستن از تئوری های پیچیده برای برآورد پارامتر مورد استفاده قرار گیرند.

روشهای بازنمونه گیری، خصوصا بوت استرپ و جک نایف، روش هایی هستند که بوسیله آنها می توان به راحتی برآوردگرهایی برای واریانس یافت و همچنین می توان فواصل اطمینان ناپاراتری را برای پارامترهای مورد نظر در جامعه به دست آورد. این روش ها از تئوری بسیار ساده ای نتیجه شده اند و استفاده از بازنمونه گیری را برای پارامتر مورد نظر  = (F) بر اساس یک نمونه تصادفی n تایی از i.i.d از جامعه ای با توزیع نامشخص F معرفی نمود و آن را بوت استرپ نامید. او نشان داد که این روش می تواند از دیگر رقبای خود بهتر باشد اما در این باره بحث های متفاوتی نیز وجود دارد که برای توضیح بیشتر می توان به” لو  و وو  “مراجعه کرد.

باز مقیاس گذاری بوت استرپ

بسیار ی از آمارها قابل نوشتن به صورت یعنی تابعی از میانگین نمونه هستند. ضرایب رگرسیون نسبت میانگین ها  و ضریب همبستگی از این نوع اند.

رائو و وو {۹} برای برآورد واریانس یک برآورد گر مانند  روشی با الگوریتم زیر در نظر گرفته اند:

۱)      استخراج نمونه ای با جایگذاری از نمونه اصلی

۲)      باز مقیاس گذاری هر عضو باز نمونه گیری شده.

۳)      محاسبه برآوردگر اصلی توسط بردار مقادیر باز مقیاس گذاری شده.

فاکتورهای باز مقیاس گذاری طوری انتخاب می شوند که واریانس بازنمونه گیری با واریانس معمولی در حالت

برآوردگرهای خطی برابر باشد.

در نمونه گیری طبقه ای اگر  مقادیر نمونه اصلی در طبقه ام و  نمونه ای تصادفی ساده از آن باشد، عامل باز مقیاس گذاری به صورت زیر تعریف می شود:

با استفاده از این عامل مقادیر بازنمونه گیری به صورت زیر با زمقیاس گذاری می شوند :

که در آن و به ترتیب میانگین نونه اصلی و باز نمونه گیر در طبقه h ام هستند. پس از این مرحله میانگین باز مقیاس گذاری، یعنی

محاسبه شده و سپس برآوردگر اصلی با استفاده از این میانگین بدست می آید

رائو و وو  ثابت کردند که با این الگوریتم برآوردگر نااریب برای توابع خطی از میانگین نمونه قابل دستیابی است. همچنین آنها الگوریتم های مختلفی را برای کلاس بزرگی از مدل های نمونه گیری با احتمالات نابرابر ارائه دادند. البته این روش معایبی دارد که برخی از مهمترین آنها عبارتند از :

۱)      محاسبه فاکتور باز نمونه گیری در الگوهای پیچیده نمونه گیری می تواند مشکل ساز باشد.

۲)      این روش حافظ دامنه تغییرات پارامتر نیست.

بوت استرپ با جایگذاری

این روش که دارای ساختار ساده ای است توسط مک کارتی و اسنودن معرفی شد. در الگوی نمونه گیری طبقه ای روش جک نایف با جایگذاری به این صورت است که نمونه ای تصادفی با جایگذاری در هر طبقه به حجم نمونه اصلی در آن طبقه به طور مستقل انتخاب می شود. پس از استخراج نمونه جک نایف بقیه مراحل مشابه قبل انجام می شود. از مزایای این روش می توان به سازگار بودن آن با ساختار بوت استرپ که نمونه ها به صورت با جایگذاری انتخاب می شوند اشاره کرد. این روش حالت خاصی از روش M.M است که بعدهای توسط سیتر معرفی شد. بنابر‌این تمام مورادی که برای روش M.M گفته می شود در این الگو نیز صادق است. حال می‌توان با نمونه حاصل و انجام رگرسیون به برآورد ضرایب دست یافت.

 

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگوها شرکت کنید؟
در گفتگو ها شرکت کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *