آخرین خبرها
خانه / روش های ناپارامتری

روش های ناپارامتری

روش های ناپارامتری

مقدمه:

در مباحث آزمون فرض استنباط هایی درباره پارامت های جامعه، همچون میانگین و نسبت ها، مطرح می باشد. از این رو آزمون هایی را تدارک می دیدیم که پارامترهای به دست آمده از نمونه ها را آزمون کنند. برای این آزمون ها ناچار بودیم فرض هایی بکنیم. مثلا فرض می کردیم توزیع جامعه مورد نمونه گیری نرمال است یا نمونه های اخذ شده مستقل از هم هستند و یا واریانس های دو جامعه برابرند. حال اگر این گونه فرض ها جایز نباشد، استفاده از این روش ها با اشکال مواجه می شود. آماردان ها در صدد برآمدند تا روش هایی ایجاد کنند که استفاده از آنها مشروط به فرض خاصی درباره توزیع جامعه نباشد، به اصطلاح برای (جامعه های آزاد – توزیع) نیز کاربرد داشته باشد. خوشبختانه روش های متعددی ارائه شده است، ولی به جای این که به روش های جامعه های آزاد – توزیع معروف باشند، از روی تسامح به (روش های ناپارامتری) معروف شده اند. همچنین می توان گفت که روش های ناپارامتری برای مقیاس های کیفی (رتبه ای) کاربرد دارد.

روش های ناپارامتری نسبت به روش های پارامتری محاسن و معایبی دارند. اولین حسن روش های ناپارامتری این است که مستلزم فرض خاصی درباره شکل توزیع جامعه نیستند. دوم این که فهم و استفاده از آن ها معمولا ساده تر از روش های پارامتری است. همچنین روش های ناپارامتری دو عیب دارند: اول این که فقط از قسمتی از اطلاعات استفاده می کنند و باعث اتلاف اطلاعات می شوند و دوم این که این روش ها کارایی و برش کمتری نسبت به روش های پارامتری دارند. مثلا فاصله اطمینان ۹۵ درصدی روش های ناپارامتری ممکن است دو برابر روش های پارامتری باشد. با توجه به مطالب فوق، در واقع ما در استفاده از روش های پارامتری یا ناپارامتری بده – بستان انجام می دهیم؛ چون در روش های ناپارامتری کمتر فرض می کنیم در نتیجه قدری از دقت و اطلاعات خود را از دست می دهیم، ولی در عوض حوزه کاربرد روش را گسترش می دهیم. قبل از ورود به بحث آزمون های نا پارامتری در طی جدول زیر روش های پارامتری و ناپارامتری را با هم مقایسه می کنیم.

آزمون های پارامتری ( متغییرهای کمی دارای توزیع نرمال یا نمونه بزرگ ) آزمونهای ناپارامتری ( متغییرهای غیر کمی یا متغییر های غیر نرمال کمی )
آزمون میانگین یک جامعه آزمون علامت ( آزمون دو جمله ای )
آزمون مقایسه میانگین دو جامعه وابسته ( آزمون مقایسه زوجها آزمون علامت زوج نمونه ای
آزمون مقایسه میانگین دو جامعه مستقل آزمون رتبه علامت دار ( ویلکا کسن )
آزمون تحلیل واریانس یک عامله ( برای نمونه های مستقل ) ندارد آزمون U ( من – ویتنی )
ضریب همبستگی پیرسون ندارد آزمون H ( کروسکال – والیس ) ( برای نمونه های مستقل )
آزمون فرید من ( برای نمونه های وابسته )
ضریب همبستگی اسپیر من
آزمون مبتنی بر ردیفهای ( آزمون گردش )

جدول مقایسه آزمون های پارامتری و ناپارامتری

آزمون علامت :

اولین روش ناپارامتری که معرفی خواهیم کرد آزمون علامت است. به خاطر آورید که آزمون t برای فرض 1، بر این فرض مبتنی بود که نمونه از جامعه ای نرمال گرفته اشده است. وقتی این فرض درست نباشد، یکی از روش های آزمون فرض 1روش آزمون علامت است. آزمون علامت نیز خود به ( آزمون علامت یک نمونه ای ) و ( آزمون علامت زوج نمونه ای ) تفکیک می شود.

آزمون علامت یک نمونه ای:

این آزمون موقعی به کار می رود که می خواهیم از جامعه متقارن پیوسته ای نمونه بگیریم به طوری که احتمال این که عددی کوچک تر از میانگین یا بزرگ تر از آن باشد2 است. در این آزمون می خواهیم صحت فرض 1، که آن را فرض صفر می نامیم و 3که میانگین نمونه است، با توجه به نمونه n تایی آزمون کنیم. روش بدین صورت است که هر یک از مقادیر نمونه را از میانگین مورد ادعا، 1، کم می کنیم. اگر تفاضل مثبت بود علامت + و اگر منفی بود علامت – را می نویسیم و اگر تفاضل صفر بود، آن نمونه را حذف می کنیم. هر نمونه 2شانس دارد که به آن علامت + داده شود؛ بنابراین تعداد علامت های مثبت توزیع دو جمله ای با پارامترهای n و np  دارد که در آن 2 است اگر تعداد نمونه کم باشد، برای آزمون فرض به جدول احتمال های تجمعی دو جمله ای ( جدول ۷ پیوست ) مراجعه می کنیم، ولی اگر n بزرگ باشد توزیع نرمال تقریب خوبی برای دو جمله ای است و به جدول Z پیوست جدول ۲ مراجعه می کنیم .

مثال:

اداعا می شود که درجه اکتان نوعی بنزین کمتر از ۹۸/۵ است. با توجه به نمونه ۱۵ تایی زیر آزمون کنید که آیا در سطح معنی دار ۵ درصد می توان ادعای فوق را پذیرفت؟

۹۵/۳ ۱۰۰/۳ ۹۷/۴ ۹۶/۸ ۹۶/۰ ۹۷/۳ ۹۵/۲ ۹۷/۵
۹۴/۴ ۹۸/۵ ۹۸/۲ ۹۷/۶ ۹۶/۱ ۹۹/۱ ۹۳/۲
  • فرض ها :

2

  • آماره آزمون: n = 14 و a = 0/05 ( چون یکی از نمونه ها به طور دقیق برابر ۹۸/۵ است آن نمونه حذف می شود، بنابراین n = 14 است). اگر هر عدد بزرگ تر از ۹۸/۵ را با علامت + و هر عدد کوچک تر از آن را با علامت – نشان دهیم و اعداد مساوی ۹۸/۵ را حذف کنیم، خواهیم داشت:
  • 1
  • مقدار بحرانی: 1که در آن X تعداد علامت های مثبت است.

اگر x کوچک تر یا مساوی ۳ باشد فرض صفر رد می شود. مقدار 1را از جدول ۷ پیوست به دست آورده ایم.طرز پیدا کردن عدد ۳ بدین صورت بوده است که با n = 14 و P = 0.5 دنبال عددی برای c می گردیم که Untitled، بنابراین نزدیک ترین مقدار کوچک تر یا مساوی ۰/۰۵ مقدار ۰/۰۲۹ است که متناظر با c = 3 است.

  • تصمیم گیری : چون X = 2 کوچک تر و مساوی 1است، بنابراین در ناحیه بحرانی قرار گرفته و فرض صفر رد می شود، از این رو می توان ادعا کرد که میانگین اکتان بنزین مورد نظر کمتر از  ۹۸/۵ است.

گفتیم که برای نمونه های زیاد، یعنی وقتی np و nq هر دو بزرگ تر از ۵ باشند، می توان به جای توزیع دو جمله ای از تقریب نرمال استفاده کرد. در این صورت آماره آزمون عبارت خواهد بود از :

Untitled

که تقریبا توزیع نرمال استاندار دارد ( x تعداد علامت های + است .)

مثال:

داده های زیر میزان بدهی های جاری شرکت ( بر حسب میلیون ریال ) در انتهای ۴۰ ماه مختلف است که با توجه به تراز های آزمایشی به دست آمده است:

۳۵ ۴۰ ۳۹ ۴۶ ۲۸ ۴۵ ۵۶ ۳۶ ۵۰ ۳۹
۵۱ ۲۷ ۳۷ ۵۲ ۶۰ ۳۵ ۷۰ ۴۲ ۸۰ ۳۱
۳۵ ۳۷ ۴۲ ۳۰ ۳۷ ۴۲ ۵۲ ۶۱ ۵۴ ۶۱
۳۶ ۳۴ ۵۰ ۴۵ ۵۲ ۶۰ ۵۵ ۳۹ ۳۲ ۴۲

بانک ادعا می کند که میانگین بدهی های جاری شرکت بیش ا ز ۳۸ میلیون ریال است. با آزمون علامت، صحت ادعای بانک را در سطح معنی دار ۵ درصد آزمون کنید.

  • فرض ها :
  • 1
  • آماره آزمون: تعداد علامت های مثبت، مقادیر بزرگ تر از ۳۸، برابر ۲۶ است؛ بنابراین:
  • 1
  • مقدار بحرانی : داریم n = 14 و a = 0.05 ، پس :
  • 1
  • تصمیم گیری: چون 1بیشتر است فرضیه صفر مردود است؛ بنابراین می توان گفت که میانگین بدهی های جاری شرکت بیشتر از ۳۸ میلیون ریال است.

آزمون علامت زوج نمونه ای

از آزمون علامت نیز می توان برای داده های زوجی استفاده کرد. در چنین مسائلی هر زوج را در نظر می گیریم؛ اگر مقدار اولی بیشتر از دومی باشد علامت + و اگر کمتر باشد علامت – قرار می دهیم و اگر دو مقدار مساوی باشند آنها را کنار می گذاریم. سپس همانند آزمون علامت یک نمونه ای، اگر حجم نمونه کم باشد از جدول توزیع دو جمله ای ( جدول احتمال های تجمعی دو جمله ای پیوست ) و اگر حجم نمونه زیاد باشد، np و nq هر دو بزرگ تر از ۵، از جدول توزیع نرمال استاندارد ( جدول Z پیوست، جدول ۲ ) برای برگزاری آزمون استفاده می کنیم.

مثال:

داده های زیر درجه رضایت شغلی ۱۰ نفر از کارکنان سازمانی را قبل و بعد از یک سیستم مدیریتی جدید نشان می دهد. آیا در سطح معنی دار ۵ درصد می توان ادعا کرد که سیستم تشویقی موثر بوده است؟

۴۵ ۶۸ ۸۵ ۵۹ ۵۰ ۷۳ ۶۹ ۷۴ ۷۱ ۷۰ قبل از سیستم مدیریت جدید
۴۵ ۸۷ ۶۹ ۵۸ ۶۴ ۸۰ ۷۵ ۷۰ ۶۸ ۷۵ بعد از سیستم مدیریت جدید
  • فرض ها :
  • 2

که 3به ترتیب میانگین رضایت شغلی قبل و بعد از سیستم مدیریتی جدید است.

  • آماره آزمون : تعداد علامت های مثبت ۴ تاست، یعنی X = 4
  • 1
  • مقدار بحرانی : داریم ،2 پس:
  • Untitled
  • تصمیم گیری: چون X = 4 کمتر و یا مساویUntitled نیست، نمی توان فرض صفر را رد کرد؛ بنابراین سیستم مدیریتی جدید باعث افزایش رضایت شغلی نشده است.

مثال:

این داده ها ارزیابی دو ارزیاب از میزان موفقیت ۲۰ کارمند شرکتی، در مقیاس ۱ تا ۳۰ است. در سطح معنی دار ۵ درصد با استفاده از آزمون علامت زوج – نمونه ای آزمون کنید که آیا تفاوتی بین ارزیابی دو ارزیاب وجود دارد یا نه؟

۲۵ ۲۴ ۲۷ ۲۸ ۲۱ ۲۸ ۲۰ ۱۵ ۲۶ ۲۳ ۱۷ ۲۵ ۳۰ ۲۲ ۱۹ ۲۰ ۱۷ ۱۹ ۲۵ ۲۸ ارزیابی ارزیاب اول
۲۷ ۲۱ ۲۲ ۲۶ ۲۳ ۲۴ ۱۵ ۱۷ ۲۶ ۲۱ ۲۰ ۲۲ ۲۷ ۱۸ ۱۹ ۲۳ ۱۵ ۱۲ ۲۵ ۲۳ ارزیابی ارزیاب دوم
  • فرض ها :
  • 1
  • آماره آزمون: تعداد علامت های مثبت، x، برابر ۱۲ است.
  • 1
  • مقادیر بحرانی:1
  • تصمیم گیری: چون Z = 1.698 بین ۱٫۹۶ و ۱٫۹۶– قرار دارد، نمی توان فرض صفر را رد کرد، بنابراین ارزیابی دو ارزیاب یکسان است.

آزمون رتبه علامت دار (Wilcoxon)

آزمون علامت که در قسمت قبل بحث شده ساده است، ولی چون مقادیر کمتر یا بیشتر از 1را با علامت – و + نشان داده و تنها از آنها در آزمون استفاده می کند باعث از دست دادن میزان قابل ملاحظه ای از اطلاعات می شود. دو مجموعه تفاضل های زوجی را، که در شکل بعد به صورت نقطه در روی محور اعداد رسم شده است، با هم مقایسه کنید. در هر دو حالت الف و ب، n = 6 است که تعداد علامت های مثبت ۴ تاست، ولی حالت ب مبین انتقال بیشتر توزیع به سمت راست است، زیرا تفاضل های مثبت بیش از تفاضل های منفی از صفر دورند، اما آزمون علامت فرقی بین این دو قائل نمی شود و به نتایج یکسانی برای هر دو منجر می شود.

Untitled

دو نمودار از تفاضل های زوجی یا تعداد علامت + مساوی، ولی توزیع های مختلف

کاری که ( آزمون رتبه علامت دار) می کند این است که وزن های بیشتر را به علامت هایی می دهد که از صفر دورند. در آزمون رتبه علامت دار، تفاضل های زوجی بر حسب قدر مطلق مقادیرشان مرتب می شوند. تفاضل های صفر را باز هم کنار می گذاریم و اگر قدر مطلق دو یا چند تفاضل یکسان باشند به هر یک از آنها میانگین رتبه هایی را که تواما اشتغال می کنند، تخصیص می دهیم. برای تشکیل آماره آزمون 1، رتبه های مربوط به مشاهدات مثبت را با هم جمع می کنیم.

برای مقادیر کوچک n ، آزمون فرض صفر چه برای آزمون یک نمونه ای و چه برای آزمون زوج – نمونه ای مبتنی بر جداول خاصی است، ولی برای مقادیر بزرگ ، توزیع 1تقریبا نرمال است و برای انجام آزمون نیاز به امید ریاضی و واریانس آن داریم.

تحت نظر فرض صفر، امید ریاضی و واریانس عبارت است از:

1

و:

1

مثال:

داده های زیر مربوط به وزن ۱۵ نفر قبل و بعد از رژیم غذایی خاصی است. با به کارگیری آزمون رتبه علامت دار در سطح معنی دار ۵ درصد، آیا می توان گفت رژیم غذایی در کاهش وزن موثر بوده است؟

قبل از رژیم ۸۳/۱ ۹۵/۲ ۸۶/۳ ۹۸/۳ ۹۵/۰ ۱۰۴/۸ ۹۳/۰ ۸۸/۱ ۹۰/۵ ۸۰/۱ ۸۹/۶ ۸۸/۱ ۱۰۵/۴ ۱۰۰/۱ ۱۱۰/۱
بعد از رژیم ۷۸/۱ ۸۸/۴ ۹۴/۵ ۹۱/۴ ۸۹/۱ ۱۰۵/۱ ۹۱/۱ ۸۰/۳ ۸۹/۱ ۷۳/۵ ۶۹/۰ ۷۸/۰ ۱۰۰/۱ ۹۹/۲ ۱۲۱/۷
  • فرض ها :
  • Untitled
  • آماره آزمون:
تفاضل های زوجی ۵ ۶٫۸ – ۸٫۲ ۶٫۹ ۵٫۹ – ۰٫۳۱ ۹۷٫۸۱ ۴۶٫۶۲ ۰٫۶ ۱۰٫۱ ۵٫۳ ۰٫۹ – ۱۱٫۶
قدر مطلق مرتب شده ۰٫۳ ۰٫۹ ۱٫۴ ۱٫۹ ۵٫۰ ۵٫۳ ۵٫۹ ۶٫۶ ۶٫۸ ۶٫۹ ۷٫۸ ۸٫۲ ۱۰٫۱ ۱۱٫۶ ۲۰٫۶
رتبه ها ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹ ۱۰ ۱۱ ۱۲ ۱۳ ۱۴ ۱۵
علامت ها + + + + + + + + + + + +

Untitled

۳- مقدار بحرانی :1

۴- تصمیم گیری: چون Z = 1.874 بیشتر از ۱٫۶۴۵ است، بنابراین فرض صفر مردود است و می توان گفت رژیم غذایی در کاهش وزن افراد موثر بوده است. گفتیم که اگر قدر مطلق دو یا چند تفاضل یکسان باشد به هر یک از آنها میانگین رتبه هایی را که تواما اشغال می کنند، تخصیص می دهیم. مثلا فرض کنید قدر مطلق تفاضل سومین و چهارمین مشاهده برابر باشد، در این صورت رتبه هر یک از آنها با 1برابر است و یا اگر قدر مطلق تفاضل هشتمین، نهمین و دهمین مشاهده برابر باشد، آن گاه رتبه هر یک از آنها با 1برابر است.بقیه مراحل همانند مثال قبل خواهد بود.

مثال :

ارزیابی دو ارزیاب، در مقیاس ۰ تا ۲۰، از عملکرد ۲۰ نفر از کارکنان سازمانی را انتخاب کرده ایم که به این صورت بوده است:

ارزیاب یک ۱۸ ۱۹ ۱۳ ۱۵ ۱۴ ۱۷ ۱۸ ۱۲ ۱۴ ۱۷ ۱۳ ۱۸ ۱۶ ۱۷ ۱۵ ۱۲ ۱۱ ۱۹ ۱۵ ۱۱
رزیاب دو ۱۳ ۱۲ ۱۱ ۱۸ ۱۰ ۱۴ ۱۵ ۱۵ ۱۲ ۱۹ ۱۳ ۱۳ ۱۶ ۱۳ ۱۷ ۱۰ ۱۱ ۱۴ ۱۲ ۱۳

با استفاده از آزمون رتبه علامت دار تعیین کنید که آیا در سطح معنی دار ۵ درصد میانگین ارزیابی این دو ارزیاب با هم متفاوت است یا نه؟

  • فرض ها :

Untitled

  • آماره آزمون: n=17 (چون سه تا از ارزیاب ها با هم مساوی بوده اند، حذف شده اند).
تفاضل های زوجی ۵ ۷ ۲ ۴ ۳ ۳ ۲ ۵ ۴ ۲ ۵ ۳
قدر مطلق مرتب شده ۲ ۲ ۲ ۲ ۲ ۲ ۳ ۳ ۳ ۳ ۳ ۴ ۴ ۵ ۵ ۵ ۷
رتبه ها ۳٫۵ ۳٫۵ ۳٫۵ ۳٫۵ ۳٫۵ ۳٫۵ ۹ ۹ ۹ ۹ ۹ ۱۳ ۱۳ ۱۵ ۱۵ ۱۵ ۱۷
علامت ها + + + + + + + + + + + +

Untitled

2

  • مقدار بحرانی:Untitled
  • تصمیم گیری: چون Z = 2.272 بین ۱٫۹۶ و ۱٫۹۶- قرار نمی گیرد، فرض صفر رد می شود؛ بنابراین ارزیابی این دو ارزیاب یکسان نیست.

آزمون های مجموع رتبه ها:

در آزمون مجموع رتبه ها می خواهیم ببینیم که آیا نمونه ها از جامعه های پیوسته ی ( یکسانی ) هستند ( میانگین های یکسانی دارند) یا اینکه جامعه ها یکسان نیستند ( میانگین های متفاوتی دارند) شکل بعد را ملاحظه کنید که در آن فرض یکسان بودن جامعه ها را فرض صفر می نماییم. در این جا مجبور نیستیم فرض کنیم که جامعه های مورد نمونه گیری توزیع نرمال دارند. اگر قضاوت درباره نمونه های گرفته شده از دو جامعه را بخواهیم مقایسه کنیم از ( آزمون U )، که گاهی آن را آزمون ( ویلکا کسن ) و یا آزمون ( من – ویتنی ) می نامند استفاده می کنیم. ولی اگر نمونه های گرفته شده از K جامعه باشد از ( آزمون H )، که گاهی آن را آزمون ( کروسکال – والیس ) می نامند بهره می بریم.

Untitled

آزمونهای مجموع رتبه ها: ( آزمون U)

در این روش می خواهیم فرض یکسانی دو جامعه را با توجه به نمونه های گرفته شده از دو جامعه آزمون کنیم. مراحل کار بدین صورت است که ابتدا تمام مقادیر نمونه را به ترتیب صعودی مرتب می کنیم و سپس به آنها رتبه های ۱ ، ۲ ، … می دهیم. سپس مجموع رتبه های هر یک از دو نمونه را به دست آورده، آنها را با 1نشان می دهیم. اگر اختلاف قابل توجهی بین میانگین های دو جانبه موجود باشد، اغلب رتبه های پایین به احتمال زیاد مربوط به مقادیر یک نمونه و رتبه های بالا به احتمال زیاد مربوط به مقادیر نمونه دیگر خواهد بود. اگر تعداد نمونه های جامعه های اول و دوم را با1 نشان دهیم در این صورت:

1

خواهد بود ( جمع جبری n عدد صحیح مثبت با شروع از یک برابر است با1 ). در عمل، معمولا از آماره های استفاده می کنیم که عبارتند از:

1

یا از آماره1 استفاده می کنیم. آزمون های حاصل همه مبتنی بر 1هستند، ولی این مزیت را دارند که در تشکیل جدول مقادیر بحرانی انعطاف پذیری بیشتری از خود نشان می دهند.

برای مقادیر کوچک1 آزمون های مجموع رتبه ای تحت فرض صفر، یکسان بودن جامعه ها، مبتنی بر جدوال خاصی هستند، ولی وقتی 1هر دو بزرگ تر از ۸ باشند توزیع 1تقریبا نرمال است و برای انجام آزمون به امید ریاضی و واریانس 1نیاز داریم.

تحت فرض صفر، میانگین ها و واریانس های 1عبارتند از:

1

مثال: داده های زیر عمر دو نوع لامپ مهتابی است که به ساعت گرد شده اند:

نوع اول ۱۷۷۰۲ ۱۶۸۷۳ ۱۵۴۷۴ ۱۹۶۴۷ ۱۷۶۸۳ ۱۵۸۴۷ ۱۶۹۹۹ ۱۶۶۸۹ ۱۷۸۷۷
نوع دوم ۱۶۷۰۱ ۱۷۸۷۱ ۱۶۷۴۸ ۱۸۵۴۲ ۱۴۳۴۵ ۱۵۵۹۶ ۱۶۸۷۹ ۱۷۶۸۶ ۱۷۴۱۱ ۱۶۸۷۸

با استفاده از آزمون U تعیین کنید که آیا در سطح معنی دار ۵ درصد می توان گفت که میانگین عمر لامپ نوع اول بیشتر از نوع دوم است؟

  • فرض ها:

Untitled

  • آماره آزمونUntitled است.
داده های مرتب شده ۱۴۳۴۵ ۱۵۴۷۴ ۱۵۵۹۶ ۱۵۸۴۷ ۱۶۶۷۸ ۱۶۷۰ ۱۱۷۴۸ ۱۶۸۷۳ ۱۶۸۷۸ ۱۶۸۷۹
نمونه ۲ ۱ ۲ ۱ ۱ ۲ ۲ ۱ ۲ ۲
رتبه ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹ ۱۰
۱۶۹۹۹ ۱۷۴۱۱ ۱۷۶۸۳ ۱۷۶۸۶ ۱۷۷۰۲ ۱۷۸۷۱ ۱۷۸۷۷ ۱۸۵۴۲ ۱۹۶۴۷
۱ ۲ ۱ ۲ ۱ ۲ ۱ ۲ ۱
۱۱ ۱۲ ۱۳ ۱۴ ۱۵ ۱۶ ۱۷ ۱۸ ۱۹

بنابراین مجموع رتبه اول Untitledاست. پس:

Untitled

  • مقدار بحرانی:Untitled
  • تصمیم گیری: چون Z = 0.33 از Untitledکمتر است نمی توان فرض صفر را مردود دانست؛ بنابراین میانیگن عمر دو نوع لامپ مهتابی یکسان است.

آزمون های مجموع رتبه: آزمون H

همان طور که قبلا گفتیم، آزمون H تعمیم آزمون U برای مقایسه K جامعه است. به عبارت در این آزمون می خواهیم فرض برابری میانگین های K جامعه را آزمون کنیم. این آزمون نیز بر مجموع رتبه های مشاهدات مبتنی است. این آزمون شبیه به تحلیل واریانس است با این تفاوت که نیازی به فرض نرمال بودن جامعه ها ندارد و به جای استفاده از خود داده ها از رتبه آن ها استفاده می کند.

روش بدین صورت است که ابتدا مجموع رتبه ها را برای نمونه I ام2 پیدا می کنیم و سپس آماره H را که آزمون بر آن مبتنی است به صورت ذیل حساب می کنیم.

Untitled

که K تعداد جامعه و Untitledاست:

اثبات می شود که آماره فوق دارای توزیع کای – مربع، Untitled، یا K-1 درجه آزادی است.

مثال:

برای مقایسه میزان فروش ماهانه سه شعبه یک شرکت زنجیره ای، نمونه های تصادفی از فروش های ماهانه آنها گرفته شده است که در جدول زیر می آید:

فروش ماهانه بر حسب میلیون ریال
شعبه سوم شعبه دوم شعبه اول
۹۸۴۰ ۵۶۳۰ ۸۰۱۰
۶۹۵۰ ۷۸۴۰ ۱۳۴۱۰
۷۸۱۰ ۵۹۸۰ ۱۰۴۹۰
۶۴۳۰ ۹۶۱۰

با استفاده از آزمون H، در سطح معنی دار ۵ درصد بررسی کنید که آیا میانگین فروش سه شعبه با هم برابر است؟

  • فرض ها :
  • 1
  • آماره آزمون: با رتبه بندی مشاهدات از ۱ تا ۱۱ این جدول به دست می آید.
جدول رتبه بندی
شعبه سوم شعبه دوم شعبه اول
۹ ۱ ۷
۴ ۶ ۱۱
۵ ۲ ۱۰
۳ ۸
 5  5  5

پس :

1

  • مقدار بحرانی : K = 3 و a=0.05 ، بنا براین:

5

  • تصمیم گیری: چون H = 5.932 بیشتر از 5نیست نمی توان فرض صفر را مردود دانست، بنابراین می پذیریم که میانگین های فروش سه شعبه برابرند.

آزمون مبتنی بر ردیفها ( آزمون استقلال )

یکی از فرضیه های مهمی که دراین قسمت داریم، که حتی مهم تر از توزیع نرمال نیز بوده، فرض تصادفی بودن نمونه است. آزمون های مختلفی برای آزمون تصادفی بودن نمونه وجود دارد آنها بر اساس نظریه ردیف هاست که در آن یک ردیف عبارت است از توالی حروف واحد یا هر علامت دیگری که قبل و بعد از آنها ممکن است تحروف دیگری قرار گرفته باشد و یا اصلا چیزی نباشد. مقلا میخواهیم ببینیم که ترتیب کاشت درختان سرو و کاج در خیابانی تصادفی است یا نه، بدین جهت درختان قسمتی از خیابان را به ترتیب یادداشت کرده ایم که به این صورت (حرف ک) (برای کاج ) و (س) ( برای سرو ) است:

Untitled

با استفاده از آکولاد برای تلفیق حروفی که تشکیل یک ردیف را می دهند، معلوم می شود که در توالی فوق ۱۱ ردیف وجود دارد. اگر کاشت درختان سرو کاج مستقل تصادفی باشند، آنگاه ترتیب مشاهدات نباید تشکیل روندی را بدهد و همچنین نباید تشکیل خوشه و گروه بدهد. همچنین اگر تعداد ردیفها خیلی زیاد باشد ممکن است به یک نوع الگوی تناوبی مشکوک شویم. در مثال فوق ظاهرا نوع الگوی خوشه ای در کشت درختان سرو و کاج وجود دارد که برای نتیجه گیر قطعی باید از آزمون فرض کمک بگیریم.

اگر تعداد حروف نوع اول و دوم را به ترتیب با 1 و تعداد ردیف ها را با R نشان دهیم، وقتی1 کوچک باشند،فرض صفر تصادفی بودن ترتیب حروف مبتنی بر جداول خاصی است. اگرUntitled باشد می توان از تقریب نرمال استفاده کرد. تحت فرض صفر تصادفی بودن نمونه، امید ریاضی و واریانس R عبارت اند از:

1

مثال: با مراجعه با مثال بالا فرض تصادفی بودن ترتیب درختان سرو و کاج را در سطح معنی دار ۵ درصد آزمون کنید.

  • فرض ها:
  • 2
  • آماره آزمون: Untitled ، پس:

 Untitled

  • مقادیر بحرانیUntitled
  • تصمیم گیری: چون Z= -0.72 بین ۱٫۹۶ و ۱٫۹۶- قرار می گیرد نمی توان فرض تصادفی بودن کشت درختان سرو و کاج را مردود دانست.

روشی که در بالا مطرح شد به تصادفی بودن رشته ای از حروف یا هر علامت دیگری منحصر نیست و می توان آن را به نمونه های عددی نیز تعمیم داد.

در این صورت می توان حروفی، مثلا a برای بالا و b برای پایین مقدار همچون میان را به کار برد اعدادی هم که برابر میانه باشند حذف می شوند و سپس توالی حروف ایجاد شده را بر پایه تعداد کل ردیف ها آزمود و نسبت به تصادفی مستقل بودن مقادیر عددی در بالا و پایین قضاوت کرد.

مثال:

فرض کنید اعداد زیر معرف قیمت نوعی سهام بر حسب ده هزار ریال در بازار سهام در ۴۰ روز متوالی باشد. آیا در سطح معنی دار ۵ درصد می توان به تصادفی بودن قیمت های هر روز قائل شد؟

۵۴,۵۳,۵۲,۵۴,۵۳,۵۳,۵۳,۵۱,۵۲,۵۵,۵۴,۵۶,۵۴,۵۵,۵۶,۵۵,۵۳,۵۵,۵۴,۵۴

۵۵,۵۷,۵۶,۵۶,۵۶,۵۵,۵۴,۵۴,۵۴,۵۵,۵۶,۵۶,۵۷,۵۷,۵۸,۶۱,۵۹,۵۸,۵۶,۵۶

میانه اعداد فوق ۵۵ است. اگر a را برای اعداد بزرگ تر از ۵۵ و b را برای اعداد کوچک تر از ۵۵ در نظر بگیریم و اعداد برابر ۵۵ را حذف کنیم، خواهیم داشت:

Untitled

  • فرض ها:
  • Untitled
  • آماره آزمون: 1 ، پس:

 1

  • مقادیر بحرانی :Untitled
  • تصمیم گیر: چون Z = -3.35 در خارج از ۱٫۹۶ و ۱٫۹۶- قرار می گیرد، می تون فرض تصادفی بودن مقیر فوق را مردود دانست.

ضریب همبستگی رتبه ای ( اسپیرمن)

گاهی اوقات روش های ناپارامتریک را که بر شرایط معمولی تر مبتنی اند به جای آن به کار می بریم. فرض صفر در این آزمون بدین معناست که همبستگی وجود ندارد. ضریب همبستگی رتبه ای را با 1نشان می دهیم. گاهی ضریب همبستگی رتبه ای، به افتخار مبتکر آن، ضریب همبستگی رتبه ای اسپیرمن خوانده می شود.

طرز محاسبه ضریب همبستگی رتبه ای برای داده های زوجی Untitled و برای i=1,2,…,n بدین صورت است: ابتدا به تمام X ها بر حسب مقادیرشان رتبه می دهیم و همین کار را برای y ها نیز انجام می دهیم، سپس تفاضل بین رتبه های هر زوج را که با Untitledنشان می دهیم حساب می کنیم. در مرحله بعد توان دوم d ها را محاسبه کرده، در نهایت با استفاده از این فرمول ضریب همبستگی رتبه ای را حساب می کنیم:

Untitled

مثال: داده های زیر مربوط به ضریب هوشی۱۳ (IQ)  زوج جوان است. ضریب همبستگی رتبه ای را برای آن حساب کنید.

زوج ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹ ۱۰ ۱۱ ۱۲ ۱۳
IQ شوهر ۹۵ ۱۲۵ ۸۳ ۸۶ ۱۰۰ ۷۵ ۹۹ ۹۵ ۱۱۵ ۸۸ ۹۱ ۸۴ ۱۰۴
IQ زن ۸۳ ۱۰۷ ۷۸ ۹۴ ۱۰۶ ۷۰ ۸۵ ۱۰۱ ۱۰۶ ۸۰ ۱۰۰ ۸۲ ۱۰۶

ابتدا X ها و y ها را رتبه بندی کرده، سپس تفاضل آنها و توان دوم تفاضل را حساب می کنیم.

زوج ۱ ۲ ۳ ۴ ۵ ۶ ۷ ۸ ۹ ۱۰ ۱۱ ۱۲ ۱۳
رتبه x 7.5 13 2 4 10 1 9 7.5 12 5 6 3 11
رتبه y 5 13 2 7 10 1 6 8 10 3 12 4 10
d 2.5 0 0 -3 0 0 3 -1 2 2 -6 -1 1
d 2 6.25 0 0 9 0 0 9 0.3 4 4 36 1 1

و1 . بنابراین:

1

اگر ضریب همبستگی پیرسون r را برای این مثال حساب کنیم مقدار r =0.78 به دست می آید که به ضریب همبستگی رتبه ای 5بسیار نزدیک است. به دلیل سادگی گاهی از 1به جای r استفاده می شود.

برای آزمون فرض صفر، فرضی که مدعی است متغییر های x و y همبستگی با هم نداشته و به صورت تصادفی این زوج ها جور شده اند، نیازی به فرض خاصی در مورد جامعه مورد نمونه گیری نیست. برای مقادیر کوچک n ،5آزمون مبتنی بر جدول ۶ پیوست قرار دارد که از توزیع دقیق نمونه گیری 1تعیین می شوند.

برای مقادیر بزرگ، 1توزیع 1را می توان با توزیع نزمال تقریب زد که در این صورت به امید ریاضی و واریانس آن نیاز داریم. پس تحت فرض صفر، امید ریاضی و واریانس 1عبارتند از:

2

مثال:

ضریب همبستگی رتبه ای را برای داده های زیر حساب کرده، آزمون کنید که آیا در سطح معنی دار ۱۰ درصد می توان ادعا کرد که بین دو متغییر x و y همبستگی وجود ندارد؟

x -5 -7 11 6 5
y 8 3 1 4 5
  • فرض ها:
  • Untitled
  • آماره آزمون: ابتدا ضریب همبستگی را حساب می کنیم.
d رتبه ی y رتبه X زوج
۹ ۵ ۲ ۱
۱ ۲ ۱ ۲
۱۶ ۴ ۱ ۵ ۳
۱ ۱ ۳ ۴ ۴
۱ ۴ ۳ ۵
 Untitled

بنابراین:

Untitled

  • مقادیر بحرانی: Untitled مقدار 5بدین صورت از جدول ۶ پیوست به دست می آید: چون آزمون دو طرفه است5 می شود که با n=5 مقدار جدول ۰٫۹۰۰ خواهد بود.
  • تصمیم گیری: چون بین ۰٫۹۰۰ و ۰٫۹۰۰- قرار می گیرد، فرض صفر را نمی توان مردود دانست. نتیجه این که همبستگی معنی داری در سطح معنی دار ۱۰ درصد بین دو متغییر x و y وجود ندارد.

حسن بزرگ ضریب همبستگی رتبه ای1 نسبت به ضریب همبستگی r، علاوه بر ساده بودنش، در این است که چون 1صرفا بر مبنای رتبه ها عمل می کند اگر یک یا چند داده نسبت به داده های دیگر خیلی افراطی باشد، آن را تحت تاثیر قرار نمی دهد ولی در ضریب همبستگی r افراطی بودن یک یا چند داده تاثیر زیادی در آن می گذارد، زیرا با مقدار داده ها کار می کند نه با رتبه آنها برای نمونه در داده های ذیل:

x 8 11 13 14 18 21
y 40 52 50 59 60 175

مقدار ۱۷۵ نسبت به بقیه y ها افراطی است و باغث تاثیر زیادی در r خواهد شد، ولی رتبه آن تنها ۶ می شود و حساسیت زیادی در 1را موجب نمی شود.

آزمون کلموگروف اسمیرنوف:

آزمون کلموگروف اسمیرنوف که به افتخار دو آماردان روسی به نامهای ا.ان.کلموگروف و ان.وی.اسمیرنوف به این نام خوانده می شود، روش ناپارامتری ساده ای برای تعیین همگونی اطلاعات تجربی با توزیع های آماری منتخب است، بنابراین آژمون کولموگوروف – اسمیر نوف، که از به بعد آن را با KS نشان می دهیم، روش دیگری علاوه بر روش کای – مربع Untitledبرای همگونی یک توزیع فراوانی نظری برای اطلاعات تجربی است.

در اینجا بد نیست مزایای هر یک از دو آزمونUntitled و KS را بر دیگری برشماریم: یکی از مزایای آزمون KS این است که هر یک از مشاهدات را به صورت اصلی در نظر میگیرد در حالی که آزمون Untitledبه طبقه بندی مشاهدات پرداخته و بدین جهت مقداری از اطلاعات را از دست می دهد. دوم اینکه در مواردی که تعداد مشاهداتn کوچک است آزمون KSبه دلیل دقیق بودن اعمال شدنی است حال آنکه آزمونUntitled اساسا برای نمونه های بزرگ استفاده می شود . سوم اینکه آزمون   KS نسبت به آزمون  Untitled از سادگی و سهولت بیشتری برخوردار است. حال مزایای آزمون   Untitled را برشماریم: اول اینکه آزمون Untitled   را به سادگی می توان طوری تغییر داد تا امکان تخمین پارامترها نیز به وسیله مشاهدات میسر شود، ولی آزمون KS چنین انعطاف پذیری را ندارد. دوم اینکه آزمون  Untitled  را می توان هم در داتده های پیوسته و هم گسسته به کار برد در حالی که آزمون KS فقط در داده های پیوسته اعمال شدنی است.

در آزمون KS فرض صفری که آزمون خواهیم کرد، توزیع مشاهدات و توزیع مشخصی با پارامتر معینی است که با حدث یا قرائن مختلف فکر کرده ایم توزیع مشاهدات با آن توزیع مشخص همخوانی دارد. آماره آزمون KS را با Untitledنشان می دهیم. آزمون KS مبتنی بر جدول خاصیاست که آن را به صورت جدول ۸ پیوسته آورده ایم. اگر آماره آزمون از مقدار جدول کوچک تر باشد فرض صفر پذیرفته، در غیر این صورت رد می شود.

آماره آزمون برابر است با حداکثر قدر مطلق تفاضل فراوانی مشاهده شده نسبی تجمعی از فراوانی نظری نسبی تجمعی، یعنی:

Untitled

که در آن Untitledبه ترتیب فراو نی نظری نسبی تجمعی و فراوانی مشاهده شده نسبی تجمعی است.

مثال:

این داده ها مربوط به ورود کشتی ها به اسکله ای برای بارگیری نفت در ۱۴ روز مختلف است:

تعداد ورود ها در هر روز ۰ ۱ ۲ ۳ ۴ ۵ و بیشتر
تعداد روزها ۲ ۴ ۵ ۱ ۰ ۲

آیا می توان در سطح معنی دار ۵ درصد ادعا کرد که توزیع ورودها با توزیع پواسن با پارامترUntitled همگون است؟

  • فرض ها:
  • 1
  • آماره آزمون: فراوانی نسبی نظری جدول ذیل را با استفاده از فرمول توزیع پواسن،1 به دست آورده ایم.
 1 فراوانی نسبی تجمعی نظری1 فراوانی نسبی نظری فراوانی نسبی تجمعی مشاهده شده1 فراوانی تجمعی مشاهده شده فراوانی مشاهده شده تعداد ورودها x
-0.008 0.008 0.135 0.135 0.143 2 2 0
-0.022 0.022 0.406 0.271 0.428 6 4 1
-0.108 0.108 0.677 0.271 0.785 11 5 2
0.000 0.000 0.857 0.18 0.857 12 1 3
0.090 0.090 0.947 0.09 0.857 12 0 4
0.000 0.000 1.000 0.053 1.000 14 2 ≥۵

با توجه به ستون آخر مشخص می شود که حد اکثر مقدار Untitledبا ۰٫۱۰۸ برابر است، یعنی:

Untitled

  • مقدار بحرانی:داریم a=0.05 و n=14 ، بنابراینUntitled
  • تصمیم گیری: چونUntitled بزرگ تر یا مساوی ۰٫۳۴۹ نیست نمی توان فرض صفر را مردود دانست. بنابراین می پذیریم که داده های فوق با توزیع پواسن با میانگین ورود ۲ کشتی در روز همگون است.

آزمون فرید من

در تحلیل واریانس دو عامله به بررسی اثر دو عامل در ایجاد تغییرات پرداختیم. منتها فرض کردیم که مشاهدات از K جامعه نرمال بیرون آمده اند و واریانس های جوامع یکسان هستند. ولی هیچ فرض خاصی برای استفاده از آزمون فرید من وجود ندارد.

هنگام استفاده از آزمون فرید من، تمامی K تیمار به گونه ای تصادفی به n بلوک تخصیص می یابند. بعد از آن که مشاهدات برای هر ترکیب تیمار – بلوک ثبت شدند، داده ها در یک جدول دو بعدی که در آن هر سطر بیانگر یک بلوک و هر ستون بیانگر یک تیمار است. در هر سطر بلوک داده ها رتبه بندی می شوند. در این صورت آزمون فرید من به دنبال تحلیل مجموع رتبه های ستونها ( تیمارها ) است؛ روش آن شبیه به آزمون مجموع رتبه ها ( آزمون u) یا کروسکال – والیس است.

فرض صفری که آزمون فرید من به دنبال آزمون آن است عبارت است از :

توزیع احتمال K تیمار مشابه است:1

و فرضیه مخالف آن به صورت زیر است:

دست کم توزیع دو تیما یکسان نیست:5

آماره آزمون فرید من به این صورت است:

2

که در آن K تعداد تیمارها، n تعداد بلوکها، و 5مجموع رتبه های j امین ستون ( تیمار ) است. همانند آزمون H ( کروسکال – والیس )، آماره آزمون Untitledتقریبا دارای توزیع Untitledبا K-1 درجه آزادی است.

مثال:

در هنگام انتخاب یک مکان برای توسعه صنعتی، مدیران اجرایی عوامل چون سیاستهای مالیاتی، دسترسی به نیروی انسانی تحصیل کرده، هزینه های ساخت و مواد اولیه را بررسی می کنند. در نهایت، بر اساس قضاوت ذهنی، جو و فضای قابلیت صنعتی را نیز اندازه گیری می کنند.

مدیرعامل شرکت الکترونیک پیشرو، از پنج معاون خود خواستهاست برای توسعه فعالیت های خود چهار شهر اردبیل، ارومیه، تبریز و زنجان را در نظر گرفته، به آنها از نظر قابلیت توسعه فعایت های شرکت از ۱ تا ۱۰ ( ۱= کاملا غیر قابل قبول، ۱۰ = کاملا برجسته) امتیاز دهند. پاسخ ها به صورت جدول زیر خلاصه شده است. در سطح خطای ۵ درصد، آیا شواهد کافی وجود دارد که ادراک آنها از قابلیت توسعه فعالیت های شرکت در این چهار شهر یکسان است؟ آیا رتبه بندی این پنج نفر یکسان است؟)

شهر معاون
زنجان تبریز ارومیه اردبیل
۶٫۰ (۳) ۳٫۵ (۴ ) ۸٫۲ ( ۲ ) ۸٫۵(۱) الف
۵٫۵ (۴) ۶٫۰ (۳) ۸٫۲ ( ۱ ) ۷٫۵(۲) ب
۷٫۰ (۲) ۴٫۰ (۴) ۶٫۰ (۳) ۹٫۰(۱) ج
۴٫۰ (۴) ۷٫۰ (۲) ۶٫۰ (۳) ۸٫۰(۱) د
۷٫۵(۱) ۴٫۵(۴) ۵٫۵ (۳) ۷٫۰(۲) ه
۱۴ ۱۷ ۱۲ ۷ R j

تعداد تیمار ها ۴ و تعداد بلوک ها ( ارزیابان) ۵ است: K = 4 و n=5 . آماره آزمون فرید من به صورت زیر خواهد بود:

Untitled

از جدول Untitledمقدار بحرانی با K-1=3 درجه آزادی عدد ۷٫۸۱۴۷۳ استخراج می شود. به دلیل این که مقدار آماره آزمون کوچک تر از مقدار جدول است، نمی توان گفت که تصور معاونان در مورد قابلیت توسعه فعالیت های شرکت در این چهار شهر متفاوت است.