ضریب همبستگی-مثال


ضریب همبستگی (Correlation Coefficient) ابزاری آماری برای تعیین نوع و درجه رابطهٔ یک متغیر کمی با متغیر کمی دیگر است. ضریب همبستگی، یکی از معیارهای مورد استفاده در تعیین همبستگی دو متغیر است.

فصل11 : ضریب همبستگی آر پیرسون / Chapter 11 : Pearson's R Correlation Coefficient

فصل11 : ضریب همبستگی آر پیرسون / Chapter 11 : Pearson's R Correlation Coefficient

کتاب الکترونیکی کاربرد رایانه در علوم اجتماعی دکتر یحیی علی بابایی / بهار 1393 فصل11: ضریب همبستگی آر پیرسون / مقدمه : هنگامی که هر دو متغیر مقیاسی هستند، لزومی ندارد که از آزمون‌ها و جداول دو بعدی استفاده کنیم، بلکه به منظور تفسیر رابطه بین متغیرهای مستقل و وابسته می‌توان از قوی‌ترین ضریب همبستگی خطی یعنی ضریب همبستگی r پیرسون استفاده نمود.فرمول r پیرسون یک فرمول متقارن، و دامنه تغییر مقدار آن از 1- تا 1+ است. 1+ به معنای همبستگی مستقیم کامل،و 1- نشانه همبستگی معکوس کامل است.ضریب همبستگی وجود، شدت و جهت رابطه میان متغیرها را می‌سنجد.هنگامی که فقط ضریب همبستگی بین دو متغیر بررسی می‌شود(یعنی هیچ متغیر کنترلی وجود ندارد)، ضریب ضریب همبستگی-مثال پیرسون را ضریب همبستگی مرتبه صفر می‌نامند. زمانی که می‌خواهیم ضریب همبستگی پیرسون را در مورد متغیرهای اسمی دارای دو پاسخ(مانند جنسیت)مورد استفاده قرار دهیم، حتماً باید آن‌ها را به صفر و یک تبدیل کنیم. اکنون برای نشان دادن نحوه اجرای دستور همبستگی پیرسون،مثالی را در نظر می‌گیریم که رابطه میان رضایت شغلی را با جنسیت، سن، درآمد و سابقه خدمت بررسی می‌کند. """

ضريب همبستگي چيست؟ انواع آن چيست؟

ضریب همبستگی (Correlation Coefficient) ابزاری آماری برای تعیین نوع و درجه رابطهٔ یک متغیر کمی با متغیر کمی دیگر است. ضریب همبستگی، یکی از معیارهای مورد استفاده در تعیین همبستگی دو متغیر است.

ضریب همبستگی شدت رابطه و همچنین نوع رابطه (مستقیم یا معکوس) را نشان می‌دهد. این ضریب بین ۱ تا ۱- است و در عدم وجود رابطه بین دو متغیر، برابر صفر است.

همبستگی بین دو متغیر تصادفی X و Y به صورت زیر تعریف می‌شود:

که در آن E عملگر امید ریاضی، cov به معنای کوواریانس، corr نماد معمول برای همبستگی (کورولیشن) پیرسون، و سیگما نماد انحراف معیار است.

امید ریاضی:

در نظریه احتمالات؛ امید ریاضی، میانگین، مقدار مورد انتظار یا ارزش مورد انتظار یک متغیر تصادفی گسسته برابر است با مجموع حاصل‌ضرب احتمال وقوع هر یک از حالات ممکن در مقدار آن حالت. در نتیجه میانگین برابر است با مقداری که بطور متوسط از یک فرایند تصادفی با بی‌نهایت تکرار انتظار می‌رود.

کواریانس یا هم‌وردایی (Covariance):

در نظریه احتمالات، اندازه تغییرات هماهنگ دو متغیر تصادفی است. (اگر دو متغیر یکی باشند کواریانس برابر واریانس خواهد شد). چنانکه دو متغیر تصادفی ناوابسته باشند کواریانس آنها صفر خواهد بود.

ضریب همبستگی پیرسون ( Pearson Correlation Coefficient):
روشی پارامتری است و برای داده‌هایی با توزیع نرمال یا تعداد داده‌های زیاد استفاده می‌شود.

ضریب همبستگی اسپیرمن (Spearman Correlation Coefficient):

در صورتی که تعداد داده‌ها کم و فرض نرمال بودن آنها معقول نباشد، از ضریب همبستگی اسپیرمن استفاده می‌شود. ضریب همبستگی‌ای که بر اساس رتبهٔ داده‌ها محاسبه می‌شود، توسط اسپیرمن محاسبه شده‌است.

انحراف معیار(Standard deviation):

نوعی سنجش پراکندگی برای یک توزیع احتمالی یا متغیر تصادفی است و نمایندهٔ پخش‌شدگی مقادیر آن حول مقدار میانگین است.

ضریب همبستگی پیرسون

ضریب همبستگی پیرسون که به نام های ضریب همبستگی گشتاوری ویا ضریب همبستگی مرتبه ی صفر نیز نامیده می شود ، توسط سرکارل پیرسون معرفی شده است. این ضریب به منظور تعیین میزان رابطه، نوع و ضریب همبستگی-مثال جهت رابطه ی بین دو متغیر فاصله ای یا نسبی و یا یک متغیر فاصله ای و یک متغیر نسبی به کار برده می شود. چندین روش محاسباتی معادل می توان برای محاسبه ی این ضریب تعریف نمود.

الف) روش محاسبه با استفاده از اعداد خام :

ب) روش محاسبه از طریق نمره های استاندارد شده :

ضریب همبستگی پیرسون بین -1 و 1 تغییر می کند.اگر r=1 بیانگر رابطه ی مستقیم کامل بین دو متغیر است ، رایطه ی مستقیم یا مثبت به این معناست که اگر یکی از متغیرها افزایش (کاهش) یابد، دیگری نیز افزایش (کاهش) می یابد. مانند رابطه ی بین میزان ساعات مطالعه در روز و معدل محصلین.

r=-1 نیز وجود یک رابطه ی معکوس کامل بین دو متغیر را نشان می دهد. رابطه ی معکوس یا منفی نشان می دهد که اگر یک متغیر افزایش یابد متغیردیگر کاهش می یابد و بالعکس.

زمانی که ضریب همبستگی برابر صفر است نشان می دهد که بین دو متغیر رابطه ی خطی وجود ندارد.

1) صفر بودن ضریب همبستگی تنها عدم وجود رابطه ی خطی بین دو متغیر را نشان می دهد ولی نمی توان مستقل بودن دو متغیر را نیز نتیجه گرفت. هنگامی که ضریب همبستگی پیرسون بین دو متغیر صفر باشد، این متغیرها تنها در صورتی مستقل از یکدیگرند که توزیع متغیرها نرمال باشد.

2) همبستگی بین دو متغیر تنها نشان دهنده ی این است که افزایش یا کاهش یک متغیر چه تاثیری بر افزایش یا کاهش متغیر دیگر دارد ولی این همبستگی ضرورتا دال بر رابطه ی علّی بین متغیرها نمی باشد. به طور مثال اگر در یک تحقیق دو متغیر قد و تحصیلات همبستگی مثبت بالایی داشته باشندنمی توانیم نتیجه بگیریم که افراد قد بلندتر دارای تحصیلات بیشتری هستند. بنابراین باید بین مفاهیم همبستگی و رابطه ی علّت و معلولی تفاوت قائل شد. به بیان دیگر ممکن است دو متغیر همبستگی داشته باشند ولی لزومی ندارد که یکی از متغیرها علت و دیگری معلول باشد، علاوه براین عوامل متعدد دیگری نیز می توانند بر ضریب همبستگی اثرگذار باشند.

مثال : سنوات خدمت و میزان درآمد تعدادی کارمنددر دست است ، به کمک نرم افزار spss ضریب همبستگی پیرسون را محاسبه می کنیم.

چگونه محاسبه ضریب همبستگی

در هنگام نگاه کردن به یک صفحه نمایش، سوالات زیادی وجود دارد. یکی از رایج ترین موارد این است که آیا خط مستقیم تقریبی داده ها است؟ برای پاسخ به این سوال، یک آمار توصیفی به نام ضریب همبستگی وجود دارد. ما خواهیم دید که چگونه این آمار را محاسبه کنیم.

ضریب همبستگی

ضریب همبستگی ، نشان داده شده توسط r به ما می گوید که اطلاعات دقیق در یک قطعه پراکنده در امتداد یک خط مستقیم سقوط می کند.

نزدیکتر است که مقدار مطلق r به یک باشد، بهتر است داده ها توسط یک معادله خطی توصیف شوند. اگر r = 1 یا r = -1 باشد، مجموعه داده کاملا تراز شده است. مجموعه داده ها با مقادیر r نزدیک به صف نشان می دهد کمی به هیچ رابطه مستقیم خطی.

با توجه به محاسبات طولانی، بهتر است محاسبه r با استفاده از یک ماشین حساب یا نرم افزار آماری. با این حال، همیشه تلاش ارزشمندی برای دانستن آنچه که ماشین حساب شما انجام می دهد هنگام محاسبه است. آنچه در ادامه است، یک فرایند برای محاسبه ضریب همبستگی عمدتا از طریق دست، با یک ماشین حساب برای مراحل ریاضی روتین استفاده می شود.

مراحل محاسبه R

ما با فهرست گام ها به محاسبه ضریب همبستگی آغاز خواهیم کرد. داده هایی که ما در حال کار با آن هستند داده های زوج است که هر جفت آنها توسط ( x i ، y i ) مشخص می شود.

  1. ما با چند محاسبه اولیه شروع می کنیم. مقدار از این محاسبات در مراحل بعدی محاسبه ما از r استفاده می شود .
    1. محاسبه x ÷، میانگین تمام مختصات اول داده x i .
    2. محاسبه ȳ، میانگین تمام مختصات دوم داده y i .
    3. s xانحراف استاندارد نمونه از تمام مختصات اول داده x i را محاسبه کنید .
    4. محاسبه s y انحراف استاندارد نمونه از تمام مختصات دوم داده y i .
    1. از فرمول (z x ) i = ( x i - x ÷) / s x استفاده کنید و یک مقدار استاندارد برای هر x i محاسبه کنید .
    2. از فرمول (z y ) i = ( y i - ȳ) / s y استفاده کنید و یک مقدار استاندارد شده برای هر y i محاسبه کنید .
    3. مقادیر استاندارد متناظر را چند برابر کنید: (z x ) i(z y ) i
    4. محصولات را از آخرین مرحله با هم اضافه کنید.
    5. مجموع از قدم قبلی را با n -1 تقسیم کنید، که n تعداد کل نقاط مجموعه ما از داده های زوج است. نتیجه این همه ضریب همبستگی r است .

    این فرایند سخت نیست و هر مرحله به نسبت معمول است، اما جمع آوری تمام این مراحل درگیر است. محاسبه انحراف استاندارد به تنهایی خسته کننده است. اما محاسبه ضریب همبستگی شامل نه تنها دو انحراف استاندارد، بلکه بسیاری از عملیات دیگر است.

    یک مثال

    برای دیدن دقیقا چگونگی به دست آوردن مقدار r به یک نمونه نگاه می کنیم. باز هم مهم است که توجه داشته باشیم که برای برنامه های کاربردی ما می خواهیم از ماشین حساب ما یا نرم افزار آماری برای محاسبه r برای ما استفاده کنیم.

    ما با یک لیست از داده های زوج شروع می کنیم: (1، 1)، (2، 3)، (4، 5)، (5،7). میانگین مقادیر x ، میانگین 1، 2، 4 و 5 x α = 3 است. ما همچنین دارای ȳ = 4 است. انحراف معیار x مقادیر s x = 1.83 و s y = 2.58 است. جدول زیر خلاصه ای از محاسبات دیگر مورد نیاز برای R است . مجموع محصولات در ستون سمت راست 2.969848 است. از آنجایی که در مجموع 4 امتیاز وجود دارد و 4 = 1 = 3، مجموع محصولات را به 3 تقسیم می کنیم. این ضریب همبستگی r = 2.969848 / 3 = 0.989949 را به ما می دهد.

    ضریب همبستگی، همبستگی دو متغیره، همبستگی تفکیکی

    عکس شاخص ضریب هبستگی و انچه که باید در موردش بدانیم

    زمانی که در مطالعه‌ای صرفا ضریب همبستگی-مثال قصد داشته ‌باشیم ارتباط بین دو متغیر را بسنجیم و هیچ‌گونه مداخله‌ای در مطالعه اعمال نکنیم، به سراغ مطالعات همبستگی می‌رویم. در مقالات قبلی، مطالعات همبستگی بطور کامل توضیح‌ داده شد و با روش انجام این مطالعات آشنا هستیم. در مطالعات همبستگی، مهمترین شاخص آماری که باید گزارش شود ضریب همبستگی است.

    ۱) همبستگی متغیرها Bivariate Correlation

    مفهوم ضریب همبستگی چیست؟

    اجازه دهید این مبحث را با یک مثال شروع می‌کنیم. فرض کنید قصد داریم دو صفت سن و نمره افسردگی را در دانش‌آموزان یک مدرسه بررسی کنیم و میخواهیم بدانیم با افزایش ۱ سال سن، نمره افسردگی چه تغییری خواهد کرد؟

    حال فرض کنید در تحلیل آماری این مطالعه، گزارش شود که با افزایش ۱ سال سن، ۵ نمره از افسردگی کم می‌شود. تفسیر بالا را شاخص آماری به ‌نام ضریب همبستگی بیان می‌کند. درواقع اگر بخواهیم بدانیم که با تغییر یک صفت، صفت دیگر در چه جهت و با چه شدتی تغییر می‌کند باید ضرایب همبستگی را بین آن دو صفت محاسبه کنیم.

    همبستگی‌های دو متغیره، شامل دو نوع همبستگی فاصله‌ای (ضریب همبستگی پیرسون Pearson ) و رتبه‌ای (ضریب همبستگی اسپیرمن Spearman و کندال بی Kendall’s tau- b ) می‌باشد.

    در نرم‌افزار SPSS از منوی Analyze می‌توان در بخش Correlation هر ۳ ضریب را انتخاب کرد.

    توضیح همبستگی

    از هر ۳ ضریب برای تعیین همبستگی بین دو دسته متغیر استفاده می‌شود. وجه افتراق این ۳ ضریب در کاربرد آن‌ها است:

    – اگر حداقل یکی از دو صفت رتبه‌ای باشد، از ضریب همبستگی پیرسون نمی‌توان استفاده کرد و بین دو ضریب اسپیرمن و کندال بی، با توجه به حجم نمونه مورد مطالعه، تصمیم می‌گیریم. به نحوی که اگر اندازه نمونه کوچک باشد، از ضریب اسپیرمن استفاده می‌کنیم و اگر بزرگ باشد، باید ضریب کندال بی را گزارش کنیم.

    – اگر حداقل یکی از صفاتِ کمی نرمال نباشد، از ضریب پیرسون استفاده نمی‌کنیم و به سراغ معادل ناپرامتری آن (اسپیرمن) می‌رویم.

    *لازم به ذکر است، اگر یک یا همه متغیرها نرمال نبودند، سعی به نرمال کردن آن‌ها نمی‌کنیم.

    در تحلیل ضرایب همبستگی، در مرحله اول سطح معنی داری آن‌ها را بررسی می‌کنیم، در صورتی که پی‌ولیو از ۰/۰۵ کمتر باشد و فرض صفر رد شود نتیجه می‌گیریم که همبستگی بین دو متغیر معنی‌دار است. در مرحله بعدی به سراغ مقدار محاسبه شده برای آن می‌رویم.

    این ضریب می‌تواند مقادیری را بین ۱- تا ۱+ اتخاذ کند. علامت منفی، رابطه عکس بین دو متغیر را بازگو می‌کند؛ به نحوی‌که با افزایش مقادیر یک صفت، مقادیر متغیر دیگر کاهش پیدا می‌کند و برعکس. علامت مثبت در کنار این ضریب، رابطه مستقیم بین دو متغیر را نشان می‌دهد؛ در واقع تغییر در دو متغیر، همسو با هم است یعنی با افزایش یکی، دیگری نیز افزایش می‌یابد و با کاهش آن، مقادیر صفت دیگر هم کم می‌شود.

    مقدار عددی ضریب همبستگی، قدرت ارتباط را نشان می‌دهد. بصورتی که اگر قدرمطلق آن بین ۰/۲ تا ۰/۳۵ باشد، رابطه ضعیف بین دو متغیر را نشان ضریب همبستگی-مثال می‌دهد . اگر این مقدار در دامنه ۰/۳۵ تا ۰/۶۵ باشد، همبستگی خوب است و درصورتی که از ۰/۶۵ بیشتر باشد همبستگی قوی بین دو متغیر وجود دارد و با ضریب همبستگی-مثال تغییر یک صفت، به‌راحتی می‌توان تغییر صفت دیگر را پیش‌بینی کرد.

    عکس ضرایب همبستگی

    · ضریب همبستگی به‌تنهایی رابطه علی بین دو متغیر را اثبات نمی ‎‎ ‌کند و حتی باوجود همبستگی بسیار قوی بین دو متغیر، هرگز نمی‌توان به علیت دست یافت.

    · ضریب همبستگی پیرسون، رابطه خطی بین دو متغیر را نشان می‌دهد. بنابراین اگر r=0 باشد، صرفا نبود رابطه خطی را می‌توان استنباط کرد (ممکن است ارتبط بین دو متغیر، سهمی باشد).

    ۲٫ ضریب همبستگی تفکیکی/ جزئی ( Partial Correlation )

    برای مثال، در بررسی همبستگی ضریب همبستگی-مثال بین دو متغر سن و نمره افسردگی، متغیر سومی به اسم BMI وجود دارد که برروی نمره افسردگی تاثیر دارد. برای کنترل تاثیر این متغیر، بر روی ارتباط دو متغیر دیگر از ضریب همبستگی جزئی استفاده می‌کنیم. همبستگی تفکیکی نوعی همبستگی است که ضمن محاسبه میزان همبستگی بین دو متغیر، اثر سایر متغیرها را کنترل می کنند. این ضریب، میزان همبستگی بین یک متغیر مستقل با متغیر وابسته را پس از حذف میزان همبستگی این دومتغیر با یک یا چند متغیر مستقلِ دیگر نشان دهد . بنابراین، ضریب همبستگی جزئی نشان می‌دهد که بعد از حذف تاثیر متغیر کنترل (یا متغیر آزمون)، چه مقدار از همبستگی خالص بین دو متغیر وجود خواهد‌ داشت.

    همبستگی تفکیکی یا جزئی

    ضریب همبستگی پیرسون، صرفا وجود ارتباط خطی بین متغیرها را نشان می‌دهد. می‌توان از روی این ضریب، به شدت و جهت ارتباط بین متغیرها پی‌برد. در مباحث کوواریانس و رگرسیون، مفهوم همبستگی اهمیت زیادی دارد. بنابراین تسلط در این بخش به فهمیدن مباحث آماری دیگر نیز کمک می‌کند.

    منبع: کتاب راهنمای جامع SPSS در تحقیقات پیمایشی/ نویسنده: دکتر حبیب پور گتابی و رضا صفری شالی

    آیا بین یک متغییر و متغییر دیگر رابطه معناداری (همبستگی) وجود دارد؟

    این مطلب و دیگر مطالبی که من می نویسم تنها بخشی از نتایج تحقیقات من هست که برای ارشیو کردن شخصی تهیه شده و احتمالا خیلی از بخش ها مختصر یا حتی اشتباه نوشته شده است. ولی خب شاید برای رفع برخی سوالات شما نیز بتونه قابل استفاده باشه. در هر صورت شاد باشید.

    خیلی از بخش ها هم فقط کپی هستن برای جمع آوری بخش ها پس باز هم شاد باشید.

    خب بریم سر اصل مطلب:ضریب همبستگی-مثال

    سوال اصلی: آیا بین میزان تخفیف و فروش روزانه در فلان بیزینس رابطه ای وجود داره؟ اگر آری رابطه چه مدلی هست؟

    منظورم از مدل این است که ایا رابطه مثبت است یا منفی (یعنی اگر مثلا تخفیف رفت بالا فروش بره بالا که میشه مثبت یا برعکس میشه منفی)

    خب چند تا متن کپی می کنم برای راهنمایی:

    گاهی اوقات پژوهشگری علاقه دارد بداند که چه رابطه‌ای بین دو متغیر وجود دارد. برای مثال آیا بین میزان بارش در ۱۰ نقطه با میزان رشد گیاهان در این ۱۰ نقطه رابطه‌ای وجود دارد یا خیر. یا اینکه آیا بین میزان افسردگی افراد با میزان عزت نفس فرد رابطه‌ای وجود دارد یا نه. برای این منظور می‌توان از آزمون‌های همبستگی استفاده کرد. آزمون‌های همبستگی به دو دسته کلی پارامتریک (تحلیل همبستگی پیرسون) و ناپارامتریک (تحلیل همبستگی اسپیرمن) تقسیم می‌شوند. البته چند تحلیل همبستگی ناپارامتریک دیگر نیز وجود دارد که به دلیل کاربرد کم در اینجا توضیحی درباره آن‌ها ارائه نخواهد شد.

    تفاوت تحلیل همبستگی پیرسون و همبستگی اسپیرمن

    برای بررسی همبستگی باید حداقل دو متغیر داشته باشید. اگر داده‌های شما در سطح فاصله‌ای یا نسبی باشند مانند نمره افسردگی، شادکامی، سن، قد، میزان پرش یک ورزشکار و … از تحلیل همبستگی پیرسون استفاده خواهد شد. همچنین اگر داده‌های شما به صورت رتبه‌ای باشند مانند تحصیلات، سال ورود به دانشگاه، مرتبه شغلی و … از تحلیل همبستگی اسپیرمن استفاده خواهد شد.

    نکته مهم: برخی از متغیرها را می‌توان هم به صورت فاصله‌ای یا نسبی به کار برد و هم به صورت رتبه‌ای. برای مثال اگر شما سن آزمودنی‌های خود را به صورت عدد (برای مثال ۲۶، ۲۷، ۲۸) ثبت کرده باشید این متغیر فاصله‌ای است اما اگر به صورت طیف قرار داده باشید (برای مثال ۰ تا ۱۰ سال، ۱۰ تا ۲۰ سال، ۲۰ تا ۳۰ سال) در این ضریب همبستگی-مثال صورت این متغیر رتبه‌ایی است.

    ضریب همبستگی چه معنایی دارد؟

    ضریب همسبتگی همیشه عددی بین ۱ تا ۱- است. ضریب همبستگی بین ۰ تا ۱ به معنی داشتن همبستگی مثبت است و هرچه این ضریب به ۱ نزدیک‌تر باشد همبستگی قوی‌تر است. همبستگی مثبت یعنی با افزایش نمره یک متغیر نمره متغیر دیگر نیز افزایش می‌یابد، مثلاً با افزایش نمره افسردگی نمره اضطراب نیز افزایش می‌یابد. ضریب همبستگی بین ۰ تا ۱- به معنی داشتن همبستگی منفی بین دو متغیر است و هرچه عدد به ۱- نزدیک‌‎تر باشد یعنی همبستگی منفی قوی‌تر است. همبستگی منفی یعنی با کاهش نمره یک متغیر نمره متغیر دیگر افزایش می‌یابد، مثلاً با افزایش افسردگی میزان شادکامی کاهش می‌یابد.

    نحوه تفسیر ضریب همبستگی

    در بالا گفتیم که ضریب همبستگی بین ۱ تا ۱- است. اما اعداد این ضریب چه معنایی دارند؟ برای مثال ضریب همبستگی ۰٫۴۷ نشان دهنده ارتباط قوی بین دو متغیر است یا ارتباط ضعیف؟ برای تفسیر ضریب همبستگی می‌توان از راهنمای زیر استفاده کرد که در بسیاری از کتاب‌های آماری آمده است:

    – ضریب بین ۰ تا ۰٫۲۹ نشان دهنده همبستگی ضعیف

    – ضریب بین ۰٫۳۰ تا ۰٫۶۹ نشان دهنده همبستگی متوسط

    – ضریب بین ۰٫۷۰ تا ۱ نشان دهنده همبستگی قوی

    برخی از موضوعاتی که با استفاده از تحلیل همبستگی انجام گرفته‌اند آورده شده است:

    – رابطه بین سلامت روانی با نمره درسی

    – رابطه بین جذابیت با اعتماد دیگران به فرد

    – رابطه بین رضایت مشتریان از پاسخگویی پرسنل با میزان خرید آنان از فروشگاه



اشتراک گذاری

دیدگاه شما

اولین دیدگاه را شما ارسال نمایید.