Питання, пропозиції, зауваження: @arsen_r_science
Відео:
Що таке кореляційний аналіз?
Це інструмент статистики, який допомагає визначити, чи пов’язані між собою дві змінні (наприклад, чи пов’язаний рівень тривоги з рівнем вигорання).
Для чого потрібен кореляційний аналіз?
Кореляційний аналіз може знадобитись в написанні курсової/дипломної роботи. Оскільки, зазвичай, у вас на вибір буде два основних аналізи — це кореляційний (пошук зв’язків, наприклад, між рівнем психологічного благополуччя та рівнем автономності) та порівняльний (пошук відмінностей, наприклад, між жінками та чоловіками у рівні толерантності).
Коли потрібен кореляційний аналіз?
Якщо ваша гіпотеза звучить таким чином:
Існує статистично значущий зв’язок між рівнем тривожності та якістю сну у студентів.
Рівень емоційного вигорання має зв’язок із рівнем задоволеності роботою.
Існує взаємозв’язок між рівнем самооцінки та соціальною тривожністю у молоді.
Чим вищий рівень мотивації до навчання, тим вищі академічні досягнення студентів.
Чим більше людина проводить часу в соцмережах, тим нижчий рівень її психологічного благополуччя.
Чи впливає рівень стресу на рівень концентрації уваги?
Чи впливає кількість друзів на рівень щастя?
Іноді вживається слово “впливає”, коли говорять про кореляцію, якщо ви пишете курсову чи бакалаврську, то, скоріше за все, це ваш випадок, але правильно було б написати “зв’язок”
Де не допоможе кореляційний аналіз?
Кореляція не показує причинно-наслідковий зв’язок. Наприклад, якщо виявиться, що люди, які більше читають, мають кращу пам’ять, це ще не означає, що читання покращує пам’ять. Можливо, люди з кращою пам’яттю просто люблять читати більше. Тому, якщо вас цікавить саме вплив, то варто подивитись вбік регресійного аналізу, або ж проводити експеримент.
Кореляційний аналіз: В цифрах
Кореляційний аналіз можна робити в різних програмах, на кшталт SPSS, Jamovi, R тощо. В якій би ви не робили, результати в цифрах мають бути ідентичні, може відрізнятися лише візуальне оформлення. Будемо розбирати на прикладі SPSS, як найбільш поширеного.

Тут, як ви бачите, чимало цифр, розберемо по черзі:

На Рис 1.2., як ви бачите, я залишив лише маленький шматочок таблички. Перший рядок, де написано лише Spearman`s rho, ми розберемо пізніше, наразі, воно нас не цікавить. Тут в нас є зверху “Опитувальник1”, це дані, які ми отримали від наших респондентів за проходження, наприклад, опитувальника тривожності. Зліва теж є “Опитувальник1” — це той самий опитувальник й ті самі дані. Вони пересікаються в клітинці (білого кольору), де ми бачимо цифру 29 й ще два незрозумілі символи.
Буква N вказує на кількість даних, в нашому випадку, кількість респондентів, в цьому дослідженні їх 29, 29 людей пройшли мій “Опитувальник1” з тривожності.
Напис Sig. (2-tailed) вказує на значущість зв’язку, цю значущість зазвичають називають p-значенням, тут, як я писав вище, в нас один й той самий опитувальник, що горизонтально, що вертикально, він сам з собою пов’язаний, інакше й не може бути, тому програма й не дає число, оскільки це ідентичні дані й відповідно вони мають зв’язок.
В Correlation Coefficient пишеться r-значення, його теж вказують в наукових роботах, як і p-значення. Різниця між ними в тому, що p-значення є універсальним. Використовуючи будь-який аналіз, порівняльний, кореляційний тощо, ми побачимо вкінці p-значення, зрозуміле всім. А r-значенням працює лише для кореляційного, в порівняльного аналізу це буде t-значення й так далі. Тому, орієнтуємось впершу чергу на p-значення, його легко зрозуміти. А в роботі вказуємо обидва, r-значення та p-значення. Тут, як ви бачите, теж немає цифри, тому що це один й той же опитувальник.
Тепер давайте розберемо на прикладі, який буде корисним й дасть інформацію про наше дослідження:

Уявімо, що на Рис. 1.3. в нас під “Опитувальник2” мається на увазі опитування з рівня стресостійкості та під “Опитувальник4” мається на увазі опитування з рівня психологічного благополуччя. Дивимось в клітинку, де пересікаються ці два опитувальника, я позначив чорним маркером, де вони “зустрічаються”. Як ми бачимо, тут N дорівнює 29, що нормально й відповідає реальності, опитувальник 2 й 4 пройшли 29 людей.
Рівень значущості (p-значення) є близько 0,001. Коли в нас p-значення близько 0,001, то це говорить про те, що чисто випадкова вірогідність отримати такі результати є лише в 1 випадку з 1000. Якщо p-значення менше 0,05 то ми вважаємо, що це — не випадковість. В нашому випадку, p-значення < 0,001, що говорить про те, що це не випадковість й вірогідність отримати такі результати випадково — дуже мала, статистично незначуща. Відповідно, кореляція є статистично значущою. Отже, рівень стресостійкості “Опитувальник2” та рівень психологічного благополуччя “Опитувальник4” значуще корелюють на рівні p = 0,001.
Наступним йде рівень значущості (r-значення), що дорівнює 0,596; Його ми просто записуємо поруч з p-значенням. Отже, рівень стресостійкості “Опитувальник2” та рівень психологічного благополуччя “Опитувальник4” значуще корелюють на рівні p = 0,001 та r = 0,596. Все. Це те, що ви маєте записати у вашій роботі: “Змінна А (стресостійкість) та змінна Б (психологічне благополуччя) корелюють на рівні p = … та r = …”
Порада: Якщо ви не впевнені, чи є кореляція (зв’язок) між змінними, тоді, ви можете подивитись на r-значення, над ним, принаймні в SPSS, є зірочки (* або **), що вказують на те, що кореляція є, це ви можете побачити на Рис 1.3.
Кореляційний аналіз: Види зв’язку
Іноді, ви ще будете бачити мінус перед r = значенням, як тут було зі зв’язком “Опитувальник1” та “Опитувальник4”, він хоч й не значущий (p = 0,670), та тим не менш, є негативним (r = -0,83), що нас й цікавить. Мінус свідчить про негативний (обернений) зв’язок між двома змінними. Тобто, коли одна змінна зростає, інша, як правило, зменшується. Наприклад, якщо ми говоримо про стресостійкість та рівень тривожності, то при негативній кореляції зростання стресостійкості супроводжуватиметься зниженням тривожності. Якщо ми не бачимо мінусу, тоді, зв’язок є прямим. Відповідно, якщо одне значення збільшується, то збільшується й друге. Як це було в нас з “Опитувальник2” та “Опитувальник4”.
Кореляційний аналіз: Spearman`s rho
Повернемось до Spearman`s rho, що це таке? Spearmans rho, вказує на те, що ми використали один з трьох можливих коефіцієнтів кореляції, а саме коефіцієнт кореляції Спірмана. В якості аналогії, уявіть, що в нас є три пательні, з різних покриттям, вони всі можуть посмажити продукти, але якась краща для такого то продукту, а така то для іншого, тут схожий принцип, коефіцієнт кореляція Спірмана, який ми використали й це відобразилось в табличці, його зазвичай використовують для ненормально розподілених даних, якщо у вас менше 50 респондентів, то велика вірогідність, що саме його вам й треба використати, але найкраще це перевірити за допомогою теста шапіро вілк, про який ми поговоримо в іншій статті.