Таке графічне зображення називається діаграма розсіювання. Діаграма розсіювання показує зв’язок між двома кількісними змінними, виміряними для тих самих осіб. Значення однієї змінної відображаються на горизонтальній осі, а значення іншої змінної – на вертикальній осі.
Кореляції відображаються як діаграми розсіювання, які є візуальним представленням зв’язку між двома змінними. Кореляції також відображаються як коефіцієнт кореляції, визначений як числове представлення сили та напрямку відносин.
Найпростіший спосіб візуалізації кореляції – це використовувати діаграму розсіювання. Вам навіть не потрібно розраховувати коефіцієнт! Діаграма розсіювання — це діаграма, яка використовує точки для відображення значень двох числових змінних. Це хороший спосіб побачити, чи є зв’язок між змінними.
Коефіцієнт кореляції Пірсона представлений грецька літера rho (ρ) для параметра сукупності та r для вибіркової статистики. Цей коефіцієнт кореляції є одним числом, яке вимірює як силу, так і напрямок лінійного зв’язку між двома безперервними змінними.
Є кілька доступних пакетів для візуалізації кореляційної матриці в R. Одним із найпоширеніших є функція corrplot. Спочатку нам потрібно встановити пакет corrplot і завантажити бібліотеку. Далі ми запустимо функцію corrplot, надаючи вихідну кореляційну матрицю як вхідні дані для функції.
Найкориснішим графіком для відображення зв’язку між двома кількісними змінними є діаграма розсіювання. Багато дослідницьких проектів є кореляційними дослідженнями, оскільки вони досліджують зв’язки, які можуть існувати між змінними.