Регресійний аналіз — це серія процесів статистичного моделювання, які допомагають аналітикам оцінити зв’язки між однією чи кількома незалежними змінними та залежною змінною. Множинний регресійний аналіз можна представити за допомогою формули: Y = b0 + b1X1 + b1 + b2X2 + … + bpXp.
MSE розраховується за:
- вимірювання відстані спостережуваних значень y від прогнозованих значень y при кожному значенні x;
- зведення кожної з цих відстаней у квадрат;
- обчислення середнього кожного з квадратів відстаней.
MSE = SSE n − p оцінки , дисперсія помилок. У формулі n = розмір вибірки, p = кількість параметрів у моделі (включаючи відрізок) і = сума квадратів помилок. Зверніть увагу, що для простої лінійної регресії p = 2. Таким чином, ми отримуємо формулу для MSE, яку ми ввели в контексті одного предиктора.
Множинний лінійний регресійний аналіз передбачає більше, ніж просто проведення лінії через точки даних. Він складається з трьох основних кроків: (1) вивчення кореляції та напрямку даних, (2) підгонка лінії до моделі та (3) оцінка достовірності та корисності моделі.
Проста лінія лінійної регресії, ^y=a+bx y ^ = a + b x , можна інтерпретувати наступним чином: ^y — це прогнозоване значення y, a — точка перетину та передбачає, де лінія регресії перетинатиме вісь y, b передбачає зміну y для кожної одиничної зміни в x .