Линейная регрессия.
Рассмотрим двумерную случайную величину (X, Y), где X и Y – зависимые случайные величины.
Представим приближенно одну случайную величину как функцию другой. Точное соответствие невозможно.
Будем считать, что эта функция линейная.
Для определения этой функции остается только найти постоянные величины a и b.
Определение. Функция g(X) называется наилучшим приближением случайной величины Y в смысле метода наименьших квадратов, если математическое ожидание
принимает наименьшее возможное значение. Также функция g(x) называется среднеквадратической регрессией Y на X.
Теорема. Линейная средняя квадратическая регрессия Y на Х вычисляется по формуле:
в этой формуле mx=M(X), my=M(Y),
коэффициент корреляции величин Х и Y.
Величина
называется коэффициентом регрессии Y на Х.
Прямая, уравнение которой
,
называется прямой сренеквадратической регрессии Y на Х.
Величина
называется остаточной дисперсией случайной величины Y относительно случайной величины Х. Эта величина характеризует величину ошибки, образующейся при замене случайной величины Y линейной функцией g(X)=aХ + b.
Видно, что если r=±1, то остаточная дисперсия равна нулю, и, следовательно, ошибка равна нулю и случайная величина Y точно представляется линейной функцией от случайной величины Х.
Прямая среднеквадратичной регрессии Х на Y определяется аналогично по формуле:
Прямые среднеквадратичной регрессии пересекаются в точке (тх, ту), которую называют центром совместного распределения случайных величин Х и Y.
Еще по теме Линейная регрессия.:
- 46. Проверка гипотезы о значимости нелинейной модели регрессии. Проверка гипотезы о линейной зависимости между переменными модели регрессии
- 26. Линейная модель множественной регрессии
- 10. Нормальная линейная модель парной (однофакторной) регрессии
- 28. Линейная модель множественной регрессии стандартизированного масштаба
- 30. Частные коэффициенты корреляции для линейной модели регрессии с двумя факторными переменными
- 13. Система нормальных уравнений и явный вид ее решения при оценивании методом наименьших квадратов линейной модели парной регрессии
- 35. Проверка гипотезы о значимости коэффициентов регрессии и модели множественной регрессии в целом
- 14. Оценка коэффициентов модели парной регрессии с помощью выборочного коэффициента регрессии
- 41. Модели регрессии с точками разрыва
- 57. Гетероскедастичность остатков модели регрессии
- 18. Характеристика качества модели регрессии
- 39. Модели регрессии, нелинейные по факторным переменным
- 58. Тест Глейзера обнаружения гетероскедастичности остатков модели регрессии
- 47. Тесты Бокса-Кокса и Зарембеки выбора модели регрессии
- 63. Устранение автокорреляции остатков модели регрессии