<<
>>

Линейная регрессия.

Рассмотрим двумерную случайную величину (X, Y), где X и Y – зависимые случайные величины.

Представим приближенно одну случайную величину как функцию другой. Точное соответствие невозможно.

Будем считать, что эта функция линейная.

Для определения этой функции остается только найти постоянные величины a и b.

Определение. Функция g(X) называется наилучшим приближением случайной величины Y в смысле метода наименьших квадратов, если математическое ожидание

принимает наименьшее возможное значение. Также функция g(x) называется среднеквадратической регрессией Y на X.

Теорема. Линейная средняя квадратическая регрессия Y на Х вычисляется по формуле:

в этой формуле mx=M(X), my=M(Y), коэффициент корреляции величин Х и Y.

Величина называется коэффициентом регрессии Y на Х.

Прямая, уравнение которой

,

называется прямой сренеквадратической регрессии Y на Х.

Величина называется остаточной дисперсией случайной величины Y относительно случайной величины Х. Эта величина характеризует величину ошибки, образующейся при замене случайной величины Y линейной функцией g(X)=aХ + b.

Видно, что если r=±1, то остаточная дисперсия равна нулю, и, следовательно, ошибка равна нулю и случайная величина Y точно представляется линейной функцией от случайной величины Х.

Прямая среднеквадратичной регрессии Х на Y определяется аналогично по формуле:

Прямые среднеквадратичной регрессии пересекаются в точке (тх, ту), которую называют центром совместного распределения случайных величин Х и Y.

<< | >>
Источник: Ларин Александр Александрович. КУРС ВЫСШЕЙ МАТЕМАТИКИ. ЧАСТЬ 4.. 2001

Еще по теме Линейная регрессия.:

  1. 46. Проверка гипотезы о значимости нелинейной модели регрессии. Проверка гипотезы о линейной зависимости между переменными модели регрессии
  2. 26. Линейная модель множественной регрессии
  3. 10. Нормальная линейная модель парной (однофакторной) регрессии
  4. 28. Линейная модель множественной регрессии стандартизированного масштаба
  5. 30. Частные коэффициенты корреляции для линейной модели регрессии с двумя факторными переменными
  6. 13. Система нормальных уравнений и явный вид ее решения при оценивании методом наименьших квадратов линейной модели парной регрессии
  7. 35. Проверка гипотезы о значимости коэффициентов регрессии и модели множественной регрессии в целом
  8. 14. Оценка коэффициентов модели парной регрессии с помощью выборочного коэффициента регрессии
  9. 41. Модели регрессии с точками разрыва
  10. 57. Гетероскедастичность остатков модели регрессии
  11. 18. Характеристика качества модели регрессии
  12. 39. Модели регрессии, нелинейные по факторным переменным
  13. 58. Тест Глейзера обнаружения гетероскедастичности остатков модели регрессии
  14. 47. Тесты Бокса-Кокса и Зарембеки выбора модели регрессии
  15. 63. Устранение автокорреляции остатков модели регрессии