37. Определение мультиколлинеарности. Последствия мультиколлинеарности. Методы обнаружения мультиколлинеарности
Наибольшие затруднения в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторных переменных, когда более чем два фактора связаны между собой линейной зависимостью.
Мультиколлинеарностью для линейной множественной регрессии называется наличие линейной зависимости между факторными переменными, включёнными в модель.
Мультиколлинеарность – нарушение одного из основных условий, лежащих в основе построения линейной модели множественной регрессии.
Мультиколлинеарность в матричном виде – это зависимость между столбцами матрицы факторных переменных Х:
Если не учитывать единичный вектор, то размерность данной матрицы равна n*n. Если ранг матрицы Х меньше n, то в модели присутствует полная или строгая мультиколлинеарность. Но на практике полная мультиколлинеарность почти не встречается.
Можно сделать вывод, что одной из основных причин присутствия мультиколлинеарности в модели множественной регрессии является плохая матрица факторных переменных Х.
Чем сильнее мультиколлинеарность факторных переменных, тем менее надежной является оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов.
Включение в модель мультиколлинеарных факторов нежелательно по нескольким причинам:
1) основная гипотеза о незначимости коэффициентов множественной регрессии может подтвердиться, но сама модель регрессии при проверке с помощью F-критерия оказывается значимой, что говорит о завышенной величине коэффициента множественной корреляции;
2) полученные оценки коэффициентов модели множественной регрессии могут быть неоправданно завышены или иметь неправильные знаки;
3) добавление или исключение из исходных данных одного-двух наблюдений оказывает сильное влияние на оценки коэффициентов модели;
4) мультиколлинеарные факторы, включённые в модель множественной регрессии, способны сделать её непригодной для дальнейшего применения.
Конкретных методов обнаружения мультиколлинеарности не существует, а принято применять ряд эмпирических приёмов.
В большинстве случаев множественный регрессионный анализ начинается с рассмотрения корреляционной матрицы факторных переменных R или матрицы (ХТХ).Корреляционной матрицей факторных переменных называется симметричная относительно главной диагонали матрица линейных коэффициентов парной корреляции факторных переменных:
где rij – линейный коэффициент парной корреляции между i-м и j-ым факторными переменными,
На диагонали корреляционной матрицы находятся единицы, потому что коэффициент корреляции факторной переменной с самой собой равен единице.
При рассмотрении данной матрицы с целью выявления мультиколлинеарных факторов руководствуются следующими правилами:
1) если в корреляционной матрице факторных переменных присутствуют коэффициенты парной корреляции по абсолютной величине большие 0,8, то делают вывод, что в данной модели множественной регрессии существует мультиколлинеарность;
2) вычисляют собственные числа корреляционной матрицы факторных переменных λmin и λmax. Если λmin‹10-5, то в модели регрессии присутствует мультиколлинеарность. Если отношение
то также делают вывод о наличии мультиколлинеарных факторных переменных;
3) вычисляют определитель корреляционной матрицы факторных переменных. Если его величина очень мала, то в модели регрессии присутствует мультиколлинеарность.
Еще по теме 37. Определение мультиколлинеарности. Последствия мультиколлинеарности. Методы обнаружения мультиколлинеарности:
- 38. Методы устранения мультиколлинеарности
- 3. Правовые последствия обнаружения недостатков в выполненной работе
- 22.Метод замены переменной в неопределенном интеграле и особенности применения этого метода при вычислении определенного интеграла.
- Метод 2. «Определение убеждений»Техника 1. «Определение ожиданий»
- Статья 92. Последствия признания определения поставщика (подрядчика, исполнителя) закрытым способом несостоявшимся
- Конкуренция: сущность, методы, последствия
- Непрямые методы определения кровенаполнения тканей
- Инфляция: сущность, методы исчисления, причины и последствия
- Прямые методы определения кровенаполнения органов
- глава 7 Исследование подложных документов.—Обнаружение методами научно-технической экспертизы подчисток, вытравления текста вставок и добавлений к тексту и копирования документов,— Установление подлинности документов.—Восстановление повреж денных, сгоревших и разорванных документов.
- Методы определения жизнеспособности яиц и личинок гельминтов
- 1. Методы определения равновесного уровня национального производства
- Колориметрический метод определения активности пероксидазы (по А.М. Бояркину)
- Метод правового регулирования характеризует нормы определенной отрасли права с точки зрения их
- Метод определения потерь вследствие низкого качества.
- Метод 3. «Группы убеждений»Техника 1. «Определение центральных убеждений»
- В. Ограничения на использование определенных методов расследования и регламентация порядка задержания подозреваемых