2.3 Статистические способы описания взаимосвязей между составляющими объектаизмерения
Допустим, в результате дисперсионного анализа установлено, что составляющая объекта измерения Х] зависит от составляющей ХА. Теперь ставится задача установить количественную зависимость составляющей Х] от ХА.
В математической статистике доказано, что истинную зависимость величин Х] и ХА, лишенную всяких случайных наслоений, дает регрессия, т. е. математическое ожидание (среднее значение) величины Х], вычисленное при условии, когда величина ХА примет определенное значение. Поэтому идеальной целью можно считать отыскание уравнения регрессии.
Однако точное уравнение регрессии можно написать только зная средние значения Х] для всех допустимых значений ХА. В практических же наблюдениях такая ситуация невозможна. Более того, даже отдельные значения средних составляющей Х], не могут быть найдены точно, а допускают лишь приближенные оценки. В связи с этим можно искать лишь уравнения приближенной регрессии, оценивая тем или иным способом величину и вероятность этой, приближенности.
Для того чтобы получить уравнение приближенной регрессии, т. е. найти зависимость составляющей Х] от ХА, составляющей ХА
задают ряд значений ХА1,...,ХА^...,ХАп и при каждом этом значении измеряют значение составляющей Хк. Результаты заносят в таблицу 3. Таблица 3 XA XA1 XAi XAn Xk Xkl Xki Xkn ОСНОВНЫМ СПОСОБОМ ОТЫСКАНИЯ УРАВНЕНИЯ РЕГРЕССИИ ЯВЛЯЕТСЯ ПРИНЦИП НАИМЕНЬШИХ КВАДРАТОВ.
ЭТОТ ПРИНЦИП УТВЕРЖДАЕТ, ЧТО НАИЛУЧШЕЕ УРАВНЕНИЕ ПРИБЛИЖЕННОЙ РЕГРЕССИИ ДАЕТ ТА ФУНКЦИЯ ИЗ РАССМАТРИВАЕМОГО КЛАССА, ДЛЯ КОТОРОЙ СУММА КВАДРАТОВN
S =?[XKI -V(XAI-А)] (2L6)
I =1
ИМЕЕТ НАИМЕНЬШЕЕ ЗНАЧЕНИЕ.
В ФОРМУЛЕ (2.16) А1,...,А/ — НЕОПРЕДЕЛЕННЫЕ КОЭФФИЦИЕНТЫ, ВХОДЯЩИЕ В АНАЛИТИЧЕСКОЕ ВЫРАЖЕНИЕ УРАВНЕНИЯ РЕПРЕССИИ.
ВЕЛИЧИНА СУММЫ S ЗАВИСИТ, С ОДНОЙ СТОРОНЫ, ОТ ВИДА УРАВНЕНИЯ РЕГРЕССИИ ХК = У(ХА, А1,...,А1), А С ДРУГОЙ СТОРОНЫ — ОТ ЧИСЛЕННЫХ ЗНАЧЕНИЙ КОЭФФИЦИЕНТОВ А1,...,А1 .
ДЛЯ ТОГО ЧТОБЫ СУММА S БЫЛА МИНИМАЛЬНА, ВО-ПЕРВЫХ, ДОЛЖЕН БЫТЬ ПРАВИЛЬНО ВЫБРАН ВИД УРАВНЕНИЙ РЕГРЕССИИ. ВИД ЭТОГО УРАВНЕНИЯ МОЖЕТ БЫТЬ ИЗВЕСТЕН ЗАРАНЕЕ ИЗ СООБРАЖЕНИЙ АНАЛОГИИ, ИЗ ТЕОРЕТИЧЕСКИХ РАССУЖДЕНИЙ ИЛИ ИЗ СРАВНЕНИЯ ЭМПИРИЧЕСКИХ ДАННЫХ С ИЗВЕСТНЫМИ ФУНКЦИЯМИ. НАИБОЛЕЕ ТРУДНОЙ ЗАДАЧЕЙ ЯВЛЯЕТСЯ ПОДБОР ТИПА РЕГРЕССИИ НЕПОСРЕДСТВЕННО ПО ЭМПИРИЧЕСКИМ ДАННЫМ, КОГДА ТЕОРЕТИЧЕСКИЕ ПРЕДПОСЫЛКИ ИЗУЧАЕМОЙ ЗАВИСИМОСТИ СОВЕРШЕННО НЕИЗВЕСТНЫ. ПРИ ЭТОМ ВСЕГДА ЖЕЛАТЕЛЬНО ВЫБИРАТЬ ТАКОЙ ВИД УРАВНЕНИЯ РЕГРЕССИИ, ЧТОБЫ ЧИСЛО L НЕОПРЕДЕЛЕННЫХ КОЭФФИЦИЕНТОВ А1,...,А1 БЫЛО ЗНАЧИТЕЛЬНО МЕНЬШЕ ЧИСЛА ИЗМЕНЕНИЯ П.
ПУСТЬ, ИСХОДЯ ИЗ ТЕХ ИЛИ ИНЫХ СООБРАЖЕНИЙ, ВЫБРАН ВИД УРАВНЕНИЯ РЕГРЕССИИ. ТОГДА ВЕЛИЧИНУ СУММЫ S (2.16), МОЖНО РАССМАТРИВАТЬ КАК ФУНКЦИЮ ОТ КОЭФФИЦИЕНТОВ А1,..., А/. ТЕПЕРЬ ЗАДАЧА СОСТОИТ В ТОМ, ЧТОБЫ НАЙТИ ТАКОЙ ВЫБОР ЭТИХ КОЭФФИЦИЕНТОВ, КОТОРЫЙ МИНИМИЗИРОВАЛ БЫ ВЕЛИЧИНУ S.
ИЗ МАТЕМАТИЧЕСКОГО АНАЛИЗА ИЗВЕСТНО, ЧТО НЕОБХОДИМЫМ УСЛОВИЕМ МИНИМУМА ФУНКЦИИ S (ДИФФЕРЕНЦИРУЕМОЙ) МНОГИХ ПЕРЕМЕННЫХ ЯВЛЯЕТСЯ ВЫПОЛНЕНИЕ РАВЕНСТВ
0.
DS DA1
DS
X
DA
ПРИНИМАЯ ВО ВНИМАНИЕ ФОРМУЛУ (2.16), ПОСЛЕ ПРЕОБРАЗОВАНИЙ ПОЛУЧИМ СИСТЕМУ X УРАВНЕНИЙ, С X НЕИЗВЕСТНЫМИ:
Vy D^(XAI, A1,..., AX) v M(Y A A ) D^(XAI' A1'...' AX); ^XKI DA ^V(XAI' A1'...' AX) ;
DA-I
I =1
I =1
VY D^(XAI' A1'...' AX) V M(Y A A ) D^(XAI' A1'...' AX); ^XKI ^V(XAI' A1'...' AX) ;
I =1 DAX I =1 DAX
(2.18)
РЕШАЯ ЭТУ СИСТЕМУ УРАВНЕНИЙ, НАХОДИМ НЕИЗВЕСТНЫЕ КОЭФФИЦИЕНТЫ A1,...,A/. ЕСЛИ ОНА ИМЕЕТ ЕДИНСТВЕННОЕ РЕШЕНИЕ, ТО ПРИ S>0 ЭТО РЕШЕНИЕ ВСЕГДА БУДЕТ ОБЕСПЕЧИВАТЬ МИНИМУМ ВЕЛИЧИНЫ S. ЕСЛИ ЖЕ РЕШЕНИЙ БУДЕТ НЕСКОЛЬКО, ТО ИЗ НИХ НЕОБХОДИМО ВЫБИРАТЬ ТО, КОТОРОЕ МИНИМИЗИРУЕТ ВЕЛИЧИНУ S.
(2.19)
A1 = Ф1 (X K1'. . .' X KN ; X A1'. . .' X AN ); AX = ФХ(Х K1'. ..' X KN ; X A1'. ..' X AN ).
А ТАК КАК ЗНАЧЕНИЯ СОСТАВЛЯЮЩИХ XK И Ха, ПОЛУЧЕННЫЕ В РЕЗУЛЬТАТЕ ИХ ИЗМЕРЕНИЯ, НОСЯТ СЛУЧАЙНЫЙ ХАРАКТЕР, ВСЛЕДСТВИЕ ВЛИЯНИЯ СЛУЧАЙНЫХ ПОГРЕШНОСТЕЙ ИЗМЕРЕНИЯ, ТО СЛУЧАЙНЫМИ БУДУТ И КОЭФФИЦИЕНТЫ A1V..,A/. ПОЭТОМУ ЭТИ КОЭФФИЦИЕНТЫ ДОЛЖНЫ БЫТЬ ОБЯЗАТЕЛЬНО ПОДВЕРГНУТЫ СТАТИСТИЧЕСКОЙ ОЦЕНКЕ. В ЧАСТНОСТИ, НЕОБХОДИМО ОЦЕНИТЬ СТЕПЕНЬ ИХ СЛУЧАЙНОСТИ, Т. Е. ВЕЛИЧИНУ СРЕДНЕКВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ КАЖДОГО КОЭФФИЦИЕНТА, И УКАЗАТЬ ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ И ДОВЕРИТЕЛЬНУЮ ВЕРОЯТНОСТЬ.
НАЙДЕННЫЕ В РЕЗУЛЬТАТЕ РЕШЕНИЯ СИСТЕМЫ УРАВНЕНИЙ (2.18) КОЭФФИЦИЕНТЫ A1V..,A/ БУДУТ, ОЧЕВИДНО, ЯВЛЯТЬСЯ ФУНКЦИЯМИ XK И Ха:
ПОСЛЕДНЯЯ ЗАДАЧА ОКАЗЫВАЕТСЯ В БОЛЬШИНСТВЕ СЛУЧАЕВ ОЧЕНЬ ТРУДНОЙ И ПОЭТОМУ ОГРАНИЧИВАЕТСЯ ЛИШЬ УКАЗАНИЕМ СРЕДНЕКВАДРАТИЧЕСКИХ ОТКЛОНЕНИЙ ЭТИХ КОЭФФИЦИЕНТОВ.
ПОСЛЕ ТОГО КАК КОЭФФИЦИЕНТЫ В УРАВНЕНИИ ПРИБЛИЖЕННОЙ РЕГРЕССИИ НАЙДЕНЫ И ОЦЕНЕНЫ, САМО ЭТО УРАВНЕНИЕ ДОЛЖНО БЫТЬ ПОДВЕРГНУТО СТАТИСТИЧЕСКОМУ АНАЛИЗУ. В РЕЗУЛЬТАТЕ ЭТОГО АНАЛИЗА, ВО-ПЕРВЫХ, ВЫЯСНЯЕТСЯ, НУЖДАЕТСЯ ЛИ ПОЛУЧЕННОЕ УРАВНЕНИЕ РЕГРЕССИИ В ПОПРАВКЕ; ВО-ВТОРЫХ, ЕСЛИ ТАКАЯ НЕОБХОДИМОСТЬ ИМЕЕТСЯ, ТО ИЩЕТСЯ САМА ПОПРАВКА.
ДЛЯ РЕШЕНИЯ ПЕРВОЙ ЗАДАЧИ ПОДСЧИТЫВАЕТСЯ СТАТИСТИЧЕСКАЯ ДИСПЕРСИЯ:
1 N 2
D = -S = Y[XKI - V(XAI' A1'...' AX] (220)
N -X I =1
ЯВЛЯЮЩАЯСЯ ОБЩЕЙ МЕРОЙ РАССЕЯНИЯ ВСЕХ Х& ВОКРУГ ФУНКЦИИ У(ХА, A1V..,A/). ОЧЕВИДНО, ЧЕМ МЕНЬШЕ ВЕЛИЧИНА D, ТЕМ ЛУЧШЕ ПОДОБРАНО УРАВНЕНИЕ РЕГРЕССИИ.
В ОБРАЗОВАНИИ ДИСПЕРСИИ D УЧАСТВУЮТ ДВА ФАКТОРА: РАССЕЯНИЕ Х^ ВОКРУГ ИСТИННОЙ ЛИНИИ РЕГРЕССИИ (ВОКРУГ СВОИХ СРЕДНИХ), ВЫЗВАННОЕ СЛУЧАЙНЫМИ ПОГРЕШНОСТЯМИ ИЗМЕРЕНИЙ СОСТАВЛЯЮЩЕЙ ХК, ОПИСЫВАЕМОЕ ДИСПЕРСИЕЙ DK, И ПОГРЕШНОСТЬ В ОПРЕДЕЛЕНИИ ПРИБЛИЖЕННОЙ РЕГРЕССИИ ХК=У(ХА, A1V..,A/), КОТОРОЙ СООТВЕТСТВУЕТ НЕКОТОРАЯ ДИСПЕРСИЯ DP. ПОСКОЛЬКУ ЭТИ ФАКТОРЫ НЕЗАВИСИМЫ, ТО
D = DK + DP (2.21)
ТАК КАК ДИСПЕРСИЯ DK ВЫЗВАНА НЕЗАВИСИМЫМИ ОТ НАС ПРИЧИНАМИ ( СЛУЧАЙНЫМИ ПОГРЕШНОСТЯМИ ИЗМЕРЕНИЙ СОСТАВЛЯЮЩЕЙ ХК ), ТО УМЕНЬШИТЬ ВЕЛИЧИНУ ДИСПЕРСИИ D ВОЗМОЖНО ЛИШЬ УМЕНЬШЕНИЕМ ДИСПЕРСИИ DP, Т. Е. УЛУЧШЕНИЕМ СХОДИМОСТИ ПРИБЛИЖЕННОЙ РЕГРЕССИИ К ИСТИННОЙ. ПРИ ЭТОМ НЕОБХОДИМО ИМЕТЬ В ВИДУ СЛЕДУЮЩЕЕ. ЧЕМ ТОЧНЕЕ ПОДОБРАНО УРАВНЕНИЕ РЕГРЕССИИ, ТЕМ МЕНЬШЕ DP. НО ЛЮБОЕ УТОЧНЕНИЕ УРАВНЕНИЯ РЕГРЕССИИ СОПРЯЖЕНО С БОЛЬШОЙ ВЫЧИСЛИТЕЛЬНОЙ РАБОТОЙ, И, КРОМЕ ТОГО, ЧЕМ ТОЧНЕЕ УРАВНЕНИЕ РЕГРЕССИИ, ТЕМ ОНО, КАК ПРАВИЛО, СЛОЖНЕЕ. С ДРУГОЙ СТОРОНЫ, ИЗ УРАВНЕНИЯ (2.21) ВИДНО, ЧТО БЕССМЫСЛЕННО СТРЕМИТЬСЯ ОБЕСПЕЧИТЬ ВЕЛИЧИНУ DP
ОЧЕНЬ МАЛОЙ ПО СРАВНЕНИЮ С DK, ТАК КАК ПРИ DP < DK ВЕЛИЧИНА ДИСПЕРСИИ И ПРАКТИЧЕСКИ ОСТАЕТСЯ НЕИЗМЕННОЙ (D«DK). ПОЭТОМУ В КАЧЕСТВЕ КРИТЕРИЯ ВЕРНОСТИ ВЫБРАННОГО УРАВНЕНИЯ РЕГРЕССИИ
ЕСТЕСТВЕННО СЧИТАТЬ ПРИБЛИЖЕННОЕ РАВЕНСТВО В«БК.ЕСЛИ ЖЕ D>DK, ТО УРАВНЕНИЕ РЕГРЕССИИ НЕОБХОДИМО УТОЧНИТЬ. ТАКИМ ОБРАЗОМ, ЧТОБЫ ОЦЕНИТЬ ВЕРНОСТЬ ВЫБРАННОГО УРАВНЕНИЯ РЕГРЕССИИ, НЕОБХОДИМО СРАВНИВАТЬ МЕЖДУ СОБОЙ ДИСПЕРСИИ D И DK. А ТАК КАК ЭТИ ДИСПЕРСИИ НОСЯТ СЛУЧАЙНЫЙ ХАРАКТЕР, ТО ТАКОЕ СРАВНЕНИЕ ДОЛЖНО ОСУЩЕСТВЛЯТЬСЯ СТАТИСТИЧЕСКИМ СПОСОБОМ. ДЛЯ ЭТОГО ПРИМЕНЯЕТСЯ, КАК И ПРИ ДИСПЕРСИОННОМ АНАЛИЗЕ, F-КРИТЕРИЙ (КРИТЕРИЙ ФИШЕРА).
ПРАВИЛО СРАВНЕНИЯ СВОДИТСЯ К СЛЕДУЮЩЕМУ:
ПО ФОРМУЛЕ (2.20) ПОДСЧИТЫВАЕТСЯ ВЕЛИЧИНА D;
ОПРЕДЕЛЯЕТСЯ ДИСПЕРСИЯ DK РЕЗУЛЬТАТОВ ИЗМЕРЕНИЯ ПАРАМЕТРА Х^ ДЛЯ ЧЕГО ПРОВОДЯТСЯ СПЕЦИАЛЬНЫЕ ИЗМЕРЕНИЯ;
ВЫЧИСЛЯЕТСЯ ОТНОШЕНИЕ D/DK=F;
ЗАДАВАЯСЬ ДОВЕРИТЕЛЬНОЙ ВЕРОЯТНОСТЬЮ Q, ИЗ ТАБЛИЦ ПО ИЗВЕСТНЫМ D, DK И ИХ СТЕПЕНЯМ СВОБОДЫ НАХОДИТСЯ ЧИСЛО FQ;
ЕСЛИ F