<<
>>

Применение дисперсионного анализа

Наиболее эффективным статистическим методом выявления взаимозависимости является дисперсионный анализ.

Этот метод состоит в том, что путем изменения соответствующих параметров объекта исследования изменяют заданным образом одну или несколько других составляющих объекта измерения. Эти изменения могут повлиять на величину одной или нескольких других составляющих. Степень такого влияния, его качественные характеристики как раз и описываются с помощью дисперсионного анализа. В зависимости от числа

составляющих, степень влияния которых на другие мы хотим оценить, различают однофакторный, двухфакторный и т.д. дисперсионные анализы.

На примере однофакторного и двухфакторного дисперсионного анализа поясним, как происходит выявление взаимосвязей между составляющими объекта измерения путем использования данного метода.

Пусть ставится задача определить, является ли составляющая Xk зависимой от составляющей Xa. Эта задача решается при помощи однофакторного дисперсионного анализа. Для этого составляющей Xa задают ряд значений Xa,Xa,...,Xa и при каждом значении производится n измерений составляющих Xk.

Для удобства результаты измерений обычно заносятся в таблицу 1. Таблица 1 Значения Номер измерения XA 1 J N XA1 Xk11 Xk1j Xk1n Xai Xki1 Xkij Xkin Xam Xkm1 Xkmj Xkmn В таблице 1 через Xkij обозначен результат j-го измерения составляющей Xk при значении Xa=Xai. Как видно из таблицы, всего мы имеем n*m результатов измерения составляющей Xk.

Обозначим через Xk среднее арифметическое из n измерений составляющей Xk, выполненных при значении Xa= Xa, через Xk- среднее арифметическое из n измерений составляющей Xk, выполненных при значении Xa=Xa и т.д.

Таким образом,

* 1 n

X k1 = — 2 xk1j n j=1

1 n

Xki = n2Xkij ; (2.7)

n j =1

* 1 n

X km = n 2 X kmj n j =1

Очевидно, если влияние составляющей Xa на составляющую

Xk существенно, то есть Xk зависит от Xa, то мы должны ожидать повышенного рассеивания средних Xk,..., Xki,...,Xkm и наоборот.

Обозначим через Xk общее среднее арифметическое всех m*n измерений составляющей Xk:

m n m

X k = "1" II xkij = -1X X ki. (2.8)

mn i =1j=1 m i =1

Определим общую статистическую дисперсию всех результатов измерений составляющей Xk:

1 m n

Dk = —II(Xkij - Xk)2- (2.9)

i =1 j =1

Эта дисперсия обязана своим, появлением всем действующим факторам - как влиянию составляющей XA, так и фактору случайности при каждом конкретном значении XA. Основная задача, которую решает дисперсионный анализ - это разделение общей дисперсии D k на компоненты, которые характеризовали бы влияние на составляющую Xk составляющей XA и фактора случайности, в отдельности.

Принимая во внимание формулы (2.7) и (2.8), статистическую дисперсию D k представим в виде

1 m n 2 1

D k = m- II[(Xkij - X kj) + (X ki - X k)] = -Ц + q0), (2.10)

11111

i=1 j=1

где

m

QA = nI(Xki - Xk)2;

i =1 mn

Q0 = II (Xky- X ki)2; i =1 j =1

Таким образом, статистическая дисперсия D k результатов измерения составляющей Xk при различных значениях XA пропорциональна сумме слагаемых QA и Q0, т.е. рассеивание, результатов измерения составляющей Xk складывается из двух компонент: QA и Q0. Величина QA характеризует влияние на

дисперсию D k составляющей Xk, а величина Q0 - влияние случайных погрешностей.

Для того чтобы оценить степень влияния составляющей XA на Xk, необходимо сравнить между собой слагаемые QA и Q0. Очевидно в том случае, когда влияние составляющей XA на Xk существенно, т.е. зависит от XA, мы должны получить QA>>Q0. Если же влияние XA на Xk несущественно, то рассеивание результатов измерения, составляющей Xk будет вызвано лишь случайными погрешностями, и мы должны получить QA<Так как результаты измерения параметра Xk носят случайный характер, то и величины QA и Q0 будут также случайными. Поэтому их сравнения нужно проводить вероятностными методами.

На практике случайные погрешности измерений очень часто оказываются распределенными по нормальному закону. В этом случае сравнение слагаемых QA и Q0, т.е. оценку влияния составляющей XA на Xk, можно проводить с помощью так называемого F-критерия:

F = -CA, (2.11)

Co

где

C = QA ¦ C = Qo

Од — , On —

m - 1 m(n - 1)

Величина F является случайной, так как величины QA и Q0 случайны. Доказано, что величина подчинена так называемому F- распределению с (m-1) и m(n-1) - степенями сво6оды.

Правило оценки степени влияния составляющей XA на Xk, сводится к следующему:

подсчитываются значения величин QA и Q0, (m-1) и m(n-1);

по этим значениям подсчитываются CA,C0 и затем F;

по специальным таблицам, имеющимся в справочниках, задаваясь доверительной вероятностью q (обычно полагают q=0.95 ^ 0.999) по степеням свободы (m-1) и m(n-1) с учетом CA,C0 и находится Fq;

гипотеза о том, что составляющая Xk зависима от принимается, если F>Fq;

если F < Fq, то влияние составляющей XA на Xk нужно считать незначительным, так как в этом случае рассеивание результатов измерений вызвано в основном случайными, погрешностями измерения Xk.

Если с помощью дисперсионного анализа установлено, что составляющая Xk зависит от XA, то это отнюдь не означает, что составляющая XA зависит от Xk, так как первая может быть причиной, а вторая - следствием. Так, например, Э.Д.С.

термопары зависит от разности температур между ее холодным и горячим спаями. Но температура между горячим и холодным спаями этой термопары ни в коем случае не зависит от термоэдс. Точно так же, если Xk не зависит от XA, то это не означает XA, что также не зависит от Xk. Поэтому, чтобы выявить взаимонезависимые составляющие объекта измерения, нужно проверять с помощью дисперсионного анализа взаимное влияние их друг на друга.

Рассмотрена методика применения дисперсионного анализа для выявления наличия зависимости какой-то одной составляющей объекта измерения от другой. Теперь необходимо определить, является ли составляющая объектом Xk зависимой от двух других XA и XB или зависит от какой-то одной из них. Эта задача решается с помощью двухфакторного дисперсионного анализа. Для этого одной из составляющих объекта, например XB, задается какое-то значение XB1. При этом значении XB начинают изменять значения составляющей XA и при каждом конкретном ее значении XA1 ,..., XAi,...,XAm осуществляют измерение величины Xk. Затем устанавливают другое значение XB=XB2 и снова осуществляют измерение при тех же самых значениях XA, что и в предыдущем случае. Такие измерения проводят для ряда значений XB1 ,...,XBi,...,XBm, составляющей XB. В итоге получают n*m результатов измерения составляющей Xk, где n и m - соответственно число значений, которое задали составляющим объекта измерения XB и XA. Результаты измерений заносят в табл. 2.

В этой таблице через Xkij; обозначен результат измерения Xk при значении XA =XAi и XB=XBj Введем обозначения:

1 n

X kAi = — 2 X kij - среднее значение составляющей при n j=1

XA =XAi;

1 m

X kBj = — 2 X kij - среднее значение составляющей при m i =1

XB =XBi;

m n m n

X1 111 11 ^iii A

X""1 X""1 v 1 X""1 v * 1 X""1 v *

k = mn 22 X kij = m 2 X kAi = n 2 XkBj - среднее i =1 j=1 i =1 j=1

арифметическое результатов измерений составляющей Xk.

Очевидно, на величину среднего X kAi оказывает влияние, помимо случайных факторов, лишь составляющая объекта XA, так

как по всем значениям XB проведено усреднение. Точно так же

X*

kBj зависит лишь от значений составляющей

XB. Поэтому рассеивание средних X kAi не будет зависеть от

значений XB, а рассеивание X kej - от значений .

Общее рассеивание результатов измерения составляющей Xk может быть оценено величиной статистической дисперсии:

mn

D

(2.12)

1 II(Xkij - Xk)2.

mn *

i =1 j=1

Принимая во внимание обозначения, введенные выше, формулу (12) представим в виде

* 1 m % * * * * * * * *1 Dk = III(XkAi - Xk) + (XkBi - Xk) + (Xkij - XkAi - XkBj + Xk

kij

kBj

mn

i =1 j =1

1

(2.13)

mn

(QA + QB + Qo).

где

m

* x2.

QA = n I (X kAi - Xk)

i =1

QB = mII(XkBi - Xk)2;

j=1 mn

Q0 = II(X kij - X kAi - X kBj + Xk) ;

i =1 j =1

Таким образом, статистическая дисперсия D k пропорциональна сумме трех слагаемых QA, QB и Q0. Причем, помимо случайных факторов, вызванных погрешностями измерения, на величину слагаемого QA влияет лишь XA, а на величину QB - XB.

Оценка степени влияния составляющих объекта измерения XA и XB на составляющую Xk, как и при однофакторном дисперсионном анализе, производится при условии нормального распределения случайных погрешностей измерений с помощью F-критерия:

QA C

= m - 1 A = CA- A= 1 ~ = Cn '

Fa = ^ = (2.14)

Qo

(m - 1)(n - 1)

-^QB C

F = —^ = C^. (2.15)

1 Co

Qo

(m - 1)(n - 1)

Правило оценки степени влияния составляющих XA и XB на Xk заключается в следующем:

подсчитываются величины QA, QB, (m-1), (n-1) и (m-1)(n-1);

по значениям величин п.1 определяются CA, CB, C0, а затем FA и FB;

задаются величиной доверительной вероятности q;

по специальным таблицам по степеням свободы (m-1) и (m- 1)(n-1) с учетом CA и C0, находится FqA, а по степеням свободы (n-1) и (m-1)(n-1) с учетом CB и C0-FqB;

если FA при FA>FqA и FB>FqB в принимается гипотеза о том, что влияние составляющих объекта измерения XA и XB на Xk существенно, т.е. Xk зависит как от XA, так и от XB;

если FA < FqA, а FB-FqB, то на составляющую влияет в основном не XA, а XB, т.е. составляющая Xk зависит лишь не от XA, а от XB;

при FA>FqA и FB>FqB в принимается гипотеза о том, что оставляющая объекта измерения зависит лишь не от XB а от XA.

Итак, рассмотрена методика применения дисперсионного анализа для выявления взаимосвязанных и взаимонезависимых составляющих объекта измерения. При этом необходимо

подчеркнуть что применение дисперсионного анализа особенно эффективно при одновременном изучении влияния нескольких составляющих объекта измерения на какую-то другую составляющую.

Дисперсионный анализ позволяет решить лишь качественную задачу — выделить из общего числа составляющих объекта измерения Х1,...,ХП взаимонезависимые и взаимозависимые.

Следующей, более высокой ступенью описания исследуемого объекта должно явиться выяснение количественных соотношений между взаимосвязанными составляющими объекта измерения. Эта задача является одной из главных при математическом описании объекта измерения.

<< | >>
Источник: Ю.Н. Пивоваров, А.Г. Реннер, В.Н. Тарасов. МЕТОДЫ ОПЕРАТИВНОЙ ОБРАБОТКИ СТАТИСТИЧЕСКОЙ ИНФОРМАЦИИ. Учебное пособие часть 1. 1998

Скачать готовые ответы к экзамену, шпаргалки и другие учебные материалы в формате Word Вы можете в основной библиотеке Sci.House

Воспользуйтесь формой поиска

Применение дисперсионного анализа

релевантные научные источники: