Проверка гипотезы об отсутствии линейной статистической связи
Надежность характеристики г ослабевает с уменьшением объема выборки п, поэтому важно уметь определять минимальное значение г , отклонение которого от нуля можно считать значимым.
Это задача проверки статистической гипотезы о значимости линейной связи [1,4].Показано, что в случае совместной нормальной распределенности исследуемых параметров и большом п распределение г асимптотически нормально с
М{?} = г, В{г}=о) Г
п
Однако при малых п яг, близких к 1, это допущение нарушается. Хорошее приближение распределения г к нормальному закону получается при малых значениях | г |, что позволяет сконструировать критерий об отсутствии корреляционной связи между исследуемыми признаками. Рассмотрим пять шагов логической схемы статистического критерия.
- й шаг. Формирование гипотезы об отсутствии статистической связи
Н0: гх,у = О,
Н\. гх,у* 0.
- й шаг. Задание уровня значимости а .
- й шаг. Выбор вида критической статистики

При «-»со предельное распределение статистики ц/кр имеет /-распределение Стьюдента с (и - 2) числом степеней свободы
lim Щукр) = /(Фкр; « - 2).
- й шаг. Определение критических границ
2
-100%
фкр.в a (« — 2),
Укр.н Ч^крв
где (п-2) - процентная точка /-распределения Стьюдента
—100%
2
уровня — ¦100%.
- й шаг. Определение расчетного значения критической статистики
Irx J\yjn-2
фрасч = Г~=“-
Vі ~fh
,Если выполняется условие
М/кр.н ^ Vpac4 ^ ЧАр.вgt; (69)
то гипотеза Н0 верна, в противном случае, Н0 отвергается с ошибкой первого рода а.
Пример 34. Для данных примера 33 проверить гипотезу об отсутствии линейной статистической связи между стоимостью квартиры и ее удаленностью от областного центра при уровне значимости а = 0,05. Воспользуемся пятью шагами логической схемы проверки гипотез.
- й шаг.
Но'- ту7= 0,
Н\: ryz ^ 0.
- й шаг. а = 0,05.
- й шаг. Вид критической статистики
I Jn-
r-
Уч» /. —2
r r,z
Согласно (67) при n —gt; со закон ее распределения стремится к /-распределению Стьюдента с (п - 2) числом степеней свободы.
- й шаг. Найдем критические границы для критерия, воспользовавшись таблицей процентных точек /-распределения Стьюдента из прил. 2.
4Vb= L,5 %(16) = 2,12,
- й шаг. Расчетное значение критической статистики найдем из выражения (68)
0,99 Vl6

= 28,07.
Поскольку 28,07 не попадает в интервал (-2,12; 2,12), условие (69) не выполняется и гипотеза Щ ошибочна.
Действительно, корреляционную связь с fy z =-0,99 нельзя считать незначимой.
- Доверительные интервалы для истинного значения коэффициента корреляции
Как уже отмечалось в п. 1.4.2, при малой выборке точечными оценками числовых характеристик пользоваться некорректно. Необходимо интервальное оценивание.
Построим доверительные интервальные оценки для истинного значения коэффициента корреляции [2, 4]. Это можно сделать, основываясь на нормальной распределенности г . Верхнюю и нижнюю границы интервала г„ и г„ можно вычислить из выражения
где ир - квантиль нормального распределения, р - уровень довери
2
тельной вероятности.
Однако использование выражения (70) возможно при многих ограничениях, выполнение которых не всегда возможно, а именно:
- г должно быть близко к величине ± 1;
- п достаточно велико.

Избавиться от этих ограничений позволяет преобразование
(71)
предложенное Р.
Фишером. Он показал, что z в выражении (71) даже при малых п достаточно близко к нормальному закону распределения. Это позволило Р. Фишеру сконструировать доверительный интервал в видеUP = иЕ
2 1-г 2(и-1) 2(77-1)'
zHB =—__2_ —- = arcth г + ' —¦. (72)
Отсюда следует, что истинное значение коэффициента корреляции г с доверительной вероятностью (р) заключено в пределах
th zH lt; г lt; th zB
где th z - гиперболический тангенс от аргумента z.
Зная z„ и zB, можно найти th z„ и th zB, воспользовавшись таблицей преобразования Фишера из прил. 8.
т Пример 35. Для данных примера 33 и полученного значения ?у z получить интервальную оценку для истинного значения коэффициента корреляции при /gt; = 0,95. Из выражения (72) получим (при м? = щ 475 = 1,96):
2
1 1 _ о 99 1 96 -0 99
zH =-1п ¦¦¦- ’—-і—^-3 124, н 2 1 + 0,99 ТЇ5 34
1 1-0,99 1,96 -0,99 011|
2 = —In Н—7=- = -2,1 1 1.
в 2 1 + 0,99 ТЇ5 34
Воспользовавшись таблицей прил. 8 и помня, что знаки функции th z и аргумента z одинаковы, найдем:
th z„ = - 0,997, th zB = - 0,971.
Следовательно
-0,997 lt;rYXlt;- 0,971.