Оценивание парных ранговых связей Ранговый коэффициент корреляции Спирмэна
Для измерения степени тесноты парной статистической связи между ранжировками К. Спирмэн в 1904 г. предложил показатель, который впоследствии получил название рангового коэффициента корреляции Спирмэна [2, 4, 12]
(85)
т(9 = 1
V 1 „3
П ~П ,=|
где R/ и R- Jgt;- і ранги соответственно параметров к и j.
Выражение (85) справедливо при отсутствии в ранжировках групп объединенных рангов. Если такие группы есть, то определяется из выражения
^(и3 -n)-^(R/ -R,U))2 -Т(к) -Г(/)
:(и3-«)~2Г0)
?(¦')
(86)
(пг -п)-2Т{к)
где Гк) и 7^ могут быть найдены из выражения
(87)
где п; - количество элементов в группе неразличимых рангов, а т(к) - число групп неразличимых рангов.
Нетрудно убедиться, что при совпадающих ранжировках
R{k) = R- J) r/ = \, а при противоположных т/ =-1. Во всех прочих случаях |т^у)| lt; 1. Если - 0, связь между компонентами
отсутствует. Кроме того, очевидно, что ранговый коэффициент корреляции обладает свойством симметрии, т. е. .
іШО Пример 40. Для данных примера 32 вычислим степень тесноты парной связи между доходами семьи и расходами на приобретение кондитерских изделий с помощью рангового коэффициента корреляции Спирмэна.
Составим вариационные ряды для U и V и расставим ранги (см. табл. 12 и 13).
Таблица 12
Вариационный ряд для параметра U
| и | 3,4 | 3,4 | 3,8 | 3,8 | 3,8 | 4,0 | 4,2 | 4,4 | 4,6 | 4,6 | 4,8 | 4,8 | 5,0 | 5,2 | 5,4 |
| к/ | 1 | 1 | 2 | 2 | 2 | 3 | 4 | 5 | 6 | 6 | 7 | 7 | 8 | 9 | 10 |
Таблица 13
Вариационный ряд для параметра V
| V | 64 | 65 | 66 | 67 | 68 | 69 | 70 | 71 | 72 | 73 | 75 | 75 | 75 | 77 | 78 |
| Rlt;K) | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 11 | 11 | 12 | 13 |
В табл.
14 представлены ранжировки в соответствии с первоначальным положением элементов в исходной двумерной совокупности (см. табл. 6).Таблица 14
Ранжировки для параметров U и V
| rlt;(/) | 7 | 2 | 10 | 4 | 1 | 6 | 1 | 7 | 8 | 2 | 9 | 3 | 2 | 6 | 5 |
| Rlt;rgt; | 11 | 5 | 13 | 8 | 1 | 10 | 3 | 11 | 11 | 2 | 12 | 6 | 4 | 9 | 7 |
Поскольку в ранжировках есть группы объединенных рангов, то для вычисления необходимо воспользоваться выражениями (86) и (87).
Для ранжировки Rf^ rrfk^ = 4, = 2, г?/ = 3, - 2,
лГ =2.
Для ранжировки Кф , mlt;J) = 1, п\У] = 3. Проведем вычисления поправочных коэффициентов (87)
Йи) = ^ [(8-2) + (27-3) + (8-2) + (8-2)] = 3,5,
= — (27 - 3) = 2. 12
Следовательно,
^(33 75-15)-( 16+9+9+16+16+4+16+9+9+9+4+9+4)-3,5-2
(3375-15)-4
^(3375-15) -7
= 0,765.
560-130-5,5
554,5
Следовательно, между доходами семьи и расходами на покупку кондитерских изделий существует сильная положительная связь.
4.3.2.2. Ранговый коэффициент корреляции Кендалла
Другим измерителем степени тесноты статистической связи между двумя ранжировками является ранговый коэффициент корреляции Кендалла [2, 4], определяемый выражением
4v
(88)
п(п -1)
т{К) -1.
Tkj 1
где v( R[k), R[J)) - минимальное число обменов последовательности R\]), необходимое для приведения ее к упорядочению, аналогичному R[k).
Очевидно, что v(R[k),RlJ)) симметрична относительно своих аргументов.При совпадающих ранжировках R-k) и R\J) обменов не будет, следовательно, v( R}k), R(,J)) = 0 и fk/K) = 1. Во всех других случаях
для ТІР выполняется условие |т^|lt;1.
Выражение (88) справедливо при отсутствии в ранжировках групп объединенных рангов.
В противном случае необходимо воспользоваться формулой
?(*¦)_
=(*Т _ Ч/ _
(89)
2Ґ
1-
1-
«(«-о
2(Т(к) +Т{Л)
«(/7-І)
2 Т(к) «(«-!)
(./)
где тIP - оценка парного рангового коэффициента корреляции из
выражения (88). Поправочные коэффициенты Т(к) и Ти) могут быть получены в виде
і "gt;(*)
(90)
/=1
где т{к) - количество групп объединенных рангов, п\к) - количество элементов в группе. Свойства парного рангового коэффициента корреляции Кендалла аналогичны свойствам коэффициента корреляции Спирмэна.
Необходимо заметить [2, 4, 12], что вычисление является
более трудоемким, чем т{/. Статистические свойства рангового
коэффициента корреляции Кендалла более исследованы. Кроме того, он обладает большими удобствами при его пересчете, если к п статистическим объектам добавляются новые. Между масштабами шкал, в которых измеряют xf'* и х$, нет простого соотношения. Но при умеренно больших п («gt;10) и при условии, что абсолютные величины значений этих коэффициентов не слишком близки к единице, для них справедливо соотношение
;(¦*)
-1 5 тlt;*gt;
* Ч/ •
Пример 41. Для данных примера 32 вычислим парную ранговую связь между доходами семьи и расходами на кондитерские изделия с помощью коэффициента корреляции Кендалла.
Воспользуемся ранжировками, полученными в примере 40 (см.
табл. 14) для вычисления v(J$u\ R{y)). Для этого ранжировку
Таблица 15
Ранжировки U и К для примера 41
| R,(l/) | 1 | 1 | 2 | 2 | 2 | 3 | 4 | 5 | 6 | 6 | f | 7 | 8 | 9 | 10 |
| Rp | 1 | 3 | 5 | 2 | 4 | 6 | 8 | 7 | 10 | 9 | 11 | 11 | 11 | 12 | 13 |
R-U) сформируем в порядке возрастания, a RjV) - в соответствии с ранжировкой RjU).
Данные сведем в табл. 15.Вычисление v(R,(U), R{iV)) осуществляем следующим образом. Сравниваем во второй ранжировке последовательно каждый элемент, начиная с первого, со всеми последующими. Если предыдущий элемент больше последующего, то необходим обмен между этими элементами и, следовательно, v(gt;/ = 1. В противном случае v,j = 0. Индексы /, j означают соответственно порядковые номера сравниваемых рангов в ранжировке Rjy].
Анализ степени согласованности двух ранжировок дает следующие результаты (см. табл. 15).
- 2 = V) 3 = V) 4 = ...= V] 15 - 0,
V2.3 = V2,5 = v2,6 = V2,7 = • • •= V2gt;15 = 0, V2gt;4 = 1,
V3,4 = V3j5 = 1, V3j6 = Узу = .. .= V3 15 = 0,
V45 = V4.6 = ...= V4 15 = 0, V5.6 = V5.7 = ...= V5J5 = 0, V6.7 = V6.8 = ...= V6J5 = 0, V78=l,
V7.9 = V7.10 = V7J5 = 0, V8gt;9 = V8il0 = • • .= V8j5 = 0, V9JO = L
V9j]= V9.12 = ...= V915 = 0, Vю,11 = ...= VЮ.15 = 0, VII,12 = ...= Y) 115 = 0, V]2.13 = V]2.14 = Vi2,i5 = 0, Vl3,14 = V13.15 =0, Vi4j5 = 0.
Следовательно, v( RjU), R\V)) = 5. Тогда из (88) найдем
4-5 15(15-1)
Поправочные коэффициенты из (90) равны
7lt;г/)=1[2-1 + 3-2 + 2-1 + 2-1] = 6,
Т(У) =--3-2 = 3.
Получим т\Р' из (89)
= 0,85.
Хк, ~
2-6
1514
1-
0,905-—
15-14
2-3
15-14
Проверка статистически значимого отличия от нуля ранговых корреляционных характеристик может быть осуществлена при не слишком малых п (п gt; 10) при заданном уровне значимости. Данный вопрос рассмотрен в [2, с. 114, 4]. Там же рассмотрена
методика построения доверительных интервалов для т[к) и т[%
[2,с.П6,4].