<<
>>

АНАЛИЗ СТАТИСТИЧЕСКОЙ СВЯЗИ МЕЖДУ КОЛИЧЕСТВЕННЫМИ ПЕРЕМЕННЫМИ. ИЗМЕРЕНИЕ ПАРНЫХ СТАТИСТИЧЕСКИХ СВЯЗЕЙ 4.2.1. Коэффициент корреляции

  1. Оценивание и свойства коэффициента корреляции

Пусть исследуется парная зависимость между случайными компонентами X и Y двумерного признака. Предположим, что в результате эксперимента получена выборка из двумерной нормальной генеральной совокупности.

Степень тесноты статистической связи между двумя исследуемыми компонентами может быть измерена с помощью выборочного коэффициента корреляции [2, 4, 14,15].

где cov{X,7} - оценка второго смешанного центрального момента случайной величины (X, 7).

Формально коэффициент корреляции может быть вычислен для любой пары параметров многомерного признака. Однако он является адекватным измерителем степени тесноты лишь линейной статистической связи между анализируемыми признаками, независимо от тенденции связи. Необходимо также отметить, что коэффициент корреляции имеет четкий смысл как характеристика степени тесноты связи только в случае совместной нормальной распределенности исследуемых случайных величин X и Y.

Свойства коэффициента корреляции. В общем случае коэффициент корреляции может принимать значения | г \ lt; 1. В частности, если | г | = 1 между исследуемыми признаками существует функциональная линейная зависимость. При г = -1 имеет место отрицательная линейная зависимость, при г = ] - положительная. Если г = 0, то параметры Хи У некоррелированы. Однако это вовсе не означает, что X и Y независимы, если априори допускается отклонение этой зависимости от линейной. Следовательно, некоррелированность не означает независимости исследуемой пары признаков. В то же время независимость всегда означает и некоррелированность X и Y. При г = 0 необходимо дополнительное статистическое исследование степени отклонения распределения рассматриваемых величин от нормального.

Коэффициент корреляции обладает свойством симметрии, т.е.

Гх.г = Гг.х-

Для случая многомерного случайного признака

і = 1,и; j = 1, р {р -размерность признака) статистический

анализ всех парных связей может быть представлен корреляционной матрицей многомерного признака.

x(i)

х{2)

Х™

*(1)

1

Г\ 2

f\p

(2)

X

гг\

і

Г2 Р

1

Гр 2

1

УЪС- Запомните! Коэффициент корреляции как измеритель степени тесноты парной статистической связи имеет четкий смысл при линейной тенденции связи и совместной нормальной распределенности исследуемых пар параметров многомерного признака.

Парный коэффициент корреляции не учитывает опосредованного или совместного влияния других факторов.

Пример 33. В табл. 7 приведены результаты исследования стоимости квартир zjt і = 1, п (тыс. руб.), общей площади и,, і = 1 ,п (м2) и удаленности квартиры от областного центра у, , / = 1, п (км.).

Таблица 7

Зависимость стоимости квартиры Z от ее плошали U и удаленности от областного центра У

У

74

47

92

48

93

72

42

50

64

78

39

96

74

88

55

80

99

85

и

56

70

29

69

25

60

71

68

65

49

62

16

58

32

64'

49

10

36

Z

44

69

27

78

30

48

79

65

56

43

80

30

43

29

64

43

19

37

Необходимо исследовать вид связи между удаленностью квартиры от областного центра, ее стоимостью и общей площадью.

Корреляционные поля для пар компонентов (К, Z), (Y, U),(U,Z) приведены на рис.

22.

Судя по корреляционному полю, между Y и Z (а) можно предположить наличие сильной линейной связи с отрицательной тенденцией. Не проводя предварительного анализа данных, допустим, что исследуемая трехмерная зависимость имеет совместно нормальное распределение.

Из выражения (66) получим оценку ту z по п - 18 элементам выборки. Для этого определим оценки числовых характеристик

щ =70,89, m7 =49,11, lt;т2г =371,32, lt;x2z =356,43.

Тогда на основе (66) получим

rr z=-0,99.

Наше предположение подтвердилось. Между стоимостью квартир и их удаленностью существует сильная отрицательная корреляция, близкая к функциональной зависимости.

М ¦

¦ ¦

¦

¦

¦ н

¦

20              40              60              80              100              120

90

80

70

60

50

40

ЗО

20

10

О

• ¦

U 80 70 60 50 40 ЗО 20 10 О

20              40              60              80              100              120

б

¦ ¦

¦ ¦

¦ ¦¦

Z 90 80 70 ¦ 60 50 40 ЗО 20 10 - О -

О 10              20              ЗО              40              50              -60              70              80

Рис. 22. Корреляционные поля для пар компонентов:

a-(Y,Z);6-(Y, U),e-(U,Z)

<< | >>
Источник: Никитина Н.Ш.. Математическая статистика для экономистов: Учеб. пособие. - 2-е изд., перераб. и доп.- М.: ИНФРА-М; Новосибирск: Изд-во НГТУ,2001. - 170 с.. 2001

Еще по теме АНАЛИЗ СТАТИСТИЧЕСКОЙ СВЯЗИ МЕЖДУ КОЛИЧЕСТВЕННЫМИ ПЕРЕМЕННЫМИ. ИЗМЕРЕНИЕ ПАРНЫХ СТАТИСТИЧЕСКИХ СВЯЗЕЙ 4.2.1. Коэффициент корреляции:

  1. ПРЕДИСЛОВИЕ