<<
>>

ОБЩИЕ СВЕДЕНИЯ. ЗАДАЧИ КОРРЕЛЯЦИОННОГО АНАЛИЗА

При решении типовых задач, практически связанных с нормированием, прогнозом, планированием, диагностикой и другими, приходится иметь дело с объектами, процессами и системами, как правило, описываемыми многими параметрами, между которыми возможна связь.

Любой закон природы или общественного развития может быть представлен описанием совокупности взаимосвязей. Если эти зависимости стохастичны, а анализ осуществляется по выборке из генеральной совокупности, то данная область исследований относится к задачам статистического исследования зависимостей [2], которые включают в себя корреляционный, регрессионный, дисперсионный и ковариационный анализы.

В данном учебном пособии рассмотрены основные элементы анализа структуры и степени тесноты статистической связи между анализируемыми переменными, т. е. задачи корреляционного анализа.

Основное содержание корреляционного анализа составляют методы, которые позволяют ответить на вопросы:

  • существует ли связь между исследуемыми переменными?
  • какова структура связей между параметрами исследуемого многомерного признака?
  • как измерить тесноту связей?

В задачах корреляционного анализа под структурой связей понимается лишь факт наличия или отсутствия связи, а не форма этой зависимости.

Корреляционный анализ - совокупность методов исследования параметров многомерного признака, позволяющая по выборке из генеральной совокупности сделать статистические выводы о мерах статистической зависимости между компонентами исследуемого признака.

Прежде чем приступить к изучению методов анализа структуры и тесноты связи между исследуемыми переменными, рассмотрим описание общей схемы взаимосвязи параметров при статистическом исследовании зависимостей, приведенной на рис. 20.

На рис. 20 S - модель исследуемого реального объекта, реализующая механизм преобразования входных переменных в отклик.

xjt, j = \,т - входные переменные, описывающие условия функционирования объекта (некоторые из них могут быть подвергнуты

Случайные

факторы

Г1'', I - I, п

Объясняющие

переменные

(преднкторные)

хг / = \,т

'

Г ’

г 1

f '

V‘'\ і ¦-= 1, /gt;

S

Рис. 20. Общая схема взаимосвязи параметров при статистическом исследовании ,              зависимостей

Результирующие

переменные

(отклик)

регулированию). Эти факторы часто называют независимыми, предикторными ИЛИ объясняющими. е°\ / = 1,77 - случайные, остаточные компоненты, влияние которых на yw трудно учесть (измерить). К ним относятся также случайные ошибки в измерении анализируемых параметров. Такие компоненть/ называют еще

латентными или просто «остатками», у01, і = 1, и - выходные переменные (отклик), характеризующие результат функционирования объекта. Иногда их называют объясняемыми переменными.

Далее будем пользоваться введенными понятиями.

При исследовании статистической связи между компонентами многомерного признака исследователю приходится решать следующие задачи [2]:

  • выбора подходящего измерителя связи с учетом специфики и природы анализируемых переменных;
  • ¦ точечного или интервального оценивания связи по выборочным данным, полученным в результате эксперимента;
  • проверки гипотезы о значимости (статистически значимом отличии значения корреляционной характеристики от нуля) анализируемого измерителя связи;
  • анализа структуры связей между компонентами многомерного признака.

Все это задачи корреляционного анализа. В качестве измерителей степени тесноты парных связей между количественными переменными могут использоваться индекс корреляции, коэффициент корреляции (иногда используют термин «коэффициент корреляции Пирсона»), корреляционное отношение, частный коэффициент корреляции, применяемый для исследования частных или «очищенных» связей, освобожденных от опосредованного одновременного влияния на исследуемую парную связь других переменных.

Если статистическая информация о многомерном признаке представлена не в количественной, а в порядковой шкале, то измерение парных связей осуществляется посредством ранговых выборочных измерителей связи — коэффициентов корреляции Кеидалла и Спирмэна.

Измерение степени тесноты множественной связи между количественными переменными возможно с помощью множественного коэффициента корреляции (или коэффициента детерминации), а между порядковыми переменными - с помощью коэффициента конкордации.

При таком многообразии измерителей статистической связи важной становится задача выбора адекватного измерителя.

Применимость того или иного измерителя определяется как формой представления исходной статистической информации (количественные или порядковые признаки), так и формой связи (линейная, нелинейная). От грамотного выбора адекватного измерителя связи зависит достоверность статистических выводов, распространяемых на исследуемую многомерную генеральную совокупность.

Предварительный анализ структуры связи между компонентами исследуемого многомерного признака, представленного выборкой из генеральной совокупности, осуществляют с помощью корреляционных полей.

Под корреляционным полем (диаграммой рассеяния) переменных (м, v) понимается графическое представление результатов

измерений («ь V]), ..., (и„ V,), ..., («„, v„), i = \,n этих переменных в плоскости (и, v). На основании анализа корреляционного поля легко решить вопрос о наличии или отсутствий связи, проследить характер связи (линейная, нелинейная, функциональная или стохастическая) и ее тенденцию (положительная, отрицательная).

Ж Пример 32. Исследование зависимости между среднемесячными доходами на семью (в тыс. руб.) и расходами на покупку кондитерских изделий (в руб.) представлено табл. 6.

Таблица 6

Зависимость расходов семьи на покупку кондитерских изделий от среднемесячных доходов

Доходы семьи (тыс. руб.), U

4,8

3,8

5,4

4,2

3,4

4,6

3,4

4,8

5,0

3,8

5,2

4,0

3,8

4,6

4,4

Расходы на

кондитерские

изделия

(руб.), у

75

68

78

71

64

73

66

75

75

65

77

69

67

72

70

Корреляционное поле, построенное по статистическим данным табл.

6, приведено на рис. 21.

70 -

90 -

тт

50-

40-

33- 20 -

10-

и

Рис. 21. Зависимость расходов семьи на кондитерские изделия (К, руб.) от среднемесячных доходов (U, тыс. руб.)

Анализ рис. 21 позволяет сделать вывод о наличии сильной линейной статистической связи между среднемесячными доходами семьи и затратами на приобретение ею кондитерских изделий.

При этом связь имеет положительную тенденцию, т. е. с ростом предикторной переменной U наблюдается увеличение отклика V.

<< | >>
Источник: Никитина Н.Ш.. Математическая статистика для экономистов: Учеб. пособие. - 2-е изд., перераб. и доп.- М.: ИНФРА-М; Новосибирск: Изд-во НГТУ,2001. - 170 с.. 2001

Еще по теме ОБЩИЕ СВЕДЕНИЯ. ЗАДАЧИ КОРРЕЛЯЦИОННОГО АНАЛИЗА:

  1. ПРЕДИСЛОВИЕ