<<
>>

ПОСТАНОВКА ЗАДАЧИ. ОБЩАЯ ЛОГИЧЕСКАЯ СХЕМА СТАТИСТИЧЕСКОГО КРИТЕРИЯ ПРОВЕРКИ ГИПОТЕЗ

На разных этапах статистического исследования возникает необходимость в формулировании и экспериментальной проверке некоторых предположительных утверждений (гипотез, истин), от которых зависят правомерность и эффективность применяемых методов анализа, например:

  • можно ли считать подлежащие обработке данные результатами независимых наблюдений случайной величины;
  • при наличии нескольких групп исходных данных можно ли считать, что они извлечены из одной генеральной совокупности;
  • симметричен ли закон распределения исследуемой случайной величины относительно центра группирования;
  • какую модель надо выбрать для описания эмпирических данных;
  • какова природа и величина неизвестных параметров рассматриваемой стохастической схемы и т.
    д.

Наша цель в данном случае - проверить, не противоречит ли высказанная нами гипотеза Н0 имеющимся эмпирическим данным.

Процедура обоснованного сопоставления высказанной гипотезы с имеющейся выборкой лгі, дэ, —» *71 осуществляется с помощью того или иного статистического критерия и называется статистической проверкой гипотез.

Результат такого сопоставления может быть как отрицательным (данные наблюдения противоречат выдвинутой гипотезе, следовательно, от нее надо отказаться), так и положительным (наблюдения не противоречат высказанной гипотезе, и поэтому ее можно принять в качестве одного из решений).

Неотрицательный результат статистической проверки гипотез не означает, что высказанное нами предположительное утверждение является наилучшим. Могут также существовать другие гипотезы, которые не будут противоречить тем же эмпирическим данным.

Принятая в этом случае гипотеза будет рассматриваться как достаточно правдоподобное, не противоречащее опыту утверждение.

Статистические критерии проверки гипотез разнообразны, но у них единая логическая схема построения критерия, которая укладывается в 5 шагов [1].

  1. й шаг. Выдвигается основная (или проверяемая) гипотеза Н0. Гипотеза Н\, которая противоречит основной Но, называется альтернативной, или конкурирующей.
  2. й шаг. Задается уровень значимости критерия а. Дело в том, что любое статистическое решение, принимаемое на основе ограниченного ряда наблюдений, сопровождается, хоть и малой, вероятностью ошибочного заключения. Именно в доле случаев а гипотеза Но может быть отвергнута при условии, что она верна, или, наоборот, в доле случаев Р мы можем принять гипотезу Но, в то время как она ошибочна. При фиксированном объеме выборки п величину вероятности а или (3 мы можем выбирать самостоятельно. Если есть возможность сколь угодно увеличивать п, то теоретически можно добиться как угодно малых ошибок аир при любой фиксированной конкурирующей гипотезе Н\.

Величину а называют уровнем значимости, размером критерия или ошибкой первого рода. Это вероятность отвергнуть основную гипотезу Но при условии, что оиа верна.

Чем весомее для исследователя потери от ошибочного отвержения гипотезы Но, тем меньшее а необходимо выбирать. Обычно пользуются стандартными значениями а (0,1; 0,05; 0,025; 0,01; 0,005; 0,001).

tiSC Пример 17. Величина а = 0,05 означает, что в среднем в 5 случаях из 100 при использовании данного статистического критерия будет ошибочно отвергаться справедливая основная гипотеза Но.

  1. й шаг. Задается некоторая функция результатов наблюдения - критическая статистика

Как функция наблюдений эта' критическая статистика также является случайной величиной и в предположении справедливости Н0 подчинена некоторому хорошо изученному закону распределения с плотностью вероятности Щцікр).

Механизм построения закона распределения критической статистики описан в [1].

Содержательный смысл критической статистики - мера расхождения имеющейся в распоряжении исследователя выборки с основной гипотезой Н0.

Например, в гипотезе об однородности двух выборок случайных величин X и Y укр - мера различия между функциями распределения F(x) и F(y).

  1. й шаг. Из статистических таблиц распределения Щц)кр) или расчетным путем находятся квантили уровня а/2 и 1-а/2 или процентные ТОЧКИ У(1_ц/2).100% И Vj/(a/2).ioo%, ЯВЛЯЮЩИЄСЯ СООТВЄТСТВЄННО нижней v|/KpH и верхней укрв критическими точками (границами). Они делят всю область допустимых значений укр на области:
  • неправдоподобно малых (I);
  • правдоподобных (II);
  • неправдоподобно больших (III).

Область принятия гипотезы Н0 определяется как доверительный -интервал для v;/Kp, который формируется на основе распределения статистики W(\\iKp) при уровне доверительной вероятности р = 1 - а.

Различают односторонние и двухсторонние критерии. Для одностороннего критерия область принятия основной гипотезы может иметь ограничение только с одной стороны (сверху или снизу). При этом область значений статистики укр разбивается на две: область правдоподобных и область неправдоподобно больших или неправдоподобно малых значений.

Для двухстороннего критерия область принятия гипотезы Но имеет два ограничения - сверху и снизу.

Рис. 17. Области принятия и отвержения гипотезы На.

5-й шаг. Определяется наблюденное (расчетное) значение критической статистики урасч подстановкой в укр конкретных выборочных значений Xi х2, ...,х„ или некоторых функций от них. Если окажется, что 1^,, принадлежит области правдоподобных значений, то гипотеза Н0 верна, т. е. не противоречит выборочным данным. В противном случае Н0 отвергается с ошибкой первого рода а. Отвержение Н0 означает, что урасч не подчиняется закону распределения Щукр). Ошибка Р может возникнуть тогда, когда принимается Н0, в то время когда она неверна, р называется ошибкой второго рода, а (1 - Р) - мощностью критерия.

Если проверяемая гипотеза Н0 сводится к проверке точного равенства, то гипотеза называется простой, в других случаях мы имеем дело со сложной или вложенной гипотезой.

Пример 18. Первый шаг проверки гипотез об однородности двух выборок выглядит так:

Ну. F(x) = F(y),

Н\\ F(x) Ф F(y).

Здесь Н0 - гипотеза простая, Н\ - гипотеза сложная (вложенная).

Задания для самоконтроля

Вопрос 1. Для двустороннего критерия по сравнению с односторонним (при ограничении сверху) при одном и том же уровне

значимости верхняя критическая точка будет расположена               . Сделайте правильный выбор.

  1. Левее
  2. Правее
  3. Останется без изменения

Вопрос 2. Вероятностью принятия основной гипотезы при

условии, что она неверна, называют . Сделайте правильный

выбор.

  1. Доверительную вероятность
  2. Уровень значимости
  3. Ошибку второго рода
  4. Ошибку первого рода

Вопрос 3. Поставьте каждому шагу логической схемы проверки статистического критерия соответствующие ему функции.

Функции

А.              Формулирование Но

  1. й шаг               Б.              Вычисление              фрасч
  2. й шаг               В.              Задание а
  3. й шаг               Г.              Проверка условия и принятие реше-
  4. й шаг               ния об истинности или ложности Н0
  5. й шаг               Д.              Задание укр

Е. Вычисление критических границ статистики фкр Ж. Исследование предельного распределения статистики укр 3. Формулирование Н\

<< | >>
Источник: Никитина Н.Ш.. Математическая статистика для экономистов: Учеб. пособие. - 2-е изд., перераб. и доп.- М.: ИНФРА-М; Новосибирск: Изд-во НГТУ,2001. - 170 с.. 2001

Еще по теме ПОСТАНОВКА ЗАДАЧИ. ОБЩАЯ ЛОГИЧЕСКАЯ СХЕМА СТАТИСТИЧЕСКОГО КРИТЕРИЯ ПРОВЕРКИ ГИПОТЕЗ:

  1. Глава III. Пути и средства увеличения вывоза наших товаров и уменьшения нашего потребления иностранных товаров