<<
>>

ОПИСАТЕЛЬНАЯ СТАТИСТИКА. ОСНОВНЫЕ ПОНЯТИЯ ВЫБОРОЧНОГО МЕТОДА

Структура главы «Описательная статистика. Основные понятия выборочного метода» представлена на рис. 2.

Ы} йели

Иметь представление:

  • об основных задачах математической статистики (МС);
  • этапах статистической обработки эмпирических данных.

Знать и уметь различать понятия:

  • малая, большая и репрезентативная выборки;

•формы представления выборки (негруппированная, группированная, вариационный ряд);

  • функционные и числовые характеристики случайных величин [6, 8];
  • точечные и интервальные оценки характеристик случайной величины;
  • характеристики положения, рассеяния, формы распределения;
  • характеристики порядковых статистик.

Уметь:

  • получать по выборке из генеральной совокупности оценки начальных и центральных моментов, оценки коэффициентов асимметрии и эксцесса, оценки характеристик порядковых статистик (медиану, квантили, процентили, квартили, децили, размахи), оценки функции и плотности распределения вероятностей случайной величины;
  • строить полигон частот, гистограмму и график накопленных частот.

Рис.

2. Структура раздела «Описательная статистика. Основные понятия выборочного

метода»

  1. ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ. ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Обозначим количество всех подлежащих обследованию объектов N (/ = ],N). Допустим, что каждому объекту /' соответствует значение X/. Согласно данному ранее определению, совокупность всех возможных значений (теоретически домысливаемых) N объектов называется генеральной совокупностью, а N - объемом генеральной совокупности.

Генеральная совокупность может быть конечной или бесконечной. Пусть количество реально наблюдаемых объектов из N равно п. Тогда х„ г = ],п - выборка из генеральной совокупности, п - объем выборки. Выборка из генеральной совокупности должна обладать следующими свойствами:
  • каждый элемент х, выбран случайно;
  • все Xj имеют одинаковую вероятность попасть в выборку;
  • п должно быть настолько велико, насколько это позволяет решать задачу с требуемым качеством (выборка должна быть репрезентативной, представительной).

В дальнейшем будем иметь дело с выборкой, обладающей такими свойствами.

Принято считать, что при п gt; 60 выборка большая, или репрезентативная, а при п lt; 60 - малая. Такое деление выборки на большую и малую условно. Разные авторы используют разное пограничное п, делящее выборки на малые и большие, которое к тому же зависит от решаемой статистической задачи.

Понятие репрезентативная выборка не всегда можно связать с ее объемом п. Чаще это зависит от реально исследуемого объекта или явления, объема генеральной совокупности, трудоемкости и стоимости получения наблюдений или измерений для формирования выборки.

Возможны ситуации, когда генеральная совокупность мала. Например, исследуется время наработки до отказа уникального оборудования, когда в эксплуатации находится заведомо малое количество его экземпляров (N). Доступного для исследования оборудования (и) может быть еще меньше. Поэтому выборка объемом п, близким к объему генеральной совокупности N, может считаться репрезентативной и одновременно малой (п lt; 60).

tBC Пример 1. Количество зарегистрированных малых предприятий торговли продуктами питания в городе Новосибирске равно 2436. Для исследования предприятий по объему товарооборота взято 136 предприятий. В данном случае N= 2436 - объем гене-

ральной совокупности (все мыслимые предприятия данной категории), а п = 136 - объем выборки из генеральной совокупности.

Рассмотрим некоторые формы представления выборки из генеральной совокупности.

  1. Представление выборки из генеральной совокупности в не-

груннированном виде xh і = 1, п . Такая форма связана с наличием сведений о каждом элементе выборки.

ЯНП Пример 2. Исследование ежедневного простоя (в часах) ¦**?-gt; бригады каменщиков из-за отсутствия строительных материалов в течение 10 дней представлено в виде: 1,3 0,7 2,8 2,3 1,15 0,25 1,17 0,8 2,4 0,45, п- 10. Здесь имеет место негруппирован- ная выборка.

  1. Представление выборки в виде вариационного ряда (в упорядоченном виде)

Х(])lt;Х(2)lt; ... lt;Х(,)lt;... lt;Х(И) .

В этом случае - член вариационного ряда, или варианта. Часто Х(,-) называют порядковой статистикой [1, 4]. Индекс (г) указывает на порядковый номер элемента в вариационном ряду. Часто X(j) обозначают где R - ранг порядковой статистики. Иногда используют обозначение где R, - ранг і-го наблюдения в исходной (неупорядоченной) выборке. Любую функцию порядковых статистик также называют порядковой статистикой.

Форма представления выборки из генеральной совокупности в виде вариационного ряда не приводит к потере информации о каждом элементе выборки, но искажает информацию, устанавливая зависимость между соседними элементами выборки.

"•“At-1 Необходимо помнить! Члены вариационного ряда, в отличие от элементов исходной выборки, уже не являются взаимно независимыми (по причине их предварительной упорядоченности).

  1. Представление выборки в группированном виде. Такая форма представления выборки из генеральной совокупности связана с разбиением области задания случайной величины X на L интервалов группирования. При этом известны только количество

элементов выборки п:, j = \,L, попавших в j интервал, и последовательность границ интервалов разбиения. Для определения числа

L интервалов искусственного группирования пользуются формулой Старджеса [5]

(1)

L= 1 + 3,322-lg п.

Иногда L может быть задано природой исследуемого явления или условиями проведения эксперимента.

В данном случае ширина каждого интервала может быть отличной от других (неравноточное группирование).

На некоторых этапах статистического анализа необходимо исходную выборку представлять в группированном виде.

Рассмотрим последовательность процедуры группирования неупорядоченной выборки из генеральной совокупности.

  1. Формирование вариационного ряда.
  2. Выделение минимального и максимального элементов выборки:

  1. Определение числа интервалов группирования осуществляется из соображения точности и устанавливается либо эмпирическим путем в зависимости от объема выборки, либо по формуле Старджеса [5], либо определяется природой явления или условиями проведения эксперимента. Округление При нахождении L осуществляется до ближайшего целого числа.
  2. Определение ширины интервалов группирования (при равноточном группировании)

(2)

Если при вычислении h необходимо округлить результат, следует помнить, что последний интервал группирования будет меньше ширины h при округлении в большую сторону и больше h при округлении в меньшую сторону.

  1. Формирование последовательности границ интервалов разбиения.

Образуемый вариационный ряд границ интервалов группирования будет выглядеть как

^(і)? ?^(i) h9 X(i) “Ь 2h, ... , “Ь (L 1) 'И, хщ).

Иногда для того, чтобы x(i) и х(п) попали внутрь соответственно 1-го и 1-го интервалов группирования, границы хП) и х{п) корректируют следующим образом:

' _ h х(і) -*(і) ~ 2 5

- _ h

Х(п) Х(п) + 2 '

Следовательно, число интервалов разбиения увеличивается на 1

L' = L+ 1.

При этом последовательность границ интервалов разбиения будет представлена в виде

х'(1), х'(1) + h,x\i)+2h, ... , х'(1) + L-h, х' (п).

6. Определение количества элементов выборки nh попавших в каждый j интервал.

Ж Пример 3. Ниже приведены объемы выработки за месяц (в тыс. руб.) пятидесяти продавцов молочных изделий, работающих в разных районах города.

  1. 19              6              18              21              16              20              17              15              10
  2. 20              7              19              22              17              21              19              16              11

19 10              8              18              20              8              18              16              20              12

16 21              21              9              19              19              14              18              19              19

12 20              20              8              13              10              18              17              22              18.

Представим выборку в группированном виде.

  1. Формируем вариационный ряд
  1. 9              12              15              16              18              19              19              20              21 ,
  2. 10              12              16              17              18              19              19              20              21
  3. 10              13              16              17              18              19              19              20              21
  1. 10              14              16              17              18              19              20              20              21
  2. 11              15              16              18              18              19              20              21              22.
  1. Находим х(1)= 22, х(п) = 6.
  2. Определяем число интервалов разбиения по формуле Стард- жеса(1)

L= 1 +3,322-lg50 = 6,6, 1 = 7.

  1. Находим ширину интервала разбиения h по формуле (2)

h = 2?-JL = 2,2857.

7

Ограничимся двумя знаками после запятой и получим h = 2,28.

Поскольку h округлено в сторону уменьшения, то последний интервал будет шире предыдущих.

  1. Строим вариационный ряд границ интервалов группирования (без корректировки границ первого и последнего интервалов): [6; 8,28], [8,28; 10,56], [10,56; 12,84], [12,84; 15,12], [15,12; 17,4], [17,4; 19,68], [19,68; 22].

Та же процедура, но с корректировкой границ первого и последнего интервалов, даст следующие результаты:

L' = L+ 1 =7+1 = 8;

/і) = /і) — — = 6 —1,14“4,86 ;

х[п) = х(п) + — = 22 + 1,14 = 23,14 .

Получаем последовательность границ интервалов разбиения для L = 8: [4,86; 7,14], [7,14; 9,42], [9,42; 11,7], [11,7; 13,98], [13,98; 16,26], [16,26; 18,54], [18,54; 20,82], [20,82; 23,14].

Ширина последнего интервала в том и другом случае (1 = 7 и L = 8) равна h = 2,32.

  1. Находим количество элементов выборки r»j, попавших в j интервал, j -l,L (случай без корректировки границ интервалов)

j

1

2

3

4

5

6

7

Пі

5

4

3

4

8

14

12

Находим rij, j = 1, L +1 (случай корректировки границ интервалов разбиения)

І

1

2

3

4

5

6

7

8

. Ч..

2

4

4

3

8

9

14

6

Группированная форма представления случайной величины не содержит информации о каждом элементе выборки. При этом часто в качестве значения случайной величины на каждом интервале принимается его середина.

Это важно! От негруппированной выборки всегда можно перейти к группированной, но не наоборот. Необходимо помнить, что переход к группированной форме представления выборки сопряжен с потерей информации об исследуемом объекте, процессе или явлении.

Любые характеристики случайной величины, полученные по выборке из генеральной совокупности, называются выборочными, или эмпирическими, характеристиками, а характеристики, полученные по генеральной совокупности, - теоретическими, или генеральными, характеристиками.

Задачи математической статистики. Основная задача математической статистики состоит в определении свойств генеральной совокупности по выборке ограниченного объема п с использованием по возможности априорных предположений.

К задачам математической статистики относятся следующие:

  • разработка и применение методов оценивания числовых и функционных характеристик генеральной совокупности по выборке из нее;
  • описание эмпирических данных вероятностными моделями;
  • проверка статистических гипотез;
  • определение взаимосвязи между характеристиками исследуемых объектов, процессов, явлений;
  • выявление согласия наблюдаемых (эмпирических) данных с теорией;
  • принятие решений;
  • другие задачи.

Все методы математической статистики можно разделить на параметрические методы, основанные на использовании знаний о вероятностной модели, и непараметрические, когда априорных представлений о виде модели нет или она не используется.

Параметрические методы рекомендуется применять для объема выборки п gt; 60.

<< | >>
Источник: Никитина Н.Ш.. Математическая статистика для экономистов: Учеб. пособие. - 2-е изд., перераб. и доп.- М.: ИНФРА-М; Новосибирск: Изд-во НГТУ,2001. - 170 с.. 2001

Еще по теме ОПИСАТЕЛЬНАЯ СТАТИСТИКА. ОСНОВНЫЕ ПОНЯТИЯ ВЫБОРОЧНОГО МЕТОДА:

  1. 34. Генеральная и выборочная совокупности. Принцип образования выборки. Собственно-случайная выборка с повторным и бесповторным отбором членов. Репрезентативная выборка. Основная задача выборочного метода.
  2. 3.4. Использование методов математической статистики для анализа данных
  3. §1.1 Основные дискретные модели математической статистики
  4. 9. формирование основных психологических понятий и методов исследования
  5. 38. Оценка генеральной дисперсии по собственно-случайной выборке. Смещенность и состоятельность выборочной дисперсии (без вывода). Исправленная выборочная дисперсия.
  6. 37. Методы управления: понятие , назначение, соотношение форм и методов управленческой деятельности
  7. 7.Основные методы интегрирования. Интегрирование методом замены переменной. Метод интегрирования по частям.
  8. Добросовестные критики вынуждены анализировать основные (неопределяемые) понятия, определения понятий
  9. § 52. Описательная («аналитическая») форма будущего времени несовершенного вида
  10. Описательное и экспериментальное исследование
  11. Описательная психология.
  12. Последний должен иметь определенную структуру и состоять из вводной, описательной, мотивировочной и резолютивной
  13. § 12. Описательные, аналитические формы степеней сравнения
  14. Статистика преступности
  15. 2. Генеральная и выборочная совокупности