ОПИСАТЕЛЬНАЯ СТАТИСТИКА. ОСНОВНЫЕ ПОНЯТИЯ ВЫБОРОЧНОГО МЕТОДА
Структура главы «Описательная статистика. Основные понятия выборочного метода» представлена на рис. 2.
Ы} йели
Иметь представление:
- об основных задачах математической статистики (МС);
- этапах статистической обработки эмпирических данных.
Знать и уметь различать понятия:
- малая, большая и репрезентативная выборки;
•формы представления выборки (негруппированная, группированная, вариационный ряд);
- функционные и числовые характеристики случайных величин [6, 8];
- точечные и интервальные оценки характеристик случайной величины;
- характеристики положения, рассеяния, формы распределения;
- характеристики порядковых статистик.
Уметь:
- получать по выборке из генеральной совокупности оценки начальных и центральных моментов, оценки коэффициентов асимметрии и эксцесса, оценки характеристик порядковых статистик (медиану, квантили, процентили, квартили, децили, размахи), оценки функции и плотности распределения вероятностей случайной величины;
- строить полигон частот, гистограмму и график накопленных частот.

Рис. 2. Структура раздела «Описательная статистика. Основные понятия выборочного
метода»
- ОСНОВНЫЕ ПОНЯТИЯ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ. ЗАДАЧИ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Обозначим количество всех подлежащих обследованию объектов N (/ = ],N). Допустим, что каждому объекту /' соответствует значение X/. Согласно данному ранее определению, совокупность всех возможных значений (теоретически домысливаемых) N объектов называется генеральной совокупностью, а N - объемом генеральной совокупности.
Генеральная совокупность может быть конечной или бесконечной. Пусть количество реально наблюдаемых объектов из N равно п. Тогда х„ г = ],п - выборка из генеральной совокупности, п - объем выборки. Выборка из генеральной совокупности должна обладать следующими свойствами:- каждый элемент х, выбран случайно;
- все Xj имеют одинаковую вероятность попасть в выборку;
- п должно быть настолько велико, насколько это позволяет решать задачу с требуемым качеством (выборка должна быть репрезентативной, представительной).
В дальнейшем будем иметь дело с выборкой, обладающей такими свойствами.
Принято считать, что при п gt; 60 выборка большая, или репрезентативная, а при п lt; 60 - малая. Такое деление выборки на большую и малую условно. Разные авторы используют разное пограничное п, делящее выборки на малые и большие, которое к тому же зависит от решаемой статистической задачи.
Понятие репрезентативная выборка не всегда можно связать с ее объемом п. Чаще это зависит от реально исследуемого объекта или явления, объема генеральной совокупности, трудоемкости и стоимости получения наблюдений или измерений для формирования выборки.
Возможны ситуации, когда генеральная совокупность мала. Например, исследуется время наработки до отказа уникального оборудования, когда в эксплуатации находится заведомо малое количество его экземпляров (N). Доступного для исследования оборудования (и) может быть еще меньше. Поэтому выборка объемом п, близким к объему генеральной совокупности N, может считаться репрезентативной и одновременно малой (п lt; 60).
tBC Пример 1. Количество зарегистрированных малых предприятий торговли продуктами питания в городе Новосибирске равно 2436. Для исследования предприятий по объему товарооборота взято 136 предприятий. В данном случае N= 2436 - объем гене-
ральной совокупности (все мыслимые предприятия данной категории), а п = 136 - объем выборки из генеральной совокупности.
Рассмотрим некоторые формы представления выборки из генеральной совокупности.
- Представление выборки из генеральной совокупности в не-
груннированном виде xh і = 1, п . Такая форма связана с наличием сведений о каждом элементе выборки.
ЯНП Пример 2. Исследование ежедневного простоя (в часах) ¦**?-gt; бригады каменщиков из-за отсутствия строительных материалов в течение 10 дней представлено в виде: 1,3 0,7 2,8 2,3 1,15 0,25 1,17 0,8 2,4 0,45, п- 10. Здесь имеет место негруппирован- ная выборка.
- Представление выборки в виде вариационного ряда (в упорядоченном виде)
Х(])lt;Х(2)lt; ... lt;Х(,)lt;... lt;Х(И) .
В этом случае - член вариационного ряда, или варианта. Часто Х(,-) называют порядковой статистикой [1, 4]. Индекс (г) указывает на порядковый номер элемента в вариационном ряду. Часто X(j) обозначают где R - ранг порядковой статистики. Иногда используют обозначение где R, - ранг і-го наблюдения в исходной (неупорядоченной) выборке. Любую функцию порядковых статистик также называют порядковой статистикой.
Форма представления выборки из генеральной совокупности в виде вариационного ряда не приводит к потере информации о каждом элементе выборки, но искажает информацию, устанавливая зависимость между соседними элементами выборки.
"•“At-1 Необходимо помнить! Члены вариационного ряда, в отличие от элементов исходной выборки, уже не являются взаимно независимыми (по причине их предварительной упорядоченности).
- Представление выборки в группированном виде. Такая форма представления выборки из генеральной совокупности связана с разбиением области задания случайной величины X на L интервалов группирования. При этом известны только количество
элементов выборки п:, j = \,L, попавших в j интервал, и последовательность границ интервалов разбиения. Для определения числа
L интервалов искусственного группирования пользуются формулой Старджеса [5]
(1)
L= 1 + 3,322-lg п.
Иногда L может быть задано природой исследуемого явления или условиями проведения эксперимента.
В данном случае ширина каждого интервала может быть отличной от других (неравноточное группирование).На некоторых этапах статистического анализа необходимо исходную выборку представлять в группированном виде.
Рассмотрим последовательность процедуры группирования неупорядоченной выборки из генеральной совокупности.
- Формирование вариационного ряда.
- Выделение минимального и максимального элементов выборки:

- Определение числа интервалов группирования осуществляется из соображения точности и устанавливается либо эмпирическим путем в зависимости от объема выборки, либо по формуле Старджеса [5], либо определяется природой явления или условиями проведения эксперимента. Округление При нахождении L осуществляется до ближайшего целого числа.
- Определение ширины интервалов группирования (при равноточном группировании)
(2)
Если при вычислении h необходимо округлить результат, следует помнить, что последний интервал группирования будет меньше ширины h при округлении в большую сторону и больше h при округлении в меньшую сторону.
- Формирование последовательности границ интервалов разбиения.
Образуемый вариационный ряд границ интервалов группирования будет выглядеть как
^(і)? ?^(i) h9 X(i) “Ь 2h, ... , “Ь (L 1) 'И, хщ).
Иногда для того, чтобы x(i) и х(п) попали внутрь соответственно 1-го и 1-го интервалов группирования, границы хП) и х{п) корректируют следующим образом:
' _ h х(і) -*(і) ~ 2 5
- _ h
Х(п) Х(п) + 2 '
Следовательно, число интервалов разбиения увеличивается на 1
L' = L+ 1.
При этом последовательность границ интервалов разбиения будет представлена в виде
х'(1), х'(1) + h,x\i)+2h, ... , х'(1) + L-h, х' (п).
6. Определение количества элементов выборки nh попавших в каждый j интервал.
Ж Пример 3. Ниже приведены объемы выработки за месяц (в тыс. руб.) пятидесяти продавцов молочных изделий, работающих в разных районах города.
- 19 6 18 21 16 20 17 15 10
- 20 7 19 22 17 21 19 16 11
19 10 8 18 20 8 18 16 20 12
16 21 21 9 19 19 14 18 19 19
12 20 20 8 13 10 18 17 22 18.
Представим выборку в группированном виде.
- Формируем вариационный ряд
- 9 12 15 16 18 19 19 20 21 ,
- 10 12 16 17 18 19 19 20 21
- 10 13 16 17 18 19 19 20 21
- 10 14 16 17 18 19 20 20 21
- 11 15 16 18 18 19 20 21 22.
- Находим х(1)= 22, х(п) = 6.
- Определяем число интервалов разбиения по формуле Стард- жеса(1)
L= 1 +3,322-lg50 = 6,6, 1 = 7.
- Находим ширину интервала разбиения h по формуле (2)
h = 2?-JL = 2,2857.
7
Ограничимся двумя знаками после запятой и получим h = 2,28.
Поскольку h округлено в сторону уменьшения, то последний интервал будет шире предыдущих.
- Строим вариационный ряд границ интервалов группирования (без корректировки границ первого и последнего интервалов): [6; 8,28], [8,28; 10,56], [10,56; 12,84], [12,84; 15,12], [15,12; 17,4], [17,4; 19,68], [19,68; 22].
Та же процедура, но с корректировкой границ первого и последнего интервалов, даст следующие результаты:
L' = L+ 1 =7+1 = 8;
/і) = /і) — — = 6 —1,14“4,86 ;
х[п) = х(п) + — = 22 + 1,14 = 23,14 .
Получаем последовательность границ интервалов разбиения для L = 8: [4,86; 7,14], [7,14; 9,42], [9,42; 11,7], [11,7; 13,98], [13,98; 16,26], [16,26; 18,54], [18,54; 20,82], [20,82; 23,14].
Ширина последнего интервала в том и другом случае (1 = 7 и L = 8) равна h = 2,32.
- Находим количество элементов выборки r»j, попавших в j интервал, j -l,L (случай без корректировки границ интервалов)
| j | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| Пі | 5 | 4 | 3 | 4 | 8 | 14 | 12 |
Находим rij, j = 1, L +1 (случай корректировки границ интервалов разбиения)
| І | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| . Ч.. | 2 | 4 | 4 | 3 | 8 | 9 | 14 | 6 |
Группированная форма представления случайной величины не содержит информации о каждом элементе выборки. При этом часто в качестве значения случайной величины на каждом интервале принимается его середина.
Это важно! От негруппированной выборки всегда можно перейти к группированной, но не наоборот. Необходимо помнить, что переход к группированной форме представления выборки сопряжен с потерей информации об исследуемом объекте, процессе или явлении.
Любые характеристики случайной величины, полученные по выборке из генеральной совокупности, называются выборочными, или эмпирическими, характеристиками, а характеристики, полученные по генеральной совокупности, - теоретическими, или генеральными, характеристиками.
Задачи математической статистики. Основная задача математической статистики состоит в определении свойств генеральной совокупности по выборке ограниченного объема п с использованием по возможности априорных предположений.
К задачам математической статистики относятся следующие:
- разработка и применение методов оценивания числовых и функционных характеристик генеральной совокупности по выборке из нее;
- описание эмпирических данных вероятностными моделями;
- проверка статистических гипотез;
- определение взаимосвязи между характеристиками исследуемых объектов, процессов, явлений;
- выявление согласия наблюдаемых (эмпирических) данных с теорией;
- принятие решений;
- другие задачи.
Все методы математической статистики можно разделить на параметрические методы, основанные на использовании знаний о вероятностной модели, и непараметрические, когда априорных представлений о виде модели нет или она не используется.
Параметрические методы рекомендуется применять для объема выборки п gt; 60.
Еще по теме ОПИСАТЕЛЬНАЯ СТАТИСТИКА. ОСНОВНЫЕ ПОНЯТИЯ ВЫБОРОЧНОГО МЕТОДА:
- 34. Генеральная и выборочная совокупности. Принцип образования выборки. Собственно-случайная выборка с повторным и бесповторным отбором членов. Репрезентативная выборка. Основная задача выборочного метода.
- 3.4. Использование методов математической статистики для анализа данных
- §1.1 Основные дискретные модели математической статистики
- 9. формирование основных психологических понятий и методов исследования
- 38. Оценка генеральной дисперсии по собственно-случайной выборке. Смещенность и состоятельность выборочной дисперсии (без вывода). Исправленная выборочная дисперсия.
- 37. Методы управления: понятие , назначение, соотношение форм и методов управленческой деятельности
- 7.Основные методы интегрирования. Интегрирование методом замены переменной. Метод интегрирования по частям.
- Добросовестные критики вынуждены анализировать основные (неопределяемые) понятия, определения понятий
- § 52. Описательная («аналитическая») форма будущего времени несовершенного вида
- Описательное и экспериментальное исследование
- Описательная психология.
- Последний должен иметь определенную структуру и состоять из вводной, описательной, мотивировочной и резолютивной
- § 12. Описательные, аналитические формы степеней сравнения
- Статистика преступности
- 2. Генеральная и выборочная совокупности