Вариант 12

Решение.

-7 1,4 3,4 5,7 7,2 9,2 10,6 12,6 14,5 18,3
-4,2 1,7 3,8 6,1 7,3 9,3 11,1 12,6 14,7 18,5
-2 2,4 3,9 6,3 7,5 9,3 11,1 13 14,9 18,9
-1,7 2,4 4,2 6,4 8,1 9,8 11,2 13,2 15,8 19,3
-1,2 2,7 4,3 6,5 8,2 9,9 11,8 13,4 16 19,7
-1 2,7 4,4 6,7 8,2 10 11,9 13,5 16,1 21,1
-0,7 3 4,6 6,8 8,6 10,5 12 13,5 16,5 22
-0,2 3,1 5 7,1 8,7 10,5 12 14 17,3 22,8
0,4 3,1 5,6 7,2 8,8 10,5 12,3 14,2 17,5 23
1,4 3,4 5,7 7,2 8,9 10,6 12,5 14,3 17,6 25,8

1. Для того чтобы построить точечный вариационный ряд, необходимо расположить наблюдаемые значения в порядке их возрастания и относительно каждого указать частоту , т. е. число повторений в выборке, при этом сумма всех частот должна быть равна объему выборки .

Ряд 1:
9207518161000

-7 -4,2 -2 -1,7 -1,2 -1 -0,7 -0,2 0,4 1,4
33020-190500  1 1 1 1 1 1 1 1 1 2
52070444500  1,7 2,4 2,7 3 3,1 3,4 3,8 3,9 4,2 4,3
3524221336000520701079500  1 2 2 1 2 2 1 1 1 1
  4,4 4,6 5 5,6 5,7 6,1 6,3 6,4 6,5 6,7
52070-1460500  1 1 1 1 2 1 1 1 1 1
1905-571500  6,8 7,1 7,2 7,3 7,5 8,1 8,2 8,6 8,7 8,8
190502540004254517907000  1 1 3 1 1 1 2 1 1 1
  8,9 9,2 9,3 9,8 9,9 10 10,5 10,6 11,1 11,2
28575-381000  1 1 2 1 1 1 3 2 2 1
330202540002794021145500  11,8 11,9 12 12,3 12,5 12,6 13 13,2 13,4 13,5
  1 1 2 1 1 2 1 1 1 2
28575-13335002857519177000  14 14,2 14,3 14,5 14,7 14,9 15,8 16 16,1 16,5
  1 1 1 1 1 1 1 1 1 1
33020-63500  17,3 17,5 17,6 18,3 18,5 18,9 19,3 19,7 21,1 22
52388571500018669000  1 1 1 1 1 1 1 1 1 1
2857519304000  22,8 23 25,8              
  1 1 1              

Здесь объем выборки , а число различных значений .
2. Так как объем выборки велик и число различных значений исследуемого случайного признака также велико, то целесообразно перейти от точечного ряда 1 к интервальному. Такой переход осуществляется:
а) отмечаются наименьшее и наибольшее значения в выборке;
б) весь обследованный диапазон [-7; 25,8] разбивается на равных интервалов группирования, где , отсюда шаг группирования или ширина интервала . Примем ;
в) отмечаются крайние точки каждого из интервалов в порядке возрастания, а также подсчитываются числа выборочных данных, попавших в каждый из интервалов (очевидно, здесь ).
За нижнюю границу первого интервала принимаем , тогда , ,
.
Следуя первоначально описанной схеме, получим ряд 2:

Ряд 2:
-7- -2,9 -2,9- 1,2 1,2- 5,3 5,3-9,4
2 7 19 25
9,4-13,5 13,5-17,6 17,6-21,7 21,7-25,8
24 13 6 4
.

Для того чтобы перейти от интервального ряда 2 вновь к точечному, необходимо отметить середины интервалов и сопоставить им частоты или относительные частоты . Так, по частотам запишется в виде ряда 3, а распределение по относительным частотам в виде ряда 4:

Ряд 3:
-4,95 -0,85 3,25 7,35 11,45 15,55 19,65 23,75
2 7 19 25 24 13 6 4

Ряд 4:
-4,95 -0,85 3,25 7,35 11,45 15,55 19,65 23,75
0,02 0,07 0,19 0,25 0,24 0,13 0,06 0,04
2 7 19 25 24 13 6 4

, .

Для построения кумуляты представим ряд 3 по накопленным частотам :

-4,95 -0,85 3,25 7,35 11,45 15,55 19,65 23,75
2 9 28 53 77 90 96 100

Объединенная расчетная таблица

i 1 2 3 4 5 6 7 8
Интервал -7- -2,9 -2,9- 1,2 1,2- 5,3 5,3-9,4 9,4-13,5 13,5-17,6 17,6-21,7 21,7-25,8 —
Частота ni
2 7 19 25 24 13 6 4 100
Середина интервалов xi
-4,95 -0,85 3,25 7,35 11,45 15,55 19,65 23,75 —
Накопленная частота mi
2 9 28 53 77 90 96 100 —
Относительная частота w i 0,02 0,07 0,19 0,25 0,24 0,13 0,06 0,04 1
Относительная накопленная частота 0,02 0,09 0,28 0,53 0,77 0,9 0,96 1 —
ni/h 0,4878 1,70732 4,63415 6,09756 5,85366 3,17073 1,46341 0,97561 —
wi/h 0,00488 0,01707 0,04634 0,06098 0,05854 0,03171 0,01463 0,00976 —

4. Полигон частот и относительных частот показан на рис. 1.

Рис.1.

Гистограмма частот и относительных частот изображена на рис. 2.

Рис.2.

Кумуляту частот и относительных частот изобразим на рис.3.

Рис.3.

Найдем медиану, моду и размах.

Вариационный размах , представляющий собой разность между наибольшим и наименьшим наблюдениями: , для нашей выборки

Найдем моду интервального ряда. В случае интервального распределения с равными интервалами модальный интервал, т.е. содержащий моду, определяется по наибольшей частоте. В нашем случае – это интервал (5,3-9,4)
Вычисление моды производится по следующей формуле:
,
где — нижняя граница модального интервала; — интервальная разность; — частота модального интервала; — частота интервала, предшествующего модальному; — частота интервала, последующего за модальным.

Графически моду можно определить по полигону (см. рис. 1).

При исчислении медианы интервального вариационного ряда вначале находят интервал, содержащий медиану, путем использования накопленных частот. Медианному интервалу соответствует первая из накопленных частот, превышающая половину объема выборки (в нашем случае 50). Для нахождения медианы используют следующую формулу

,
где — нижняя граница медианного интервала, — интервальная разность, — накопленная частота интервала, предшествующего медианному, — частота медианного интервала.

Определим медиану графически по кумуляте, представленной на рис. 3. Для этого последнюю ординату, равную объему выборки , поделим пополам. Восстановим перпендикуляр до пересечения с кумулятой. Абсцисса точки пересечения и будет медианой.

Для расчета арифметического среднего , выборочной дисперсии, выборочной асимметрии и эксцесса составим вспомогательную таблицу

Вспомогательная таблица для вычисления выборочных
характеристик по группированным данным

k              
1 -4,95 2 -9,9 -28,29 400,2 -5660,3 80065
2 -0,85 7 -5,95 -70,32 706,3 -7094,9 71269
3 3,25 19 61,75 -113 671,5 -3992,2 23733
4 7,35 25 183,8 -46,13 85,1 -157,01 289,68
5 11,45 24 274,8 54,12 122 275,2 620,58
6 15,55 13 202,2 82,615 525 3336,5 21203
7 19,65 6 117,9 62,73 655,8 6856,8 71688
8 23,75 4 95 58,22 847,4 12334 179518
Итого 100 919,5 0 4013 5897,9 448387
      9,195    40,13 58,979   4483,9

Пользуясь данными табл. и формулой, вычислим выборочное среднее.
Для проверки правильности вычисления полезно убедиться в выполнении условия .
На основании данных таблицы найдем выборочные: выборочное среднее , дисперсию; среднее квадратическое отклонение ; центральные моменты третьего и четвертого порядков;; коэффициент асимметрии; эксцесса.

Исправленная выборочная дисперсия и исправленное выборочное среднеквадратическое отклонение равны:

, где

, где

Проверка соответствия нормальному закону распределения может быть произведена лишь приближенно с помощью показателей асимметрии и эксцесса. При нормальном распределении эти показатели равны нулю. Рассчитаем среднеквадратические ошибки этих показателей:

Следовательно, гипотеза о нормальности распределения принимается.

  

Построим теоретическую кривую нормального распределения, для этого заполним таблицу, в которой определим ординаты теоретической кривой f(x)

k х х-хср v=(х-хср)/s (v) f(x)
1 -7 -16,2 -2,543566 0,0158 0,00248153
2 -2,9 -12,1 -1,8996252 0,0669 0,01050723
3 1,2 -7,995 -1,2556845 0,1804 0,02833339
4 5,3 -3,895 -0,6117437 0,3312 0,05201785
5 9,4 0,205 0,03219704 0,3988 0,06263502
6 13,5 4,305 0,67613778 0,3166 0,04972479
7 17,6 8,405 1,32007853 0,1669 0,0262131
8 21,7 12,505 1,96401928 0,0584 0,00917223
9 25,8 16,605 2,60796003 0,0132 0,00207318
        0,24315831

Контроль вычислений
Равенство выполняется с достаточной точностью. Теоретическая кривая и полигон относительных частот представлены на графике (Рис.4).

Рис.4

Построение вариационные ряды и их графические изображения представляют данные в компактном виде. Кроме этого имеется возможность получить сведения о законе распределения вероятностей исследуемой случайной величины. Здесь внешний контур гистограммы (рис. 2), графики кумулятивной кривой (рис. 3) свидетельствуют о близости эмпирического распределения к нормальному закону. К этому же выводу можно прийти, сравнивая значения выборочного среднего, моды и медианы. Так как и практически не отличаются друг от друга, то есть основание предполагать, что теоретическое распределение симметрично относительно своего среднего значения, что является еще одним доводом в пользу выбора модели нормального закона. И, наконец, близость значений выборочных коэффициентов асимметрии и эксцесса к нулю также свидетельствует в пользу выбора нормального закона распределения для анализируемой генеральной совокупности.
Следовательно, в результате первичной статистической обработки данных мы получили возможность определить некоторые средние показатели интересующего нас признака, а также считать, что случайная величина — распределена по нормальному закону.
Выясним с помощью критерия Пирсона, можно ли на уровне значимости считать распределение нормальным.
На принадлежность к нормальной генеральной совокупности исследуемой выборки объема указывали элементы первичной статистической обработки данных. Убедимся в этом, используя критерий согласия . Итак, имеем:
: , где ,
.
.
(здесь число интервалов группирования -2). (после объединения интервалов с малочисленными частотами)
Из таблиц квантилей распределения найдем критическую точку . Критическая область правосторонняя:

22860003810

00

Для расчета наблюдаемого значения критерия составим две вспомогательные таблицы (используем интервальный вариационный ряд):

Расчет

1 -7 -2,9 -2,543566 -1,8996 -0,4945 -0,4706 0,0239 2,39
2 -2,9 1,2 -1,8996252 -1,2557 -0,4706 -0,3962 0,0744 7,44
3 1,2 5,3 -1,2556845 -0,6117 -0,3962 -0,2291 0,1671 16,71
4 5,3 9,4 -0,6117437 0,0322 -0,2291 0,012 0,2411 24,11
5 9,4 13,5 0,03219704 0,67614 0,012 0,2517 0,2397 23,97
6 13,5 17,6 0,67613778 1,32008 0,2517 0,4066 0,1549 15,49
7 17,6 21,7 1,32007853 1,96402 0,4066 0,475 0,0684 6,84
8 21,7 25,8 1,96401928 2,60796 0,475 0,4954 0,0204 2,04

0,98991 98,99100

После вычисления объединяем первый и второй, а также седьмой и восьмой интервалы с малочисленными частотами, и заполняем таблицу
Расчет

1 9 9,83 0,6889 0,07008 8,24008138
2 19 16,71 5,2441 0,31383 21,60383
3 25 24,11 0,7921 0,03285 25,9228536
4 24 23,97 0,0009 3,8E-05 24,0300375
5 13 15,49 6,2001 0,40026 10,9102647
6 10 8,88 1,2544 0,14126 11,2612613
100 98,99100
0,95833 101,968329

Контроль вычислений
Сравниваем наблюдаемое значение критерия с критической точкой . Так как 0,96<7,81, т. е. принадлежит области принятия нулевой гипотезы, гипотезу о нормальном распределении принимаем.
Построим доверительные интервалы для математического ожидания и среднеквадратического отклонения
Решим задачу интервального оценивания параметров и нормальной генеральной совокупности, т. е. будем считать, что величина .

Найдем интервальную оценку математического ожидания:

При случайная величина имеет распределение, близкое к , поэтому с вероятностью
, где : .
, где : .

Найдем интервальную оценку дисперсии (среднего квадратического отклонения)
Относительно с вероятностью выполняется неравенство

и с такой же вероятностью выполняется неравенство

Величины и находятся из таблиц квантилей распределения : и
; .

.

Вариант 12 Решение -7 1 4 3 4 5 7 7 2 9 2 10 6 12 6 14