деталей из текущей продукции прецизионного токарного автомата. Проверяемый размер деталей измерен с точностью до 1 мкм. В таблице приведены отклонения от номинального размера для этой выборки.
Границы отклонений Число деталей
-20, -15 7
-15, -10 11
-10, -5 15
-5, 0 24
0, 5 49
5, 10 41
10, 15 26
15, 20 17
20, 25 7
25, 30 3
n=200
Считая закон распределения опытных данных нормальным:
найти оценки параметров а (статистическое среднее или математическое ожидание) и σ (среднее квадратическое отклонение выборки) и оценку генерального закона распределения;
построить гистограмму; сопоставить визуально эмпирическую и теоретическую функции распределения;
проверить гипотезы нормальности распределения:
а) по размаху варьирования;
б) по критерию Пирсона.
Решение.
Пункт 1
Среднее значение интервала -17,5 -12,5 -7,5 -2,5 2,5 7,5 12,5 17,5 22,5 27,5
Частота 7 11 15 24 49 41 26 17 7 3
Запишем точечный статистический ряд (для каждого интервала находим выборочное среднее (то что в школе называли средним арифметическим. На преподавателю так говорить не стоит, с точки зрения статистики не совсем верно) по формуле: a+b2, где а – нижняя граница интервала, b – верхняя), соответствующий интервальному ряду задачи.
Найдем статистическое среднее выборки (pi*=ni/n, где ni – частота появления деталей с определенным отклонением):
Дисперсию:
Несмещенная (исправленная) дисперсия (В практических задачах помимо расчета выборочной дисперсии используется исправленная выборочная дисперсия, поскольку значение выборочной дисперсии занижено по отношению к действительной дисперсии. Обязательно применяется при малых выборках (n < 30)).
94,73
Среднеквадратическое отклонение выборки:
Нормальный закон распределения (плотность распределения) имеет вид:
. В нашем случае , . Следовательно, нормальный закон распределения примет вид:
Пункт 2.
Построим гистограмму распределения в координатах (хi, hi). Она представляет собой эмпирическую функцию распределения. На одном графике с гистограммой изобразим f(x) – теоретическую функцию распределения, предварительно рассчитав ее максимум и точки перегиба.
Для начала сведем в таблицу данные о значениях hi, вычисляемого по формуле: , где – ширина интервала (они все одинаковы).
Интервал отклонений -20, -15 -15, -10 -10, -5 -5, 0 0, 5 5, 10 10, 15 15, 20 20, 25 25, 30
hi 0,007 0,011 0,015 0,024 0,049 0,041 0,026 0,017 0,007 0,003
Максимум функции плотности распределения находится в точке x=a=4,30, поскольку значение экспоненты в этой точке равно 1. Вычислим его:
Найдем координаты точек перегиба для f(x):
С учетом полученных данных гистограмма и плотность распределения будут выглядеть следующим образом:
Рис. 1
Сравнивая полученные графики на Рис. 1, делаем предварительный вывод о нормальности закона распределения опытных данных.
Пункт 3.
Проверим гипотезу о нормальности распределения двумя способами:
по размаху варьирования
Вычислим размах варьирования:
Найдем отношение размаха варьирования к среднеквадратическому отклонению:
Если рассчитанное отношение лежит в пределах границ, примем гипотезу о нормальности распределения. Для уверенного принятия решения о нормальности данных выборки важно, чтобы условие нахождения внутри границ выполнялось на жестком 10%-ном уровне значимости (p=0,1). По таблице П. 6 [1] находим, что при объеме выборки n=200 и p=0,1 нижняя граница такого отношения равна 4,90, а верхняя – 6,15. 4,90<R/S<6,15.
По критерию Пирсона.
По данным наблюдений: ; .
Находим yi – выравнивающие частоты теоретической кривой:
yi=nhSφ(ui) , где n=200 – количество испытаний; h=5 – разность между двумя соседними средними значениями интервала.
ui=xi-XS, φui=12πe-ui22. Вычислим все необходимые значения с помощью MS Excel и сведем полученные данные в таблицу.
xi ni xi-X
ui φ(ui) yi
-17,5 7 -21,8 -2,24 0,032 3,33
-12,5 11 -16,8 -1,73 0,090 9,23
-7,5 15 -11,8 -1,21 0,191 19,65
-2,5 24 -6,8 -0,70 0,312 32,11
2,5 49 -1,8 -0,18 0,392 40,30
7,5 41 3,2 0,33 0,378 38,84
12,5 26 8,2 0,84 0,280 28,74
17,5 17 13,2 1,36 0,159 16,33
22,5 7 18,2 1,87 0,069 7,13
27,5 3 23,2 2,38 0,023 2,39
ni=200
yi=198,06
3. Строим точки (xi, ni), (xi, yi) и соединяем их плавными кривыми (Рис. 2)
Рис. 2
На Рис. 2 штриховая кривая полигона экспериментального распределения находится достаточно близко от сплошной кривой теоретического полигона нормального распределения, что говорит в пользу нормального распределения опытных данных.
4. (Наша цель – сравнить эмпирические и теоретические частоты (количество деталей для каждого среднего значения интервала) и выяснить являются ли эти различия несущественными, не опровергающими гипотезу о нормальном распределении или наоборот, противоречат ей. Для этого используется критерий в виде случайной величины χ2 – критерий согласия «хи-квадрат» [2]). Найдем χнабл2:
χнабл2=i=110(ni-yi)2yi. Воспользуемся MS Excel и сведем вычисления в таблицу:
ni yi (ni – yi) (ni – yi)2 (ni – yi)2/yi
7 3,33 3,67 13,45 4,04
11 9,23 1,77 3,12 0,34
15 19,65 -4,65 21,63 1,10
24 32,11 -8,11 65,83 2,05
49 40,30 8,70 75,67 1,88
41 38,84 2,16 4,67 0,12
26 28,74 -2,74 7,52 0,26
17 16,33 0,67 0,44 0,03
7 7,13 -0,13 0,02 0,00
3 2,39 0,61 0,37 0,16
χнабл.2=9,97
5. Найдем число степеней свободы k=s-1-r[2], где s – количество интервалов выборки, r – число параметров предполагаемого распределения: k=10-1-2=7. Выбираем уровень значимости α=0,01.
6. Найдем по таблице критических точек (приложение 5 в [2]) распределения χ2 по уровню значимости α = 0,01 и числу степеней свободы k = 7 критическую точку правосторонней области χкр(0,01;7) = 18,5. Поскольку χq2<χкр2, гипотеза о нормальности распределения подтверждается [2].