Имеются выборочные данные (выборка 5%-ная механическая) по 20 предприятиям за отчетный год:
Номер предприятия Среднесписочная численность рабочих, чел
7 276
8 331
9 192
10 203
11 210
12 156
13 184
14 126
15 118
16 230
17 242
18 261
19 160
20 350
21 175
22 284
23 350
24 342
25 128
26 350
По исходным данным Вашего варианта:
Постройте статистический ряд распределения, образовав 5 групп с равными интервалами. Построить графики ряда распределения: гистограмму, полигон, кумуляту.
По каждой группе и совокупности предприятий определить число предприятий и их удельный вес в общем количестве предприятий (структуру). Результаты расчетов представьте в таблицы.
По данным группировки рассчитайте характеристики ряда распределения предприятий: средний уровень ряда (по формулам средней арифметической обычным методом и методом моментов) ; размах вариации; среднее линейное отклонение; дисперсию (по формулам обычным методом и методом моментов); среднее квадратическое отклонение; коэффициент вариации; моду и медиану для дискретного и интервального ряда распределения. Проанализировать полученные результаты.
С вероятностью 0,964 определить ошибку среднесписочной численности рабочих и границы, в которых будет находиться генеральная средняя.
С вероятностью 0,997 определите ошибку выборки для доли предприятий, находящихся в последней 5-ой группе интервального ряда распределения и границы, в которых будет находиться генеральная доля. Сделайте выводы.
Решение
Построим статистический ряд распределения, образовав 5 групп с равными интервалами.
Определим длину интервала
i=xmax-xminn=350-1185=46 чел.
xmax- максимальное значение в данной совокупности
xmin- минимальное значение в данной совокупности
n-число групп
Получаем следующий интервальный ряд, по каждой группе определяем частоты
Группы предприятий по численности рабочих, чел. Число предприятий Накопленные частоты Середина интервала
118 – 164 5 5 141
164 – 210 5 10 187
210 – 256 2 12 233
256 – 302 3 15 279
302 – 350 5 20 325
Итого 20
Построим графики ряда распределения:
Гистограмма
Полигон
Кумулята
По каждой группе и совокупности предприятий определить число предприятий и их удельный вес в общем количестве предприятий (структуру). Результаты расчетов представьте в таблицы.
Удельный вес в общем количестве предприятий (структура) – отношение показателя по группе к общей численности по совокупности
Группы предприятий по стажу работы, лет. Число предприятий Удельный вес, %
118 – 164 5 25
164 – 210 5 25
210 – 256 2 10
256 – 302 3 15
302 – 350 5 25
Итого 20 100
Наибольший удельный вес имеют предприятия со среднесписочной численностью 118-164 чел., 164 – 210 чел., 302-350 чел, наименьший удельный вес имеют предприятия с численностью 210-256 чел.
По данным группировки рассчитайте характеристики ряда распределения предприятий: средний уровень ряда (по формулам средней арифметической обычным методом и методом моментов) ; размах вариации; среднее линейное отклонение; дисперсию (по формулам обычным методом и методом моментов); среднее квадратическое отклонение; коэффициент вариации; моду и медиану для дискретного и интервального ряда распределения. Проанализировать полученные результаты.
а) выборочное среднее
для определения среднего времени решения контрольной используем формулу средней арифметической взвешенной
х=хff
х-середина интервала
f-частоты
х=141*5+187*5+233*2+279*3+325*520=228 чел.
б) выборочную дисперсию
σ2=хi-x2ff==141-2282*5+187-2282*5+233-2282*2+(279-228)2*3+(325-228)2*520=5057,4
хi-x2- сумма квадратов отклонений данных значений от среднего
f-частоты
Выборочное среднее квадратическое отклонение
σ=(хi-x)2ff=5057,4=71,12 чел.
хi-x2- сумма квадратов отклонений данных значений от среднего
f-частоты
в) моду и медиану
Мода
M0=x0+ifM0-fM0-1fM0-fM0-1+(fM0-fM0+1)
x0- начало интервала с наибольшей частотой
i-длина интервала
fM0-модальная частота наибольшая
fM0-1- домодальная частота
fM0+1-послемодальная частота
M0=118+465-05-0+(5-5)=164 чел.
Медиана
Me=xe+if2-SMe-1fMe
xе- начало медианного интервала
i-длина интервала
fMе-медианная частота
f- сумма всех частот f=20
SMe-1-сумма накопленных частот до медианной
Me=164+4610-55=210 чел.
г) размах вариации
R=xmax-xmin=350-118=232 чел.
среднее линейное отклонение
d=xi-xfifi=141-228*5+187-228*5+233-228*2+279-228*3+325-228*520
=65,4 чел.
xi-x- сумма отклонений от среднего значения по абсолютной величине
д) коэффициент вариации
V=σх*100
σ-среднее квадратическое отношение
х- среднее значение признака
V=31,2%<33%
Совокупность количественно однородна
Для дискретного ряда
Среднее значение
x=xin=466820=233 чел.
xi- сумма значений признака, n-число признаков
Дисперсия
σ2=x2n-x2=121321620-2332=6185,24
x2- сумма квадратов заданных значений признака, n-число признаков
Мода – варианта с наибольшей частотой
Мо=164 чел.
Медиана для дискретного ряда с четным числом значений
Me=xi+xi+12=210+2302=220 чел.
С вероятностью 0,964 определить ошибку среднесписочной численности рабочих и границы, в которых будет находиться генеральная средняя.
Определим вначале предельную ошибку
∆x=tσ2n1-nN
σ2- дисперсия, n-объем выборки, N-общая численность
Ф(t)=0,964 из таблицы t=2,1
∆x=2,15057,4*0,9520=33 чел.
Границы среднесписочной численности рабочих
x=x±∆x=228±33 чел.
С вероятностью 0,997 определите ошибку выборки для доли предприятий, находящихся в последней 5-ой группе интервального ряда распределения и границы, в которых будет находиться генеральная доля. Сделайте выводы.
Определим предельную ошибку доли
∆w=tw(1-w)n1-nN
w- доля, n-объем выборки, N-общая численность
Ф(t)=0,997 из таблицы t=3,0
Доля предприятий последней группы
w=520=0.25
∆w=30,75*0,25*0,9520=0,28
границы удельного веса предприятий со среднесписочной численностью более 325 чел.
w=w±∆w=0.25±0.28
Вывод:
Среднесписочная численность составила 228 человек, большая часть предприятий среднесписочную численность 164 человека, 50% предприятий имеют численность рабочих менее чем 210 человек , 50% – более чем 210 человек. Среднесписочная численность рабочих с вероятностью 0,964 заключена в пределах 228±33 чел.