Условие.
Имеются следующие выборочные данные за отчетный период по предприятиям одной из финансово-промышленных групп (выборка 10%-ная, механическая), млн. руб.:
№
предприятия Среднегодовая стоимость основных производственных фондов Объем выпуска продукции №
предприятия Среднегодовая стоимость производственных фондов Объем выпуска продукции
1 73,82 451,80 16 81,93 489,58
2 56,69 375,05 17 50,81 345,79
3 67,71 386,54 18 93,21 586,90
4 52,70 360,72 19 100,20 591,31
5 79,20 476,45 20 40,00 290,00
6 77,14 463,34 21 76,75 456,64
7 89,64 531,01 22 76,23 455,61
8 71,84 449,22 23 83,24 509,35
9 69,42 410,21 24 91,28 558,44
10 62,41 380,44 25 89,30 531,27
11 103,82 635,22 26 102,43 620,95
12 116,00 681,30 27 101,80 601,22
13 110,54 656,00 28 90,67 545,03
14 69,61 439,75 29 140,00 690,00
15 48,81 308,10 30 92,80 572,42
Группировочный признак – среднегодовая стоимость основных производственных фондов.
Постройте интервальный ряд распределения. Определите среднегодовую стоимость основных производственных фондов, абсолютные и относительные показатели вариации, моду, медиану, седьмой и девятый децили.
Решение.
Так как в основание группировки положен непрерывный количественный признак, то число групп определяют одновременно с размером интервала.
Когда совокупность единиц более или менее однородна (вариация по группировочному признаку мала), прибегают к равным интервалам, размер которых приближенно определяется по формуле Стэрджесса:
n = 1 + 3,2log n
n = 1 + 3,2log 30 = 6
Тогда ширина интервала составит:
EQ h = f(Xmax – Xmin;n)
EQ h = f(140 – 40;6) = 16.67
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
40 40 – 56.67 1
48.81 40 – 56.67 2
50.81 40 – 56.67 3
52.7 40 – 56.67 4
56.69 56.67 – 73.34 1
62.41 56.67 – 73.34 2
67.71 56.67 – 73.34 3
69.42 56.67 – 73.34 4
69.61 56.67 – 73.34 5
71.84 56.67 – 73.34 6
73.82 73.34 – 90.01 1
76.23 73.34 – 90.01 2
76.75 73.34 – 90.01 3
77.14 73.34 – 90.01 4
79.2 73.34 – 90.01 5
81.93 73.34 – 90.01 6
83.24 73.34 – 90.01 7
89.3 73.34 – 90.01 8
89.64 73.34 – 90.01 9
90.67 90.01 – 106.68 1
91.28 90.01 – 106.68 2
92.8 90.01 – 106.68 3
93.21 90.01 – 106.68 4
100.2 90.01 – 106.68 5
101.8 90.01 – 106.68 6
102.43 90.01 – 106.68 7
103.82 90.01 – 106.68 8
110.54 106.68 – 123.35 1
116 106.68 – 123.35 2
140 123.35 – 140.02 1
Аналитическая группировка.
Группы
№ Кол-во, nj
∑X Xcp = ∑Xj / nj
∑Y Ycp = ∑Yj / nj
40 – 56.67 1,2,3,4 4 192.32 48.08 1304.61 326.15
56.67 – 73.34 5,6,7,8,9,10 6 397.68 66.28 2441.21 406.87
73.34 – 90.01 11,12,13,14,15,16,17,18,19 9 727.25 80.81 4365.05 485.01
90.01 – 106.68 20,21,22,23,24,25,26,27 8 776.21 97.03 4711.49 588.94
106.68 – 123.35 28,29 2 226.54 113.27 1337.3 668.65
123.35 – 140.02 30 1 140 140 690 690
Итого
30 2460 14849.66
По аналитической группировке измеряют связь при помощи эмпирического корреляционного отношения. Оно основано на правиле разложения дисперсии: общая дисперсия равна сумме внутригрупповой и межгрупповой дисперсий.
Находим средние значения каждой группы.
EQ xto(y1) = f(∑yj;n1) = f(1304.61;4) = 326.15
EQ xto(y2) = f(∑yj;n2) = f(2441.21;6) = 406.87
EQ xto(y3) = f(∑yj;n3) = f(4365.05;9) = 485.01
EQ xto(y4) = f(∑yj;n4) = f(4711.49;8) = 588.94
EQ xto(y5) = f(∑yj;n5) = f(1337.3;2) = 668.65
EQ xto(y6) = f(∑yj;n6) = f(690;1) = 690
Общее средние значение для всей совокупности:
EQ xto(y) = f(∑(yi*nj);∑nj) = f(14849.66;30) = 494.99
Таблица для расчета показателей.
Группы
xi Кол-во, fi xi * fi Накопленная частота, S |x – xср|*f (x – xср)2*f Частота, fi/n
40 – 56.67 48.34 4 193.34 4 135.58 4595.66 0.13
56.67 – 73.34 65.01 6 390.03 10 103.35 1780.34 0.2
73.34 – 90.01 81.68 9 735.08 19 5 2.78 0.3
90.01 – 106.68 98.35 8 786.76 27 128.91 2077.37 0.27
106.68 – 123.35 115.02 2 230.03 29 65.57 2149.63 0.0667
123.35 – 140.02 131.69 1 131.69 30 49.45 2445.73 0.0333
Итого
30 2466.92 487.88 13051.52 1
Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения.
Средняя взвешенная
EQ xto(x) = f( ∑x • f;∑f)
EQ xto(x) = f(2466.92;30) = 82.23
Мода.
Мода – наиболее часто встречающееся значение признака у единиц данной совокупности.
EQ Mo = x0 + h f(f2 – f1; (f2 – f1) + (f2 – f3))
где x0 – начало модального интервала; h – величина интервала; f2 –частота, соответствующая модальному интервалу; f1 – предмодальная частота; f3 – послемодальная частота.
Выбираем в качестве начала интервала 73.34, так как именно на этот интервал приходится наибольшее количество.
EQ Mo = 73.34 + 16.67 f( 9 – 6; (9 – 6) + (9 – 8)) = 85.84
Наиболее часто встречающееся значение ряда – 85.84
Медиана.
Медиана делит выборку на две части: половина вариант меньше медианы, половина — больше.
В интервальном ряду распределения сразу можно указать только интервал, в котором будут находиться мода или медиана. Медиана соответствует варианту, стоящему в середине ранжированного ряда. Медианным является интервал 73.34 – 90.01, т.к. в этом интервале накопленная частота S, больше медианного номера (медианным называется первый интервал, накопленная частота S которого превышает половину общей суммы частот).
EQ Me = x0 + f(h;fme) b( f( ∑f;2) – Sme-1 )
EQ Me = 73.34 + f(16.67;9) b( f( 30;2) – 10 ) = 82.6
Таким образом, 50% единиц совокупности будут меньше по величине 82.6.
Децили
Децили – это значения признака в ранжированном ряду распределения, выбранные таким образом, что 10% единиц совокупности будут меньше по величине D1; 80% будут заключены между D1 и D9; остальные 10% превосходят D9
EQ D1 = x0 + f(h;fme) b( f( ∑f;10) – Sme-1 )
EQ D1 = 40 + f(16.67;4) b( f( 30;10) – 0 ) = 52.5
Таким образом, 10% единиц совокупности будут меньше по величине 52.5
EQ D9 = x0 + f(h;fme) b( f( 9 ∑f;10) – Sme-1 )
EQ D9 = 90.01 + f(16.67;8) b( f(9•30;10) – 19 ) = 106.68
Остальные 10% превосходят 106.68
Показатели вариации.
Абсолютные показатели вариации.
Размах вариации – разность между максимальным и минимальным значениями признака первичного ряда.
R = Xmax – Xmin
R = 140 – 40 = 100
Среднее линейное отклонение – вычисляют для того, чтобы учесть различия всех единиц исследуемой совокупности.
EQ d = f(∑|xi – xto(x)| • f;∑f)
EQ d = f(487.88;30) = 16.26
Каждое значение ряда отличается от другого в среднем на 16.26
Дисперсия – характеризует меру разброса около ее среднего значения (мера рассеивания, т.е. отклонения от среднего).
EQ D = f(∑(xi – xto(x))2 f;∑f)
EQ D = f(13051.52;30) = 435.05
Среднее квадратическое отклонение (средняя ошибка выборки).
EQ σ = r(D) = r(435.051) = 20.86
Каждое значение ряда отличается от среднего значения 82.23 в среднем на 20.86
Относительные показатели вариации.
К относительным показателям вариации относят: коэффициент осцилляции, линейный коэффициент вариации, относительное линейное отклонение.
Коэффициент вариации – мера относительного разброса значений совокупности: показывает, какую долю среднего значения этой величины составляет ее средний разброс.
EQ v = f(σ;xto(x)) = f(20.86;82.23)100% = 25.37%
Поскольку v ≤ 30%, то совокупность однородна, а вариация слабая. Полученным результатам можно доверять.
Линейный коэффициент вариации или Относительное линейное отклонение – характеризует долю усредненного значения признака абсолютных отклонений от средней величины.
EQ Kd = f(d;xto(x)) = f(16.26;82.23)100% = 19.77%
Коэффициент осцилляции – отражает относительную колеблемость крайних значений признака вокруг средней.
EQ Kr = f(R;xto(x)) = f(100;82.23)100% = 121.61%