факторным является признак Среднесписочная численность работников (X), результативным – признак Объем выпуска продукции (Y).
1. Установление наличия и характера связи между признаками Среднесписочная численность работников и Объем выпуска продукции методом аналитической группировки
Применение метода аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.
Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х –Среднесписочная численность работников и результативным признаком Y – Объем выпуска продукции. Макет аналитической таблицы имеет следующий вид (табл. 7):
Таблица 7
Зависимость объема выпуска продукции от среднесписочной численности работников
Номер группы Группы предприятий по среднесписочной численности работников, чел. Число предприятий Объем выпуска продукции, млн. руб.
всего в среднем на одно предприятие
1
2
3
4
5
Итого
Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.
Таблица 8
Зависимость объема выпуска продукции от среднесписочной численности работников
Номер группы Группы предприятий по среднесписочной численности работников, чел., x Число предприятий,
fi
Объем выпуска продукции, млн. руб.
всего в среднем на одно предприятие, yj
1 125 – 145 3 78 26
2 145 – 165 5 190 38
3 165 – 185 11 539 49
4 185 – 205 7 427 61
5 205 – 225 4 296 74
Итого 30 1530 51
Вывод. Анализ данных табл. 8 показывает, что между среднесписочной численностью работников и объемом выпуска продукции наблюдается прямая зависимость, так как с ростом среднесписочной численности работников возрастает и объем выпуска продукции.
2. Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .
Эмпирический коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
η2=δx2σо2, (9)
где – общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними – равенство =1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле
σо2=i=1n(yi-y0)2n (10)
где yi – индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n – число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
y0=i=1nyin
или как средняя взвешенная по частоте групп интервального ряда:
y0=j=1kyjfjj=1kfj (12)
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (11):
y0=153030=51 чел.
Для расчета общей дисперсии применяется вспомогательная таблица 12.
Таблица 12
Вспомогательная таблица для расчета общей дисперсии
Номер
предприятия
п/п Объем выпуска продукции, млн. руб.
1 2 3 4 5
1 42 -9 81 1764
2 52 1 1 2704
3 45 -6 36 2025
4 65 14 196 4225
5 49 -2 4 2401
6 69 18 324 4761
7 73 22 484 5329
8 64 13 169 4096
9 48 -3 9 2304
10 53 2 4 2809
11 29 -22 484 841
12 41 -10 100 1681
13 63 12 144 3969
14 47 -4 16 2209
15 35 -16 256 1225
16 30 -21 441 900
17 50 -1 1 2500
18 46 -5 25 2116
19 33 -18 324 1089
20 75 24 576 5625
21 44 -7 49 1936
22 39 -12 144 1521
23 19 -32 1024 361
24 51 0 0 2601
25 53 2 4 2809
26 59 8 64 3481
27 79 28 784 6241
28 61 10 100 3721
29 50 -1 1 2500
30 66 15 225 4356
Итого 1530 0 6070 84100
Расчет общей дисперсии по формуле (10):
σо2=607030=202,3
Общая дисперсия может быть также рассчитана по формуле
σо2=yi2-(y)2
где – средняя из квадратов значений результативного признака,
– квадрат средней величины значений результативного признака.
Расчет по данной формуле:
yi2=8410030=2803,3
(y)2=512=2601
Тогда
σо2=yi2-y2=2803,3-2601=202,3
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
δx2=j=1k(yj-y0)2fjj=1kfj, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k – число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы предприятий по среднесписочной численности работников, чел. Число предприятий,
Среднее значение в группе
1 2 3 4 5
125 – 145 3 26 -25 1875
145 – 165 5 38 -13 845
165 – 185 11 49 -2 44
185 – 205 7 61 10 700
205 – 225 4 74 23 2116
Итого 30 51 5580
Расчет межгрупповой дисперсии по формуле (13):
δx2=558030=186
Расчет эмпирического коэффициента детерминации по формуле (9):
η2=δx2σо2=186202,3=0,919 или 91,9%
Вывод. 91,9% вариации объема выпуска продукции обусловлено вариацией среднесписочной численности работников, и всего 8,1% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
η=η2=δx2σо2 14
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Характеристика
силы связи Слабая Умеренная Заметная Тесная Весьма тесная
Расчет эмпирического корреляционного отношения по формуле (14):
η=δx2σо2=0,919=0,959
Вывод. Согласно шкале Чэддока связь между среднесписочной численностью работников и объемом выпуска продукции, является весьма тесной.
3. Оценка статистической значимости коэффициента детерминации .
Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
F=δx2σj2∙n-mm-1
где n – число единиц выборочной совокупности,
m – количество групп,
– межгрупповая дисперсия,
– дисперсия j-ой группы (j=1,2,…,m),
– средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
σj2=σо2-δx2
где – общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если FрасчFтабл, коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если FрасчFтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:
k2
k1 24 25 26 27 28 29 30 31 32 33 34 35
3 3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,91 2,90 2,89 2,88 2,87
4 2,78 2,76 2,74 2,73 2,71 2,70 2,69 2,68 2,67 2,66 2,65 2,64
5 2,62 2,60 2,59 2,57 2,56 2,55 2,53 2,52 2,51 2,50 2,49 2,48
Расчет дисперсионного F-критерия Фишера для оценки =20,9%, полученной при =202,3, =186:
F=δx2σj2∙n-mm-1=186202,3-186∙30-55-1=71,3
Табличное значение F-критерия при = 0,05:
n m k1=m-1 k2=n-m Fтабл (,5, 25)
30 5 4 25 2,76
Вывод: поскольку Fрасч>Fтабл, то величина коэффициента детерминации =91,9% признается значимой (случайной) с уровнем надежности 95% и, следовательно, найденные характеристики связи между признаками Среднесписочной численностью работников и Объемом выпуска продукции правомерны для всей генеральной совокупности предприятий.