факторным является признак фондоотдача (X), результативным – объем выпуска продукции (Y).
1. Установление наличия и характера связи между признаками фондоотдача и объем выпуска продукции аналитической группировки
Применение метода аналитической группировки
При использовании метода аналитической группировки строится интервальный ряд распределения единиц совокупности по факторному признаку Х и для каждой j-ой группы ряда определяется среднегрупповое значение результативного признака Y. Если с ростом значений фактора Х от группы к группе средние значения систематически возрастают (или убывают), между признаками X и Y имеет место корреляционная связь.
Используя разработочную таблицу 3, строим аналитическую группировку, характеризующую зависимость между факторным признаком Х – фондоотдача и результативным признаком Y – объем выпуска продукции. Макет аналитической таблицы имеет следующий вид (табл. 7):
Таблица 7
Зависимость объема выпуска продукции от фондоотдачи
Номер группы Группы предприятий по фондоотдаче, руб. Число предприятий Выпуск продукции,
млн руб.

всего в среднем на одно предприятие
1

2

3

4

5

 Итого

Групповые средние значения получаем из таблицы 3 (графа 4), основываясь на итоговых строках «Всего». Построенную аналитическую группировку представляет табл. 8.
Таблица 8
Зависимость объема выпуска продукции от фондоотдачи
Номер группы Группы предприятий по фондоотдаче, руб.
х Число предприятий,
fj
Выпуск продукции,
млн руб.

всего в среднем на одно предприятие,
1 2 3 4 5=4:3
1 1-3 2 572 286
2 3-5 6 2259 376,5
3 5-7 11 5252,5 477,5
4 7-9 9 5368,5 596,5
5 9-11 2 1398 699
  Итого 30 14850 495
Вывод. Анализ данных табл. 8 показывает, что с увеличением фондоотдачи от группы к группе систематически возрастает и объем выпуска продукции по каждой группе предприятий, что свидетельствует о наличии прямой корреляционной связи между исследуемыми признаками.
2. Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Для измерения тесноты и силы связи между факторным и результативным признаками рассчитывают специальные показатели – эмпирический коэффициент детерминации и эмпирическое корреляционное отношение .
Эмпирический коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, (9)
где – общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними — равенство =1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле
, (10)
где yi – индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n – число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
(11)
или как средняя взвешенная по частоте групп интервального ряда:
(12)
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (11):

Для расчета общей дисперсии применяется вспомогательная таблица 12.
Таблица 12
Вспомогательная таблица для расчета общей дисперсии
Номер
предприятий
п/п Выпуск продукции, млн руб.

1 2 3 4 5
1 476,45 -18,55 344,103 227004,603
2 620,95 125,95 15863,4 385578,903
3 386,54 -108,5 11763,6 149413,172
4 439,75 -55,25 3052,56 193380,063
5 681,3 186,3 34707,7 464169,69
6 635,22 140,22 19661,6 403504,448
7 269 -226 51076 72361
8 360,72 -134,3 18031,1 130118,918
9 380,44 -114,6 13124 144734,594
10 410,21 -84,79 7189,34 168272,244
11 572,42 77,42 5993,86 327664,656
12 534,32 39,32 1546,06 285497,862
13 455,61 -39,39 1551,57 207580,472
14 375,92 -119,1 14180 141315,846
15 656 161 25921 430336
16 586,03 91,03 8286,46 343431,161
17 303 -192 36864 91809
18 601,22 106,22 11282,7 361465,488
19 345,17 -149,8 22449 119142,329
20 716,7 221,7 49150,9 513658,89
21 451,8 -43,2 1866,24 204123,24
22 529,43 34,43 1185,42 280296,125
23 487,33 -7,67 58,8289 237490,529
24 558,44 63,44 4024,63 311855,234
25 463,34 -31,66 1002,36 214683,956
26 546,39 51,39 2640,93 298542,032
27 591,83 96,83 9376,05 350262,749
28 509,35 14,35 205,923 259437,423
29 455,9 -39,1 1528,81 207844,81
30 449,22 -45,78 2095,81 201798,608
Итого 14850 0 376024 7726774

Расчет общей дисперсии по формуле (10):

Общая дисперсия может быть также рассчитана по формуле
,
где – средняя из квадратов значений результативного признака,
– квадрат средней величины значений результативного признака.
Получаем

Тогда

Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k – число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы предприятий по фондоотдаче, руб. Число предприятий Среднее значение в группе
1 2 3 4 5
1-3 2 286 -209 87362
3-5 6 376,5 -118,5 84253,5
5-7 11 477,5 -17,5 3368,75
7-9 9 596,5 101,5 92720,25
9-11 2 699 204 83232
Итого 30
  350942
Расчет межгрупповой дисперсии по формуле (11):

Расчет эмпирического коэффициента детерминации по формуле (9):
или 93,3%
Вывод. 93,3% вариации объема выпуска обусловлено вариацией фондоотдачи, а 6,7% – влиянием прочих неучтенных факторов.
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
(14)
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
0,1 – 0,3 0,3 – 0,5 0,5 – 0,7 0,7 – 0,9 0,9 – 0,99
Характеристика
силы связи Слабая Умеренная Заметная Тесная Весьма тесная
Расчет эмпирического корреляционного отношения по формуле (14):

Вывод. Согласно шкале Чэддока связь между объемом выпуска продукии и фондоотдачей является весьма тесной.
3. Оценка статистической значимости коэффициента детерминации .
Показатели и рассчитаны для выборочной совокупности, т.е. на основе ограниченной информации об изучаемом явлении. Поскольку при формировании выборки на первичные данные могли иметь воздействии какие-либо случайные факторы, то есть основание полагать, что и полученные характеристики связи , несут в себе элемент случайности. Ввиду этого, необходимо проверить, насколько заключение о тесноте и силе связи, сделанное по выборке, будет правомерными и для генеральной совокупности, из которой была произведена выборка.
Проверка выборочных показателей на их неслучайность осуществляется в статистике с помощью тестов на статистическую значимость (существенность) показателя. Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
,
где n – число единиц выборочной совокупности,
m – количество групп,
– межгрупповая дисперсия,
– дисперсия j-ой группы (j=1,2,…,m),
– средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
,
где – общая дисперсия.
Для проверки значимости показателя рассчитанное значение F-критерия Fрасч сравнивается с табличным Fтабл для принятого уровня значимости и параметров k1, k2, зависящих от величин n и m : k1=m-1, k2=n-m. Величина Fтабл для значений , k1, k2 определяется по таблице распределения Фишера, где приведены критические (предельно допустимые) величины F-критерия для различных комбинаций значений , k1, k2. Уровень значимости в социально-экономических исследованиях обычно принимается равным 0,05 (что соответствует доверительной вероятности Р=0,95).
Если FрасчFтабл , коэффициент детерминации признается статистически значимым, т.е. практически невероятно, что найденная оценка обусловлена только стечением случайных обстоятельств. В силу этого, выводы о тесноте связи изучаемых признаков, сделанные на основе выборки, можно распространить на всю генеральную совокупность.
Если FрасчFтабл, то показатель считается статистически незначимым и, следовательно, полученные оценки силы связи признаков относятся только к выборке, их нельзя распространить на генеральную совокупность.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:

k2
k1 24 25 26 27 28 29 30 31 32 33 34 35
3 3,01 2,99 2,98 2,96 2,95 2,93 2,92 2,91 2,90 2,89 2,88 2,87
4 2,78 2,76 2,74 2,73 2,71 2,70 2,69 2,68 2,67 2,66 2,65 2,64
5 2,62 2,60 2,59 2,57 2,56 2,55 2,53 2,52 2,51 2,50 2,49 2,48

Расчет дисперсионного F-критерия Фишера для оценки =93,3%, полученной при =12534,13, =11698,05:
Fрасч
Табличное значение F-критерия при = 0,05:
n m k1=m-1 k2=n-m Fтабл (,4, 26)
30 5 4 25 2,76
Вывод: поскольку FрасчFтабл, то величина коэффициента детерминации =96,4% признается значимой (неслучайной) с уровнем надежности 95% и, следовательно, найденные характеристики связи между признаками фондоотдача и объем выпуска продукции правомерны не только для выборки, но и для всей генеральной совокупности регионов.

факторным является признак фондоотдача (X) результативным – объем выпуска продукции (Y)