По 10 однородным предприятиям имеются следующие данные:
Исходные данные
№ предприятия Кол-во рабочих с профессиональной подготовкой, % Кол-во бракованной продукции, %

x y
1 10 18
2 12 17
3 14 14
4 17 12
5 24 10
6 28 10
7 30 8
8 35 9
9 40 6
10 50 6
ИТОГО 260 110
1). По исходным данным постройте однофакторную регрессионную модель зависимости между выпуском бракованной продукции и профессиональной подготовкой рабочих.
2). Вычислите коэффициенты эластичности, показатели тесноты корреляционной связи.
3). Проверьте найденную модель на адекватность.
4). Сделайте выводы.
5). Постройте графики.

По исходным данным построим однофакторную регрессионную модель зависимости между выпуском бракованной продукции и профессиональной подготовкой рабочих
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x y x2 y2 x • y
10 18 100 324 180
12 17 144 289 204
14 14 196 196 196
17 12 289 144 204
24 10 576 100 240
28 10 784 100 280
30 8 900 64 240
35 9 1225 81 315
40 6 1600 36 240
50 6 2500 36 300
260 110 8314 1370 2399
1. Параметры уравнения регрессии.
Выборочные средние.
EQ xto(x) = f(∑xi;n) = f(260;10) = 26
EQ xto(y) = f(∑yi;n) = f(110;10) = 11
EQ xto(xy) = f(∑xiyi;n) = f(2399;10) = 239.9
Выборочные дисперсии:
EQ S2(x) = f(∑x2i;n) — xto(x)2 = f(8314;10) — 262 = 155.4
EQ S2(y) = f(∑y2i;n) — xto(y)2 = f(1370;10) — 112 = 16
Среднеквадратическое отклонение
EQ S(x) = r(S2(x)) = r(155.4) = 12.466
EQ S(y) = r(S2(y)) = r(16) = 4
Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:
EQ b = f(xto(x • y)-xto(x) • xto(y);S2(x)) = f(239.9-26 • 11;155.4) = -0.2967
1.1. Коэффициент корреляции
Ковариация.
EQ cov(x,y) = xto(x • y) — xto(x) • xto(y) = 239.9 — 26 • 11 = -46.1
2). Вычислим коэффициенты эластичности, показатели тесноты корреляционной связи.

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
EQ rxy = f(xto(x • y) -xto(x) • xto(y) ;S(x) • S(y)) = f(239.9 — 26 • 11;12.466 • 4) = -0.925
Линейный коэффициент корреляции принимает значения от –1 до +1.
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < rxy < 0.3: слабая;
0.3 < rxy < 0.5: умеренная;
0.5 < rxy < 0.7: заметная;
0.7 < rxy < 0.9: высокая;
0.9 < rxy < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X весьма высокая и обратная.
Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:
EQ rx,y = bf(S(x);S(y)) = -0.3f(12.466;4) = -0.925
Уравнение регрессии (оценка уравнения регрессии).
EQ yx = rxy f(x — xto(x);S(x)) S(y) + xto(y) = -0.925 f(x — 26;12.466) 4 + 11 = -0.3x + 18.71
Линейное уравнение регрессии имеет вид y = -0.3 x + 18.71
Коэффициентам уравнения линейной регрессии можно придать экономический смысл.
Коэффициент регрессии b = -0.3 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y понижается в среднем на -0.3.
Коэффициент a = 18.71 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Подставив в уравнение регрессии соответствующие значения х, можно определить выровненные (предсказанные) значения результативного показателя y(x) для каждого наблюдения.
Связь между у и х определяет знак коэффициента регрессии b (если > 0 – прямая связь, иначе — обратная). В нашем примере связь обратная.
Коэффициенты регрессии (в примере b) нежелательно использовать для непосредственной оценки влияния факторов на результативный признак в том случае, если существует различие единиц измерения результативного показателя у и факторного признака х.
Для этих целей вычисляются коэффициенты эластичности и бета — коэффициенты.
Средний коэффициент эластичности E показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения.
Коэффициент эластичности находится по формуле:
EQ E = f(∂y;∂x) f(x;y) = bf(xto(x);xto(y))
EQ E = -0.3f(26;11) = -0.7
Коэффициент эластичности меньше 1. Следовательно, при изменении Х на 1%, Y изменится менее чем на 1%. Другими словами — влияние Х на Y не существенно.
Коэффициент детерминации.
Квадрат (множественного) коэффициента корреляции называется коэффициентом детерминации, который показывает долю вариации результативного признака, объясненную вариацией факторного признака.
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
R2= -0.9252 = 0.8547
т.е. в 85.47 % случаев изменения х приводят к изменению y. Другими словами — точность подбора уравнения регрессии — высокая. Остальные 14.53 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
x y y(x) (yi-ycp)2 (y-y(x))2
10 18 15.75 49 5.08
12 17 15.15 36 3.41
14 14 14.56 9 0.31
17 12 13.67 1 2.79
24 10 11.59 1 2.54
28 10 10.41 1 0.17
30 8 9.81 9 3.29
35 9 8.33 4 0.45
40 6 6.85 25 0.72
50 6 3.88 25 4.49
260 110 110 160 23.24
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
EQ S2 = f(∑(yi — yx)2;n — m — 1)
EQ S2 = f(23.24;8) = 2.905
S2 = 2.905 — необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
EQ S = r(S2) = r(2.905) = 1.7
S = 1.7 — стандартная ошибка оценки (стандартная ошибка регрессии).
3). Проверка найденной модели на адекватность.
F-статистика. Критерий Фишера.
Коэффициент детерминации R2 используется для проверки существенности уравнения линейной регрессии в целом.
Проверка значимости модели регрессии проводится с использованием F-критерия Фишера, расчетное значение которого находится как отношение дисперсии исходного ряда наблюдений изучаемого показателя и несмещенной оценки дисперсии остаточной последовательности для данной модели.
Если расчетное значение с k1=(m) и k2=(n-m-1) степенями свободы больше табличного при заданном уровне значимости, то модель считается значимой.
EQ R2 = 1 — f(∑(yi — yx)2; ∑(yi — xto(y))2) = 1 — f(23.24;160) = 0.8547
где m – число факторов в модели.
Оценка статистической значимости парной линейной регрессии производится по следующему алгоритму:
1. Выдвигается нулевая гипотеза о том, что уравнение в целом статистически незначимо: H0: R2=0 на уровне значимости α.
2. Далее определяют фактическое значение F-критерия:
EQ F = f(R2;1 — R2)f((n — m -1);m)EQ F = f(0.8547;1 — 0.8547)f((10-1-1);1) = 47.07
где m=1 для парной регрессии.
3. Табличное значение определяется по таблицам распределения Фишера для

По 10 однородным предприятиям имеются следующие данные Исходные данные № предприятия Кол-во рабочих с профессиональной подготовкой