Для оценки параметров α и β — используют МНК (метод наименьших квадратов).
Система нормальных уравнений.
a•n + b∑x = ∑y
a∑x + b∑x2 = ∑y•x
Для наших данных система уравнений имеет вид
50a + 63679 b = 5476
63679 a + 86891927 b = 7073792
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = 0.01721, a = 87.603
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.01721 x + 87.603
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)
x y x2 y2 x • y
1281 103 1640961 10609 131943
1333 113 1776889 12769 150629
1632 124 2663424 15376 202368
635 95 403225 9025 60325
949 102 900601 10404 96798
788 112 620944 12544 88256
1728 124 2985984 15376 214272
1773 116 3143529 13456 205668
1679 118 2819041 13924 198122
1085 100 1177225 10000 108500
1214 99 1473796 9801 120186
1422 107 2022084 11449 152154
523 87 273529 7569 45501
1025 109 1050625 11881 111725
1083 106 1172889 11236 114798
1178 120 1387684 14400 141360
1304 105 1700416 11025 136920
1308 114 1710864 12996 149112
1416 107 2005056 11449 151512
1185 115 1404225 13225 136275
1220 96 1488400 9216 117120
1311 104 1718721 10816 136344
1288 108 1658944 11664 139104
918 102 842724 10404 93636
809 102 654481 10404 82518
1188 120 1411344 14400 142560
1394 106 1943236 11236 147764
1435 114 2059225 12996 163590
1514 112 2292196 12544 169568
1577 112 2486929 12544 176624
1579 122 2493241 14884 192638
1210 122 1464100 14884 147620
1448 108 2096704 11664 156384
1468 114 2155024 12996 167352
1661 113 2758921 12769 187693
989 108 978121 11664 106812
1007 102 1014049 10404 102714
1030 112 1060900 12544 115360
1099 113 1207801 12769 124187
1197 110 1432809 12100 131670
1386 107 1920996 11449 148302
1498 117 2244004 13689 175266
1672 120 2795584 14400 200640
1466 113 2149156 12769 165658
1642 123 2696164 15129 201966
387 82 149769 6724 31734
704 104 495616 10816 73216
1177 112 1385329 12544 131824
1792 116 3211264 13456 207872
2072 106 4293184 11236 219632
63679 5476 86891927 603628 7073792

1. Параметры уравнения регрессии.
Выборочные средние.
EQ xto(x) = f(∑xi;n) = f(63679;50) = 1273.58
EQ xto(y) = f(∑yi;n) = f(5476;50) = 109.52
EQ xto(xy) = f(∑xiyi;n) = f(7073792;50) = 141475.84
Выборочные дисперсии:
EQ S2(x) = f(∑x2i;n) — xto(x)2 = f(86891927;50) — 1273.582 = 115832.52
EQ S2(y) = f(∑y2i;n) — xto(y)2 = f(603628;50) — 109.522 = 77.93
Среднеквадратическое отклонение
EQ S(x) = r(S2(x)) = r(115832.52) = 340.34
EQ S(y) = r(S2(y)) = r(77.93) = 8.83
Коэффициент корреляции
Ковариация.
EQ cov(x,y) = xto(x • y) — xto(x) • xto(y) = 141475.84 — 1273.58 • 109.52 = 1993.36
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
EQ rxy = f(xto(x • y) -xto(x) • xto(y) ;S(x) • S(y)) = f(141475.84 — 1273.58 • 109.52;340.34 • 8.83) = 0.66
Связь между признаком Y фактором X заметна и прямая.
Кроме того, коэффициент линейной парной корреляции может быть определен через коэффициент регрессии b:
EQ rx,y = bf(S(x);S(y))
Уравнение регрессии (оценка уравнения регрессии).
EQ yx = rxy f(x — xto(x);S(x)) S(y) + xto(y) = 0.66 f(x — 1273.58;340.34) 8.83 + 109.52 = 0.0172x + 87.6
Линейное уравнение регрессии имеет вид y = 0.0172 x + 87.6
Коэффициент регрессии b = 0.0172 показывает среднее изменение результативного показателя (в единицах измерения у) с повышением или понижением величины фактора х на единицу его измерения. В данном примере с увеличением на 1 единицу y повышается в среднем на 0.0172.
Коэффициент a = 87.6 формально показывает прогнозируемый уровень у, но только в том случае, если х=0 находится близко с выборочными значениями.
Эмпирическое корреляционное отношение.
EQ η = r(f(∑(xto(y) — yx)2; ∑(yi — xto(y))2) )
EQ η = r(f(1715.18;3896.48)) = 0.66
где
EQ (xto(y) — yx)2 = 3896.48 — 2181.3 = 1715.18
Индекс корреляции.
Для линейной регрессии индекс корреляции равен коэффициенту корреляции rxy = 0.66.
Полученная величина свидетельствует о том, что фактор x умеренно влияет на y
Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
EQ R = r(1 — f(∑(yi — yx)2; ∑(yi — xto(y))2) )
Коэффициент детерминации.
R2= 0.662 = 0.4402
т.е. в 44.02 % случаев изменения х приводят к изменению y. Другими словами — точность подбора уравнения регрессии — средняя. Остальные 55.98 % изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 2)
x y y(x) (yi-ycp)2 (y-y(x))2 (xi-xcp)2 |y — yx|:y
1281 103 109.65 42.51 44.19 55.06 0.0645
1333 113 110.54 12.11 6.04 3530.74 0.0217
1632 124 115.69 209.67 69.09 128464.9 0.067
635 95 98.53 210.83 12.47 407784.42 0.0372
949 102 103.93 56.55 3.74 105352.18 0.019
788 112 101.16 6.15 117.43 235787.94 0.0968
1728 124 117.34 209.67 44.35 206497.54 0.0537
1773 116 118.11 41.99 4.47 249420.34 0.0182
1679 118 116.5 71.91 2.26 164365.38 0.0127
1085 100 106.27 90.63 39.37 35562.42 0.0627
1214 99 108.49 110.67 90.15 3549.78 0.0959
1422 107 112.07 6.35 25.75 22028.5 0.0474
523 87 96.6 507.15 92.22 563370.34 0.11
1025 109 105.24 0.27 14.12 61792.02 0.0345
1083 106 106.24 12.39 0.0578 36320.74 0.00227
1178 120 107.88 109.83 147.01 9135.54 0.1
1304 105 110.04 20.43 25.44 925.38 0.048
1308 114 110.11 20.07 15.11 1184.74 0.0341
1416 107 111.97 6.35 24.71 20283.46 0.0465
1185 115 108 30.03 49.06 7846.42 0.0609
1220 96 108.6 182.79 158.71 2870.82 0.13
1311 104 110.16 30.47 37.99 1400.26 0.0593
1288 108 109.77 2.31 3.13 207.94 0.0164
918 102 103.4 56.55 1.96 126437.14 0.0137
809 102 101.53 56.55 0.23 215834.58 0.00466
1188 120 108.05 109.83 142.87 7323.94 0.0996
1394 106 111.59 12.39 31.27 14500.98 0.0528
1435 114 112.3 20.07 2.9 26056.42 0.0149
1514 112 113.66 6.15 2.75 57801.78 0.0148
1577 112 114.74 6.15 7.52 92063.7 0.0245
1579 122 114.78 155.75 52.19 93281.38 0.0592
1210 122 108.43 155.75 184.26 4042.42 0.11
1448 108 112.52 2.31 20.44 30422.34 0.0419
1468 114 112.87 20.07 1.29 37799.14 0.00995
1661 113 116.19 12.11 10.16 150094.26 0.0282
989 108 104.62 2.31 11.41 80985.78 0.0313
1007 102 104.93 56.55 8.6 71064.9 0.0287
1030 112 105.33 6.15 44.51 59331.22 0.0596
1099 113 106.52 12.11 42.05 30478.18 0.0574
1197 110 108.2 0.23 3.23 5864.5 0.0163
1386 107 111.45 6.35 19.84 12638.26 0.0416
1498 117 113.38 55.95 13.09 50364.34 0.0309
1672 120 116.38 109.83 13.13 158738.5 0.0302
1466 113 112.83 12.11 0.0284 37025.46 0.00149
1642 123 115.86 181.71 50.98 135733.3 0.058
387 82 94.26 757.35 150.38 786024.1 0.15
704 104 99.72 30.47 18.33 324421.38 0.0412
1177 112 107.86 6.15 17.16 9327.7 0.037
1792 116 118.44 41.99 5.96 268759.3 0.021
2072 106 123.26 12.39 297.91 637474.5 0.16
63679 5476 5476 3896.48 2181.3 5791626.18 2.48

Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия
EQ tнабл = rxy f(r(n-2);r(1 — r2xy))
и по таблице критических точек распределения Стьюдента, по

Для оценки параметров α и β — используют МНК (метод наименьших квадратов)