Условие.
Имеются следующие данные о выработке литья на одного работающего Х1(T), браке литья Х2 (%) и себестоимости 1 т литья Y (руб.) по литейным цехам заводов (табл.):
Необходимо: а)найти уравнение множественной регрессии Y по X1 и X2, б) оценить значимость этого уравнения и его коэффициентов на уровне α=0,05; в) сравнить раздельное влияние на зависимую переменную каждой из объясняющих переменных, используя стандартизованные коэффициенты регрессии и коэффициенты эластичности; г) найти 95%-ные доверительные интервалы для коэффициентов регрессии, а также для среднего и индивидуальных значений себестоимости 1 т литья в цехах, в которых выработка литья на одного работающего составляет 40 т, а брак литья – 5%.
Вариант 8
Х1
7 7 10 9 8 8 7 7
Х2
10 10 11 9 9 8 7 7
у 7 9 10 8 8 6 6 5
Решение.
Оценка уравнения регрессии.Определим вектор оценок коэффициентов регрессии. Согласно методу наименьших квадратов, вектор s получается из выражения: s = (XTX)-1XTYК матрице с переменными Xj добавляем единичный столбец:
1 7 10
1 7 10
1 10 11
1 9 9
1 8 9
1 8 8
1 7 7
1 7 7
Матрица Y
7
9
10
8
8
6
6
5
Матрица XT
1 1 1 1 1 1 1 1
7 7 10 9 8 8 7 7
10 10 11 9 9 8 7 7
Умножаем матрицы, (XTX)
XT X = 8 63 71
63 505 565
71 565 645
В матрице, (XTX) число 8, лежащее на пересечении 1-й строки и 1-го столбца, получено как сумма произведений элементов 1-й строки матрицы XT и 1-го столбца матрицы XУмножаем матрицы, (XTY)
XT Y = 59
473
539
Находим обратную матрицу (XTX)-1
8.333 -0.667 -0.333
-0.667 0.153 -0.0603
-0.333 -0.0603 0.091
Вектор оценок коэффициентов регрессии равен
Y(X) = 8,333 -0,667 -0,333
-0,667 0,153 -0,0603
-0,333 -0,0603 0,091
* 59
473
539
= -3,333
0,351
0,895
Уравнение регрессии (оценка уравнения регрессии)Y = -3.33 + 0.35X1 + 0.89X2Частные коэффициенты эластичности.С целью расширения возможностей содержательного анализа модели регрессии используются частные коэффициенты эластичности, которые определяются по формуле:Частный коэффициент эластичности показывает, насколько процентов в среднем изменяется признак-результат у с увеличением признака-фактора хj на 1% от своего среднего уровня при фиксированном положении других факторов модели.Частный коэффициент эластичности |E1| < 1. Следовательно, его влияние на результативный признак Y незначительно.Частные коэффициент эластичности |E2| > 1. Следовательно, он существенно влияет на результативный признак Y.
Стандартизированные частные коэффициенты регрессии
Непосредственное влияние фактора x1 на результат Y в уравнении регрессии измеряется βj и составляет 0.235; косвенное (опосредованное) влияние данного фактора на результат определяется как:rx1x2β2 = 0.511 * 0.774 = 0.3959
Сравнительная оценка влияния анализируемых факторов на результативный признак производится:- средним коэффициентом эластичности, показывающим на сколько процентов среднем по совокупности изменится результат y от своей средней величины при изменении фактора xi на 1% от своего среднего значения
Оценка значения результативного признака при заданных значениях факторов.Y(40,5) = -3.33 + 0.35 * 40 + 0.89 * 5 = 15.19V = X0T(XTX)-1X0где
X0 = 1
40
5
X0T = [ 1 ; 40 ; 5]
(XT X) -1 = 8,333 -0,667 -0,333
-0,667 0,153 -0,0603
-0,333 -0,0603 0,091
Умножаем матрицы X0T и (XTX)-1
X0T(XTX)-1 = ( 1 ; 40 ; 5) * 8,333 -0,667 -0,333
-0,667 0,153 -0,0603
-0,333 -0,0603 0,091
= -20 5,135 -2,288
Умножаем полученную матрицу на X0, находим V = 173.94Доверительные интервалы с вероятностью 0.95 для среднего значения результативного признака M(Y).(Y – t*SY ; Y + t*SY )где t(8-2-1;0.05/2) = 2.571 находим по таблице Стьюдента.(15.19 – 2.571*10.51 ; 15.19 + 2.571*10.51)(-11.83;42.21)C вероятностью 0.95 среднее значение Y при X0i находится в указанных пределах.Доверительные интервалы с вероятностью 0.95 для индивидуального значения результативного признака.(15.19 – 2.571*10.54 ; 15.19 + 2.571*10.54)(-11.91;42.29)C вероятностью 0.95 индивидуальное значение Y при X0i находится в указанных пределах.Проверка гипотез относительно коэффициентов уравнения регрессии (проверка значимости параметров множественного уравнения регрессии).1) t-статистикаTтабл (n-m-1;α/2) = (5;0.025) = 2.571Находим стандартную ошибку коэффициента регрессии b0:Статистическая значимость коэффициента регрессии b0 не подтверждается.Находим стандартную ошибку коэффициента регрессии b1:Статистическая значимость коэффициента регрессии b1 не подтверждается.Находим стандартную ошибку коэффициента регрессии b2:Статистическая значимость коэффициента регрессии b2 подтверждается.Доверительный интервал для коэффициентов уравнения регрессии.Определим доверительные интервалы коэффициентов регрессии, которые с надежность 95% будут следующими:(bi – ti Sbi; bi + ti Sbi)b0: (-3.33 – 2.571 • 2.3 ; -3.33 + 2.571 • 2.3) = (-9.25;2.58)b1: (0.35 – 2.571 • 0.31 ; 0.35 + 2.571 • 0.31) = (-0.45;1.15)b2: (0.89 – 2.571 • 0.24 ; 0.89 + 2.571 • 0.24) = (0.28;1.51)Проверка общего качества уравнения множественной регрессии.2) F-статистика. Критерий Фишера.Чем ближе этот коэффициент к единице, тем больше уравнение регрессии объясняет поведение Y.Более объективной оценкой является скорректированный коэффициент детерминации:Добавление в модель новых объясняющих переменных осуществляется до тех пор, пока растет скорректированный коэффициент детерминации.Проверим гипотезу об общей значимости – гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:H0: R2 = 0; β1 = β2 = … = βm = 0.H1: R2 ≠ 0.Проверка этой гипотезы осуществляется с помощью F-статистики распределения Фишера (правосторонняя проверка).Если F < Fkp = Fα ; n-m-1, то нет оснований для отклонения гипотезы H0.Табличное значение при степенях свободы k1 = 2 и k2 = n-m-1 = 8 – 2 – 1 = 5, Fkp(2;5) = 5.79Отметим значения на числовой оси.
Принятие H0 Отклонение H0, принятие H1
95% 5%
5.79 13.15
Поскольку фактическое значение F > Fkp, то коэффициент детерминации статистически значим и уравнение регрессии статистически надежно