6 вариант
1.Имеются выборочные данные о распределении вкладчиков по размеру вклада в Сбербанке города.
Размер вклада, тыс руб
До 40 40-60 60-80 80-100 Свыше 100 итого
Число вкладов 32 56 92 120 100 400
Найти:
1.
Вероятность того, что средний размер вклада в Сбербанке отличается от среднего размера вклада в выборке не более , чем на 5 тыс руб
Границы в которых с вероятностью 0,95 заключена доля вкладов, размер которых менее 60тыс руб
Объем повторной выборки, при котором те же границы для доли вкладов(смотри пункт 2) можно гарантировать с вероятностью 0,9876; дать ответ на тот же вопрос, если никаких предварительных данных о рассматриваемой доле нет
Решение.
Вычислим среднюю арифметическую и дисперсию распределения. Величина интервала k = 20. Вычислим новые варианты в рабочей таблице:
i
[xi;xi+1] xi ui
ni
ui;ni
u2i;ni ui +1 (ui + 1)ni
1 20-40 30 -2 32 -64 128 -1 -32
2 40-60 50 -1 56 -56 56 0 0
3 60-80 70 0 92 0 0 1 92
4 80-100 90 1 120 120 120 2 240
5 100-120 110 2 100 200 400 3 300
350 0 400 200 704 5 600
a) Найдем среднюю квадратическую ошибку бесповторной выборки
Искомая доверительная вероятность
б)
Средняя квадратическая ошибка бесповторной выборки для доли
Из соотношения = Ф(t) = 0,95; t = 1,97
Предельная ошибка выборки для доли = 1,97*0,016 = 0,0315
Искомый доверительный интервал
0,22-0,0315 р 0,22+0,0315
0,1885 р 0,2515
в) Учитывая = Ф(t) = 0,9876; t = 2,5
Если о доле p = w ничего не известно, полагаем (pq)max = 0,17
Ответ: а) ; б) 0,1885 р 0,2515 ; в) 519 число вкладов
2. По данным задачи 1, используя критерий χ2-Пирсона, на уровне значимости α=0,05 проверить гипотезу о том, что случайная величина ε- размер вклада в Сбербанке-распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Решение.
Выдвигается гипотеза Н0: случайная величина ε- размер вклада в Сбербанке – распределена нормально. с параметрами а = 80 и 2 = 604
Для расчета рi используем функцию Лапласа
Дальнейшие расчеты покажем в таблице
i
[xi;xi+1] ni
pi npi
(ni – npi)
1 20-40 32 0,0443 1,4176 30,5824 1,02
2 40-60 56 0,1574 8,8144 47,1856 8,69
3 60-80 92 0,2910 26,772 65,228 15,68
4 80-100 120 0,2910 34,92 85,08 15,1
5 100-120 100 0,1564 15,64 84,36 0,78
400
41,27
Фактическое значение 2 = 41,27 Соотносим критическое значение 20,05;2= 5,99 k = m – r – 1 = 5– 2 – 1 = 2
Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по нормальному закону.
Строим гистограмму относительных частот.
Гистограмма относительных частот — это фигура, состоящая из m прямоугольников, опирающихся на интервалы группировки. Площадь к-ro прямоугольника полагают равной nk*/n, т.е. относительной частоте данного интервала.Для построения гистограммы нам необходимо получить границы интервалов группировки, для этого: Вычисляем полуширину интервала группировки:d = (x2*- x1* )/2 =…= (x*m+1- xm* )/2 = (40 – 20)/2 = 10 Находим xmin = x1*-d = 20-10 = 10 и xmax = x5*+d = 100+10 = 110 Находим границы интервалов группировки по формуле xk-1 = xk*-d k = 1…5
Номер Интервалаk Центр Интервалаxk* Границы Интервала[xk-1 , xk ]
nk*/n Hk
1 2 3 4 5
1 20.00000 10.00000… 30.00000 0.08000 0.00400
2 40.00000 30.00000… 50.00000 0.14000 0.00700
3 60.00000 50.00000… 70.00000 0.23000 0.01150
4 80.00000 70.00000… 90.00000 0.30000 0.01500
5 100.00000 90.00000…110.00000 0.25000 0.01250
Убеждаемся, что сумма всех высот Hk , умноженная на h, равна единице. (допускается небольшое отличие от единицы в рамках погрешности вычислений)0.00400+ 0.00700+ … + 0.01250 = 0.05000 ; 0.05000* 20.00000 = 1.00000 На оси абсцисс выбираем начальную точку чуть левее точки x1 = 30.00000, и такой масштаб, чтобы на оси поместился интервал [x1 , x5 ] = [ 30.00000 , 110.00000] и отчетливо различались точки xk.На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы отчетливо различались HkДля построения гистограммы относительных частот на ось абсцисс наносим интервалы [xk-1 , xk] и, используя каждый из них как основание, строим прямоугольник с соответствующей высотой Hk.Получаем гистограмму, изображенную на рисунке ниже.
Ответ: Гипотеза о выбранном теоретическом нормальном законе N (80; 604) не согласуется с опытными данными.
3. Распределение 50 предприятий по стоимости основных производственных фондов ε( млн. руб) и стоимости произведенной продукции η( млн.руб) представлены в таблице
η
ε 15-25 25-35 35-45 45-55 55-65 65-75 итого
5-15 17 4
21
15-25 3 18 3
24
25-35
2 15 5
22
35-45
3 13 7
23
45-55
6 14 20
итого 20 24 21 18 13 14 110
Необходимо:
1) вычислить групповые средние Xj и Yi и построить эмпирические линии регрессии;
2) предполагая, что между переменными η и ε существует линейная корреляционная зависимость: а) найти уравнения прямых регрессий и построить их графики на одном чертеже с эмпирическими линиями регрессии; б) вычислить коэффициент корреляции, на уровне а = 0,05 оценить его значимость сделать выводы тесноте и направлении связи между переменными η и ε; в) используя соответствующее уравнение регрессии, определить среднюю стоимость производственной продукции, при стоимости основных производственных фондов 45 млн.руб
Решение.
1) Найдём средние значения :
При ε1 = 10;
При ε2 = 20;
При ε3 = 30;
При ε4 = 40;
При ε5 = 50;
Построим график ломаной по полученным точкам – эмпирическую линию регрессии η на ε (рис. 2, синяя линия).
Аналогично найдём средние значения :
При η1 = 20;
При η2 = 30;
При η3 = 40;
При η4 = 50;
При η5 = 60
При η6 = 70;
Построим график ломаной по полученным точкам – эмпирическую линию регрессии ε на η (рис. 3, синяя линия).
2) а) Вычислим среднее значение
26670001143000Найдем уравнение
ηε = bηε(ε – ε) + η,
где bηε =
ηε = 1,11(ε – 29,64) + 42
ηε = 1,11ε + 74,9
148590017145006381752095500εη – ε = bηε (η – η),
где bεη =
εη = 0,7(η – 42) + 29,64
εη = 0,7η + 0,24
б) Коэффициент корреляции
связь обратная и тесная;
Статистика критерия
Для заданного уровня значимости по таблицам находим коэффициент Стьюдента:
.
Поскольку , то на данном уровне значимости можно сделать вывод о том, что между ε и η действительно существует достаточно тесная корреляционная зависимость.
Поскольку коэффициент корреляции отрицателен, то связь между ε и η обратная. Поскольку коэффициент корреляции по абсолютной величине ближе к единице, чем к нулю, то можно сделать вывод о достаточно тесной корреляционной связи между ε и η.
Построим эту прямую на начальном графике (рис. 2, красная линия). Сравнивая результат с данными испытаний (эмпирической линией регрессии), можно сделать вывод о достаточно тесной корреляционной связи между стоимостью основных производственных фондов ε( млн. руб) и стоимостью произведенной продукции η( млн.руб). Эта связь обратная: чем больше величина основных фондов, тем меньше себестоимость выпуска единицы продукции, и наоборот, чем меньше величина основных фондов, тем выше себестоимость единицы продукции.
Рис. 2
Построим эту прямую на начальном графике (рис. 3, красная линия). Сравнивая результат с данными испытаний (эмпирической линией регрессии), можно сделать вывод о достаточно тесной корреляционной связи между стоимостью основных производственных фондов ε( млн. руб) и стоимостью произведенной продукции η( млн.руб). Эта связь обратная: чем больше себе стоимость единицы продукции, тем меньше величина основных фондов, и наоборот, чем меньше себестоимость единицы продукции, тем больше величина основных фондов.
Рис. 3
в) Для оценки средней стоимости производственной продукции, при стоимости основных производственных фондов 45 млн.руб используем уравнение регрессии ε на η:
εη = 0,7η + 0,24
εη = 0,7*45+ 0,24=31,74 млн.руб
Ответ: 1) рис. 2; рис. 3;
2) а) ηε = 1,11ε + 74,9
εη = 0,7η + 0,24
б) ;
в) 31,74
8 вариант
С целью изучения дневной выработки ткани( м) ткачихи комбината по схеме собственно-случайной бесповторной выборки было отобрано 100 ткачих из 2000. Результаты представлены в таблице
Дневная выработка, м
Менее55 55-65 65-75 75-85 85-95 95-105 Более 105 итого
Число ткачих 8 7 15 35 20 8 7 100
Найти:
1.
А) Границы в которых с вероятностью 0,9883 заключена средняя дневная выработка всех ткачих комбината
Б)Вероятность того, что доля ткачих комбината, вырабатывающих в день не менее 85 м ткани, отличается от доли таких ткачих в выборке не более , чем на 0,05( по абсолютной велчиине).
В)Объем бесповторной выборки, при котором те же границы средней выработки(см пункт а) можно гарантировать с вероятностью 0,99942.
РЕШЕНИЕ
а) Найдём точечные оценки математического ожидания и дисперсии случайной величины X. Обозначим – номер интервала, –середина соответствующего интервала.
Вычислим выборочное среднее:
.
Вычислим выборочную дисперсию:
.
Тогда средняя ошибка выборки для средней составляет (учитывая, что отбор бесповторный):
.
Предельная ошибка выборки для средней:
,
где ищем по таблицам из соотношения:
,
,
,
.
Тогда:
.
Границы для средней:
,
,
.
б) Выборочная доля студентов, имеющих стаж работы менее 6 лет, составляет . Имеем . Тогда средняя ошибка выборки для доли составляет (учитывая, что отбор бесповторный):
.
Т. к. предельная ошибка выборки , то:
.
Вероятность, гарантирующую данную предельную ошибку, ищем по таблицам:
в) ищем по таблицам из соотношения:
,
0,99942,
,
.
Тогда:
.
Численность выборки составляет (учитывая, что отбор бесповторный):
.
Формально искомый объём выборки чуть меньше, чем 2000 ,но на практике тот же самый, т. к. число элементов выборки целое.
Ответ: а) ;б) 0,3729;в) 2000
По данным задачи 1, используя критерий χ2-Пирсона, на уровне значимости α=0,05 проверить гипотезу о том, что случайная величина ε- дневная выработка ткани-распределена по нормальному закону. Построить на одном чертеже гистограмму эмпирического распределения и соответствующую нормальную кривую.
Дневная выработка, м
Менее55 55-65 65-75 75-85 85-95 95-105 Более 105 итого
Число ткачих 8 7 15 35 20 8 7 100
РЕШЕНИЕ
В предположении нормальности распределения рассчитаем теоретические частоты. Обозначим эмпирические значения частот , а вычисленные теоретические частоты . Значения функции находим по таблицам. – шаг. Все расчёты сведены в табл. 1.
Табл. 1
1 50 8 -2,005 0,0540 3,5618
2 60 7 -1,35 0,1604 10,57
3 70 15 -0,686 0,3166 20,88
4 80 35 -0,03 0,3988 26,304
5 90 20 0,633 0,3271 21,576
6 100 8 1,293 0,1736 11,45
7 110 7 1,95 0,0596 3,9312
Составим таблицу для применения критерия Пирсона с целью проверки гипотезы о нормальном распределении генеральной совокупности.
Табл. 2
1 50 8 3,5618 5,54
2 60 7 10,57 1,206
3 70 15 20,88 1,655
4 80 35 26,304 2,87
5 90 20 21,576 0,115
6 100 8 11,45 1,039
7 110 7 3,9312 2,39
100
14,82
В результате расчетов получено значение критерия Пирсона.
Найдем число степеней свободы, учитывая, что групп выборок , число параметров нормального распределения , тогда . Kkp = χ2(7-2-1;0.05) = 9.48773; Kнабл = 14,82Наблюдаемое значение статистики Пирсона попадает в критическую область: Кнабл > Kkp, поэтому есть основания отвергать основную гипотезу. Данные выборки распределены не по нормальному закону. На рис. 1 изображена гистограмма эмпирического распределения и теоретическая кривая распределения (данные взяты из табл. 1).
Строим гистограмму относительных частот.
Гистограмма относительных частот — это фигура, состоящая из m прямоугольников, опирающихся на интервалы группировки. Площадь к-ro прямоугольника полагают равной nk*/n, т.е. относительной частоте данного интервала.Для построения гистограммы нам необходимо получить границы интервалов группировки, для этого:Вычисляем полуширину интервала группировки:d = (x2*- x1* )/2 =…= (x*m+1- xm* )/2 = (55 – 45)/2 = 5Находим xmin = x1*-d = 45-5 = 40 и xmax = x7*+d = 105+5 = 110Находим границы интервалов группировки по формуле xk-1 = xk*-d k = 1…7
Номер Интервалаk Центр Интервалаxk* Границы Интервала[xk-1 , xk ]
nk*/n Hk
1 2 3 4 5
1 45.00000 40.00000… 50.00000 0.08000 0.00800
2 55.00000 50.00000… 60.00000 0.07000 0.00700
3 65.00000 60.00000… 70.00000 0.15000 0.01500
4 75.00000 70.00000… 80.00000 0.35000 0.03500
5 85.00000 80.00000… 90.00000 0.20000 0.02000
6 95.00000 90.00000…100.00000 0.08000 0.00800
7 105.00000 100.00000…110.00000 0.07000 0.00700
Убеждаемся, что сумма всех высот Hk , умноженная на h, равна единице. (допускается небольшое отличие от единицы в рамках погрешности вычислений)0.00800+ 0.00700+ … + 0.00700 = 0.10000 ; 0.10000* 10.00000 = 1.00000На оси абсцисс выбираем начальную точку чуть левее точки x1 = 50.00000, и такой масштаб, чтобы на оси поместился интервал [x1 , x7 ] = [ 50.00000 , 110.00000] и отчетливо различались точки xk.На оси ординат выбираем начало отсчета в точке 0 и такой масштаб, чтобы отчетливо различались HkДля построения гистограммы относительных частот на ось абсцисс наносим интервалы [xk-1 , xk] и, используя каждый из них как основание, строим прямоугольник с соответствующей высотой Hk.Получаем гистограмму, изображенную на рисунке ниже.
Ответ: гипотеза отвергается;
3. Распределение 50 однотипных предприятий по основным фондам ε(млн.руб) и себестоимости выпуска единицы продукции η(млнюруб) представлены в таблице
η
ε 1 2 3 4 5 итого
30-80
1 2 3 6
80-130
1 4 3 8
130-180
4 8 3 1 16
180-230 2 5 4
11
230-280 3 4 2
9
итого 5 13 16 9 7 50
Необходимо:
1) вычислить групповые средние Xj и Yi и построить эмпирические линии регрессии;
2) предполагая, что между переменными η и ε существует линейная корреляционная зависимость: а) найти уравнения прямых регрессий и построить их графики на одном чертеже с эмпирическими линиями регрессии; б) вычислить коэффициент корреляции, на уровне а = 0,05 оценить его значимость сделать выводы тесноте и направлении связи между переменными η и ε; в) используя соответствующее уравнение регрессии, определить себестоимость выпускаемой продукции на предприятии с основными фондами 270 млн.руб
РЕШЕНИЕ
1) Найдём средние значения :
При ε1 = 55;
При ε2 = 105;
При ε3 = 155;
При ε4 = 205;
При ε5 = 255;
Построим график ломаной по полученным точкам – эмпирическую линию регрессии η на ε (рис. 2, синяя линия).
Аналогично найдём средние значения :
При η1 = 1;
При η2 = 2;
При η3 = 3;
При η4 = 4;
При η5 = 5;
Построим график ломаной по полученным точкам – эмпирическую линию регрессии ε на η (рис. 3, синяя линия).
2) а) Вычислим среднее значение
26670001143000Найдем уравнение
ηε = bηε(ε – ε) + η,
где bηε =
ηε = – 0,0182(ε – 164) + 3
ηε = – 0,0182ε + 5.9848
148590017145006381752095500εη – ε = bηε (η – η),
где bεη =
εη = – 50.36(η – 3) + 164
εη = – 50.36η + 315.08
б) Коэффициент корреляции
связь обратная и тесная;
Статистика критерия
Для заданного уровня значимости по таблицам находим коэффициент Стьюдента:
.
Поскольку , то на данном уровне значимости можно сделать вывод о том, что между ε и η действительно существует достаточно тесная корреляционная зависимость.
Поскольку коэффициент корреляции отрицателен, то связь между ε и η обратная. Поскольку коэффициент корреляции по абсолютной величине ближе к единице, чем к нулю, то можно сделать вывод о достаточно тесной корреляционной связи между ε и η.
Построим эту прямую на начальном графике (рис. 2, красная линия). Сравнивая результат с данными испытаний (эмпирической линией регрессии), можно сделать вывод о достаточно тесной корреляционной связи между основными фондами ε(млн.руб) и себестоимостью выпуска единицы продукции η(млнюруб). Эта связь обратная: чем больше величина основных фондов, тем меньше себестоимость выпуска единицы продукции, и наоборот, чем меньше величина основных фондов, тем выше себестоимость единицы продукции.
Рис. 2
Построим эту прямую на начальном графике (рис. 3, красная линия). Сравнивая результат с данными испытаний (эмпирической линией регрессии), можно сделать вывод о достаточно тесной корреляционной связи между основными фондами ε(млн.руб) и себестоимостью выпуска единицы продукции η(млнюруб). Эта связь обратная: чем больше себе стоимость единицы продукции, тем меньше величина основных фондов, и наоборот, чем меньше себестоимость единицы продукции, тем больше величина основных фондов.
Рис. 3
в) Для оценки себестоимости выпускаемой продукции на предприятии с основными фондами 270 млн.руб используем уравнение регрессии ε на η:
εη = – 50.36η + 315.08
εη = – 50.36*270 + 315.08=13282,12 млн.руб
Ответ: 1) рис. 2; рис. 3;
2) а) ηε = – 0,0182ε + 5.9848
εη = – 50.36η + 315.08
б) ;
в) 13282,12