Читайте также:
|
|
Пример «ручного» выполнения работы
Исследуются связь между величиной расходов на питание (X) и размерами прожиточного минимума (Y). Результаты наблюдений изучаемых переменных приведены в таблице 1.1.
Построить прогноз для размера прожиточного минимума при расходах на питание хр = 20 (усл. ед.).
Таблица 1.1
X | |||||
Y |
Решение
Рис. 1.1. Корреляционное поле для изучаемых признаков
Табл. 1.2.
x | y | xy | x2 | y2 | ![]() | e2=(y- ![]() |
7,8 | 1,44 | |||||
10,9 | 0,81 | |||||
14,0 | 4,00 | |||||
17,1 | 3,61 | |||||
20,2 | 0,04 | |||||
70,0 | 9,90 | |||||
164,8 | 217,2 | 14,0 | 1,98 |
В двух последних строках приведены суммарные и средние значения величин, необходимые для последующих расчётов. А именно, используем эти данные, чтобы по формуле (2) найти выборочный коэффициент корреляции:
.
Проверим его статистическую значимость.
С этой целью вычисляется статистика:
,
которая при выполнении нулевой гипотезы имеет распределение Стьюдента с (n-2) степенями свободы.
Для нашего примера
.
С другой стороны, для уровня значимости α = 0,05 и числа степеней свободы ν = n – 2 = 3 по таблице распределения Стьюдента найдем критическое значение t (α/2, n – 2) = 3,18.
Так как | t | > t (α/2, n – 2), коэффициент корреляции статистически значим.
Оформим полученные результаты в виде статистического заключения по корреляционному анализу связи Х и У.
По знаку коэффициента корреляции выбираем один из следующих вариантов:
при rxy > 0 между Х и У имеется положительная корреляция;
при rxy < 0 между Х и У имеется отрицательная корреляция;
при rxy = 0 между Х и У отсутствует линейная корреляция.
По величине коэффициента корреляции теснота связи между Х и У характеризуется с помощью шкалы Чеддока:
׀rxy ׀ | 0,5 – 0,7 | 0,7 – 0,9 | 0,9 – 0,99 |
Теснота связи | заметная | высокая | весьма высокая |
Таким образом, в нашем примере между изучаемыми переменными есть положительная линейная корреляция: с увеличением расходов на питание величина прожиточного минимума в среднем возрастает. Теснота линейной связи оценивается по шкале Чеддока как весьма высокая.
5. Найдём оценки коэффициентов уравнения регрессии:
Используя данные табл. 1.2, получим b0 = 6,25, b1= 0,775, следовательно, выборочное уравнение регрессии имеет вид: .
Коэффициент b1 показывает, что при увеличении расходов на питание на 1 усл. ед. прожиточный минимум увеличится в среднем на 0,775 усл. ед. Значение b0 показывает, что при нулевом уровне расходов на питание прожиточный минимум составит в среднем 6,25 усл. ед.
Знаки коэффициентов уравнения регрессии соответствуют экономическому смыслу изучаемого явления.
6. Оценим значимость выборочных коэффициентов уравнения регрессии b 0и b 1.
Для этого сначала найдём стандартную ошибку регрессии: , в нашем примере
.
Стандартные ошибки коэффициентовуравнения регрессии:
в нашем случае:
.
Для углового коэффициента регрессии наблюдаемое значение t-статистики . При a=0,05 и n=3 критическое значение t(α/2, ν) = 3,18. Поскольку | tb1 | > t(α/2, ν), выборочный коэффициент регрессии b1 значим.
Аналогичную проверку проводим в отношении b 0. Для него
.
Так как | tb0 | > t(α/2, ν), коэффициент b0 значим.
Таким образом, в нашем примере оба коэффициента уравнения регрессии оказались значимыми.
Выполним интервальное оценивание истинных коэффициентов регрессии b0 и b1.
Доверительный интервал для теоретического коэффициента уравнения регрессии b1 при выбранном уровне значимости α:
b1 - t(α/2, ν)·Sb1 < β1 < b1 + t(α/2, ν)·Sb1
Аналогичная формула применяется для свободного члена β0.
Так, доверительный интервал, который с надёжностью 95% накрывает истинный (теоретический) коэффициент регрессии b1:
0,775-3,18×0,14 < b1 < 0,775+3,18×0,14, то есть
0,32 < b1 < 1,23.
Доверительный интервал для β0:
6,25-3,18×1,65 < β0 < 6,25+3,18×1,65, то есть
1,00 < β0 < 11,50.
Протяжённость доверительных интервалов для коэффициентов b0 и b1 (при одном и том же уровне значимости) отличается: для b0 он заметно шире, следовательно, точность оценивания в этом случае ниже по сравнению с точностью оценки b1. Скорей всего так проявляется очень малый объём выборки (n = 5).
7. Проверим качество построенного уравнения регрессии, вычислив коэффициент детерминации. В нашем примере получим R 2 = rxy 2 ≈ 0,91, отсюда заключаем, что 91 % дисперсии результативного признака объясняется уравнением регрессии , а доля необъяснённой дисперсии составляет лишь 9 %.
Значимость коэффициента детерминации следует из установленной выше значимости коэффициента корреляции.
Близость величины коэффициента R2 к единице свидетельствует о высоком качестве уравнения регрессии.
8. Найдем прогноз модели для уровня прожиточного минимума при величине расходов на питание хр = 20 (усл. ед.).
В качестве хр выбирают 80% от хмакс (для внутреннего, интерполяционного прогноза) или 110 – 120 % от хмакс для экстраполяционного прогнозирования за пределами области построения уравнения регрессии.
Точечный прогноз выполняем по выборочному уравнению регрессии . Для хр = 20 (усл. ед.):
.
При расходах на питание в 20 (усл. ед.) наиболее вероятная величина прожиточного минимума будет 21,75 (усл. ед.).
Для интервального прогноза найдём его стандартную ошибку:
.
В нашем примере:
.
Тогда доверительный интервал
при α = 0,05 будет:
21,75-3,18∙2,45 < Yp < 21,75+3,18∙2,45,
13,94 < Yp < 29,56.
С вероятностью 95% истинное значение прожиточного минимума Yр при расходах на питание в 20 (усл. ед.) лежит в пределах между 13,94 (усл. ед.) и 29,56 (усл. ед.).
Вывод: при исследовании связи между размером прожиточного минимума Y и величиной расходов на питание Xпо выборочным данным построено уравнение регрессии, которое обладает хорошими статистическими свойствами и, следовательно, может быть рекомендовано для практического применения.
Дата добавления: 2015-09-11; просмотров: 71 | Поможем написать вашу работу | Нарушение авторских прав |
|
<== предыдущая лекция | | | следующая лекция ==> |
Проверка резьбы на срез и смятие | | | Регрессионный анализ |