Читайте также:
|
|
Параметры линейной модели регрессии в Excel получают с помощью встроенной функции ЛИНЕЙН:
ЛИНЕЙН(изв_знач_Y, изв_знач_Х, конст, статистика).
В Calc аналогичная функция называется LINEST:
LINEST(изв_знач_Y, изв_знач_Х, тип линии, статистика).
Первые два аргумента задают диапазоны размещения выборочных данных для результативного и факторного признаков, соответственно. Два последних аргумента имеют логический тип с допустимыми значениями “истина” или “ложь” (1 или 0 в цифровом варианте). Если конст (тип линии) полагается равной “истина” либо опущено, то свободный член b 0 в уравнении регрессии может быть любым, в противном случае (конст - “ложь”) b 0 принудительно полагается равной нулю. Последний аргумент статистика указывает, требуется ли вычислять дополнительную статистику по регрессии: если здесь введено значение “истина”, то дополнительная статистика выдается, в противном случае (статистика - “ложь” или опущено) вычисляются только коэффициенты уравнения регрессии b 0 и b 1.
Поскольку в полном варианте (с дополнительной статистикой) функции ЛИНЕЙН и LINEST выдают массивы значений, их следует вводить специальным образом. А именно:
При правильном обращении к встроенной функции выделенная под результаты область заполняется следующим образом:
Угловой коэффициент b 1 | Свободный член b 0 |
Стандартная ошибка b 1 | Стандартная ошибка b 0 |
Коэффициент детерминации R2 | Стандартная ошибка регрессии S |
F-статистика Фишера | Число степеней свободы ν |
Регрессионная дисперсия | Остаточная дисперсия |
Перечисленные здесь параметры модели линейной регрессии не нуждаются в дополнительном разъяснении, напомним только, что статистика Фишера Fm,v при m = 1 равна квадрату статистики Стьюдента. Тогда наблюдаемое значение t -статистики , его используют при проверке гипотез о значимости параметров регрессионной модели.
Таким образом, построение уравнения регрессии и его статистический анализ, аналогичный по полноте рассмотренному выше “ручному” варианту, обеспечивается автоматизированными средствами MS Excel и OO Calc. Продемонстрируем сказанное на том же примере по изучению связи между размером прожиточного минимума (Y) и величиной расходов на питание (X).
Рис. 1.2. Выборочные данные.
1. Размер прожиточного минимума (Y) является результативным признаком, а величина расходов на питание (X) - факторный признак.
2. Корреляционное поле (рис. 1.3), представляющее данные рис. 1.2, строим с помощью Мастера диаграмм (тип диаграммы – «Точечная»).
Рис. 1.3. Корреляционное поле для изучаемых признаков
3. По виду корреляционного поля предполагаем, что линейная функция f(x) = β 0 + β 1 ∙x пригодна для описания связи между Х и Y.
4. Для вычисления выборочного коэффициента корреляции в Excel используем функцию КОРРЕЛ, а в Calc – CORREL, в качестве аргументов укажем область размещения массивов X и Y (рис.1.2):
КОРРЕЛ(В2:В6; С2:С6) или CORREL(В2:В6; С2:С6).
Полученная в результате оценка коэффициента корреляции r проверяется на значимость.
В нашем примере получим r = 0,91, тогда наблюдаемое значение t-статистики:
Критические точки распределения Стьюдента для заданного уровня значимости α и числа степеней свободы ν = n – 2 в Excel находят с помощью встроенной функции СТЬДРАСПОБР(α, ν). Соответствующая функция в Calc - TINV(α, ν).
Для нашего примера по результатам применения СТЬДРАСПОБР(0,05, 3) (или TINV(0,05, 3)) найдём критическое значение t (α, n – 2) = 3,18.
Так как , коэффициент корреляции r статистически значим.
5. Параметры модели линейной регрессии находим с помощью
ЛИНЕЙН(С2:С6; В2:В6; 1; 1) <Ctrl><Shift><Enter> либо
LINEST(С2:С6; В2:В6; 1; 1) <Ctrl><Shift><Enter>.
Заметим, что здесь наиболее частая ошибка – несинхронное нажатие клавиш <Ctrl><Shift><Enter>. Ошибка сразу же обнаружится: вместо ожидаемых десяти значений получится всего одно! Для исправления вернитесь в строку формул и повторите запуск (<Ctrl><Shift><Enter>) аккуратно.
Результат работы функции ЛИНЕЙН (или LINEST) для нашего примера представлен на рис. 1.4:
Рис. 1.4. Оценки параметров линейной регрессии в примере
Оценки коэффициентов уравнения регрессии b 0 и b 1 указаны в ячейках В10 и А10 (рис. 1.4) соответственно, тогда выборочное уравнение регрессии имеет вид: = 6,25+0,775∙ х.
6. Проверка значимости коэффициентов b 0 и b 1.
Стандартные ошибки коэффициентов уравнения регрессии Sb1 и Sb 0приведены в ячейках А11 и В11 (рис. 1.4) соответственно. Тогда наблюдаемые значения t -статистик: ;
.
Сравнение этих величин с найденным ранее (в пункте 4) критическим значением t (α, n – 2) =3,18, свидетельствует о значимости выборочных коэффициентов уравнения регрессии.
Найденные выше параметры модели обеспечивают построение доверительных интервалов для теоретических коэффициентов уравнения регрессии b1 и b0. При заданном уровне значимости α = 0,05 имеем:
0,775-3,18×0,143 < b 1 < 0,775+3,18×0,143, или
0,32 < b 1 < 1,23.
6,25-3,18×1,65 < β 0 < 6,25+3,18×1,65, или
1,003 < β 0 < 11,497.
7. Коэффициент детерминации R2 = rxy 2 ≈ 0.91 приведен в ячейке А12 (рис. 1.4), его значимость следует из установленной выше (в пункте 4) значимости коэффициента корреляции.
Таким образом, полученные в электронных таблицах результаты подтверждают правильность «ручного» варианта решения поставленной задачи. Понятно, что вывод также сохраняется.
Дата добавления: 2015-09-11; просмотров: 60 | Поможем написать вашу работу | Нарушение авторских прав |
<== предыдущая лекция | | | следующая лекция ==> |
Решение | | | Принцип заинтересованности при досрочном прекращении правовой охраны товарного знака в связи с неиспользованием |