Студопедия
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Регрессионный анализ

Читайте также:
  1. B.8 Топологический анализ активных линейных цепей
  2. I. Ситуационный анализ внутренней деятельности.
  3. III ЭТАП: РЕЗУЛЬТАТЫ АНАЛИЗА
  4. III. Образцы анализа.
  5. SWOT- анализ
  6. SWOT-анализ
  7. Swot-анализ и формулировка стратегии развития службы приема и размещения в гостинице Радуга
  8. Swot-анализ туристского потенциала Нижегородской области
  9. V Анализ состояния общественно-политической ситуации в организации
  10. V этап анализа конфликта

Параметры линейной модели регрессии в Excel получают с помощью встроенной функции ЛИНЕЙН:

ЛИНЕЙН(изв_знач_Y, изв_знач_Х, конст, статистика).

В Calc аналогичная функция называется LINEST:

LINEST(изв_знач_Y, изв_знач_Х, тип линии, статистика).

Первые два аргумента задают диапазоны размещения выборочных данных для результативного и факторного признаков, соответственно. Два последних аргумента имеют логический тип с допустимыми значениями “истина” или “ложь” (1 или 0 в цифровом варианте). Если конст (тип линии) полагается равной “истина” либо опущено, то свободный член b 0 в уравнении регрессии может быть любым, в противном случае (конст - “ложь”) b 0 принудительно полагается равной нулю. Последний аргумент статистика указывает, требуется ли вычислять дополнительную статистику по регрессии: если здесь введено значение “истина”, то дополнительная статистика выдается, в противном случае (статистика - “ложь” или опущено) вычисляются только коэффициенты уравнения регрессии b 0 и b 1.

Поскольку в полном варианте (с дополнительной статистикой) функции ЛИНЕЙН и LINEST выдают массивы значений, их следует вводить специальным образом. А именно:

При правильном обращении к встроенной функции выделенная под результаты область заполняется следующим образом:

 

Угловой коэффициент b 1 Свободный член b 0
Стандартная ошибка b 1 Стандартная ошибка b 0
Коэффициент детерминации R2 Стандартная ошибка регрессии S
F-статистика Фишера Число степеней свободы ν
Регрессионная дисперсия Остаточная дисперсия

Перечисленные здесь параметры модели линейной регрессии не нуждаются в дополнительном разъяснении, напомним только, что статистика Фишера Fm,v при m = 1 равна квадрату статистики Стьюдента. Тогда наблюдаемое значение t -статистики , его используют при проверке гипотез о значимости параметров регрессионной модели.

Таким образом, построение уравнения регрессии и его статистический анализ, аналогичный по полноте рассмотренному выше “ручному” варианту, обеспечивается автоматизированными средствами MS Excel и OO Calc. Продемонстрируем сказанное на том же примере по изучению связи между размером прожиточного минимума (Y) и величиной расходов на питание (X).

Рис. 1.2. Выборочные данные.

1. Размер прожиточного минимума (Y) является результативным признаком, а величина расходов на питание (X) - факторный признак.

2. Корреляционное поле (рис. 1.3), представляющее данные рис. 1.2, строим с помощью Мастера диаграмм (тип диаграммы – «Точечная»).

Рис. 1.3. Корреляционное поле для изучаемых признаков

3. По виду корреляционного поля предполагаем, что линейная функция f(x) = β 0 + β 1 ∙x пригодна для описания связи между Х и Y.

4. Для вычисления выборочного коэффициента корреляции в Excel используем функцию КОРРЕЛ, а в Calc – CORREL, в качестве аргументов укажем область размещения массивов X и Y (рис.1.2):

КОРРЕЛ(В2:В6; С2:С6) или CORREL(В2:В6; С2:С6).

Полученная в результате оценка коэффициента корреляции r проверяется на значимость.

В нашем примере получим r = 0,91, тогда наблюдаемое значение t-статистики:

Критические точки распределения Стьюдента для заданного уровня значимости α и числа степеней свободы ν = n – 2 в Excel находят с помощью встроенной функции СТЬДРАСПОБР(α, ν). Соответствующая функция в Calc - TINV(α, ν).

Для нашего примера по результатам применения СТЬДРАСПОБР(0,05, 3) (или TINV(0,05, 3)) найдём критическое значение t, n – 2) = 3,18.

Так как , коэффициент корреляции r статистически значим.

5. Параметры модели линейной регрессии находим с помощью

ЛИНЕЙН(С2:С6; В2:В6; 1; 1) <Ctrl><Shift><Enter> либо

LINEST(С2:С6; В2:В6; 1; 1) <Ctrl><Shift><Enter>.

Заметим, что здесь наиболее частая ошибка – несинхронное нажатие клавиш <Ctrl><Shift><Enter>. Ошибка сразу же обнаружится: вместо ожидаемых десяти значений получится всего одно! Для исправления вернитесь в строку формул и повторите запуск (<Ctrl><Shift><Enter>) аккуратно.

Результат работы функции ЛИНЕЙН (или LINEST) для нашего примера представлен на рис. 1.4:

Рис. 1.4. Оценки параметров линейной регрессии в примере

Оценки коэффициентов уравнения регрессии b 0 и b 1 указаны в ячейках В10 и А10 (рис. 1.4) соответственно, тогда выборочное уравнение регрессии имеет вид: = 6,25+0,775∙ х.

6. Проверка значимости коэффициентов b 0 и b 1.

Стандартные ошибки коэффициентов уравнения регрессии Sb1 и Sb 0приведены в ячейках А11 и В11 (рис. 1.4) соответственно. Тогда наблюдаемые значения t -статистик: ; .

Сравнение этих величин с найденным ранее (в пункте 4) критическим значением t, n – 2) =3,18, свидетельствует о значимости выборочных коэффициентов уравнения регрессии.

Найденные выше параметры модели обеспечивают построение доверительных интервалов для теоретических коэффициентов уравнения регрессии b1 и b0. При заданном уровне значимости α = 0,05 имеем:

0,775-3,18×0,143 < b 1 < 0,775+3,18×0,143, или

0,32 < b 1 < 1,23.

6,25-3,18×1,65 < β 0 < 6,25+3,18×1,65, или

1,003 < β 0 < 11,497.

7. Коэффициент детерминации R2 = rxy 2 ≈ 0.91 приведен в ячейке А12 (рис. 1.4), его значимость следует из установленной выше (в пункте 4) значимости коэффициента корреляции.

Таким образом, полученные в электронных таблицах результаты подтверждают правильность «ручного» варианта решения поставленной задачи. Понятно, что вывод также сохраняется.




Дата добавления: 2015-09-11; просмотров: 60 | Поможем написать вашу работу | Нарушение авторских прав

<== предыдущая лекция | следующая лекция ==>
Решение| Принцип заинтересованности при досрочном прекращении правовой охраны товарного знака в связи с неиспользованием

lektsii.net - Лекции.Нет - 2014-2025 год. (0.007 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав