Студопедия
Главная страница | Контакты | Случайная страница | Спросить на ВикиКак

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Элементы корреляционного анализа

Читайте также:
  1. d-элементы IV группы
  2. d-элементы V группы
  3. I.II. ЭЛЕМЕНТЫ ФИНАНСОВОЙ ПОЛИТИКИ
  4. II. Основные элементы денежной системы.
  5. III. ЗАЩИТНЫЕ ДЕЙСТВИЯ Я, РАССМАТРИВАЕМЫЕ КАК ОБЪЕКТ АНАЛИЗА
  6. III. Процедурные методы анализа
  7. III. Составные элементы генерального бюджета.
  8. OLAP-технологии анализа и прогнозирования деловой ситуации
  9. s-, p-Элементы, переходные элементы
  10. А3.2. Правила проведения SWOT-анализа


14.1. Приближенное уравнение линейной регрессии


Зависимость между величинами может быть двух видов: функциональная и стохастическая. Если каждому значению одной величины соответствует единственное значение другой, то такая зависимость называется функциональной. Однако возможна такая зависимость, когда в ответ на появление значения одной величины, другая принимает некоторое случайное значение. Но вид закона распределения второй величины изменяется в зависимости от значения первой. Такая зависимость называется стохастической.

Проведем n наблюдений над случайными величинами X и Y. В результате получим выборку объема n, состоящую из трех строк. В первой номер наблюдения, во второй и третьей соответствующие значения случайных величин, полученных в данном наблюдении.

 

i 1 2 . . . n
Xi x1 x2 . . . xn
Yi y1 y2 . . . yn


Попытаемся по результатам наблюдений найти приближенную зависимость между величинами X и Y. Указать точную зависимость очень сложно. Поэтому естественно выдвинуть некоторое предположение о виде этой зависимости, включающему в себя некоторые параметры с тем, чтобы за счет варьирования этих параметров, подобрать уравнение зависимости лучшего вида. Ответ на вопрос о том, какую зависимость считать наилучшей сильно зависит от того в каком классе функций ищется решение и по какому критерию оценивается отклонение от оптимального вида зависимости. Такое уравнение называется приближенным уравнением регрессии. Чаще всего ищется зависимость вида Y=aX+b, т. е. линейное уравнение. Предположим, что имеется зависимость такого вида. Тогда отклонение для каждой пары значений найдем по формуле Di=Yi-aXi-b. Выберем в качестве общей меры отклонения для всей выборки в целом сумму квадратов отклонений. Обозначим ее

(1)

Для исследования более удобно выбрать в качестве меры величину

(2)

Подберем a и b так, чтобы величина D была минимальной.

Этот метод называется методом наименьших квадратов. Необходимым условием существования экстремума являются условия

(3)

Запишем условия (3)

(4)

(5)

Из уравнения (5) находим

b=MY-aMX

Из уравнения (4) получим

M(XY)-aMX2-( MY-aMX)MX=0.

Или

M(XY)- MY MX-a(M(X2)-( MX)2)=0.

Откуда находим

Cov(X,Y)- aDX=0.

Следовательно

rXYsXsY- asX2=0.

Получаем

И приближенное линейное уравнение регрессии Y на X

Или

(6)

Аналогично, приближенное линейное уравнение регрессии X на Y

(7)

Замечание. Уравнение (7) не равносильно уравнению (6). Они задают разные линии.

При практических исследованиях для построения уравнения (6) используют статистические числовые характеристики.

(8)

Причем в качестве статистической числовой оценки для ковариации используем

Коэффициент корреляции показывает меру линейной зависимости между случайными величинами X и Y.


14.2. Множественная регрессия


Пусть дана система случайных величин X1,X2,...,Xk,Y. Попытаемся отыскать зависимость вида

(9)

Найдем математическое ожидание от обеих частей уравнения (9)

(10)

Вычтем

(11)

Введем меру отклонения

(12)

Предположим, что знак математического ожидания и дифференцирования можно менять местами. После дифференцирования получим систему

. . . . . . . . . . . (13)

Мы получили систему из k уравнений с k неизвестными. Матрица коэффициентов системы называется ковариционной матрицей. Если каждый коэффициент матрицы разделить на произведение соответствующих среднеквадратичных отклонений, то получим корреляционную матрицу. Решим систему (13) и найдем коффициенты при неизвестных равенства (9). Подставим найденные значения в (10) и найдем b. А затем построим зависимость (9). Уравнение (9) называется уравнением множественной регрессии, Для статистического исследования системы случайных величин X1,X2,...,Xk,Y. Проведем n наблюдений над случайными величинами. В результате получим выборку объема n, которую удобно представить в виде таблицы

 

i X1 X2 . . . Xk Y
1 X11 X12 . . . X1k Y1
2 X21 X22 . . . X2k Y2
. . . . . . . . . . . . . . . . . .
n Xn1 Xn2 . . . Xnk Yn


Построим по этой таблице ковариации величин системы (13) и найдем уравнение множественной регрессии.


14.3. Приближенное полиномиальное уравнение регрессии


Часто требуется зависимость зависимости между случайными величинами X и Y в виде некоторого полинома (многочлена) вида

Y=a0+a1X+a2X2+... + anXn.

Этот случай сводится к рассмотренной схеме множественной регрессии с помощью следующего приема. Вводится система величин

X0 =X0, X1 =X1, X2 =X2,..., Xn =Xn.

После этого проводим корреляционный анализ по схеме множественной регрессии и находим коэффициенты многочлена.


Дата добавления: 2015-01-12; просмотров: 40 | Нарушение авторских прав

<== предыдущая лекция | следующая лекция ==>
Анализ показателей рентабельности| История и принцип метода

lektsii.net - Лекции.Нет - 2014-2017 год. (0.023 сек.)