Читайте также:
|
|
Пусть изучается система количественных признаков (X, Y). В результате п независимых опытов получены п пар чисел (x 1 y 1), (х 2 y 2),..., (хп, уn).
Найдем по данным наблюдений выборочное уравнение прямой линии среднеквадратичной регрессии. Для определенности будем искать уравнение регрессии Y на X: =kx + b.
Поскольку различные значения х признака X и соответствующие им значения у признака Y наблюдались по одному разу, то группировать данные нет необходимости. Также нет надобности использовать понятие условной средней, поэтому искомое уравнение можно записать так:
y = kx + b.
Угловой коэффициент прямой линии регрессии Y на X называют выборочным коэффициентом регрессии Y на X и обозначают через r ух; Итак, будем искать выборочное уравнение прямой линии регрессии Y на X вида
Y = r ух x + b. (1)
Подберем параметры r ух и b так, чтобы точки (x 1 y 1),(х 2 y 2),..., (хп, уn),построенные по данным наблюдений, на плоскости Оху лежали как можно ближе к прямой (1). Назовем отклонением разность Yi – yi (i =l, 2,..., n), где Yi – вычисленная по уравнению (1) ордината, соответствующая наблюдаемому значению хi; уi – наблюдаемая ордината, соответствующая хi.
Подберем параметры r ух и b так, чтобы сумма квадратов отклонений была минимальной (в этом состоит сущность метода наименьших квадратов). Так как каждое отклонение зависит от отыскиваемых параметров, то и сумма квадратов отклонений есть функция этих параметров (временно вместо r ух будем писать r):
,
или
Для отыскания минимума приравняем нулю соответствующие частные производные:
Выполнив элементарные преобразования, получим систему двух линейных уравнений относительно rи b:
. (2)
Решив эту систему, найдем искомые параметры:
(3)
Аналогично можно найти выборочное уравнение прямой линии регрессии X на Y: = rxyx + C, где rху – выборочный коэффициент регрессии X на Y.
Корреляционная таблица
При большом числе наблюдений одно и то же значение х может встретиться пх раз, одно и то же значение у – пу раз, одна и та же пара чисел (х, у)может наблюдаться пху раз. Поэтому данные наблюдений группируют, т. е. подсчитывают частоты пх, пу, пху. Все сгруппированные данные записывают в виде таблицы, которую называют корреляционной.
Дата добавления: 2015-01-12; просмотров: 186 | Поможем написать вашу работу | Нарушение авторских прав |