Читайте также:
|
Установление формы и оценки тесноты корреляционной зависимости между случайными величинами X и Y.
Цель задания: закрепление знаний по основам теории корреляции; приобретение умений и навыков в проведении анализов статистических зависимостей.
Содержание задания: по данным корреляционной таблицы необходимо установить форму корреляционной зависимости, т.е. установить вид теоретической функции регрессии, оценить тесноту корреляционной зависимости между случайными величинами
и
и определить параметры теоретических линий регрессии
по
и
по
.
Методические указания к выполнению работы
Для установления формы корреляционной зависимости следует в прямоугольной системе координат построить эмпирическую ломаную регрессию
по
и по виду графика сделать заключение о предлагаемой форме связи между рассматриваемыми величинами
и
. Для оценки тесноты связи между величинами
и
следует вычислить коэффициент корреляционного отношения
yx и коэффициент корреляции
. Сравнив значения полученных показателей, сделать заключение о возможности использования прямолинейной формы для составления уравнений регрессии
по
и
по
. Затем вычислить средние квадратические погрешности для
и
yx, а также доверительные границы для них с вероятностью 0,99. Параметры искомых теоретических линий регрессии можно определить с помощью метода наименьших квадратов.
Пример. На 100 участках земли одинаковой площади с различным комплексом
внесенных в них удобрений произведено обследование урожайности кукурузы
. Результаты обследования представлены в табл.8, где
и
– суммы частот соответственно по столбцам и строкам таблицы:


Таблица 8
Количество зерна в центнерах, собранного с участка,
| Количество удобрений в тоннах, внесенных на участок,
| Итого
| ||||
| - | - | - | ||||
| - | - | - | ||||
| - | - | - | ||||
| - | - | - | ||||
| - | - | - | - | |||
Итого
|
Числа первой строки таблицы означают, что 14 ц кукурузного зерна собрано на 10 участках с 1 т внесенных удобрений и на 8 участках с 2 т внесенных удобрений. На участках с количеством внесенных удобрений 3, 4 и 5 т урожайности в 14 ц не наблюдалось. Аналогично следует истолковать числа остальных строк таблицы.
Решение. Для построения эмпирических линий регрессии
по
и
по
найдем групповые средние
и
:


где
– число участков, на которые было внесено
тонны удобрений и собранно
центнеров с гектара.
В данном примере 





В прямоугольной системе координат строим точки с координатами
и
. Точки последовательно соединяются отрезками прямой (см. рис.1). Полученная ломаная является эмпирической ломаной регрессии
по
. Расположение эмпирических точек на чертеже позволяет предположить наличие прямолинейной корреляционной зависимости между
и
.

Рис. 1. Эмпирические линии регрессии
по
(—) и
по
(‑‑‑).
Эмпирические корреляционные отношения
по
и
по
находятся по формулам:

где

– межгрупповые дисперсии,


– дисперсии случайных величин
и
,
и
– их средние значения, вычисляемые по формулам:

Вычисления проводятся с использованием табл. 1 и полученных значений в следующем порядке:







Значение
, близкое к единице, говорит о высокой степени корреляционной связи между
и
.
Аналогично вычисляем:

Линейный коэффициент корреляции вычисляется по одной из формул:


где

С вычислительной точки зрения удобнее пользоваться последней формулой.
Для вычисления r удобно составить вспомогательную табл. 9
Таблица 9
|
|
|
|
|
|
|
|
|
|
| 14,6 | |||||||||
| 15,8 | |||||||||
| 16,6 | |||||||||
| 17,6 | |||||||||
| - | - |

Близость значений
и
подтверждает предположение о линейной корреляционной зависимости между
и
. Значения линейного коэффициента корреляции, близкое к 1, говорит о высокой степени линейной корреляционной связи
и
, близкой к функциональной.
Доверительная оценка линейного коэффициента корреляции производится по следующей схеме:
а) находится средняя квадратическая ошибка по формуле:

б) вычисляется критерий
;

в) по таблице находится
(см. табл.1 прил.).
По значению
оценивается коэффициент линейной корреляции: чем ближе значение
к 1, тем достовернее вычисленный коэффициент
. При
можно считать, что вычисленный коэффициент корреляции практически достоверен. В данном случае
.
Доверительные границы для
определяются по формуле:
· нижняя граница =
;
· верхняя граница =
,
где
решение уравнения
доверительная вероятность.
В данном примере
. По таблице значений
находим
, соответствующее
Получим
.
Вычисляем доверительные границы:

Окончательно: 
Аналогично оценивается и корреляционное отношение, для которого средняя квадратическая ошибка вычисляется по формуле:

Переходим к определению линейных уравнений регрессии:
уравнение прямой регрессии
по
;
уравнение прямой регрессии
по
,
где
общие средние соответственно случайных величин
и
.
коэффициенты регрессии, которые вычисляются по формулам:

Если же
,
,
не вычислялись, используются непосредственные формулы:


Все необходимые данные для вычисления
и
содержаться в табл. 9


Уравнение прямой регрессии
по
:

или окончательно 
Аналогично получим уравнение обратной регрессии
по
:

окончательно 
Дата добавления: 2015-04-11; просмотров: 109 | Поможем написать вашу работу | Нарушение авторских прав |