Читайте также: |
|
Регрессионно-корреляционный анализ - раздел математического статистики, объединяющий методы для определения регрессионной зависимости и тесноты корреляционной связи между двумя (парная или частная) или несколькими (многомерная или множественная) факторами.
Если между случайными величинами x и y существует корреляционная связь, то получаем уравнение регрессии:
где
- теоретическое значение у, полученное из уравнения
,
- погрешность отклонения теоретического значения у от фактических (экспериментальных) данных.
Уравнение зависимой средней величины от x, то есть
называют уравнение регрессии.
Связь между х и уна диаграмме рассеяния представлена прямой линией. Для оценки величин переменной простого выборочного анализа х и у используют метод наименьших квадратов, с помощью которого можно найти линию регрессии:
Параметр b указывает наклон линии регрессии. Если b<0, линия регрессии будет направлена вниз, если b>0, то линия регрессии направлена вверх.
С помощью уравнения прямой можно удовлетворить требованиям метода наименьших квадратов, используя формулы:
,
Наиболее подходящей является та линия, для которой сумма всех квадратов отклонения будет минимальной:
Для подбора наилучшей линии регрессии используют «коэффициент аппроксимации» - e:
где n - количество экспериментальных точек.
Упрощенно считают, что если коэффициент аппроксимации e < 33%, то линейная модель - наилучшая аппроксимация корреляционного поля точек и ее можно использовать для дальнейшего анализа. Если e >33%, то наилучшая модель
.
Квадратическая ошибка оценки, проверка их типичности.
Применительно к совокупности, у которой число параметров исследования
меньше 30 (n<30), для проверки типичности параметров уравнения регрессиииспользуется t- критерий Стьюдента. При этом вычисляется фактическоезначение t-критерия:
,
где σε- остаточная среднеквадратическая погрешность.
,
Полученные ta и tb сравнивают с критическим tk из таблицы Стьюдента сучётом принятого уровня значимости (а=0,01=99% или а=0,05=95%)и m - числа параметров исследуемого уравнения (степень свободы).
tb<tкр<ta
Вывод: по проверенным на типичность параметрам уравнения регрессиипроизводится построение математической модели связи ў=а+bх. Смысловое содержание полученных таким образом моделей состоит в том, что они характеризуют среднюю величину результативного признака , рассчитанного по факторному - X.
Определение коэффициента корреляции.
Основная задача- определение и выражение формы аналитической зависимости результативного признака У от факторного X и измерение тесноты связи. Изучение отношения между признаками- главная задача научных исследований. Взаимосвязь явлений и их признаков является главной задачей корреляционного анализа. "Корреляция" означает соответствие, соотношение, сопоставление. При обработке статистических данных необходимо проследить изменение признака одного от другого, тоесть найти уравнение связи, а также тесноту связи и коэффициент корреляции r:
r= ÖD, 0<|г|<1-1<г<1,
где D- коэффициент детерминации (доля соотношений признаков X и У в коэффициенте корреляции).
Для измерения надёжности коэффициента корреляций используется формула:
Статистическая оценка тесноты связи.
Существуют критерии оценки коэффициента корреляции:
1) Критерий Пирсона
η=
S2 – погрешность выборки,
σ2 – погрешность генеральной совокупности.
η Є (0;1]
Если η→1, корреляционная связь тесная;
если η→0, корреляционная связь отсутствует.
Здесь
, р - количество изучаемых параметров
, n - число наблюдений.
Дата добавления: 2014-12-20; просмотров: 191 | Поможем написать вашу работу | Нарушение авторских прав |