Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Условия применения и ограничения корреляционно-регрессионного анализа

Читайте также:
  1. C) одновременно выполняются условия а) и б);
  2. D) Отечественная культура в условиях тоталитарного общества.
  3. D. Условия пребывания и размещение
  4. E. закономерности психического развития, протекающего в неблагоприятных условиях, патогенная сила которых превышает компенсаторные возможности индивида
  5. I. История применения лекарственных растений. Заготовка, сбор, сушка и хранение лекарственных растений
  6. I. Область применения
  7. I. Область применения
  8. I. Условия допуска к итоговой аттестации
  9. II. 9. УСЛОВИЯ РОСТА ЗНАНИЯ
  10. II. УСЛОВИЯ УЧАСТИЯ В АКЦИИ

Поскольку корреляционная связь является статистической, то первым условием возможности её изучения является наличие данных по достаточно большой совокупности. Какое именно число явлений достаточно для анализа корреляционной связи зависит от требуемой точности и надежности параметров связи, от числа факторов…Обычно считают, что число наблюдений должно быть не менее чем в 5-6 раз, а лучше в 10 раз больше числа факторов. Ещё лучше, если число наблюдений в сотни раз больше числа факторов, тогда закон больших чисел обеспечивает эффективное взаимопогашение случайных отклонений от закономерного характера связи признаков.

Вторым условием закономерного проявления корреляционной связи служит условие, обеспечивающее надежное выражение закономерности в средней величине, т.е. необходима достаточна однородность совокупности. Например, для выяснения влияния комбикормов на повышения жирности молока у коров, следует рассматривать коров одной породы.

Третьим условием является необходимость подчинения распределения совокупности по результативному и факторным признакам нормальному закону распределения вероятностей. На практике эта предпосылка выполняется приближенно.

Основные понятия и формулы, применяемые при корреляционно-регрессионном анализе

 

Генеральная выборка – если набор данных содержит информацию о каждом элементе группы или обо всех возможных измерениях, говорят, что такой набор данных представляет генеральную совокупность

Выборка – если измерения проводятся только на некотором подмножестве генеральной совокупности или выполняется лишь часть всех возможных измерений, такой набор данных называется выборкой. При использовании выборочного метода исследования следует позаботиться о получении репрезентативной выборки, Чаще всего в ее качестве используют случайную выборку.

Случайный отбор – такой метод формирования выборки, при котором в нее с одинаковой вероятностью могут попасть все элементы генеральной совокупности.

Среднее арифметическое – сумма всех входящих в набор значений, деленная на их количество.

Математическое ожидание – есть сумма значений, входящих в выборку, делённая на их количество. При очень большом количестве элементов в выборке математическое ожидание с большой вероятностью будет близко к среднему арифметическому

,

 

Отклонение – разность между значениями, входящими в выборку величины и средним выборочным значением.

Стандартное отклонение – значение, характеризующее диапазон разброса входящих в набор данных величин возле среднего арифметического.

Дисперсия – стандартное отклонение, возведенное в квадрат.

Среднее квадратичное отклонение: - квадратный корень из дисперсии

Коэффициент вариации характеризует относительную меру отклонения измеренных значений от среднеарифметического:

Чем больше значение коэффициента вариации, тем относительно больший разброс и меньшая выравненность исследуемых значений. Если коэффициент вариации меньше 10%, то изменчивость вариационного ряда принято считать незначительной, от 10% до 20% относится к средней, больше 20% и меньше 33% к значительной и если коэффициент вариации превышает 33%, то это говорит о неоднородности информации и необходимости исключения самых больших и самых маленьких значений

Относительное отклонение:

Корреляция – статистика, описывающая связь между случайными величинами. Если связь линейная – то используется коэффициент корреляции, в противном случае корреляционное отношение

Коэффициент корреляции может принимать значения . Отрицательные значения свидетельствуют об обратной связи признаков у и х, положительные - о прямой.

Обычно считают связь сильной, если , средней – при и слабой – при

Оценив корреляционные связи в нашем эксперименте, переходим к моделированию процесса.

Удобной математической моделью такого рода зависимостей является уравнение вида

, где случайная переменная. Это уравнение называется у равнением регрессии, функция - функцией регрессии. Относительно случайной величины обычно делается предположение, что она имеет нормальное распределение с нулевым математическим ожиданием.

Одним из широко распространенных критериев оптимальности функции регрессии является критерий минимума суммы квадратов. Формулируется так: пусть имеются наблюдения (х11), (х22), … (хn,yn). Функция f(x) подбирается таким образом, чтобы сумма квадратов расстояний была минимальной.

Тип функции регрессии определяется исходя из эксперимента

ментальных данных, чаще всего – линейный, полиноминальный, показательный, степенной, логарифмический. В нашем случае подбираем линейный тип: .

Показатели корреляционной связи, вычисленные по ограниченной совокупности, являются лишь оценками той или иной совокупности, оценками той или иной статистической закономерности, поскольку в любом параметре сохраняется элемент не полностью погасившейся случайности, присущей индивидуальным значениям признаков. Поэтому необходима статистическая оценка степени точности и надежности параметров корреляции. Под надежностью здесь понимается вероятность того, что значение проверяемого параметра не равно нулю, не включает в себя величины противоположных знаков. Средняя ошибка для коэффициента парной регрессии а вычисляется так:

где - расчетные значения результативного признака для i-й единицы:

n-2 – число степеней свободы (теряются 2 степени свободы, поскольку парная регрессия имеет два параметра)

Проверяем гипотезу значимости а. С этой целью находится соотношение коэффициента к его средней ошибке, т. е. t-критерий Стьюдента:

Сравниваем его значение с табличным по заданному уровню достоверности и соответствующим степеням свободы. Если расчетный t-критерий больше табличного, то гипотезу о несущественном коэффициенте а можно отклонить.

 




Дата добавления: 2015-01-12; просмотров: 48 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.011 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав