Студопедия
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Линейный коэффициент корреляции

Читайте также:
  1. Inventory turnover ratio / Коэффициент оборачиваемости запасов
  2. Lt;variant>коэффициент финансовой зависимости
  3. Working capital turnover ratio / Коэффициент оборачиваемости оборотного капитала
  4. Анализ финансовых коэффициентов
  5. Анализ финансовых коэффициентов
  6. Весовой коэффициент двоичных векторов и расстояние между ними
  7. Влияние изменения коэффициентов функции Ф на прибыль.
  8. Влияние изменения масштаба измерения переменных на коэффициенты регрессии
  9. Влияние на коэффициенты регрессии масштаба измерения переменных.
  10. Выбор опасных сечений валов и коэффициент запаса

Для устранения недостатка ковариации был введён линейный коэффициент корреляции (или коэффициент корреляции Пирсона), который разработали Карл Пирсон, Фрэнсис Эджуорт и Рафаэль Уэлдон (англ.)русск. в 90-х годах XIX века. Коэффициент корреляции рассчитывается по формуле[10][8]:

где , — среднее значение выборок.

Коэффициент корреляции изменяется в пределах от минус единицы до плюс единицы[11].

Доказательство Линейный коэффициент корреляции связан с коэффициентом регрессии в виде следующей зависимости: где — коэффициент регрессии, — среднеквадратическое отклонение соответствующего факторного признака[12].

Для графического представления подобной связи можно использовать прямоугольную систему координат с осями, которые соответствуют обеим переменным. Каждая пара значений маркируется при помощи определенного символа. Такой график называется «диаграммой рассеяния».

Метод вычисления коэффициента корреляции зависит от вида шкалы, к которой относятся переменные. Так, для измерения переменных с интервальной и количественной шкалами необходимо использовать коэффициент корреляции Пирсона (корреляция моментов произведений). Если по меньшей мере одна из двух переменных имеет порядковую шкалу, либо не является нормально распределённой, необходимо использовать ранговую корреляцию Спирмена или (тау) Кендалла. В случае, когда одна из двух переменных является дихотомической, используется точечная двухрядная корреляция, а если обе переменные являются дихотомическими: четырёхполевая корреляция. Расчёт коэффициента корреляции между двумя недихотомическими переменными не лишён смысла только тогда, когда связь между ними линейна (однонаправлена).

 

32 Интерпритация коэффициента корреляции- Корреляция не является показателем зависимости одного фактора от другого, а лишь устанавливает их совместную вариативность. То обстоятельство, что два признака изменяются согласованно, может зависеть и от влияния третьей причины на оба сопоставляемых признака. Пример.Пусть имеются два ряда случайных чисел (две переменные с набором значений):

Х: 0 4 2 6 6 2 9 8 5 3

У: 8 9 1 0 5 2 4 6 7 1

Для этих рядов, никак между собой не связанных, коэффициент корреляции очень близок к нулю, и равен r = 0,006.

Ошибка при интерпретации коэффициента корреляции может быть допущена, когда в выборке присутствуют аномальные значения (очевидно большие или очевидно низкие). Они могут возникать, во-первых, из-за неоднородности исследуемых элементов выборки. Во-вторых, - из-за ошибок. Термин «корреляция» впервые применил французский палеонтолог Ж. Кювье. В статистику указанный термин ввел английский биолог и статистик Ф. Гальтон. Корреляционный анализ – это проверка гипотез о связях между переменными с использованием коэффициентов корреляции, двумерной описательной статистики, количественной меры взаимосвязи (совместной изменчивости) двух переменных. Таким образом, это совокупность методов обнаружения корреляционной.

34. Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента. Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:1) Сопоставать каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).2) Определить разности рангов каждой пары сопоставляемых значений.3) Возвести в квадрат каждую разность и суммировать полученные результаты.4) Вычислить коэффициент корреляции рангов по формуле:

35.Коэффициенты ранговой корреляции Кендалла. Исходные данные представляют собой две выборки, каждая из которых содержит n последовательных и несвязанных рангов, т.е. чисел от 1 до n. Кендалл построил свой коэффициент корреляции на количестве пар рангов, которые упорядочиваются в одинаковом направлении как по переменной х, так и по переменной у.Для некоторой пары лиц констатируется совпадение, если их порядок как по переменной х, так и по переменной у одинаков. Для некоторой пары лиц констатируется инверсия, если их порядок по переменным х и у различен. КРК Кендалла обычно обозначается и вычисляется по формуле:= (P – Q): ((n (n – 1)):2), где P – общее количество совпадений; Q – общее количество инверсий

 

Корреляция качественных признаков – метод анализа связи переменных, измеряемых в порядковых шкалах и шкалах наименований. Наиболее часто такой корреляционный анализ проводят с помощью коэффициентов ранговой корреляции, используемых в случаях, когда обе переменные измеряются в шкалах порядка или легко могут быть преобразованы в ранги. При измерении сравниваемых переменных в шкалах наименований широко применяются коэффициенты сопряженности, в которых в качестве промежуточной расчетной величины используется критерий согласия Пирсона. Наиболее часто в таких расчетах пользуются коэффициентом сопряженности Пирсона

37 Линейная регрессия.Регрессия - величина, выражающая зависимость среднего значения случайной величины у от значений случайной величины х.Уравнение регрессии выражает среднюю величину одного признака как функцию другого.линейная - регрессия, применяемая в статистике в виде четкой экономической интерпретации ее параметров: у = а+b*х+Е;Функция регрессии - это модель вида у = л», где у - зависимая переменная (результативный признак); х - независимая, или объясняющая, переменная (признак-фактор). Линия регрессии - график функции у = f (x)

38 Множественная линейная регрессия – уравнение связи с несколькими независимыми переменными: , где у – зависимая (объясняемая, эндогенная) – регрессанд; x 1, x 2,, xm – независимые (объясняющие, экзогенные) переменные – регрессоры, e – случайная составляющая модели.

39 Зависимые и не зависимые переменные. Термины зависимая и независимая переменная обычно применяются в экспериментальных исследованиях, где приходится манипулировать некоторыми переменными. В этом смысле "независимость" переменной определяется как независимость от реакции, свойств и намерений объектов эксперимента и т.п. Некоторые переменные предполагаются "зависимыми" от действий объекта эксперимента или условий эксперимента. Эти переменные, возможно в неявной форме, содержат некоторую информацию о поведении или реакции объекта в ходе эксперимента. Независимые переменные - это переменные, значениями которых можно управлять, а зависимые переменные - это переменные, которые можно только измерять или регистрировать.

40. Дисперсионный анализ – анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов. задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака выделить три частные вариативности:- Вариативность, обусловленную действием каждой из исследуемых независимых переменных.- Вариативность, обусловленную взаимодействием исследуемых независмых переменных.- Вариативность случайную, обусловленную всеми неучтенными обстоятельствами. Вариативность, обусловленная действием исследуемых переменных и их взаимодействием соотносится со случайной вариативностью. Показателем этого соотношения является F – критерий Фишера (метод, не имеющий ничего общего, кроме автора, с «угловым преобразованием Фишера»). FэмпА = Вариативность, обусловленная действием переменной А / Случайная вариативность FэмпБ = Вариативность, обусловленная действием переменной Б / Случайная вариативность FэмпАБ = Вариативность, обусловленная взаимодействием А и Б / Случайная вариативность

Виды дисперсеонного анализа.Однофакторный Д.А для незвязных выборокВиды дисперсионного анализа.Дисперсионный анализ схематически можно подразделить на несколько категорий. Это деление осуществляется, смотря по тому, сколько, во-первых, факторов принимает участие в рассмотрении, во-вторых, - сколько переменных подвержены действию факторов, и, в-третьих, - по тому, как соотносятся друг с другом выборки значений.При наличии одного фактора, влияние которого исследуется, дисперсионный анализ именуется однофакторным, и распадается на две разновидности:- Анализ несвязанных (то есть – различных) выборок. Например, одна группа респондентов решает задачу в условиях тишины, вторая – в шумной комнате. (В этом случае, к слову, нулевая гипотеза звучала бы так: «среднее время решения задач такого-то типа будет одинаково в тишине и в шумном помещении», то есть не зависит от фактора шума. Анализ связанных выборок. То есть: двух замеров, проведенных на одной и той же группе респондентов в разных условиях. Тот же пример: в первый раз задача решалась в тишине, второй – сходная задача – в условиях шумовых помех. (На практике к подобным опытам следует подходить с осторожностью, поскольку в действие может вступить неучтенный фактор «научаемость», влияние которого исследователь рискует приписать изменению условий, а именно, - шуму.В случае, если исследуется одновременное воздействие двух или более факторов, мы имеем дело с многофакторным дисперсионным анализом, который также можно подразделить по типу выборки.Если же Однофакторный дисперсионный анализ для несвязанных выборок.Метод однофакторного дисперсионного анализа применяется в тех случаях, когда исследуются изменения результативного признака (зависимой переменной) под влиянием изменяющихся условий или градаций какого-либо фактора. Влиянию каждой из градаций фактора подвержены разные выборки.Должно быть не менее трех градаций фактора и не менее двух наблюдений в каждой градации.Описание метода.Расчеты начинаются с расстановки всех данных по столбцам, относящимся к каждому из факторов соответственно.Следующим действием будет нахождение сумм значений по столбцам (то есть – градациям) и возведение их в квадратФактически метод состоит в сопоставлении каждой из полученных и возведенных в квадрат сумм с суммой квадратов всех значений, полученных во всем эксперименте.воздействию факторов подвержено несколько переменных, - речь идет о многомерном анализе.

42.Факторный анализ, Назначение.ф.а — многомерный метод, применяемый для изучения взаимосвязей между значениями переменных. Предполагается, что известные переменные зависят от меньшего количества неизвестных переменных и случайной ошибки.Факторный анализ – определение влияния факторов на результат - является одним из сильнейших методических решений в анализе хозяйственной деятельности компаний для принятия решений. Для руководителей - дополнительный аргумент, дополнительный "угол зрения". Факторный анализ позволяет решить две важные проблемы исследователя: описать объект измерения всесторонне и в то же время компактно. С помощью факторного анализа возможно выявление скрытых переменных факторов, отвечающих за наличие линейных статистических связей корреляций между наблюдаемыми переменными. Таким образом можно выделить 2 цели Факторного анализа: определение взаимосвязей между переменными, (классификация переменных), т. е. «объективная R-классификация»[1][2]; сокращение числа переменных необходимых для описания данных.

44.Вращение и интерпретация факторов. Цель вращения – получить простую структуру, которой соответствует большое значение нагрузки каждой переменной только по одному фактору и малое по всем остальным факторам. Нагрузка отражает связь между переменной и фактором, являясь подобием коэффициента корреляции. Значение нагрузки лежит в пределах [-1;1].

45.Понятие о кластерном анализе. Назначение кластерного анализамногомерная статистическая процедура, выполняющая сбор данных, содержащих информацию о выборке объектов, и затем упорядочивающая объекты в сравнительно однородные группы[1][2][3][4]. Задача кластеризации относится к статистической обработке, а также к широкому классу задач обучения без учителя

Кластерный анализ выполняет следующие основные задачи:Разработка типологии или классификации.Исследование полезных концептуальных схем группирования объектов.Порождение гипотез на основе исследования данных.Проверка гипотез или исследования для определения, действительно ли типы (группы), выделенные тем или иным способом, присутствуют в имеющихся данных.

46. Метод кластерного анализа. Выполняет сбор данных,содерж-х инф. о выборке обьектов,и упорядочивающая их в сравнительно однородные группы.Задачи: разработка типологии или классификации. Порождение гипотез на осн. исследования данных.Проверка гипотез для определения действительно ли группы,выделенные присутствуют в имеющихся данных. Кластеризуются только количественные данные




Дата добавления: 2014-12-18; просмотров: 178 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2025 год. (0.011 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав