Читайте также:
|
|
Определение тесноты связи между фактором и результирующим показателем. Подсчет коэффициента корреляции.
При изучении корреляционной связи важным направлением анализа является оценка степени тесноты связи.
Понятие степени тесноты связи между двумя признаками возникает вследствие того, что в реальной действительности на изменение результативного признака влияют несколько факторов. При этом влияние одного из факторов может выражаться более заметно и четко, чем влияние других факторов.
Тесноту связи между двумя факторами обычно определяется по коэффициенту корреляции:
где:
- коэффициент корреляции;
- значение случайной величины
;
- среднее значение случайной величины
;
- значение случайной величины
;
– среднее значение случайной величины
.
По условиям задачи - среднесписочная численность человек на предприятии, а
– объем выполненной работы.
Занесем данные в таблицу:
№ пред-тия | Среднесоч-я числен-ть, чел. | Объем выполненной работы. | ![]() | ![]() | ![]() | ![]() | ![]() |
1 | 2562,5 | 5662,5 | 858,13 | 266,525 | 228711,77 | 736378,52 | 71035,576 |
2 | 400,63 | 939,025 | 376196,89 | 160500,39 | 881767,95 | ||
3 | 822,5 | -881,88 | -4005,98 | 3532769,20 | 777703,52 | ||
4 | 3552,5 | -674,38 | -1843,48 | 1243193,45 | 454781,64 | 3398400,1 | |
5 | 1887,5 | 183,13 | 2454,02 | 449393,33 | 33534,766 | 6022238,7 | |
6 | 6587,5 | 20,63 | 1191.52 | 24575,20 | 425,39663 | 1419731,8 | |
7 | 6692,5 | 595,63 | 1296,52 | 772242,70 | 354769,14 | 1680977,1 | |
8 | -349,38 | -910,97 | 318271,89 | 122062,89 | 829875,45 | ||
9 | 10277,5 | 605.63 | 4881,52 | 2956373,58 | 366781,64 | ||
10 | 95,63 | 3424,02 | 327422,39 | 9144,1406 | |||
11 | 2357,5 | -429,38 | -3038,48 | 1304645,20 | 184362,89 | 9232330,3 | |
12 | 1095,6 | -4945,97 | -543402,61 | 1200394,1 | 245991,2 | ||
13 | -634,38 | -1875,98 | 1190071,64 | 402431,64 | 3519282,2 | ||
14 | 2052,5 | 348,13 | 4209,02 | 1465266,83 | 121191,02 | ||
15 | 1197,5 | -506,88 | -2630,98 | 1333575,45 | 256922,27 | 6922029,5 | |
16 | 2062,5 | 358,13 | 1841,02 | 659317,08 | 128253,52 | 3389373,1 | |
17 | 3337,5 | 150,63 | -2058.48 | -310057,80 | 22687,891 | 4237319,3 | |
18 | 812,5 | -891,88 | -2470,98 | 2203800,83 | 795441,02 | 6105717,5 | |
19 | 1037,5 | 2282,5 | -666,88 | -3113,48 | 2076298,64 | 444722,27 | 9693726,6 |
20 | 2027,5 | 7337,5 | 323,13 | 1941,52 | 627355,27 | 104409,77 | 3769519,3 |
Σ | 1704,375 | 5395,975 | 0,00 | 0,00 | 20236020,94 | 6676898,4 |
Теперь подсчитаем коэффициент корреляции:
Коэффициент корреляции равен 0,68 %.
Вывод: Связь между среднесписочной численностью на предприятие и объемом выполненных работ высокая.
Оценка значимости коэффициента корреляции по t-критерию Стьюдента.
Критерий значимости определяют для того чтобы распределить выводы по результатам выборки на всю генеральную совокупность.
Критерий Стьюдента можно рассчитать по формуле:
где:
- коэффициент корреляции;
Таким образом:
Также по таблице определяем которое равно 2,101.
Вывод: T расчетное больше чем t табличное это означает, что в генеральной совокупности коэффициент корреляции с 95% вероятностью отличен от 0.
Построение поля корреляции и формулировка гипотезы о форме связи. Коэффициент регрессии.
Регрессионный анализ и в частности коэффициент регрессии определяет форму связи между случайными величинами.
где - коэффициент корреляции.
Поле корреляции – зависимость между объёмами выполненных работ предприятия и среднесписочной численность работников (линейная).
Коэффициент корреляции можно найти по формуле:
Занесем данные в таблицу:
№ пред-тия | Среднесоч-я числен-ть раб-в, чел. | Объем выполненной работы. | ![]() | ![]() | ![]() | ![]() |
1 | 2562,5 | 5662,5 | 858,13 | 266,525 | 228711,77 | 736378,52 |
2 | 400,63 | 939,025 | 376196,89 | 160500,39 | ||
3 | 822,5 | -881,88 | -4005,98 | 3532769,20 | 777703,52 | |
4 | 3552,5 | -674,38 | -1843,48 | 1243193,45 | 454781,64 | |
5 | 1887,5 | 183,13 | 2454,02 | 449393,33 | 33534,766 | |
6 | 6587,5 | 20,63 | 1191.52 | 24575,20 | 425,39663 | |
7 | 6692,5 | 595,63 | 1296,52 | 772242,70 | 354769,14 | |
8 | -349,38 | -910,97 | 318271,89 | 122062,89 | ||
9 | 10277,5 | 605.63 | 4881,52 | 2956373,58 | 366781,64 | |
10 | 95,63 | 3424,02 | 327422,39 | 9144,1406 | ||
11 | 2357,5 | -429,38 | -3038,48 | 1304645,20 | 184362,89 | |
12 | 1095,6 | -4945,97 | -543402,61 | 1200394,1 | ||
13 | -634,38 | -1875,98 | 1190071,64 | 402431,64 | ||
14 | 2052,5 | 348,13 | 4209,02 | 1465266,83 | 121191,02 | |
15 | 1197,5 | -506,88 | -2630,98 | 1333575,45 | 256922,27 | |
16 | 2062,5 | 358,13 | 1841,02 | 659317,08 | 128253,52 | |
17 | 3337,5 | 150,63 | -2058.48 | -310057,80 | 22687,891 | |
18 | 812,5 | -891,88 | -2470,98 | 2203800,83 | 795441,02 | |
19 | 1037,5 | 2282,5 | -666,88 | -3113,48 | 2076298,64 | 444722,27 |
20 | 2027,5 | 7337,5 | 323,13 | 1941,52 | 627355,27 | 104409,77 |
Σ | 1704,375 | 5395,975 | 0,00 | 0,00 | 20236020,94 | 6676898,4 |
Коэффициент регрессии получился равным 3,03.
Найдем значение величины по формуле:
Итак:
Построим поле корреляции:
Также добавим следующие линии тренда логарифмическую и степенную.
Оценка модели через среднюю ошибку аппроксимации.
Значимость коэффициента корреляции может быть высокой из-за влияния случайных факторов, а в генеральной совокупности эта связь может отсутствовать.
Критерий значимости определяется для того, чтобы распределить выводы по результатам выборки на всю генеральную совокупность.
Ошибку аппроксимации можно найти по формуле:
где - теоретическое значение случайной величины
.
Оно рассчитывается подстановкой соответствующего значения в уравнение регрессии:
Недостающие данные занесем в таблицу:
№ Предприятия | Среднесписочная числ,чел | Объём выполненной раб | ![]() | ![]() | ![]() | |
1 | 2562,5 | 5662,5 | 7994,78 | -2332,3 | 0,41 | |
2 | 6608,55 | -273,55 | 0,04 | |||
3 | 822,5 | 2722,58 | -1332,6 | 0,96 | ||
4 | 3552,5 | 3351,3 | 201,2 | 0,06 | ||
5 | 1887,5 | 5949,53 | 1900,48 | 0,24 | ||
6 | 6587,5 | 5457,15 | 1130,35 | 0,17 | ||
7 | 6692,5 | 7199,4 | -506,9 | 0,08 | ||
8 | 4336,05 | 148,95 | 0,03 | |||
9 | 10277,5 | 7229,7 | 3047,8 | 0,30 | ||
10 | 5684,4 | 3135,6 | 0,36 | |||
11 | 2357,5 | 4093,65 | -1736,2 | 0,74 | ||
12 | 8714,4 | -3814,4 | 0,78 | |||
13 | 3472,5 | 47,5 | 0,01 | |||
14 | 2052,5 | 6449,48 | 3155,53 | 0,33 | ||
15 | 1197,5 | 3858,83 | -1093,8 | 0,40 | ||
16 | 2062,5 | 6479,78 | 757,225 | 0,10 | ||
17 | 3337,5 | 5851,05 | -2513,6 | 0,75 | ||
18 | 812,5 | 2692,28 | 232,725 | 0,08 | ||
19 | 1037,5 | 2282,5 | 3374,03 | -1091,5 | 0,48 | |
20 | 2027,5 | 7337,5 | 6373,73 | 963,775 | 0,13 | |
Σ | 1704,38 | 5395,98 | 6,44 |
Таким образом:
Вывод: качество модели – среднее.
Также по условию задания построим еще 2 линии тренда – логарифмическую и экспоненциальную. Далее рассчитаем для каждого ошибку аппроксимации.
Логарифмическая:
![]() | ![]() | ![]() |
7775,201 | -2112,7 | 0,37 |
6783,68 | -448,68 | 0,07 |
2045,976 | -655,976 | 0,47 |
3180,163 | 372,3373 | 0,10 |
6233,832 | 1616,168 | 0,21 |
5779,956 | 807,5443 | 0,12 |
7230,334 | -537,834 | 0,08 |
4562,784 | -77,7844 | 0,02 |
7252,206 | 3025,294 | 0,29 |
5994,524 | 2825,476 | 0,32 |
4255,976 | -1898,48 | 0,81 |
8222,068 | -3322,07 | 0,68 |
3372,247 | 147,7531 | 0,04 |
6656,345 | 2948,655 | 0,31 |
3939,817 | -1174,82 | 0,42 |
6680,848 | 556,1518 | 0,08 |
6146,266 | -2808,77 | 0,84 |
1984,304 | 940,6956 | 0,32 |
3216,74 | -934,24 | 0,41 |
6594,56 | 742,9404 | 0,10 |
107907,8 | 11,67257 | 6,07 |
Откуда:
Экспоненциальная:
![]() | ![]() | ![]() |
11364,44 | -5701,94 | 1,01 |
7881,271 | -1546,27 | 0,24 |
2824,946 | -1434,95 | 1,03 |
3335,055 | 217,4452 | 0,06 |
6622,607 | 1227,393 | 0,16 |
5815,281 | 772,2189 | 0,12 |
9211,835 | -2519,34 | 0,38 |
4325,333 | 159,667 | 0,04 |
9285,826 | 991,6743 | 0,10 |
6174,878 | 2645,122 | 0,30 |
4057,184 | -1699,68 | 0,72 |
13742,44 | -8842,44 | 1,80 |
3443,503 | 76,4975 | 0,02 |
7557,112 | 2047,888 | 0,21 |
3813,278 | -1048,28 | 0,38 |
7617,811 | -380,811 | 0,05 |
6452,639 | -3115,14 | 0,93 |
2802,436 | 122,5638 | 0,04 |
3355,125 | -1072,63 | 0,47 |
7407,471 | -69,9713 | 0,01 |
127090,5 | -19171 | 8,07 |
Вывод: при построении 3-х моделей и подсчета ошибки аппроксимации лучшей моделью оказывается логарифмическая для которой (для линейной и экспоненциальной 32,22 и
соответственно).
Определение доли влияния изучаемого фактора на результирующий показатель с помощью ошибки детерминации.
Ошибка детерминации определяет долю влияния факторов вошедших в модель на результат.
Итак:
Откуда понятно, что доля влияния факторов вошедших в модель составляет 0,47, а не вошедших 0,53.
Дата добавления: 2014-12-23; просмотров: 124 | Поможем написать вашу работу | Нарушение авторских прав |