Читайте также:
|
|
2.
Fфакт =
ρ2 yx |
1 - ρ2 yx |
·
n-m-1 |
m |
=
0,1555 |
0,8445; |
·5 = 0,92
где Fфакт=6,6< Fфактα=0,05.
Следовательно, принимается гипотеза Н0 о статистически незначимых параметрах этого уравнения. Этот результат можно объяснить сравнительно невысокой теснотой выявленной зависимости и небольшим числом наблюдений.
Пример 2
По территориям региона приводятся данные за 199Х г. (табл. 1.6).
Таблица 1.6
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, руб., х | Среднедневная заработная плата, руб., у |
Требуется:
1. Построить линейное уравнение парной регрессии у от х.
2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3. Оценить статистическую значимость параметров регрессии и корреляции.
4. Выполнить прогноз заработной платы у при прогнозном значении среднедушевого прожиточного минимумах, составляющем 107% от среднего уровня.
5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
Решение
1. Для расчета параметров уравнения линейной регрессии строим расчетную таблицу (табл. 1.7).
Таблица 1.7
x | y | yx | y2 | x2 | ŷ х | y - ŷ х | Ai | |
-16 | 12,0 | |||||||
-4 | 2,7 | |||||||
-23 | 17,2 | |||||||
2,6 | ||||||||
1,9 | ||||||||
10,8 | ||||||||
0,0 | ||||||||
0,0 | ||||||||
5,3 | ||||||||
3,1 | ||||||||
7,5 | ||||||||
-10 | 5,8 | |||||||
Итого | 68,8 | |||||||
Среднее значение | 85,6 | 155,8 | 13484,0 | 7492,3 | 24531,4 | x | x | 5,7 |
σ | 12,95 | 16,53 | x | x | x | x | x | x |
σ2 | 167,7 | 273,4 | x | x | x | x | x | x |
b =
y · x - y·x |
Σ x2 - (x)2 |
=
13484 - 85,6 · 155,8 |
7492,3 - 85,62 |
=
151,8 |
164,94 |
= 0,92
a = y - b · x = 155,8 - 0,92 · 85,6=77,0
Получено уравнение регрессии: у = 77,0+0,92 · х.
С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.
2. Тесноту линейной связи оценит коэффициент корреляции:
rxy = b ·
σ x |
σ y |
= 0,92 ·
12,95 |
16,53 |
= 0,721; r2xy = 0,52
Это означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х - среднедушевого прожиточного минимума. Качество модели определяет средняя ошибка аппроксимации:
A =
n |
Σ Ai =
68,9 |
= 5,7%
Качество построенной модели оценивается как хорошее, так как А не превышаете- 10%.
3. Оценку статистической значимости параметров регрессии проведем с помощью t-статистики Стьюдента и путем расчета доверительного интервала каждого из показателей.
Выдвигаем гипотезу Н0 о статистически незначимом отличии показателей от нуля: а = b = rxy = 0.
tтабл для числа степеней свободы df=n-2 = l2-2=10 и α = 0,05 составит 2,23.
Определим случайные ошибки та, тb, тxy:
Тогда
ta =
24,3 |
= 3,2; tb =
0,92 |
0,281 |
= 3,3; txy =
0,721 |
0,219 |
= 3,3;
Фактические значения t-статистики превосходят табличные значения:
ta - 3,2 > t табл = 2,3; tb = 3,3 > tтабл = 2,3; tr xy =3,3>tтабл = 2,3,
поэтому гипотеза H0 отклоняется, т.е. a b и r ху не случайно отличаются от нуля, а статистически значимы.
Рассчитаем доверительный интервал для а и b. Для этого определим предельную ошибку для каждого показателя:
Δa = 2,23 · 24,3 = 54; Δb = 2,23 · 0,281 = 0,62
Доверительные интервалы:
γa = a ± Δa=77 ± 54;
γ a min = 77 - 54 = 23;
γa max = 77 + 54 = 131;
γb = b ± Δ b = 0,92 ±0,62;
γb min = 0,92 - 0,62 = 0,30;
γa max = 0,92 + 0,62 = 1,54;
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью ρ = 1 - σ = 0,95 параметры а и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: хр = x· 1,07 = 85,6 · 1,07 = 91,6 тыс. руб., тогда прогнозное значение прожиточного минимума составит: ŷ р =77+ 0,92 · 91,6 = 161 тыс. руб.
5. Ошибка прогноза составит:
Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:
Δŷp = tтабл· m ŷ p = 2,23 - 13,2 = 29,4.
Доверительный интервал прогноза:
γ ŷ p = 91,6 ± 29,4;
γ ŷ p min = 91,6 - 29,4 = 62,2; руб.
γŷ p max = 91,6 + 29,4 = 121; руб.
Выполненный прогноз среднемесячной заработной платы оказался надежным (р = 1 - σ= 1 - 0,05 = 0,95), но неточным, так как диапазон верхней и нижней границ доверительного интервала Dγ составляет 1,95 раза:
Dγ =
γ ŷ max |
γ ŷ min |
=
Пример 3
По группе предприятий, производящих однородную продукцию, известно, как зависит себестоимость единицы продукции у от факторов, приведенных в табл. 1.8.
Таблица 1.8
Признак-фактор | Уравнение парной регрессии | Среднее значение фактора | ||
Объем производства, млн руб., х1 | ŷx1 = 0,62+58,74·
| х1 = 2,64 | ||
Трудоемкость единицы продукции, чел.-час, х2 | ŷ x2 = 0,62+58,74· x2 | х2 = 1,38 | ||
Оптовая цена за 1 т энергоносителя, млн руб., x3 | ŷ x3 = 11,75+x31,6281 | х3 = 1,503 | ||
Доля прибыли, изымаемой государством, %, х4 | ŷ x4 = 14,87·1,016 x4 | х4 = 26,3 |
Требуется:
1. Определить с помощью коэффициентов эластичности силу влияния каждого фактора на результат.
2. Ранжировать факторы по силе влияния.
Решение
Для уравнения равносторонней гиперболы у Х1 =0,62 + 58,74·
x1 |
:
Для уравнения прямой ŷх2 = 9,30 + 9,83 · х2
Эyx2 = ƒ '(x2)
x2 |
y |
=
b · x2 |
a + b ·x2 |
=
9,83·1,38 |
9,30+9,83·1,38 |
= 0,59%
Для уравнения степенной зависимости ŷх3 = 1 1,75 + х31,6281
Эyx3 = ƒ'(x3)
x3 |
y |
= a · b · x3b - 1 =
x3 |
a · x3b |
= b = 1,63 %
Для уравнения показательной зависимости ŷх4 = 1 4,87 + 1,016 х3x4
Эyx4 = ƒ'(x4)
x4 |
y |
= a · b x4· ln b ·
x4 |
a · bx4 |
= ln 1,016 · 26,3 = 0,42 %
2. Сравнивая значения Эyxi ранжируем Xj по силе их влияния на себестоимость единицы продукции:
а) Эyx3=1,63%; в) Эyx2=0,59%;
б) Эyx1 = -0,973%; г) Эyx4= 0,42%.
Для формирования уровня себестоимости продукции группы предприятий первоочередное значение имеют цены на энергоносители; в гораздо меньшей степени влияют трудоемкость продукции и отчисляемая часть прибыли. Фактором снижения себестоимости выступает размер производства: с ростом его на 1% себестоимость единицы продукции снижается на -0,97%.
Пример 4
Зависимость потребления продукта А от среднедушевого дохода по данным 20 семей характеризуется следующим образом:
уравнение регрессии ŷx=2·x0,3;
индекс корреляции ρху = 0,9;
остаточная дисперсия σ2 ОСТ = 0,06.
Требуется:
Провести дисперсионный анализ полученных результатов.
Решение
Результаты дисперсионного анализа приведены в табл. 1.9.
Таблица 1.9
Вариация результата у | Число степеней свободы | Сумма квадратов отклонений, S | Дисперсия на одну степень свободы, D | Fфакт | Fтабл α = 0,05,1 = 1, k2 = 18 |
Общая | Dƒ = n - 1 = 19 | 6,316 | - | - | - |
Факторная | k1 = m = 1 | 5,116 | 5,116 | 76,7 | 4,41 |
Остаточная | K2 = n - m - 1 = 18 | 1,200 | 0,0667 | - | - |
Sост = σ2 ост· n = 0,06 · 20 = 1,2;
Sобщ = Sост: (1 - p 2 xy) = 1,2: (1 - 0,81) = 6,316;
Sфакт = 6,316 - 1,2 = 5,116;
Fфакт =
0,92 |
1 - 0,92 |
·
= 76,7
В силу того что Fфакт = 76,7 > Fтабл = 4,4, гипотеза о случайности различий факторной и остаточной дисперсий отклоняется. Эти различия существенны, статистически значимы, уравнение надежно, значимо, показатель тесноты связи надежен и отражает устойчивую зависимость потребления продукта А от среднедушевого дохода.
1.3. РЕАЛИЗАЦИЯ ТИПОВЫХ ЗАДАЧ НА КОМПЬЮТЕРЕ
Решение с помощью ППП Excel
1. Встроенная статистическая функция ЛИНБЙН определяет параметры линейной регрессии у = а + b · х. Порядок вычисления следующий:
1) введите исходные данные или откройте существующий файл, содержащий анализируемые данные;
2) выделите область пустых ячеек 5x2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики или область 1x2 - для получения только оценок коэффициентов регрессии,
3) активизируйте Мастер функций любым из способов
а)в главном меню выберите Вставка/Функция,
б)на панели инструментов Стандартная щелкните по кнопке Вставка функции,
4) в окне Категория (рис 1 1) выберите Статистические, в окне Функция - ЛИНЕЙН Щелкните по кнопке ОК,
Рис. 1.1 Диалоговое окно "Мастер функций"
5) заполните аргументы функции (рис 1 2)
Известные_значения_у - диапазон, содержащий данные результативного признака,
Известные_значения_х - диапазон, содержащий данные факторов независимого признака,
Константа - логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении, если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = О, то свободный член равен О, Статистика - логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения Щелкните по кнопке ОК,
Рис. 1.2.Диалоговое окно ввода аргументов функции ЛИНЕЙН
6) в левой верхней ячейке выделенной области появится первый элемент итоговой таблицы Чтобы раскрыть всю таблицу, нажмите на клавишу <F2>, а затем - на комбинацию клавиш <CTRL>+<SHEFT>+<ENTER>
Дополнительная регрессионная статистика будет выводиться в порядке, указанном в следующей схеме
Значение коэффициента b | Значение коэффициента а |
Среднеквадратическое отклонение b | Среднеквадратическое отклонение а |
Коэффициент детерминации R2 | Среднеквадратическое отклонение у |
F-статистика | Число степеней свободы |
Регрессионная сумма квадратов | Остаточная сумма квадратов |
Для вычисления параметров экспоненциальной кривой
у =α β x MS Excel применяется встроенная статистическая функция ЛГРФПРИБЛ Порядок вычисления аналогичен применению функции ЛИНЕЙН
Для данных из примера 2 результат вычисления функции ЛИНЕИН представлен на рис. 1.3, функции ЛГРФПРИБЛ - на рис. 1.4.
Рис. 1.3. Результат вычисления функции ЛИНЕЙН
Рис. 1.4. Результат вычисления функции ЛГРФПРИБЛ
2. С помощью инструмента анализа данных Регрессия, помимо результатов регрессионной статистики, дисперсионного анализа и доверительных интервалов, можно получить остатки и графики подбора линии регрессии, остатков и нормальной вероятности Порядок действий следующий'
1) проверьте доступ к пакету анализа. В главном меню последовательно выберите Сервис /Надстройки. Установите флажок Пакет анализа (рис. 1.5);
Рис. 1.5. Подключение надстройки Пакет анализа
2)в главном меню выберите Сервис/Анализ данных/Регрессия
Щелкните по кнопке ОК,
3) заполните диалоговое окно ввода данных и параметров вывода (рис 1 6)
Входной интервал Y - диапазон, содержащий данные результативного признака;
Входной интервал X - диапазон, содержащий данные факторов независимого признака;
Метки - флажок, который указывает, содержит ли первая строка названия столбцов или нет,
Константа - ноль - флажок, указывающий на наличие или отсутствие свободного члена в уравнении;
Выходной интервал - достаточно указать левую верхнюю ячейку будущего диапазона;
Новый рабочий лист - можно задать произвольное имя нового
листа.
Если необходимо получить информацию и графики остатков, установите соответствующие флажки в диалоговом окне. Щелкните по кнопке ОК
Рис.1.6. Диалоговое окно ввода параметров инструмента Регрессия
Результаты регрессионного анализа для данных из примера 2 представлены на рис. 1 7
Рис. 1.7. Результат применения инструмента Регрессия
Решение с помощью ППП Statgraphics
Порядок вычислений при использовании функции Simple Regression следующий:
1) введите исходные данные (рис. 1.8) или откройте существующий файл, содержащий исходные данные;
2) в главном меню последовательно выберите Relate/Simple Regression;
3) заполните диалоговое окно ввода данных. В поле "Y" введите название столбца, содержащего зависимую переменную, в поле "X" - название столбца, содержащего значения факторного признака. Щелкните по кнопке ОК;
Рис. 1.8. Диалоговое окно ввода данных
4) в окне табличных настроек поставьте флажок напротив Analysis Summary.
Результаты вычислений появятся в отдельном окне.
Для данных из примера 2 результат применения функции Simple Regression представлен на рис. 1.9.
Рис. 1.9.Итоговое окно функции SimpleRegression
Как видим, результаты вычислений вручную и с помощью компьютера совпадают.
КОНТРОЛЬНЫЕ ЗАДАНИЯ
Задача 1
Получены функции:
1. y = a + bx3 + ε, 2. y = a = b ln x + ε, 3. ln y = a + b ln x +ε, 4. y = a + bxc + ε, | 5. ya = b + cx2 + ε, 6. y = 1 + a(1 - xb) + ε, 7. y = a + b
+ ε, |
Задание
Определите, какие из представленных выше функций линейны по переменным, линейны по параметрам, нелинейны ни по переменным, ни по параметрам.
Задача 2
Исследуя спрос на телевизоры марки N, аналитический отдел компании ABC по данным, собранным по 19 торговым точкам компании, выявил следующую зависимость:
ln y = 10,5 - 0,8 ln x +ε,
(2,5) (-4,0)
где у - объем продаж телевизоров марки N в отдельной торговой точке;
х - средняя цена телевизора в данной торговой точке; в скобках приведены фактические значения t-критерия Стьюдента для параметров уравнения регрессии.
Задание
До проведения этого исследования администрация компании предполагала, что эластичность спроса по цене для телевизоров марки N составляет -0,9. Подтвердилось ли предположение администрации результатами исследования?
Задача 3
Для трех видов продукции А, В и С модели зависимости удельных постоянных расходов от объема выпускаемой продукции выглядят следующим образом:
yA = 600,
yB = 80 + 0,7x,
yC = 40x0,5
Задание
1. Определите коэффициенты эластичности по каждому виду продукции и поясните их смысл.
2. Сравните при х = 1000 эластичность затрат для продукции В и С.
3. Определите, каким должен быть объем выпускаемой продукции, чтобы коэффициенты эластичности для продукции В и С были равны.
Задача 4
Пусть имеется следующая модель регрессии, характеризующая зависимость у от х:
y = 8 - 7x + ε
Известно также, что rxy= -0,5; n = 20
Задание
1. Постройте доверительный интервал для коэффициента регрессии в этой модели:
а)с вероятностью 90%;
б)с вероятностью 99%.
2. Проанализируйте результаты, полученные в п.1, и поясните причины их различий.
Задача 5
Изучается зависимость потребления материалов у от объема производства продукции х. По 20 наблюдениям были получены следующие варианты уравнения регрессии:
1. y = 3 + 2 x + ε
(6,48)
2. ln y = 2,5 + 0,2 · lnx + ε, r2 = 0,68
(6,19)
3. ln Y = 1,1 + 0,8 · X + ε r2 = 0,69
(6,2)
4. Y = 3 + 1,5 · + 0,1 · X2 r2 = 0,701
(6,2) (2,65)
В скобках указаны фактические значения t-критерия.
Задание
1. Определите коэффициент детерминации для 1-го уравнения.
2. Запишите функции, характеризующие зависимость у от х во 2-м и 3-м уравнениях.
3. Определите коэффициенты эластичности для каждого из уравнений.
4. Выберите наилучший вариант уравнения регрессии.
Задача 6
По совокупности 30 предприятий торговли изучается зависимость между признаками: х - цена на товар А, тыс. руб.; у - прибыль торгового предприятия, млн руб.
При оценке регрессионной модели были получены следующие промежуточные результаты:
∑(yj - ŷ x)2 = 39 000;
∑(yj - y)2 = 120 000;
Задание
1. Поясните, какой показатель корреляции можно определить по этим данным.
2. Постройте таблицу дисперсионного анализа для расчета значения F-критерия Фишера.
3. Сравните фактическое значение F-критерия с табличным. Сделайте выводы.
Задача 7
Зависимость среднемесячной производительности труда от возраста рабочих характеризуется моделью: у = а + bх + сх. Ее использование привело к результатам, представленным в табл. 1.10.
Таблица 1.10
№ п/п | Производительность труда рабочих, тыс. руб., у | № п/п | Производительность труда рабочих, тыс. руб., у | ||
фактическая | расчетная | фактическая | расчетная | ||
Задание
Оцените качество модели, определив ошибку аппроксимации, индекс корреляции и F-критерий Фишера.
Задача 8
Моделирование прибыли фирмы по уравнению у = abx привело к результатам, представленным в табл. 1.11.
Таблица 1.11
№ п/п | Прибыль фирмы, тыс. руб., у | № п/п | Прибыль фирмы, тыс. руб., у | ||
фактическая | расчетная | фактическая | расчетная | ||
Задание
Оцените качество модели. Для этого:
а)определите ошибку аппроксимации;
б)найдите показатель тесноты связи прибыли с исследуемым в модели фактором;
в)рассчитайте F-критерий Фишера. Сделайте выводы.
Задача 9
Изучалась зависимость вида у = ахb Для преобразованных в логарифмах переменных получены следующие данные:
∑xy = 4,2087; ∑x = 8,2370;
∑x2 = 9,2334; ∑y = 3,9310;
∑(Y - Ŷx)2 = 0,0014.
Задание
1. Найдите параметр b.
2. Найдите показатель корреляции, предполагая σY = 0.08. Оцените его значимость.
3. Оцените его значимость, если известно, что п = 9.
Задача 10
Зависимость объема производства (тыс. ед.) от численности занятых х (чел.) по 15 заводам концерна характеризуется следующим образом:
Уравнение регрессии | Y = 30 - 0,4x + 0,04x2 |
Доля остаточной дисперсии в общей | 20% |
Задание
Определите:
а) индекс корреляции;
б) значимость уравнения регрессии;
в) коэффициент эластичности, предполагая, что численность занятых составляет 30 человек.
Задача 11
По группе 10 заводов, производящих однородную продукцию, получено уравнение регрессии себестоимости единицы продукции у (тыс. руб.) от уровня технической оснащенности х (тыс. руб.): у = 20 +
x |
Доля остаточной дисперсии в общей составила 0,19.
Задание
Определите:
а) коэффициент эластичности, предполагая, что стоимость активных производственных фондов составляет 200 тыс. руб.;
б) индекс корреляции;
в) F-критерий Фишера. Сделайте выводы.
Задача 12
Зависимость спроса на товар К от его цены характеризуется по 20 наблюдениям уравнением: lg у = 1,75- 0,35 lgx. Доля остаточной дисперсии в общей составила 18%.
Задание
1. Запишите данное уравнение в виде степенной функции.
2. Оцените эластичность спроса на товар в зависимости от его цены.
3. Определите индекс корреляции.
4. Оцените значимость уравнения регрессии через F-критерий Фишера. Сделайте выводы.
Задача 13
По 20 фермам области получена информация, представленная в табл. 1.12.
Таблица 1.12
Показатель | Среднее значение | Коэффициент вариации |
Урожайность, ц/га | ||
Внесено удобрений на 1 га посева, кг |
Фактическое значение F-критерия Фишера составило 45.
Задание
1. Определите линейный коэффициент детерминации.
2. Постройте уравнение линейной регрессии.
3. Найдите обобщающий коэффициент эластичности.
4. С вероятностью 0,95 укажите доверительный интервал ожидаемого значения урожайности в предположении роста количества внесенных удобрений на 10% от своего среднего уровня.
Задача 14
Для двух видов продукции А и Б зависимость расходов предприятия у (тыс. руб.) от объема производства х (шт.) характеризуется данными, представленными в табл. 1.13.
Таблица 1.13
Уравнение регрессии | Показатели корреляции | Число наблюдений |
у A = 160 + 0,8x | 0,85 | |
yБ = 50x0,6 | 0,72 |
Задание
1. Поясните смысл величин 0,8 и 0,6 в уравнениях регрессии.
2. Сравните эластичность расходов от объема производства для продукции А и Б при выпуске продукции А в 500 единиц.
1. Определите, каким должен быть выпуск продукции А, чтобы эластичность ее расходов совпадала с эластичностью расходов на продукцию Б.
4. Оцените значимость каждого уравнения регрессии с помощью F- критерия Фишера.
Задача 15
Зависимость объема продаж у (тыс. долл.) от расходов на рекламу х (тыс. долл.) характеризуется по 12 предприятиям концерна следующим образом:
Уравнение регрессии | у = 10,6 + 0,6x |
Среднее квадратическое отклонение | σ х = 4,7 |
Среднее квадратическое отклонение | σ у = 3,4 |
Задание
1. Определите коэффициент корреляции.
2. Постройте таблицу дисперсионного анализа для оценки значимости уравнения регрессии в целом.
3. Найдите стандартную ошибку оценки коэффициента регрессии.
4. Оцените значимость коэффициента регрессии через г-критерий Стьюдента.
5. Определите доверительный интервал для коэффициента регрессии с вероятностью 0,95 и сделайте экономический вывод.
Задача 16
По 20 регионам страны изучается зависимость уровня безработицы у (%) от индекса потребительских цен х (% к предыдущему году). Информация о логарифмах исходных показателей представлена в табл. 1.14.
Таблица 1.14
Показатель | In x | lп у |
Среднее значение | 0,6 | 1,0 |
Среднее квадратическое отклонение | 0,4 | 0,2 |
Известно также, что коэффициент корреляции между логарифмами исходных показателей составил rlnx lny = 0,8.
Задание
1. Постройте уравнение регрессии зависимости уровня безработицы от индекса потребительских цен в степенной форме.
2. Дайте интерпретацию коэффициента эластичности данной модели регрессии.
3. Определите значение коэффициента детерминации и поясните его смысл.
Задача 17
Изучается зависимость материалоемкости продукции от размера предприятия по 10 однородным заводам (табл. 1.15).
Таблица 1.15
Показатель | Материалоемкость продукции по заводам | |||||||||
Потреблено материалов на единицу продукции, кг | 3,7 | 3,6 | 3,5 | 3,5 | ||||||
Выпуск продукции, тыс ед |
Задание
1. Найдите параметры уравнения у = a+
b |
x |
2. Оцените тесноту связи с помощью индекса корреляции.
3. Охарактеризуйте эластичность изменения материалоемкости продукции.
4. Сделайте вывод о значимости уравнения регрессии.
Задача 18
По территориям Центрального района известны данные за 1995 г. (табл. 1.16).
Таблица 1.16
Район | Доля денежных доходов, направленных на прирост сбережений во вкладах, займах, сертификатах и на покупку валюты, в общей сумме среднедушевого денежного дохода, %, у | Среднемесячная начисленная заработная плата, тыс. руб., х |
Брянская обл. | 6,9 | |
Владимирская обл. | 8,7 | |
Ивановская обл. | 6,4 | |
Калужская обл. | 8,4 | |
Костромская обл. | 6,1 | |
Орловская обл. | 9,4 | |
Рязанская обл. | 11,0 | |
Смоленская обл. | 6,4 | |
Тверская обл. | 9,3 | |
Тульская обл. | 8,2 | |
Ярославская обл. | 8,6 |
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5. Оцените с помощью средней ошибки аппроксимации качество уравнений.
6. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости α = 0,05.
8. Оцените полученные результаты, выводы оформите в аналитической записке.
Задача 19
По территориям Центрального района известны данные за 1995 г. (табл. 1.17).
Таблица 1.17
Район | Средний размер назначенных ежемесячных пенсий, тыс. руб., у | Прожиточный минимум в среднем на одного пенсионера в месяц, тыс. руб., д: |
Брянская обл. | ||
Владимирская обл. | ||
Ивановская обл. | ||
Калужская обл. | ||
Костромская обл. | ||
г. Москва | ||
Московская обл. | ||
Орловская обл. | ||
Рязанская обл. | ||
Смоленская обл. | ||
Тверская обл. | ||
Тульская обл. | ||
Ярославская обл. |
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5. Оцените с помощью средней ошибки аппроксимации качество уравнений.
6. С помощью F-критерия Фишера оцените статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости а = 0,05.
8. Оцените полученные результаты, выводы оформите в аналитической записке.
Задача 20
По территориям Центрального и Волго-Вятского районов известны данные за ноябрь 1997 г. (табл. 1.18).
Таблица 1.18
Район | Средняя заработная плата и выплаты социального характера, тыс. руб., у | Прожиточный минимум в среднем на душу населения, тыс. руб., х |
Центральный | ||
Брянская обл. | ||
Владимирская обл. | ||
Ивановская обл. | ||
Калужская обл. | ||
Костромская обл. | ||
Орловская обл. | ||
Рязанская обл. | ||
Смоленская обл. | ||
Тверская обл. | ||
Тульская обл. | ||
Ярославская обл. | ||
Волго-Вятский | ||
Респ. Марий Эл | ||
Респ. Мордовия | ||
Чувашская Респ. | ||
Кировская обл. | ||
Нижегородская обл. |
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5. Оцените с помощью средней ошибки аппроксимации качество уравнений.
6. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости α = 0,05.
8. Оцените полученные результаты, выводы оформите в аналитической записке.
Задача 21
По территориям Волго-Вятского, Центрально-Черноземного и Поволжского районов известны данные за ноябрь 1997 г. (табл. 1.19).
Таблица 1.19
Район | Потребительские расходы в расчете на душу населения, тыс. руб., у | Средняя заработная плата и выплаты социального характера, тыс. руб., х |
Волго-Вятский | ||
Респ. Марий Эл | ||
Респ. Мордовия | ||
Чувашская Респ. | ||
Кировская обл. | ||
Нижегородская обл. | ||
Центрально-Черноземный | ||
Белгородская обл. | ||
Воронежская обл. | ||
Курская обл. | ||
Липецкая обл. | ||
Тамбовская обл. | ||
Поволжский | ||
Респ. Калмыкия | ||
Респ. Татарстан | ||
Астраханская обл. | ||
Волгоградская обл. | ||
Пензенская обл. | ||
Саратовская обл. | ||
Ульяновская обл. |
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5. Оцените с помощью средней ошибки аппроксимации качество уравнений.
6. Оцените с помощью F-критерия Фишера статистическую надежность результатов регрессионного моделирования. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 7% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости а = 0,05.
8. Оцените полученные результаты, выводы оформите в аналитической записке.
Задача 22
По территориям Северного, Северо-Западного и Центрального районов известны данные за ноябрь 1997 г. (табл. 1.20).
Таблица 1.20
Район | Потребительские расходы на душу населения, тыс. руб., у | Денежные доходы на душу населения, тыс. руб., х |
Северный | ||
Респ. Карелия | ||
Респ. Коми | ||
Архангельская обл. | ||
Вологодская обл. | ||
Мурманская обл. | ||
Северо-Западный | ||
Ленинградская обл. | ||
Новгородская обл. | ||
Псковская обл. | ||
Центральный | ||
Брянская обл. | ||
Владимирская обл. | ||
Ивановская обл. | ||
Калужская обл. | ||
Костромская обл. | ||
Московская обл. | ||
Орловская обл. | ||
Рязанская обл. | ||
Смоленская обл. | ||
Тверская обл. | ||
Тульская обл. | ||
Ярославская обл. |
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Рассчитайте средний (общий) коэффициент эластичности.
5. Оцените качество уравнений с помощью средней ошибки аппроксимации.
6. Оцените статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте ожидаемое значение результата, если прогнозное значение фактора увеличится на 4% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости α= 0,05.
8. Оцените полученные результаты, выводы оформите в аналитической записке.
Задача 23
По территориям Восточно-Сибирского и Дальневосточного районов известны данные за ноябрь 1997 г. (табл. 1.21).
Таблица 1.21
Район | Потребительские расходы на душу населения, тыс. руб., у | Денежные доходы на душу населения, тыс. руб., х |
Восточно-Сибирский | ||
Респ. Бурятия | ||
Респ. Тыва | ||
Респ. Хакасия | ||
Красноярский край | ||
Иркутская обл. | ||
Усть-Ордынский Бурятский авт. округ | ||
Читинская обл. | ||
Дальневосточный | ||
Респ. Саха (Якутия) | ||
Еврейская авт. обл. | ||
Чукотский авт. округ | ||
Приморский край | ||
Хабаровский край | ||
Амурская обл. | ||
Камчатская обл. | ||
Магаданская обл. | ||
Сахалинская обл. |
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5. Оцените качество уравнений с помощью средней ошибки аппроксимации.
6. Оцените статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте ожидаемое значение результата, если значение фактора увеличится на 5% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости а = 0,05.
8. Оцените полученные результаты, выводы оформите в аналитической записке.
Задача 24
По территориям Уральского и Западно-Сибирского районов известны данные за ноябрь 1997 г. (табл. 1.22).
Таблица 1.22
Район | Потребительские расходы на душу населения, тыс. руб.гу | Денежные доходы на душу населения, тыс. руб., х | |
Уральский | |||
Респ. Башкортостан | |||
Удмуртская Респ. | |||
Курганская обл. | |||
Оренбургская обл. | |||
Пермская обл. | |||
Свердловская обл. | |||
Челябинская обл. | |||
Западно-Сибирский | |||
Респ. Алтай | |||
Алтайский край | |||
Кемеровская обл. | |||
Новосибирская обл. | |||
Омская обл. | |||
Томская обл. | |||
Тюменская обл. | |||
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5. Оцените качество уравнений с помощью средней ошибки аппроксимации.
6. Оцените статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 8% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости α = 0,05.
8. Оцените полученные результаты, выводы оформите в аналитической записке.
Задача 25
По территориям Уральского и Западно-Сибирского районов известны данные за ноябрь 1997 г. (табл. 1.23).
Таблица 1.23
Район | Потребительские расходы на душу населения, тыс. руб., у | Средняя заработная плата и выплаты социального характера, тыс. руб., х |
Уральский | ||
Респ. Башкортостан | ||
Удмуртская Респ. | ||
Курганская обл. | ||
Оренбургская обл. | ||
Пермская обл. | ||
Свердловская обл. | ||
Челябинская обл. | ||
Западно-Сибирский | ||
Респ. Алтай | ||
Алтайский край | ||
Кемеровская обл. | ||
Новосибирская обл. | ||
Омская обл. | ||
Томская обл. | ||
Тюменская обл. |
Задание
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнений линейной, степенной, экспоненциальной, полулогарифмической, обратной, гиперболической парной регрессии.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте сравнительную оценку силы связи фактора с результатом с помощью среднего (общего) коэффициента эластичности.
5. Оцените качество уравнений с помощью средней ошибки аппроксимации.
6. Оцените статистическую надежность результатов регрессионного моделирования с помощью F-критерия Фишера. По значениям характеристик, рассчитанных в пп. 4, 5 и данном пункте, выберите лучшее уравнение регрессии и дайте его обоснование.
7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 5% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости α = 0,05.
8. Оцените полученные результаты, выводы оформите в аналитической записке.
Задача 26
Имеются данные по странам за 1994 г., представленные в табл. 1.24.
Таблица 1.24
Страна | Душевой доход*, долл., у | Индекс человеческого развития (ИЧР), л | Индекс человеческой бедности (ИЧБ), х2 |
Объединенные Арабские Эмираты | 0,866 | 14,9 | |
Таиланд | 0,833 | 11,7 | |
Уругвай | 0,883 | 11,7 | |
Ливия | 0,801 | 18,8 | |
Колумбия | 0,848 | 10,7 | |
Иордания | 0,730 | 10,9 | |
Египет | 0,514 | 34,8 | |
Марокко | 0,566 | 41,7 | |
Перу | 0,717 | 22,8 | |
Шри-Ланка | 0,711 | 20,7 | |
Филиппины | 0,672 | 17,7 | |
Боливия | 0,589 | 22,5 | |
Китай | 0,626 | 17,5 | |
Зимбабве | 0,513 | 17,3 | |
Пакистан | 0,445 | 46,8 | |
Уганда | 0,328 | 41,3 | |
Нигерия | 0,393 | 41,6 | |
Индия | 0,446 | 36,7 | |
* По паритету покупательной способности валют. |
Задание
1. Вычислите описательные статистики. Проверьте характер распределения признаков. При необходимости удалите аномальные наблюдения.
2. Постройте матрицу парных коэффициентов корреляции.
3. Постройте парные линейные уравнения регрессии, принимая душевой доход в качестве объясняющей переменной. Постройте графики остатков. Сделайте выводы.
4. Оцените значимость уравнений регрессии в целом и их параметров. Сравните полученные результаты, выберите лучшее уравнение регрессии.
Раздел МНОЖЕСТВЕННАЯ РЕГРЕССИЯ И КОРРЕЛЯЦИЯ
2.1. МЕТОДИЧЕСКИЕ УКАЗАНИЯ
Множественная регрессия - уравнение связи с несколькими независимыми переменными:
где у - зависимая переменная (результативный признак);
х1, х2,..., хр - независимые переменные (факторы).
Для построения уравнения множественной регрессии чаще используются следующие функции:
· линейная - у - a + b1 · x1 + b2 · x2 +... + bp · xp + ε
· степенная - y = a · x1b1 · x 2 b2 ...#· x p bp ·ε
· экспонента - y = ea + b1·x1 + b2·x2 +... + bp·xp + ε
· гипербола - y =
a + b1·x1 + b2· x2 +... + bp· xp + ε |
Можно использовать и другие функции, приводимые к линейному виду.
Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Для линейных уравнений и нелинейных уравнений, приводимых к линейным, строится следующая система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии:
Для ее решения может быть применён метод определителей: a =
Δa |
Δ |
, b1 =
Δb1 |
Δ |
...bp =
Δbp |
Δ |
Δ a, Δb1, Δbр - частные определители; которые получаются путем замены соответствующего столбца матрицы определителя системы данными левой части системы
Другой вид уравнения множественной регрессии - уравнение регрессии в стандартизованном масштабе.
ty = β1tx1 + β2 tx2+... + βpt xp,
где ty =
y -y |
σy, |
, txi =
xi - xi |
σ xi |
- стандартизованные переменные;
βi - стандартизованные коэффициенты регрессии.
К уравнению множественной регрессии в стандартизованном масштабе применим МНК. Стандартизованные коэффициенты регрессии (3-коэффициенты) определяются из следующей системы уравнений:
Связь коэффициентов множественной регрессии 6, со стандартизованными коэффициентами Р, описывается соотношением
bi = β
Дата добавления: 2015-09-10; просмотров: 437 | Поможем написать вашу работу | Нарушение авторских прав |