Читайте также:
|
|
Анализ данных по недвижимости
При проведении анализа рассматривалось более 6 тыс. двухкомнатных квартир.
Анализируемые показатели:
1) _____________________________
2) _____________________________
3) _____________________________
4) _____________________________
5) _____________________________
6) ____________________________________________________________________ (переменная, принимающая значение 1- _____________________________________, 0- ___________________________________,).
7) ____________________________________________________________________ (переменная, принимающая значение 1- ______________________________________, 0- _____________________________).
8) ____________________________________________________________________ (переменная, принимающая значение 1, если ____________________________ __________________________, 0 _____________________________).
Задачей анализа является
1) ____________________________________________________________________
2) _________________________________________________________________________________________________________________________________________________________________________________________________________________________.
Также дополнительно в рамках поставленной задачи необходимо определить стоимость1 м2.
При проведении анализа используются возможности системы STATISTICA, а именно – методы модуля «________________________________________________».
Исходные данные в системе STATISTICA представляются в виде таблицы, столбцы которой характеризуют _________________________________________________ _____________________________________________________________________________, а каждая строка – __________________________________________________________ ________________________________________________________________________.
Для более наглядного представления исходных данных кроме табличного представления можно использовать и графическое. Для этого по оси X откладываются ______________________________________, по оси Y – анализируемый показатель.
Из графика зависимости цен квартир (при сортировке по убыванию) видно, что цена квартиры находится в интервале ________________________________________.
Расстояние от центра изменяется ____________________________________.
Математическая постановка задачи.
Для решения задачи строится линейная модель множественной регрессии зависимости цены квартиры (Price) от анализируемых показателей, которые обозначим X. Математическое выражение зависимости выглядит следующим образом:
_________________________________________________________________
где под X понимается столбец всех анализируемых показателей,
ε – __________________________________________.
Неизвестными в формуле являются значения коэффициентов α и β. Они определяются с помощью метода___________________________________________(МНК).
При изменении значения переменной X на 1 значение цены изменяется на β единиц.
При проведении анализа с помощью МНК из всех возможных значений α и β необходимо выбрать те, которые минимизируют функцию:
_________________________________________________________________
В одномерном случае характеристики МНК можно представить следующим образом:
В двумерном случае схема выглядит следующим образом:
На первом этапе решения задачи необходимо отбросить те переменные, которые являются статистически незначимыми, то есть те, от которых значение цены квартиры зависит слабо. Этот этап необходим для того, чтобы упростить модель, так как в противном случае анализ значительно усложняется.
Для этого в системе STATISTICA в форме модуля «__________________________ ______________________________» нажатием на кнопку «Переменные» устанавливаем в качестве независимых переменных ________________________________________, зависимой будет являться ___________________________, выбираем пункт «Провести анализ по умолчанию» и нажимаем на «ОК». В результате в окне «___________________________________________________________________________» в таблице получим значения коэффициентов регрессионной модели α и β и стандартной ошибки ε. Кроме того, в полученной таблице также отражены значения t-статистики оценки и p-уровня оценки коэффициента.
По данным таблицы из модели можно исключить переменную, отвечающую за ___________________________ Иными словами, от _________________________________ цена квартиры зависит слабо.
После исключения указанной переменной снова производится аналогичный анализ для поиска других переменных, которые можно исключить из модели. В результате расчетов таких переменных не найдено.
Второй этап – анализ результатов.
В столбце с названием B хранятся значения коэффициента β. Для переменных, значения которых могут быть 0 или 1, а именно: _____________________________________________________________________________________________________________________________________________________, соответствующая цифра указывает сумму, которую добавляет наличие этого фактора.
Так, тот факт, что быстро добираться до метро можно пешком, добавляет к стоимости квартиры _________________________. Это значение находится в колонке B в строке с названием WALK.
Тот факт, что тип постройки дома кирпичный, а не панельный,добавляет к стоимости квартиры __________________ (строка с названием ___________________).
Тот факт, что этаж, на котором находится квартира, не первый и не последний, добавляет к стоимости квартиры ___________ (строка с названием ___________________).
В исходной модели общая площадь разделялась на
1) _____________________________
2) _____________________________
3) _____________________________
Для того, чтобы определить стоимость 1 м2, включим вместо трех указанных переменных ______________________________________________________.
Таким образом, задача изменена и для этой новой задачи вновь необходимо произвести множественный регрессионный анализ и получить новые значения коэффициентов. В результате по значению коэффициента β для полной площади можно установить, что средняя цена 1 м2 недвижимости равна _____________ (строка с названием ___________________, столбец _________).
На третьем этапе решения задачи необходимо проверить адекватность построенной модели. При этом производится анализ:
1) ____________________________________________________________________. В адекватной модели значение этой величины должно быть близким к нулю. Из полученной таблицы видно, что в нашем случае это условие выполняется.
2) ____________________________________________________________________. Если толерантность низкая (близка к нулю), то ___________________________. Значение характеристики не должно превосходить 1. В исследуемой модели толерантность ____________________________________________________.
3) ____________________________________________________________________. Остатки ε должны быть близкими к нулю. Из графика (см. рисунок) делаем вывод, что это условие не выполняется.
Таким образом, модель не является адекватной и ее использовать нельзя.
Для выхода из сложившейся ситуации и построения адекватной модели проведем кластеризацию квартир по показателю _________________ (кластеризация = ___________________________________________________________________________, кластер = ____________________________________________________________________) и воспользуемся методами модуля “_________________________________________”.
В системе STATISTICA можно выбрать один из трех методов кластеризации:
1) _____________________________________________________________________
2) _____________________________________________________________________
3) _____________________________________________________________________
Для кластеризации квартир по цене используем _____________________________. Он применяется тогда, когда __________________________________________________ _______________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________.
Для проведения анализа в системе STATISTICA в окне «_______________________________________________________________________» выбираем:
1) ____________________________________________________________________В нашем случае это цена PRICE;
2) ____________________________________________________________________. Устанавливаем значение, равное 2.
В результате кластеризации каждая из 6 тыс. квартир будет отнесена к одному из двух кластеров. Таким образом, будет получено две модели (для каждой группы квартир).
При анализе таблиц для каждой группы квартир можно сделать вывод, что для квартир первого кластера средняя цена 1 м2 равна ________________. Значимыми при определении цены являются _________________________________________________ _____________________________________________________________________________. Для квартир второго кластера средняя цена 1 м2 равна __________________ Значимыми при определении цены оказываются _________________________________________ ________________________________________________________________________.
Тот факт, что тип постройки дома кирпичный, а не панельный, добавляет к стоимости квартиры из первого кластера ________, из второго - __________ (строка с названием ___________________, столбец ___).
При определении цены квартиры из второго кластера такие параметры, как _____ _____________________________________________________________________________не являются статистически значимыми. Можно сделать вывод о том, что данные квартиры покупают ________________________________________________________________ ________________________________________________________________________.
Дата добавления: 2015-01-12; просмотров: 126 | Поможем написать вашу работу | Нарушение авторских прав |
<== предыдущая лекция | | | следующая лекция ==> |
Консолидация данных в EXCEL | | | Показатели обеспеченности населения амбулаторно-поликлинической помощью |