Читайте также:
|
|
1. Оскільки факторний аналіз проводиться лише по корелюючим змінним, то побудуємо матрицю кореляцій всіх наявних змінних з метою виділити ті, які будуть брати участь у факторному аналізі. (Будемо пропускати ті змінні, кореляція яких більше за 0.5)
Variable | Correlations (Flats.sta) Casewise deletion of MD N=43 | |||||||
РАЙОН | ВУЛИЦЯ | ЧИСЛО КІМНАТ | ПЛОЩА | ПОВЕРХ | ТЕЛЕФОН | ЦІНА ЗА 1 М | ВАРТІСТЬ | |
РАЙОН | 1.00 | 0.18 | 0.18 | 0.13 | -0.16 | -0.18 | -0.56 | -0.26 |
ВУЛИЦЯ | 0.18 | 1.00 | 0.02 | 0.13 | 0.14 | -0.13 | -0.16 | -0.07 |
ЧИСЛО КІМНАТ | 0.18 | 0.02 | 1.00 | 0.88 | 0.24 | -0.23 | -0.07 | 0.66 |
ПЛОЩА | 0.13 | 0.13 | 0.88 | 1.00 | 0.29 | -0.27 | -0.09 | 0.71 |
ПОВЕРХ | -0.16 | 0.14 | 0.24 | 0.29 | 1.00 | -0.20 | 0.11 | 0.34 |
ТЕЛЕФОН | -0.18 | -0.13 | -0.23 | -0.27 | -0.20 | 1.00 | -0.06 | -0.24 |
ЦІНА ЗА 1 М | -0.56 | -0.16 | -0.07 | -0.09 | 0.11 | -0.06 | 1.00 | 0.58 |
ВАРТІСТЬ | -0.26 | -0.07 | 0.66 | 0.71 | 0.34 | -0.24 | 0.58 | 1.00 |
В результаті аналізу кореляцій для факторного аналізу відібрано наступні змінні: РАЙОН, ЧИСЛО КІМНАТ, ПЛОЩА, ЦІНА ЗА 1 М, ВАРТІСТЬ.
2. Оскільки бажано, щоб факторів було менше, ніж змінних, то спробуємо виділити 4 фактори, від яких залежатимуть наші змінні. Проведемо аналіз власних значень.
Value | Eigenvalues (Flats.sta) Extraction: Principal components | |||
Eigenvalue | % Total Variance | Cumulative Eigenvalue | Cumulative % | |
2.540909 | 50.81818 | 2.540909 | 50.81818 | |
1.811061 | 36.22121 | 4.351969 | 87.03939 | |
0.476188 | 9.52377 | 4.828158 | 96.56316 | |
0.133212 | 2.66424 | 4.961370 | 99.22740 |
Бачимо, що найбільший вплив на модель мають фактори 1 та 2 (пояснюють 50.8% та 36.2% дисперсії відповідно).
3. Використовуючи результати пункту 2 та критерій Кайзера ми можемо скоротити кількість факторів до двох, тобто, за Кайзером, предметна область може бути описана в термінах лише . Перевіримо, чи дійсно це так, обчсливши факторні навантаження.
Variable | Factor Loadings (Unrotated) (Flats.sta) Extraction: Principal components (Marked loadings are >.700000) | |||
Factor 1 | Factor 2 | Factor 3 | Factor 4 | |
РАЙОН | 0.075920 | -0.840847 | -0.535230 | -0.027035 |
ЧИСЛО КІМНАТ | -0.891362 | -0.345585 | 0.067430 | 0.285477 |
ПЛОЩА | -0.907312 | -0.326991 | 0.152565 | -0.186293 |
ЦІНА ЗА 1 М | -0.275947 | 0.878519 | -0.374069 | 0.058989 |
ВАРТІСТЬ | -0.917201 | 0.325405 | -0.148212 | -0.113136 |
Expl.Var | 2.540909 | 1.811061 | 0.476188 | 0.133212 |
Prp.Totl | 0.508182 | 0.362212 | 0.095238 | 0.026642 |
Отримали підтвердження критерію Кайзера – фактори 1 та 2 мають найбільший вплив на наші змінні. Проте, бачимо, що фактор 3 теж достатньо сильно впливає на змінну РАЙОН, проте STATISTICA не виділила його як значущий. Це може бути пов'зане з невдалим розташуванням точок відносно використаної системи координат. Спробуємо повернути систему координати, використовуючи метод Varimax для первірки того, чи дійсно фактор 3 можна виключити з нашої моделі.
Variable | Factor Loadings (Varimax normalized) (Flats.sta) Extraction: Principal components (Marked loadings are >.700000) | |||
Factor 1 | Factor 2 | Factor 3 | Factor 4 | |
РАЙОН | 0.063666 | 0.282569 | 0.957038 | -0.013035 |
ЧИСЛО КІМНАТ | 0.952431 | 0.001706 | 0.119461 | -0.280357 |
ПЛОЩА | 0.972089 | 0.052682 | 0.057656 | 0.192516 |
ЦІНА ЗА 1 М | -0.034898 | -0.947135 | -0.304504 | -0.018592 |
ВАРТІСТЬ | 0.757554 | -0.605594 | -0.142189 | 0.145127 |
Expl.Var | 2.431241 | 1.346432 | 1.046457 | 0.137240 |
Prp.Totl | 0.486248 | 0.269286 | 0.209291 | 0.027448 |
Критерій Varimax показав, що фактор 3 насправді є значущим і його не можна видалити з нашої моделі. Тому, наразі, можемо скоротити нашу модель до 3-х факторів.
4. Застосуємо критерій кам'янистої осипи для підтвердження нашої гіпотези (Рис. 1). Бачимо, що спадання власних значень максимально уповільнюється після точки 3, тож за цим критерієм наші змінні можуть бути описані також в термінах 3-х факторів.
5. Спробуємо провести факторний аналіз методом головних компонент, виділивши лише 3 фактори.
Рис. 1. Графік власних значень
Результати факторного аналізу з виділенням 3-х факторів
Value | Eigenvalues (Flats.sta) Extraction: Principal components | |||
Eigenvalue | % Total | Cumulative | Cumulative | |
2.540909 | 50.81818 | 2.540909 | 50.81818 | |
1.811061 | 36.22121 | 4.351969 | 87.03939 | |
0.476188 | 9.52377 | 4.828158 | 96.56316 |
Variable | Factor Loadings (Unrotated) (Flats.sta) Extraction: Principal components (Marked loadings are >.700000) | ||
Factor 1 | Factor 2 | Factor 3 | |
РАЙОН | 0.075920 | -0.840847 | -0.535230 |
ЧИСЛО КІМНАТ | -0.891362 | -0.345585 | 0.067430 |
ПЛОЩА | -0.907312 | -0.326991 | 0.152565 |
ЦІНА ЗА 1 М | -0.275947 | 0.878519 | -0.374069 |
ВАРТІСТЬ | -0.917201 | 0.325405 | -0.148212 |
Expl.Var | 2.540909 | 1.811061 | 0.476188 |
Prp.Totl | 0.508182 | 0.362212 | 0.095238 |
Variable | Factor Loadings (Varimax normalized) (Flats.sta) Extraction: Principal components (Marked loadings are >.700000) | ||
Factor 1 | Factor 2 | Factor 3 | |
РАЙОН | 0.070796 | 0.283650 | 0.955923 |
ЧИСЛО КІМНАТ | 0.950337 | 0.003949 | 0.123881 |
ПЛОЩА | 0.974539 | 0.039260 | 0.046321 |
ЦІНА ЗА 1 М | -0.043989 | -0.946150 | -0.301225 |
ВАРТІСТЬ | 0.753439 | -0.615785 | -0.149170 |
Expl.Var | 2.427484 | 1.356405 | 1.044270 |
Prp.Totl | 0.485497 | 0.271281 | 0.208854 |
Variable | Communalities (Flats.sta) Extraction: Principal components Rotation: Varimax normalized | |||
From 1 | From 2 | From 3 | Multiple | |
РАЙОН | 0.005012 | 0.085470 | 0.999259 | 0.345444 |
ЧИСЛО КІМНАТ | 0.903140 | 0.903155 | 0.918502 | 0.790482 |
ПЛОЩА | 0.949727 | 0.951268 | 0.953414 | 0.901773 |
ЦІНА ЗА 1 М | 0.001935 | 0.897135 | 0.987871 | 0.854151 |
ВАРТІСТЬ | 0.567670 | 0.946861 | 0.969113 | 0.923674 |
Бачимо, що 3 фактора пояснюють від 92 до 99% дисперсії даних (залежно від змінної, що є досить добрим результатом.
6. Тоді фактори в термінах наших змінних можуть бути представлені наступним чином.
Примітка.
У таблиці представлені коефіцієнти наступного рівняння:
Variable | Factor Score Coefficients (Flats.sta) Rotation: Varimax normalized Extraction: Principal components | ||
Factor 1 | Factor 2 | Factor 3 | |
РАЙОН | -0.088096 | -0.368494 | 1.155963 |
ЧИСЛО КІМНАТ | 0.408398 | 0.112826 | -0.003023 |
ПЛОЩА | 0.441411 | 0.216044 | -0.145728 |
ЦІНА ЗА 1 М | -0.162567 | -0.872830 | 0.275554 |
ВАРТІСТЬ | 0.239965 | -0.438089 | 0.099777 |
Дата добавления: 2014-12-20; просмотров: 64 | Поможем написать вашу работу | Нарушение авторских прав |