Читайте также: |
|
Московский автомобильно-дорожный государственный технический университет
Лабораторная работа № 6
по дисциплине «Математика (спецглавы)»
на тему: «Анализ данных: кластерный, дискриминантный,
факторный, регрессионный»
Выполнила:
студентка группы 4ВЭАТ2
Орешкина А.И.
Проверила:
доцент кафедры прикладной математики
Леева М.А.
Москва, 2012
Ход работы:
1. Взять исходные данные (программа RANDOM)
m=4 (количество групп)
n=20 (количество данных в каждой группе)
2. Расчет выполнять в программе SDADIA.
2.1 Внести первые 15 данных
2.2 С помощью кластерного анализа разбить на 2 группы
2.3 Внести оставшиеся значения (20-15=5)
2.4 С помощью дискриминантного анализа получить номера классов для этих 5 значений
3. Отдельно выписать исходные данные первого и второго классов, выполнить для каждой совокупности факторный и регрессионный анализы.
Результаты выполнения лабораторной работы в программе SDADIA:
Исходные данные:
1,12 5,41 5,52 2,54 1
2,23 2,11 2,55 0,13 2
5,12 1,35 4,44 3,22 2
4,85 3,51 1,11 2,01 2
8,56 4,23 8,54 1,05 2
9,21 3,42 1,23 1,08 2
2,25 2,43 6,54 7,06 1
1,14 7,46 7,52 4,61 1
7,41 6,45 5,99 1,01 2
5,62 4,76 8,11 1,12 1
9,52 2,22 6,44 6,55 2
4,22 4,88 2,35 0,11 2
2,23 8,45 5,55 5,11 1
5,23 7,63 1,17 8,22 2
6,34 3,67 8,56 2,82 1
5,22 5,87 5,88 6,56 1
7,23 7,93 7,33 6,82 1
3,25 2,25 3,48 7,23 2
5,36 4,23 1,19 3,66 2
1,11 7,7 5,58 0,22 1
КЛАСТЕРНЫЙ АНАЛИЗ. Файл:
Эвклид+Дивизивная
Таблица расстояний
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10)
(2) 5,17
(3) 5,84 4,7
(4) 6,1 3,8 4,16
(5) 8,25 9,02 6,45 8,39
(6) 9,48 7,29 5,99 4,46 7,38
(7) 5,62 8 5,34 7,93 9,12 10,6
(8) 3,53 8,64 8,04 8,79 8,9 11,6 5,79
(9) 6,57 7,63 6,21 6,33 3,57 5,92 8,93 7,46
(10) 5,42 7,1 5,45 7,21 3,02 7,88 7,38 6,32 3,25
(11) 9,88 10,5 5,93 8,51 6,29 7,66 7,29 10,1 7,3
7,34
(12) 5,08 3,42 5,23 2,72 7,65 5,41 8,7 7,94 5,17
6,01 9,66
(13) 4,13 8,6 7,97 7,78 9,13 10,4 6,4 2,51 6,92
6,9 9,74 7,21
(14) 8,54 10,3 8,67 7,46 11,3 9,19 8,13 8,37 9,02
10,3 8,84 8,7 6,21
(15) 6,29 7,92 4,9 7,64 2,89 8,07 6,35 6,76 4,33
2,19 5,53 7,2 7,35 10
К л а с т е р ы:
Среднее внутрикластерное расстояние=4,72
1= (1,7,8*,10,13,15)
2= (2,3,4*,5,6,9,11,12,14)
ДИСКРИМИНАНТНЫЙ АНАЛИЗ. Файл:
Расстояние Махаланобиса=7,24, значимость=0,124
Гипотеза 0: <Межкластерное расстояние не отлично от нуля>
Класс <--- Коэффициенты дискриминантной функции:a[0],a[1],... --->
1 -10,5 -0,198 1,35 1,75 0,559
2 -6,26 1,03 1,04 0,326 0,29
Объект Класс D^2 Значим Апостеор.вероят.
16 1* 2,87 0,581 0,795
17 1* 6,29 0,179 0,842
18 2* 6,77 0,148 0,645
19 2* 1,44 0,837 0,999
20 1* 4,1 0,393 0,992
Данные первого класса:
1,12 | 5,41 | 5,52 | 2,54 | |
2,25 | 2,43 | 6,54 | 7,06 | |
1,14 | 7,46 | 7,52 | 4,61 | |
5,62 | 4,76 | 8,11 | 1,12 | |
2,23 | 8,45 | 5,55 | 5,11 | |
6,34 | 3,67 | 8,56 | 2,82 | |
5,22 | 5,87 | 5,88 | 6,56 | |
7,23 | 7,93 | 7,33 | 6,82 | |
1,11 | 7,7 | 5,58 | 0,22 |
ФАКТОРНЫЙ АНАЛИЗ. Файл:
Корреляционная матрица
x1 x2 x3 x4
x2
x3 0,667
x4
Собственные значения и процент объясняемой дисперсии факторов
Фактор: 1 2 3 4 5 6 7
Собств.зн 1,97 1,14 0,702 0,195
Дисперс% 49,2 28,4 17,5 4,88
Накоплен% 49,2 77,6 95,1 100
Переменная <-- Собственные вектора (коэффициенты поворота факторных осей) -->
Фактор: 1 2 3 4
x1 0,629 0,249 0,302 -0,672
x2 -0,391 0,522 0,741 0,161
x3 0,606 -0,289 0,386 0,633
x4 0,292 0,763 -0,46 0,349
Переменная <-------- Факторные нагрузки до вращения ----------------------->
Фактор: 1 2 3 4
x1 0,882
x2 -0,548 0,556 0,62
x3 0,85
x4 0,813
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. Файл:
Y=x1 x2 x3 x4
Коэфф. a0 a1 a2 a3
Значение -7,44 0,0901 1,39 0,272
Ст.ошиб. 6,7 0,422 0,748 0,326
Значим. 0,319 0,833 0,12 0,555
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 22,5 3 7,49
Остаточн 27 5 5,41
Вся 49,5 8
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,67367 0,45383 0,12613 2,325 1,38 0,349
Гипотеза 0: <Регрессионная модель неадекватна экспериментальным данным>
Y=x2 x1 x3 x4
Коэфф. a0 a1 a2 a3
Значение 11,1 0,1 -0,769 -0,078
Ст.ошиб. 6,13 0,469 0,966 0,365
Значим. 0,128 0,833 0,534 0,832
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 4,8 3 1,6
Остаточн 30 5 6
Вся 34,8 8
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,37132 0,13788 -0,3794 2,4501 0,267 0,847
Гипотеза 0: <Регрессионная модель неадекватна экспериментальным данным>
Y=x3 x1 x2 x4
Коэфф. a0 a1 a2 a3
Значение 6,98 0,294 -0,146 -0,105
Ст.ошиб. 1,44 0,158 0,184 0,153
Значим. 0,00547 0,12 0,534 0,525
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 5,46 3 1,82
Остаточн 5,71 5 1,14
Вся 11,2 8
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,69913 0,48878 0,18204 1,0689 1,59 0,302
Гипотеза 0: <Регрессионная модель неадекватна экспериментальным данным>
Y=x4 x1 x2 x3
Коэфф. a0 a1 a2 a3
Значение 8,72 0,45 -0,116 -0,824
Ст.ошиб. 8,8 0,539 0,543 1,2
Значим. 0,631 0,555 0,832 0,525
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 6,8 3 2,27
Остаточн 44,7 5 8,94
Вся 51,5 8
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,36333 0,13201 -0,38879 2,99 0,253 0,856
Гипотеза 0: <Регрессионная модель неадекватна экспериментальным данным>
Данные второго класса:
2,23 | 2,11 | 2,55 | 0,13 | |
5,12 | 1,35 | 4,44 | 3,22 | |
4,85 | 3,51 | 1,11 | 2,01 | |
8,56 | 4,23 | 8,54 | 1,05 | |
9,21 | 3,42 | 1,23 | 1,08 | |
7,41 | 6,45 | 5,99 | 1,01 | |
9,52 | 2,22 | 6,44 | 6,55 | |
4,22 | 4,88 | 2,35 | 0,11 | |
5,23 | 7,63 | 1,17 | 8,22 | |
3,25 | 2,25 | 3,48 | 7,23 | |
5,36 | 4,23 | 1,19 | 3,66 |
ФАКТОРНЫЙ АНАЛИЗ. Файл:
Корреляционная матрица
x1 x2 x3 x4
x2
x3
x4
Собственные значения и процент объясняемой дисперсии факторов
Фактор: 1 2 3 4 5 6 7
Собств.зн 1,36 1,21 1,05 0,375
Дисперс% 34 30,3 26,4 9,38
Накоплен% 34 64,3 90,6 100
Переменная <-- Собственные вектора (коэффициенты поворота факторных осей) -->
Фактор: 1 2 3 4
x1 0,539 0,634 0,0733 -0,55
x2 -0,31 0,584 0,601 0,449
x3 0,779 -0,155 0,105 0,598
x4 -0,0823 0,483 -0,789 0,37
Переменная <-------- Факторные нагрузки до вращения ----------------------->
Фактор: 1 2 3 4
x1 0,628 0,697
x2 0,643 0,617
x3 0,908
x4 0,531 -0,811
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. Файл:
Y=x1 x2 x3 x4
Коэфф. a0 a1 a2 a3
Значение 3,22 0,243 0,491 0,0115
Ст.ошиб. 2,29 0,41 0,31 0,266
Значим. 0,201 0,576 0,155 0,966
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 16,4 3 5,46
Остаточн 42,8 7 6,12
Вся 59,2 10
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,52602 0,2767-0,033284 2,4729 0,893 0,508
Гипотеза 0: <Регрессионная модель неадекватна экспериментальным данным>
Y=x2 x1 x3 x4
Коэфф. a0 a1 a2 a3
Значение 3,2 0,197 -0,184 0,038
Ст.ошиб. 2 0,332 0,318 0,239
Значим. 0,151 0,576 0,586 0,873
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 2,49 3 0,829
Остаточн 34,7 7 4,96
Вся 37,2 10
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,25856 0,066856 -0,33306 2,2267 0,167 0,915
Гипотеза 0: <Регрессионная модель неадекватна экспериментальным данным>
Y=x3 x1 x2 x4
Коэфф. a0 a1 a2 a3
Значение 1,41 0,538 -0,248 -0,044
Ст.ошиб. 2,66 0,339 0,429 0,278
Значим. 0,616 0,155 0,586 0,873
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 18,1 3 6,03
Остаточн 46,9 7 6,7
Вся 65 10
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,52749 0,27825-0,031074 2,5885 0,9 0,511
Гипотеза 0: <Регрессионная модель неадекватна экспериментальным данным>
Y=x4 x1 x2 x3
Коэфф. a0 a1 a2 a3
Значение 2,9 0,0232 0,0944 -0,0809
Ст.ошиб. 3,52 0,537 0,595 0,512
Значим. 0,559 0,966 0,873 0,873
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 0,796 3 0,265
Остаточн 86,3 7 12,3
Вся 87,1 10
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,0955740,0091344 -0,41552 3,5113 0,0215 0,995
Гипотеза 0: <Регрессионная модель неадекватна экспериментальным данным>.
Дата добавления: 2015-04-11; просмотров: 78 | Поможем написать вашу работу | Нарушение авторских прав |