Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Кластерный анализ

Читайте также:
  1. D. обобщение, сравнение анализ ,синтез
  2. I) Однофакторный дисперсионный анализ .
  3. I)Однофакторный дисперсионный анализ (выполняется с применением программы «Однофакторный дисперсионный анализ» надстройки «Анализ данных» пакета Microsoft Excel).
  4. Ii) Двухфакторный дисперсионный анализ
  5. II. Анализ деятельности педагога
  6. II. Анализ программ по чтению и литературной подготовке учащихся начальной школы и УМК к ним. Познакомьтесь с требованиями ФГОС.
  7. II. Анализ результатов учебной деятельности.
  8. II.1. Прямые иммуноанализы
  9. II.2. Непрямые иммуноанализы
  10. III. Анализ работы с мотивированными учащимися

Кластерный анализ— это процедура упорядочивания объектов в срав­нительно однородные классы на основе попарного сравнения этих объектов по предварительно определенным и измеренным критериям. Кластерный анализ решает задачу построения классификации, то есть раз­деления исходного множества объектов на группы (классы, кластеры). При этом предполагается, что у исследователя нет исходных допущений ни о со­ставе классов, ни об их отличии друг от друга. Приступая к кластерному ана­лизу, исследователь располагает лишь информацией о характеристиках (при­знаках) для объектов, позволяющей судить о сходстве (различии) объектов, либо только данными об их попарном сходстве (различии). Существует множество вариантов кластерного анализа, но наиболее ши­роко используются методы, объединенные общим названием иерархический кластерный анализ (Hierarchical Cluster Analysis).

При решении ряда задач кластерный анализ явля­ется более эффективным, чем другие многомерные методы:

• разбиение совокупности испытуемых на группы по измеренным призна­кам с целью дальнейшей проверки причин межгрупповых различий по внешним критериям (например, проверка гипотез о том, проявляются ли типологические различия между испытуемыми по измеренным признакам);

• применение кластерного анализа как значительно более простого и на­глядного аналога факторного анализа, когда ставится только задача груп­пировки признаков на основе их корреляции;

• классификация объектов на основе непосредственных оценок разли­чий между ними (например, исследование социальной структуры кол­лектива по данным социометрии — по выявленным межличностным предпочтениям).

Несмотря на различие целей проведения кластерного анализа, можно вы­делить общую его последовательность как ряд относительно самостоятель­ных шагов, играющих существенную роль в прикладном исследовании:

1. Отбор объектов для кластеризации. Объектами могут быть, в зависимо­сти от цели исследования: а) испытуемые; б) объекты, которые оцени­ваются испытуемыми; в) признаки, измеренные на выборке испытуемых.

2. Определение множества переменных, по которым будут различаться объек­ты кластеризации. Для испытуемых — это набор измеренных призна­ков, для оцениваемых объектов — субъекты оценки, для признаков — испытуемые. Если в качестве исходных данных предполагается исполь­зовать результаты попарного сравнения объектов, необходимо четко определить критерии этого сравнения испытуемыми (экспертами).

3. Определение меры различия между объектами кластеризации.

4. Выбор и применение метода классификации для создания групп сходных объектов.

5. Проверка достоверности разбиения на классы.

Последний этап не всегда необходим, например, при выявлении социаль­ной структуры группы. Тем не менее, следует помнить, что кластерный анализ всегда разобьет совокупность объектов на классы, независимо от того, суще­ствуют ли они на самом деле. Поэтому бесполезно доказывать существенность разбиения на классы, например, на основании достоверности различий между классами по признакам, включенным в анализ. Обычно проверяют устойчи­вость группировки — на повторной идентичной выборке объектов. Значимость разбиения проверяют по внешним критериям — признакам, не вошедшим в анализ.

Принцип кластерного анализа. Простой кластерный анализ для двух переменных можно провести при помощи диаграммы рассеяния. К сожалению, отчётливая картина отношений между переменными встречается очень редко. Во-первых, структуры кластеров, если вообще таковые имеются, не так чётко разделены, особенно при наличии большого количества наблюдений. Скорее наоборот, кластеры размыты и даже проникают друг в друга. Во-вторых, как правило, кластерный анализ проводится не с двумя, а с большим количеством переменных.

При кластерном анализе с тремя переменными можно ввести ещё одну ось — ось z и рассматривать размещение наблюдений, а также проводить расчёт расстояния по формуле евклидовой меры в трёхмерном пространстве.

При наличии более трёх переменных определение расстояния между двумя точками х и y в любом n-мерном пространстве для математиков не представляет особого труда. Формула Евклида в таких случаях приобретает следующий вид:

Наряду с евклидовой мерой расстояния, SPSS предлагает и другие дистанционные меры, а также меры подобия. Так что кластерный анализ можно проводить не только с переменными, относящимися к интервальной шкале, но и с дихотомическими переменными. В такой ситуации применяется уже другие дистанционные меры и меры подобия.

При проведении кластерного анализа отдельные кластеры могут формироваться при помощи пошагового слияния, для которого существует ряд различных методов. Важную роль играют иерархические и партиционные методы, причём последние применяются в подавляющем большинстве случаев. Оба эти метода можно задействовать, если пройти через меню Analyze (Анализ) Classify (Классифицировать)

Они помещены в этом меню под именами Hierarchical Cluster... (Иерархический кластер) и K-Means Cluster... (Кластерный анализ методом к-средних).




Дата добавления: 2015-01-12; просмотров: 38 | Поможем написать вашу работу | Нарушение авторских прав




lektsii.net - Лекции.Нет - 2014-2024 год. (0.007 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав