Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Системы интеллектуального анализа данных Data Mining.

Читайте также:
  1. EIS и DSS системы.
  2. I. Исследование свойств форматов сжатия графических данных
  3. I. Судебно-следственная практика формирования системы доказательств по уголовному делу (постановка проблемы).
  4. II. Метод анализа оперы
  5. II. Начала математического анализа
  6. II. Этапы сбора и анализа информации в стратегическом менеджменте
  7. PEST-анализ. Метод анализа внешней среды
  8. V2: Патофизиология иммунной системы
  9. А) Дидактические системы.
  10. А) ухудшение продовольственного снабжения, распространение карточной системы В) недовольство крестьян аграрной политикой Хрущева

Интеллектуальный анализ данных - это процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей. При этом накопленные сведения автоматически обобщаются до информации, которая может быть охарактеризована как знания.

В общем случае процесс интеллектуального анализа данных состоит из трех стадий:

1. Выявление закономерностей -> 2.использование выявленных закономерностей для предсказания неизвестных значений (прогностическое моделирование) -> 3. анализ исключений, предназначенный для выявления и толкования аномалий в найденных закономерностях.

Пример. Рыночная сегментация - идентифицирует общие характеристики клиентов, которые покупают одинаковые изделия у вашей компании; Прямой маркетинг - идентифицирует, какие проспекты должны быть включены в список рассылки, чтобы по­лучить самую высокую эффективность; Характеристики клиентов - предсказывает, какие клиенты, вероятно, мо­гут оставить вашу компанию и уйти к конку­ренту.

Компьютерными технологиями, образующими Data Mining являются:

Статистические пакеты. Основная оперативная аналитическая обработка данных. Например, пакет STATISTICA.

Нейронные сети и их вариации. Сеть взаимосвязанных элементов, которые являются математической моделью нейронов головного мозга. Используются для определения априорно неизвестных сложных функциональных зависимостей на основании статистических данных. Отличительная особенность - возможность обучения. Например, Эврика+.

Экспертные системы. Позволяют на основании опыта экспертов моделировать процесс принятия решений и выдавать эффективный результат. Например, Acquire.

Байесовы (вероятностные) сети. Моделируют вероятностные причинно-следственные связи. Позволяют рассчитывать вероятность наступления того или иного события при известной априорной вероятности причин.

Методы эвристической самоорганизации. Позволяют моделировать сложные нелинейные процессы и системы при отсутствии априорных знаний о структуре системы.

Теория игр. Применяются в условиях неопределенностей, риска и конфликтов интересов. Задача состоит в определении оптимальной стратегии для каждого из игроков.

Теория хаоса. Применяется где раньше систему считали случайной, и не имеющей каких-либо закономерностей. Позволяет качественно изучать нестабильное апериодическое поведение в нелинейных динамических системах, например, в экономических процессах.

Многозначные логики. Нечеткая логика. Логика антонимов. Позволяет оперировать с нечеткой, неточной, "размытой" информацией. Дает возможность использования качественных, а не количественных характеристик, что позволяет манипулировать лингвистическими понятиями "плохо"-"средне"-"хорошо".

Эволюционные алгоритмы. Адаптивные методы поиска, используемые для решения задач функциональной оптимизации. Основаны на эволюционном принципе "выживает сильнейший". Такой подход является динамическим и позволяет довольно быстро находить оптимальные, с определенной точки зрения, решения. Примером такой системы является PolyAnalyst.

Деревья решений и алгоритмы классификации (decision trees). Создается иерархическая структура классифицирующих правил типа "ЕСЛИ..., ТО...", имеющая вид дерева.

Системы рассуждений на основе аналогичных случаев. Основаны на обнаружении некоторых аналогий в прошлом, наиболее близких к текущей ситуации, с тем, чтобы оценить неизвестное значение или предсказать возможные результаты. Например, КОРА.

Ассоциативные правила. Алгоритмы ограниченного перебора. Выявляют причинно-следственные связи и определяют вероятности или коэффициенты достоверности, позволяя делать соответствующие выводы. (Пример, WizWhy).

Кластерный анализ. Подразделяет гетерогенные данные на гомогенные или полугомогенные группы. Метод позволяет классифицировать наблюдения по ряду общих признаков. Кластеризация расширяет возможности прогнозирования.

Иммунные сети. Основаны на принципах функционирования иммунной системы. Используются в задачах распознавания образов, информационной безопасности, прогнозировании временных рядов и др.

Роевой интеллект. Данный подход основан на коллективном интеллекте, представляющим собой мощную интеллектуальную распределенную систему. Наиболее активными сферами применения являются социальное моделирование, экономическое прогнозирование, маркетинговые исследования.

Методы экспертных оценок.. Использование знаний и опыта экспертов - методы получения, формализации и интеграции экспертных знаний.

Среди западных систем класса Data Mining наиболее известно решение Microsoft Data Mining. Наиболее известная российская система класса Data Mining - Poly Analyst.

 


Дата добавления: 2015-01-30; просмотров: 5 | Нарушение авторских прав

1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | <== 10 ==> | 11 | 12 | 13 | 14 |


lektsii.net - Лекции.Нет - 2014-2020 год. (0.023 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав