Студопедия  
Главная страница | Контакты | Случайная страница

АвтомобилиАстрономияБиологияГеографияДом и садДругие языкиДругоеИнформатика
ИсторияКультураЛитератураЛогикаМатематикаМедицинаМеталлургияМеханика
ОбразованиеОхрана трудаПедагогикаПолитикаПравоПсихологияРелигияРиторика
СоциологияСпортСтроительствоТехнологияТуризмФизикаФилософияФинансы
ХимияЧерчениеЭкологияЭкономикаЭлектроника

Прогнозируемые данные

Когда говорится о неизменности и статичности данных в аналитических системах, имеется в виду неизменность исключительно исторических данных (данных, описывающих уже произошедшие события). Существенным моментом является то, что такое предположение ни в коем случае не распространяется на Прогнозируемые данные (данные о событии, которое еще не происходило).

Например, если строится прогноз об объеме продаж на сентябрь 2005 г. для менеджера Петрова, то, по мере поступления фактических (исторических) данных за 2004 г., эта цифра будет многократно изменяться и уточняться. Более того, достаточно часто прогнозирование и моделирование затрагивает не только будущие, еще не произошедшие, но и прошлые, уже свершившиеся события. Например, анализ: "а, что будет (было бы)... если (бы)..?", строится на предположении о том, что значения некоторых данных, в том числе и из прошлого, отличны от реальных. И для ответа на вопрос: "Какой был бы прогноз по объему продаж компьютеров Celeron для менеджера Петрова на сентябрь 2005 г., если бы объем продаж компьютеров Celeron в сентябре 2004 г. у него возрос на тот же процент, что объем продаж Pentium" потребуется не только вычислить новое, еще не существующее значение Объема Продаж, для еще не наступившего сентября 2005 г., но и предварительно вычислить гипотетическое значение Объема продаж, за уже прошедший сентябрь 2004 г.

В свою очередь, к оперативным данным, отражающим состояние некоторой предметной области в данный текущий момент времени, не применимы такие понятия, как прошлое или будущее. Для них существует единственное понятие - сейчас, а их основное назначение - адекватное детализированное отображение текущих событий (изменений), происходящих в реальном мире.

 

Пример.

Менеджер Петров продал еще один компьютер Celeron; менеджера Петрова перевели из Сумского филиала фирмы в Шосткинский.

Вместе с тем изменчивость оперативных данных ни в коем случае не подразумевает их близость по свойствам к прогнозируемым данным. Между ними существует коренное различие. оперативным данным, в отличие от прогнозируемых, присуще свойство общезначимости, и обычно все пользователи работают с одним и тем же экземпляром данных. После того как в оперативную систему заведены данные о том, что Петров продал еще один компьютер, эта информация сразу же должна стать доступной всем заинтересованным в ней пользователям. Причем до тех пор, пока это изменение не зафиксировано, ни какой другой пользователь не имеет права изменять строку с информацией о продажах Петрова.

Существенно иная ситуация с прогнозируемыми данными. Они носят, скорее, личностный (индивидуальный) характер. Вполне реальна ситуация, когда коммерческий директор фирмы и управляющий региональным отделением одновременно решили получить прогноз возможного объема продаж на 2006 г. для Петрова. Однако каждый из них делает собственный прогноз. Каждый из них может использовать свои функции прогнозирования, и, даже если применяется один и тот же метод (или функция), прогноз может основываться на различных исторических интервалах, и результаты, по всей вероятности, будут различны. Поэтому каждый из них работает с собственным экземпляром прогнозируемых данных (хотя эти данные и относятся формально к одной и той же личности, виду деятельности и времени), и эти данные не должны смешиваться. Конечно, вполне вероятно, что один из этих вариантов будет принят в качестве плановых показателей для Петрова. Но после того как прогноз утвержден в качестве плана, данные просто перейдут в другую категорию и станут историческими.

 

 

Многомерная модель данных

 

"Многомерный взгляд на данные наиболее характерен для пользователя, занимающегося анализом данных" - это утверждение сегодня стало уже почти аксиомой. Однако, у, впервые прочитавшего это утверждение, возникают вопросы: · что такое многомерное представление? · откуда появляется многомерность в трехмерном мире? · чем многомерность отличается и чем она лучше ставшего уже привычным реляционного представления? · откуда могут появиться люди, мыслящие в четырех и более измерениях, и как это им удается? Однако, пользователь, занимающийся анализом, сам не замечая того, действительно имеет многомерность мышления. Весь вопрос в том, что понимать под измерением. Достаточно очевидно, что даже при небольших объемах данных отчет, представленный в виде двухмерной таблицы (Модели компьютеров по оси Y и Время по оси X), нагляднее и информативнее отчета с реляционной построчной формой организации.
Реляционная модель представления данных Многомерная модель представления данных
Модель Месяц Объем   Июнь Июль Август
Celeron Июнь   "Celeron"      
Celeron Июль   "Pentium"     -
Celeron Август   "Athlon" -   -
Pentium Июнь          
Pentium Июль          
Athlon Июль          

Но в любом магазине имеется не три модели товара, а значительно больше (например, 30), и анализ проводится не за три, а за 12 месяцев. В случае построчного (реляционного) представления будет получен отчет в 360 строк (30х12), который займет не менее 5-6 страниц. В случае же многомерного (в данном случае двухмерного) представления будет получена достаточно компактная таблица 12 на 30, которая уместится на одной странице и которую, даже при таком объеме данных, можно реально оценивать и анализировать.

И когда говорится о многомерной организации данных, вовсе не подразумевается то, что данные представляются конечному пользователю (визуализируются) в виде четырех или пятимерных гиперкубов. Это невозможно, да и пользователю более привычно и комфортно иметь дело с двухмерным табличным представлением и двухмерной бизнес-графикой.

При многомерном представление и описании структур данных основными понятиями, с которыми оперирует пользователь и проектировщик в многомерной модели данных, являются:

· Измерение (Dimension)

Это множество однотипных данных, образующих одну из граней гиперкуба. Измерения играют роль индексов, используемых для идентификации конкретных значений (Показателей), находящихся в ячейках гиперкуба. Наиболее часто используемые в анализе измерения:

o временные -Дни, Месяцы, Кварталы, Годы;

o географических - Города, Районы, Регионы, Страны и т.д. В многомерной модели данных

· Ячейка (Cell)

Это часть данных, получаемая путем определения одного элемента в каждом измерении многомерного массива. Ячейки гиперкуба могут быть пусты или полны. Когда значительное число ячеек куба не содержит данных, говорят, что он "разрежен".

Разреженность (Sparse)

Многомерная база данных называется разреженной, если относительно большой процент ячеек содержит пустые (утраченные) данные. Вполне обычны такие наборы данных, которые содержат 1%, 0.01% и даже меньшую долю возможных данных.

Показатель (Measure)

Иногда вместо термина "Ячейка" используется термин показатель (Measure) - это поле (обычно числовое), значения которого однозначно определяются фиксированным набором измерений.

 




Дата добавления: 2015-09-12; просмотров: 16 | Поможем написать вашу работу | Нарушение авторских прав

<== предыдущая лекция | следующая лекция ==>
Внешнее отображение информации в системе| Организация данных в МСУБД

lektsii.net - Лекции.Нет - 2014-2024 год. (0.008 сек.) Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав