Принципы организации хранилища
Проблемно-предметная ориентация. Данные объединяются в категории и хранятся в соответствии с областями, которые они описывают, а не с приложениями, которые они используют.
Интегрированность. Данные объединены так, чтобы они удовлетворяли всем требованиям предприятия в целом, а не единственной функции бизнеса.
Некорректируемость. Данные в хранилище данных не создаются: т.е. поступают из внешних источников, не корректируются и не удаляются.
Зависимость от времени. Данные в хранилище точны и корректны только в том случае, когда они привязаны к некоторому промежутку или моменту времени.
37. Многомерные модели данных. Схемы «звезда» и «снежинка».
Реляционная модель данных, которая была предложена Э.Ф. Коддом в 1970 году, и за которую десятилетие спустя он получил премию Тьюринга, служит основой современной многомиллиардной отрасли баз данных.
Реляционная модель данных, которая была предложена Э.Ф. Коддом в 1970 году, и за которую десятилетие спустя он получил премию Тьюринга, служит основой современной многомиллиардной отрасли баз данных. За последние десять лет сложилась многомерная модель данных, которая используется, когда целью является именно анализ данных, а не выполнение транзакций. Технология многомерных баз данных — ключевой фактор интерактивного анализа больших массивов данных с целью поддержки принятия решения. Подобные базы данных трактуют данные как многомерные кубы, что очень удобно именно для их анализа.
Многомерные модели рассматривают данные либо как факты с соответствующими численными параметрами, либо как текстовые измерения, которые характеризуют эти факты. В розничной торговле, к примеру, покупка — это факт, объем покупки и стоимость — параметры, а тип приобретенного продукта, время и место покупки — измерения. Запросы агрегируют значения параметров по всему диапазону измерения, и в итоге получают такие величины, как общий месячный объем продаж данного продукта. Многомерные модели данных имеют три важных области применения, связанных с проблематикой анализа данных.
Хранилища данных интегрируют для анализа информации из нескольких источников на предприятии.
Системы оперативной аналитической обработки (online analytical processing — OLAP) позволяют оперативно получить ответы на запросы, охватывающие большие объемы данных в поисках общих тенденций.
Приложения добычи данных служат для выявления знаний за счет полуавтоматического поиска ранее неизвестных шаблонов и связей в базах данных.
Схема снежинки получила свое название за свою форму, в виде которой отображается логическая схема таблиц в многомерной базе данных. Так же как и в схеме звезды, схема снежинки представлена централизованной таблицей фактов, соединенной с таблицами измерений. Отличием является то, что здесь таблицы измерений нормализованы с рядом других связанных измерительных таблиц, — в то время как в схеме звезды таблицы измерений полностью денормализованы, с каждым измерением представленным в виде единой таблицы, без соединений на связанные таблицы в схеме снежинки. Чем больше степень нормализации таблиц измерений, тем сложнее выглядит структура схемы снежинки. Создаваемый «эффект снежинки» затрагивает только таблицы измерений, и не применим к таблицам фактов.
Схема «звезды», схема звёздного соединения, звездоподобная схема, звёздная схема (от англ. star schema) — специальная организация реляционных таблиц, удобная для хранения многомерных показателей. Лежит в основе реляционного OLAP.
Модель данных состоит из двух типов таблиц: одной таблицы фактов (fact table) — центр «звезды» — и нескольких таблиц измерений (dimension table) по числу измерений в модели данных — лучи «звезды».
Таблица фактов обычно содержит одну или несколько колонок типа DECIMAL, дающих числовую характеристику какому-то аспекту предметной области (например, объём продаж для торговой компании или сумма платежей для банка), и несколько целочисленных колонок-ключей для доступа к таблицам измерений.
Таблицы измерений расшифровывают ключи, на которые ссылается таблица фактов; например, таблица «products» измерения «товары» базы данных торговой компании может содержать сведения о названии товара, его производителе, типе товара. За счёт использования специальной структуры таблицы измерений реализуется иерархия измерений, в том числе ветвящаяся.
Обычно данные в таблицах-измерениях денормализованы: ценой несколько неэффективного использования дискового пространства удается уменьшить число участвующих в операции соединения таблиц, что обычно приводит к сильному уменьшению времени выполнения запроса. Иногда, тем не менее, требуется произвести нормализацию таблиц-измерений; такая схема носит название «снежинка» (snowflake schema).
SQL-запрос к схеме «звезда» обычно содержит в себе:
одно или несколько соединений таблицы фактов с таблицами измерений;
несколько фильтров (SQL-оператор WHERE), применяемых к таблице фактов или таблицам измерений;
группировку и агрегирование по требуемым элементам иерархии измерений (dimension elements).
- 1 .Информационные процессы в управлении организацией
- 2. Методические указания основы создания информационной системы и информационной технологии в управление организацией
- 3. Информационное обеспечение информационной системы и информационной технологии управления организацией.
- 4. Техническое и программное обеспечение информационной системы и информационной технологии управления организацией
- 5. Информационные технологии в системах управления.
- 6. Защита информации в информационных системах информационной технологии управления организацией.
- 7. Информационные технологии стратегического менеджмента на предприятии.
- 8. Информационная технология логистических исследований в управлении организацией.
- 9. Информация, методы ее хранения, обработки и передачи.
- 10. Локальные и глобальные сети эвм.
- 1. Компьютерные сети
- 14. Архитектура информационных сетей. Эталонная Модель Взаимодействия Открытых Систем (эмв ос).
- 15. Архитектура информационных сетей. Факсимильная передача информации. Электронная почта Телеконференции.
- 16. Инструментальные средства управления проектами - мs Рrojket 2000. Ресурсы, типы ресурсов. Ввод таблицы ресурсов. Назначение ресурсов.
- 17. Методология создания компьютерных систем. Системный подход. Этапы системного анализа.
- 18. Методология создания компьютерных систем. Системный подход. Проблемная ситуация. Целевыявление.
- 19. Методология создания компьютерных систем. Системный подход Функции. Структура Ресурсы.
- 20. Стадии создания компьютерных систем. Технико-экономическое обоснование. Техническое задание. Технический и рабочий проекты. Внедрение. Анализ функционирования.
- 21. Создание модели процессов в вРwin.
- 23. История и основные направления развития ис. Классификация ис
- Классификация ис
- 24. Структура программного обеспечения ис. Структура приложений в ис.
- 25. Количество и качество информации. Основные понятия экономических информационных систем.
- Понятие информации.
- Понятие экономической информации.
- Понятие системы.
- Понятие информационной системы.
- 26. Этапы автоматизации управления. Компоненты Информационных Систем. Технологии управления. Направления развития управления.
- 27. Этапы автоматизации управления. Управление по результатам. Области совершенствования управления. Области применения информационных технологий.
- 28. Инструментальные средства управления проектами - мs Рrojeсt 2000. Ресурсы, типы ресурсов. Ввод таблицы ресурсов. Назначение ресурсов.
- 29. Инструментальные средства управления проектами - мs Рrojeсt 2000. Режимы представления информации в разных форматах: режим диаграммы Ганта.
- 30. Инструментальные средства управления проектами - мs Рrojeсt 2000. Режим перт-диаграммы, режим использования работ, режим использования ресурсов. Способы оптимизации графика работ.
- 31. Электронная коммерция. Технология в2в. Базы данных в Internet. Технология АсtiveServerPeges.
- 33. Типы информации, хранимой в рамках Internet (Теlnet, fтр, Gopher, е-mail). Основные протоколы Internet (тср, ip, Еthernet, fтр, ррр, slip). Url. НурегТехt: МагкUрLanguage (нтмl).
- 34. Экспертные системы поддержки решений. Технология получения, представления, хранения и преобразования знаний.
- Принципы организации хранилища
- 38. Риск-технология принятия решения. Принятие решений в условия неточности данных и неопределенности. Технология нейронных сетей и генетические алгоритмы
- 39.Модель "сущность-связь".
- 40.Электронный документооборот.
- 42.Особенности информационных технологий в организациях различного типа. Информационные технологии как инструмент формирования
- 2) Регистрацию, накопление и анализ отклонений хода производства от запланированного; 3) выработку и реализацию решений по устранению или минимизации нежелательных отклонени