Введение
1 Понятие хранилища данных
2 Основные компоненты хранилища данных
3 Технологии управления информацией
3.1 OLAP – технология
4 Концепции хранилища данных
4.1 Концепция централизованного хранилища данных
4.2 Концепция распределённого хранилища данных
4.3 Концепция автономных витрин данных
4.4 Концепция единого интегрированного хранилища и многих витрин данных
4.5 Глобальные информационные хранилища информации
Заключение
Список литературы
В начале 80-х годов, в период бурного развития регистрирующих информационных систем, появилось осознание ограниченности их применения для анализа данных и построения систем поддержки и принятия решений. Регистрирующие системы создавались для автоматизации рутинных операций: выписки счетов, оформления договоров, проверки состояния склада и т.д., и предназначались для линейного персонала.
Для менеджеров и аналитиков в свою очередь требовались системы, которые бы позволяли: анализировать информацию во временном аспекте, формировать произвольные запросы к системе, обрабатывать большие объемы данных, интегрировать данные из различных регистрирующих систем. Очевидно, что регистрирующие системы не удовлетворяли ни одному из этих требований – информация в такой системе актуальна только на момент обращения к базе данных, а в следующий момент времени по тому же запросу можно получить совершенно другой результат. Интерфейс регистрирующих систем рассчитан на проведение жестко определенных операций и возможности получения результатов на нерегламентированный (ad-hoc) запрос сильно ограничены. Возможности обработки больших массивов данных также были невелики из-за настройки СУБД на выполнение коротких транзакций [3].
Ответом на возникшую потребность стало появление технологии хранилищ данных.
1 Понятие хранилища данных
Хранилище данных (англ. Data Warehouse) – предметно-ориентированная информационная база данных, специально разработанная и предназначенная для подготовки отчётов и бизнес – анализа с целью поддержки принятия решений в организации. Строится на базе систем управления базами данных и систем поддержки принятия решений. Данные, поступающие в хранилище данных, как правило, доступны только для чтения. Данные из OLTP-системы копируются в хранилище данных таким образом, чтобы построение отчётов и OLAP-анализ не использовал ресурсы транзакционной системы и не нарушал её стабильность. Как правило, данные загружаются в хранилище с определённой периодичностью, поэтому актуальность данных может несколько отставать от OLTP-системы
Хранилища данных выполняют задачи сбора информации из баз данных, отображающих отдельные бизнес-процессы, автоматизированных рабочих мест, информационных систем и других источников информации, в том числе из глобальных информационных сетей, как например Internet .
Сбор информации сочетается, как правило, с доработкой исходных данных, которая заключается в проверке достоверности, устранении противоречивости, сортировке, систематизации, построении заданной единой структуры хранилища и т.д.
Можно выделить следующие характерные свойства хранилищ:
− предметную ориентированность;
− интегрированность;
− неизменчивость;
− поддержка хронологии.
Свойство предметной ориентированности означает компоновку пулов информации по определённым предметным областям или целям, обеспечивающим подготовку и принятие необходимых решений в соответствующей системе принятия решений (DSS) .
Интегрированность предусматривает сбор и доработку (предварительную обработку) информации по определённой предметной области из различных источников и превращение её в организованный по заданным правилам, подчинённым определённой цели, массив в виде гиперкуба или системы поликубов информации.
Неизменчивость состоит в том, что информация не подвергается частым обновлениям, а только в случае крайней необходимости. В основном наращивается по заданному, чётко определённому графику. Пользователь имеет только право чтения информации.
Поддержка хронологии заключается в обязательности привязки данных ко времени. Информация, содержащаяся в хранилище, рассматривается в историческом аспекте. Используют следующие типы привязки ко времени:
1 Карминский A.M., Черников Б.В. Информационные системы в экономике: В 2-х ч. Ч. 1. Методология создания: Учеб. пособие. − М.: Финансы и статистика, 2006. −336 с: ил.
2 Кузнецов С., Артемьев В. Обзор возможностей применения ведущих СУБД для построения хранилищ данных (DataWareHouse) [Электронный ресурс]. URL: http://citforum.novgorod.ru/database/kbd98/glava15.shtml.
3 Стулов А. Особенности построения информационных хранилищ. [Электронный ресурс]. URL: http://citforum.ru/database/articles/20030520/ю
4 Понятие информационного хранилища [Электронный ресурс] // Market_Pages.ru: Информационный бизнес портал. URL: http://www.market-pages.ru/ias/25.html.
5 Технологии хранилищ данных [Электронный ресурс]//OLAR.ru: [сайт].URL: http://www.olap.ru/.