Быстрый переход к готовым работам
|
Хранилища данных
Разновидностью
баз данных является хранилище данных (Data Wareh Youse). Понятие хранилищ
данных возникло совсем недавно.
Необходимость разработки новой концепции хранилищ данных обусловлена следущими
факторами: C Развитие информационных технологий привело к системам нового типа, которые получили название систем поддержки принятия решений. Эти системы основаны на новой технологии, получившей название OLAP - технологии. Основой OLAP – технологии является реализация аналитических запросов. C Системы поддержки принятия решений, основанные на формировании аналитических запросов, начали конфликтовать с транзакционными системами оперативной обработки данных (OLТP - системами). Одновременное решение оперативных и аналитических запросов на одной базе данных часто приводит к недостатку ресурсов. C Формирование аналитических отчетов на основе традиционных баз данных, вмещающих оперативную информацию, занимает очень много времени. Причем расход времени, необходимый для формирования аналитических отчетов, неустанно возрастают с ростом объемов оперативной информации в базе данных. Это приводит к тому, что менеджеры не успевают готовить соответствующие решения на основе полученных аналитических отчетов. C Очень часто на предприятии или в организации
функционирует несколько OLАP -систем, каждая из которых имеет свою отдельную базу данных, в которой используются разные структуры данных,
способы кодирования, единицы измерения.
Построение сводного аналитического запроса на основе нескольких баз данных является
очень сложной проблемой нуждающейся в
решении проблемы согласованности данных,
хранящихся в разных базах данных. Решение
вышеперечисленных проблем было найдено в разработке концепции хранилища данных. Хранилища данных
должны выполнять функции предыдущего
отбора, агрегации и подготовки оперативных данных OLAP -системам. В хранилище
данных сохраняются не первичные данные, а определенным образом
интегрированные данные, создающие
основу для решения аналитических задач и функционирования систем
поддержки принятия решений. Взаимосвязь между системами отображена на рис. 1
Рис. 1 Схема взаимосвязи OLТP и OLAP систем Хранилище данных (Data Waren House) это особая форма организации базы данных, предназначенная для хранения в согласованном виде агрегированной информации, полученной на основе баз данных разных OLТP -систем и внешних источников. Хранилища
данных характеризуются предметной
ориентацией, интегрированностью, поддержкой хронологии, неизменностью и минимальной избыточностью. Эти основные особенности хранилищ данных были
определены в 1992 году их изобретателем Биллом Имоном (Bill Іпmоn). Они независимо от реализации присущи всем
хранилищам данных и состоят: E Предметная ориентация. Данные в хранилище данных организованны в соответствии с основными направлениями деятельности предприятия или фирмы (заказчики, продажи, состав и т.п.). В этом заключается отличие хранилищ данных от организации оперативной БД, в которой данные выдаются соответственно процессам (отгрузка товара, выписка счетов и т.п.). Предметная организация данных не только упрощает анализ, а и значительно ускоряет проведение аналитических расчетов. Хранилища ориентированны на бизнес-понятия, а не на бизнес процессы. E Интегрированность. Первичные данные оперативных баз данных проверяются, определенным образом дополняются, приводятся к единому виду, агрегируються ( т.е. обсчитываются суммарные показатели) и загружаются в хранилище данных. Такие интегрированные данные намного проще анализировать. E Поддержка хронологии. Данные, которые выбираются из оперативных баз данных накапливаются в хранилище данных в виде «исторических пластов», каждый из которых характеризует определенный период времени. Это разрешает проводить анализ изменения показателей во времени. E Неизменность. Данные хранилища данных, характеризующие каждый «исторический пласт», ни в коем случае не подлежат изменениям. Это тоже является существенным отличием данных, которые сохраняются в хранилище данных, от оперативных данных.. Оперативные данные могут очень часто изменяться, с данными хранилища возможны лишь операции их первичной загрузки, поиска и их чтение. E Минимальная избыточность. Несмотря на то, что информация в хранилища данных загружается с БД OLТP -систем, это не приводит избыточности данных. Сведениу к минимуму избыточности данных обеспечивается тем, что прежде чем загружать данные в хранилища, их фильтруют и определенным образом очищают от не нужных данных, которые не не могут быть использованы в OLАP -системах. Заказать написание авторской работы |
|