Deductor Warehouse

Deductor Warehouse – многомерное кросс-платформенное хранилище данных, аккумулирующее всю необходимую для анализа предметной области информацию. Использование единого хранилища позволяет обеспечить удобный доступ, высокую скорость обработки, непротиворечивость информации, централизованное хранение и автоматическую поддержку всего процесса анализа данных.

При работе с хранилищем данных от пользователя не требуется знание структуры хранения данных и языка запросов. Он оперирует привычными бизнес-терминами – отгрузка, товар, клиент. Для импорта из хранилища нужно всего лишь вызвать мастер и выбрать, какого рода информацию хотелось бы получить. Все необходимые для извлечения данных операции будут произведены автоматически.

Вся информация хранится в схемах типа "снежинка". Такая архитектура хранилища наиболее адекватна задачам анализа данных. Каждая "снежинка" описывает определенное действие, например, продажи товара, отгрузки, поступления денежных средств и прочее. В Deductor Warehouse может одновременно содержаться множество процессов, имеющих общие измерения, например, Товар, фигурирующий в Поступлении и в Отгрузке.


Deductor Warehouse - схема хранения данных

Измерения могут быть как простыми списками, например, дата, так и содержать дополнительные столбцы, называемые атрибутами. Например, измерение Товар может состоять из "Наименование товара" – собственно измерение (первичный ключ), а "Вес", "Объем" и прочее – его атрибуты. Иногда измерения могут быть связаны с другими измерениями.

Загрузка данных в Deductor Warehouse производится при помощи Deductor Studio либо Deductor Server, причем данную операцию можно произвести с любыми данными, импортированными или обработанными программой. Это обеспечивает широкие возможности – до загрузки можно провести весь цикл предобработки и очистки, например, удалить аномальные значения, заполнить пропуски и загрузить в хранилище очищенные и необходимым образом трансформированные данные.

Deductor Warehouse может строиться на базе одной из трех СУБД: Oracle, MS SQL или Firebird. Выбор информации из хранилища производится при помощи Мастера импорта: пользователь просто выбирает, какие данные из имеющейся в хранилище его интересуют, а система самостоятельно формирует специфичный для каждой СУБД SQL запрос. Работа с любой из баз данных происходит совершенно прозрачно для пользователя.

Deductor Warehouse - кросс-платформенное хранилище данных

Вне зависимости от используемой СУБД семантический слой остается единым для любого хранилища. Благодаря этому можно с минимальными усилиями строить иерархические хранилища данных, витрины данных, комбинировать их произвольным образом, применяя наиболее пригодную для конкретного случая базу данных. Это дает возможность минимизировать совокупную стоимость системы, не жертвуя производительностью.

Deductor Warehouse оптимизирован для решения именно аналитических задач, что гарантирует высокую скорость доступа. При загрузке данных автоматически производятся все необходимые для получения наилучшего качества операции. Кроме того, процедуру загрузки в хранилище можно запускать автоматически ночью или в любое другое время, когда сервер наименее занят.

Deductor Warehouse является идеальным местом хранения аналитических данных:

  • Централизованное хранилище
  • Оптимизированный доступ
  • Непротиворечивость данных
  • Использование бизнес-понятий для доступа к информации
  • Автоматическое обновление.

Хранилище данных оптимизировано для решения задач анализа, поэтому при загрузке автоматически выполняются все необходимые действия:

  • Данные преобразовываются из плоских таблиц в многомерное представление, наилучшим образом подходящее для анализа данных.
  • Исключаются все дублирующиеся данные для уменьшения объемов базы данных.
  • Обеспечивается непротиворечивость информации.
  • Проводятся все требуемые манипуляции, позволяющие в последствии в 10-100 раз увеличить скорость извлечения данных из хранилища.

Использование хранилища данных не является обязательным при анализе. Все необходимые действия в Deductor Studio можно провести с любыми табличными данными, однако практика показывает, что применение Deductor Warehouse позволяет значительно ускорить создание законченного решения, обеспечить более высокую производительность и сделать проще работу с информацией конечным пользователям.