Хранилища данных и OLAP

Предобработка и очистка данных перед загрузкой в хранилище

При создании хранилищ данных очень мало внимания уделяется очистке поступающей в него информации. Видимо считается, что чем больше размер хранилища данных, тем лучше. Это порочная практика и лучший способ превратить хранилище данных в свалку. Механизмы фильтрации должны стать такими же неотъемлемым атрибутами хранилищ данных как OLAP. Иначе в горе собранного мусора будет практически невозможно найти зерно полезного. 

Хранилища данных и задачи прогнозирования

При решении практических задач, в частности, задачи прогнозирования, вы обязательно столкнетесь с проблемой подготовки данных. Не надо питать никаких иллюзий, что если не помог один способ прогнозирования, то поможет другой, более изощренный. Дело не в методах. Если в исходных данных не хватает параметров, если информация сильно искажена, то никакой метод не поможет. Но выход есть... 

Ядро OLAP системы. Часть 1 - принципы построения.

В Интернете и прессе можно найти много информации об OLAP системах, но практически нигде не сказано о том, как это устроено внутри. Надеемся, что данный материал частично заполнит этот пробел. Это высокопроизводительное ядро является основой OLAP модуля, встроенного в Deductor. 

Ядро OLAP системы. Часть 2 - внутри гиперкуба.

Описаны детали реализации библиотеки компонентов CubeBase. В частности, рассмотрены вопросы загрузки, внутреннего представления и принципов хранения информации в многомерном гиперкубе. Примененные в CubeBase подходы позволили создать масштабируемое высокопроизводительное OLAP ядро. 

Ядро OLAP системы. Часть 3 - построение срезов куба.

Описаны детали реализации библиотеки компонентов CubeBase. В частности, рассмотрены вопросы постоения срезов гиперкуба и отображения информации в виде сводной (кросс) таблицы.