Knowledge Discovery in Databases

При решении задач моделирования, прогнозирования и поиска закономерностей практически всегда приходится комбинировать различные методы аналитической обработки. Это связано с тем, что реальные данные в "сыром виде" чаще всего непригодны для анализа. Сведения нужно собрать из множества источников, систематизировать, очистить, трансформировать и только зачем можно применять методы Data Mining.

Knowledge Discovery in Databases (KDD) – это процесс поиска полезных знаний в "сырых" данных. KDD включает в себя вопросы: подготовки данных, выбора информативных признаков, очистки, применения методов Data Mining (DM), постобработки и интерпретации полученных результатов. Deductor содержит все необходимые инструменты для реализации KDD-процесса:

  • Сценарный подход. Процесс анализа заключается в построении экспертом сценариев обработки. Все операции производятся при помощи мастеров. При построении сценария аналитик может произвольным образом комбинировать любые механизмы обработки, реализованные в Deductor.
  • Очистка и трансформация данных. Deductor включает полный набор алгоритмов очистки и предобработки данных: заполнение пропусков, редактирование аномалий, фильтрация, замена, группировка, слияние и множество других.
  • Data Mining. В Deductor реализованы наиболее мощные самообучающиеся алгоритмы поиска закономерностей: нейросети, деревья решений, самоорганизующиеся карты, ассоциативные правила и т.п.
  • Визуализация. Программа включает в себя десятки удобных визуализаторов как общего плана (таблицы, графики, OLAP…), так и специализированных, учитывающих особенности аналитической обработки и облегчающих интерпретацию результатов анализа (деревья, карты, правила...).
  • Интеграция. Deductor поддерживает обмен с различными источниками и приемниками данных: от файлов и офисных приложений до промышленных СУБД и OLTP-систем.

Реализация в Deductor KDD-подхода позволяет решать задачу формализации знаний экспертов и их тиражирования. Конечные пользователи могут не задумываться, как получены те или иные результаты, система автоматически извлечет необходимые для анализа данные, выполнит подготовленный сценарий и отобразит результаты наиболее удобным для конечного пользователя способом.