Data Mining

Очевидно, что огромные массивы данных, накопленные в организациях, содержат много полезной информации, которую можно и нужно использовать для оптимизации работы. Для этого требуется обобщить прошлый опыт, найти закономерности, извлечь правила и использовать эти знания в процессе управления. Простые методы анализа, наподобие визуализации, в этом случае не могут помочь. Они позволяют ответить на вопрос: "что было", а необходимо получить ответ на вопрос: "что надо делать". Для этого нужны механизмы построения моделей, способные находить нетривиальные закономерности в больших объемах данных, - Data Mining системы.

Data Mining - это процесс обнаружения в сырых данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Deductor содержит все необходимое для решения задач Data Mining. В нем реализованы самые современные алгоритмы построения моделей, а также механизмы, обеспечивающие весь цикл аналитической обработки (подготовка данных, моделирование, оценка результатов, внедрение в бизнес-процесс):

  • Самообучающиеся алгоритмы и машинное обучение. В Deductor реализованы самые современные адаптивные алгоритмы построения моделей: деревья решений, нейронные сети, самоорганизующиеся карты, ассоциативные правила... Они очень просты в работе. Аналитик только формулирует гипотезы о возможном наличии зависимости, а система автоматически строит модели по существующим данным.
  • Анализ временных рядов. В Deductor включены алгоритмы, применяемые для выявления сезонности, трендов, нахождения автокорреляционных зависимостей. Подобные модели чаще всего используются для решения задач прогнозирования временных рядов.
  • Анализ отклонений. После построения моделей возможно выделение отклонений, выявление наиболее нехарактерных прецедентов. Подобные механизмы позволяют автоматически выявлять те события, на которые необходимо обратить внимание, а также находить шаблоны, не подпадающие под общие закономерности.
  • Оценка качества моделей. В систему интегрированы механизмы оценки качества моделей. Они применяются для сравнения результатов моделирования как на основе формальных критериев качества, так и экспертных знаний.
  • Визуализация. В Deductor встроено множество специализированных способов визуализации, ориентированных на различные Data Mining алгоритмы. Удобные механизмы отображения значительно облегчают процесс интерпретации результатов, повышая доверие экспертов к результатам анализа.

Применение методов Data Mining – фактически единственная возможность извлечь пользу из накопленной информации, в противном случае собранные данные будут лежать "мертвым грузом". Data Mining позволяет извлекать из данных знания и превратить в конкурентные преимущества: качественно прогнозировать, точнее выявлять целевые аудитории, предсказывать развитие событий, управлять рисками и прочее.