Главная | Библиотека | Методология |
Методология
Анализ бизнес информации - основные принципы
Описан подход к анализу данных, позволяющий получить целостную картину об исследуемом процессе. Этот подход дает возможность, используя различные технологии, комбинировать методы анализа и в любом случае выжать максимум из имеющейся информации.
Методика анализа данных
Процесс извлечения знаний из данных происходит по той же схеме, что и установление физических законов: сбор экспериментальных данных, организация их в виде таблиц и поиск такой схемы рассуждений, которая, во-первых, делает полученные результаты очевидными и, во-вторых, дает возможность предсказать новые факты. При этом имеется ясное понимание того, что наши знания об анализируемом процессе, как и любом физическом явлении, в какой-то степени приближение.
Knowledge Discovery in Databases - обнаружение знаний в базах данных
Knowledge Discovery in Databases – это процесс поиска полезных знаний в "сырых данных". KDD включает в себя вопросы: подготовки данных, выбора информативных признаков, очистки данных, применения методов Data Mining, постобработки данных и интерпретации полученных результатов.
Data Mining - добыча данных
Развитие методов записи и хранения данных привело к бурному росту объемов собираемой и анализируемой информации. Объемы данных настолько внушительны, что человеку просто не по силам проанализировать их самостоятельно. Для того чтобы провести автоматический анализ данных, используется Data Mining.
Подготовка исходных данных для анализа
Никакой самый изощренный метод сам по себе не даст хороший результат в задачах Data Mining, поэтому критически важной становится проблема не используемых алгоритмов, а качества исходных данных. Чаще всего именно качество данных является причиной неудачи. В статье описана методика, следуя которой, можно подготовить качественные данные в нужном объеме для анализа.
Анализ больших объемов данных
Анализ огромных баз данных – это нетривиальная задача, которая в большинстве случаев не решается "в лоб", однако современные базы данных и аналитические платформы предлагают множество методов решения этой задачи. При разумном их применении системы способны перерабатывать терабайты данных с приемлемой скоростью.
Онтология анализа данных
Как ориентироваться в многообразии методов анализа данных? Какой из них выбрать для решения конкретной задачи? Онтология – это точная спецификация некоторой предметной области. Она обеспечивает словарь для представления и обмена знаниями об этой предметной области и множество связей, установленных между терминами в этом словаре.

