Регрессия и классификация

Логистическая регрессия и ROC-анализ - математический аппарат

В статье рассказывается о математическом аппарате и назначении бинарной логистической регрессии – популярного инструмента для решения задач регрессии и классификации. ROC-анализ тесно связан с бинарной логистической регрессией и применяется для оценки качества моделей: позволяет выбрать аналитику модель с наилучшей прогностической силой, проанализировать чувствительность и специфичность моделей, подобрать порог отсечения. 

Методы отбора переменных в регрессионные модели

Статья посвящена проблеме отбора факторов (Feature Selection) в случае с линейной моделью множественной регрессии. Рассмотрены такие итерационные алгоритмы по выбору независимых переменных как Forward Selection, Backward Elimination, Stepwise, а также изложена идея частного F-критерия, на основе которого осуществляется проверка на значимость входных признаков. Механизм работы каждой из методик разобран на конкретном примере. 

Алгоритм ближайшего соседа

Статья посвящена алгоритму KNN, который широко используется в Data Mining для решения задач классификации, так как он прост для программной реализации, а полученный результат легко поддается интерпретации. Рассмотрены базовые идеи, области применения алгоритма, приведены примеры.