Глоссарий

Алгоритм CART

CART algorithm

Один из популярных алгоритмов построения деревьев решений, предложенный в 1984 г. (Leo Breiman, Jerome Friedman, Richard Olshen, and Charles Stone). Аббревиатура CART означает Classification and Regression Tree – дерево классификации и регрессии. Из названия алгоритма следует, что он может работать как с непрерывной, так и с дискретной выходной переменной.

Алгоритм строит бинарные деревья решений, которые содержат только два потомка в каждом узле. В процессе работы происходит рекурсивное разбиение примеров обучающего множества на подмножества, записи в которых имеют одинаковые значения целевой переменной.

В процессе роста дерева алгоритм CART проводит для каждого узла полный перебор всех атрибутов, на основе которых может быть построено разбиение, и выбирает тот, который максимизирует значение показателя

Алгоритм CART, CART algorithm,

где s - идентификатор разбиения, t - идентификатор узла, tL и tR - левый и правый потомки узла t соответственно, PL и PR - отношение числа примеров в левом и правом потомках к их общему числу в обучающем множестве, P(j|tL) и P(j|tR) – отношение числа примеров класса j в левом и правом потомках к их общему числу в каждом из них.

Процесс построения регрессионных деревьев решений в основном аналогичен классификационным, но вместо меток классов в листьях будут располагаться числовые значения. Фактически при этом реализуется кусочно-постоянная функция входных переменных.

Алгоритм CART, CART algorithm

В результате в каждом листе должны оказаться примеры с похожими значениями выходной переменной. Чем ближе они будут, тем меньше станет их дисперсия. Поэтому она является хорошей мерой «чистоты» узла. Тогда наилучшим разбиением в узле является то, которое обеспечит максимальное уменьшение дисперсии выходной переменной в нем.

Подпишитесь!

Микроблог BaseGroup в Twitter
Блог BaseGroup в Live Journal (ЖЖ)
Почтовая рассылка BaseGroup на Subscribe.ru

Искать термин

А Б В Г Д Е Ж З И К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Э Ю Я

A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

Искать по слову