Apriori - масштабируемый алгоритм поиска ассоциативных правил

Современные базы данных имеют очень большие размеры, достигающие гига- и терабайтов, и тенденцию к дальнейшему увеличению. И поэтому, для нахождения ассоциативных правил требуются эффективные масштабируемые алгоритмы, позволяющие решить задачу за приемлемое время. Об одном из таких алгоритмов и пойдет речь в данной статье. Мы опишем алгоритм Apriori.

Читайте статью Apriori - масштабируемый алгоритм поиска ассоциативных правил 


Обсуждение: Apriori -- масштабируемый алгоритм поиска ассоциативных правил

Вопрос такой: я уже написала поиск часто встречающихся наборов. Зациклилась на формировании правил. В инете много разных штук, но чтоб четко по теме, пока не встречала, хотя пролазила кучу всяких ссылок. Если можна, пришлите пожалуйста какую-либо помощь по этому поводу. Язык C++ либо C#, или просто алгоритм формирования правил из набора на псевдокоде.
Заранее благодарна за любую информацию по этому поводу.

Lara

01-06-2007

Обсуждение: Apriori -- масштабируемый алгоритм поиска ассоциативных правил

Помогите очень срочно нужен исходник алгоритма Apriori, желательно на С или C#

Анюта

22-04-2007

Могу выслать. Но вообще-то Вы и сами могли бы найти этот алгоритм в инете.

duke

23-04-2007

Пожалуйста вышлите мне этот алгоритм я в этой области новичок и у меня не получается самому найти

sanjar

10-05-2007

http://fuzzy.cs.uni-magdeburg.de/~borgelt/apriori.html
Эту и другие ссылки найти не представляет особого труда.

Duke

10-05-2007

Обсуждение: Apriori -- масштабируемый алгоритм поиска ассоциативных правил

В статье сказано, что генерация кандидатов состоит из:
1. добавления элементов
2. удаления избыточных правил

У меня возник вопрос по второму пункту - откуда могут взяться избыточные правила? По-моему, по построению очередного уровня это невозможно, т.к. на предыдущем шаге все редкие кандитаты были отброшены и на следующем уровне они ничего не порождают...

Или я что-то не правильно понял, объясните пожалуйста.

Спасибо.

P.S. скобка в 8-й строчке, закрывающая цикл должна быть после присваивания Fk= ...

Возможно, Вы немного запутались в определениях.
1. Алгоритм генерирует список часто встречающихся множеств.
2. Каждая итерация состоит из:
2.1. Генерации ПОТЕНЦИАЛЬНО часто встречающихся множеств (кандидатов)
2.2. Удаление избыточных кандидатов. Соответственно, оставшиеся множества, можно считать часто встречающимися множествами мощности k.

Если же Ваш основной вопрос: "Бывают ли множества Fk мощностью k, состоящие из элементов множеств Fk-1 мощностью k-1, c поддержкой меньше чем поддержка множеств Fk-1?", то ответ "да".

По поводу закрывающейся скобки, ее просто не хватает, т.е. строка 9.5 должна быть равна "}". Спасибо за замечание.

С уважением, Сергей Ларин.

Спасибо. Все, я разобрался.

Обсуждение: Apriori -- масштабируемый алгоритм поиска ассоциативных правил

А чем отличается Apriori от AprioriTID? Что то я совсем мало нашел про AprioriTID информации по его реализации. Спасибо.

Nik

24-10-2006

Обсуждение: Apriori -- масштабируемый алгоритм поиска ассоциативных правил

Либо я не понял, либо не сказано как вычислять достоверность правила. В любом случае хотелось бы более расширенное описание.
И еще, у вас сказано, что поддержка, скажем - на первой итерации, это число повторений элемента, т.е. целое число.
Почему Deductor выдает даже на первой итерации числа вида 40,63; 6,25; 15,63; 6,25.
Спасибо.

Yustos

05-03-2006

Поддержка элемента есть отношение количества транзакций, содержащих данный элемент, к общему количеству транзакций.

Сергей

28-06-2006

Обсуждение: Apriori -- масштабируемый алгоритм поиска ассоциативных правил

Будьте добры, мне тоже нужна статейка про алгоритм построения хеш-дерева или любая полезная ссылка, посвященная хешированию. Спасобо!

Lala

24-08-2005

Форум: технологии анализа данных

Обсуждаются темы, связанные с математическим аппаратом и алгоритмами поиска закономерностей, моделирования, прогнозирования, визуализации и т.п. Все, что связано с Data Warehouse, OLAP, Data Mining, Knowledge Discovery in Databases..

Подпишитесь!

Микроблог BaseGroup в Twitter
Блог BaseGroup в Live Journal (ЖЖ)
Почтовая рассылка BaseGroup на Subscribe.ru

Тематика на форуме