1 : A , B , C , E 2 : A , C , D , E 3 : B , C , E 4 : A , C , D , E 5 : C , D , E 6 : A , D , E
Quero descobrir o máximo de conjuntos de itens frequentes e os conjuntos de itens frequentes fechados .
- O conjunto de itens frequentes é máximo se não tiver nenhum superconjunto frequente.
- O conjunto de itens frequentes X ∈ F é fechado se não houver um superconjunto com a mesma frequência
Então contei a ocorrência de cada conjunto de itens.
{A} = 4 ; {B} = 2 ; {C} = 5 ; {D} = 4 ; {E} = 6
{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2;
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3
{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3;
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3
{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0
Min_Support definido como // Muito importante. Obrigado, Steffen, por lembrar isso.
Faz máximas = ?
Faz fechado = ?
data-mining
dataset
association-rules
Mike John
fonte
fonte
Você pode querer ler o algoritmo APRIORI. Evita itens desnecessários por poda inteligente.
B não é frequente, remova.
Construa e conte conjuntos de dois itens (nenhuma mágica ainda, exceto que
B
já está fora)Tudo isso é frequente (observe que tudo o que tinha
B
não pode ser frequente!)Agora use a regra de prefixo. SOMENTE combine conjuntos de itens começando com os mesmos itens n-1. Remova tudo, onde qualquer subconjunto não for frequente. Conte os conjuntos de itens restantes.
Observe que isso
{A,C,D}
não é frequente. Como não há prefixo compartilhado, não pode haver um conjunto maior de itens frequentes!Observe quanto menos trabalho eu fiz!
Para conjuntos de itens máximos / fechados, verifique subconjuntos / superconjuntos.
Observe que
{E}=6
, por exemplo , e{A,E}=4
.{E}
é um subconjunto, mas possui um suporte mais alto, ou seja, está fechado, mas não é o máximo.{A}
não é nenhum, pois não possui suporte mais alto que{A,E}
, isto é, é redundante .fonte