Saya ingin mengetahui set item sering maksimal dan set item sering tertutup .
- Set item yang sering adalah maksimal jika tidak memiliki superset sering.
- Set item yang sering X ∈ F ditutup jika tidak memiliki superset dengan frekuensi yang sama
Jadi saya menghitung terjadinya setiap set item.
{A} = 4 ; {B} = 2 ; {C} = 5 ; {D} = 4 ; {E} = 6
{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2;
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3
{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3;
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3
{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0
Min_Support disetel ke // Sangat penting. Terima kasih steffen untuk mengingatkan hal itu.
Apakah maksimal = ?
Apakah ditutup = ?
data-mining
dataset
association-rules
Mike John
sumber
sumber
Anda mungkin ingin membaca tentang algoritma APRIORI. Ini menghindari itemset yang tidak perlu dengan pemangkasan yang cerdas.
B tidak sering, hapus.
Bangun dan hitung dua item (belum ada sihir, kecuali yang
B
sudah keluar)Semua ini sering terjadi (perhatikan bahwa semua itu
B
tidak mungkin sering terjadi!)Sekarang gunakan aturan awalan. HANYA menggabungkan itemet dimulai dengan item n-1 yang sama. Hapus semua, di mana subset tidak sering. Hitung itemet yang tersisa.
Perhatikan bahwa
{A,C,D}
tidak sering. Karena tidak ada awalan bersama, tidak mungkin ada itemset yang lebih sering!Perhatikan betapa sedikitnya pekerjaan yang saya lakukan!
Untuk itemset maksimal / tertutup, periksa subset / superset.
Perhatikan bahwa misalnya
{E}=6
, dan{A,E}=4
.{E}
adalah himpunan bagian, tetapi memiliki dukungan yang lebih tinggi, yaitu ditutup tetapi tidak maksimal.{A}
juga tidak, karena tidak memiliki dukungan yang lebih tinggi daripada{A,E}
, yaitu berlebihan .sumber