Saya menemukan makalah ini yang menggunakan deteksi anomali tautan untuk memprediksi topik yang sedang tren, dan saya merasa sangat menarik: Makalah ini adalah "Menemukan Topik Muncul di Streaming Sosial melalui Tautan Anomali Deteksi" .
Saya ingin mereplikasi pada kumpulan data yang berbeda, tapi saya tidak cukup akrab dengan metode untuk mengetahui cara menggunakannya. Katakanlah saya memiliki serangkaian snapshot jaringan node selama enam bulan. Node memiliki distribusi derajat berekor panjang, dengan sebagian besar hanya memiliki beberapa koneksi, tetapi beberapa memiliki banyak sekali. Node baru muncul dalam periode waktu ini.
Bagaimana saya bisa menerapkan kalkulasi kemungkinan maksimum yang dinormalisasi secara diskonto yang dikurangi secara berkala yang digunakan dalam makalah untuk mendeteksi tautan anomali yang menurut saya mungkin merupakan pelopor dari ledakan? Apakah ada metode lain yang lebih sesuai?
Saya bertanya baik secara teoritis maupun praktis. Jika seseorang bisa mengarahkan saya ke cara untuk mengimplementasikan ini dalam python atau R, itu akan sangat membantu.
Siapa saja? Saya tahu Anda orang-orang pintar di luar sana memiliki beberapa pemikiran awal untuk sebuah jawaban,
Jawaban:
Pertama-tama Anda harus membuat definisi skor anomali untuk simpul baru (lihat bagian 3.1, 3.2). Untungnya, korespondensi antara posting baru (dalam kasus mereka) dan node baru (dalam kasus Anda) hampir satu-ke-satu, karena kami hanya tertarik pada set node (pengguna) yang menjadi node (posting) adalah berhubungan dengan.
Tanyakan lebih lanjut, jika Anda mengalami kesulitan untuk mengikuti langkah-langkah yang dijelaskan dalam ayat 3.4., Di mana SDNML diterapkan.
sumber