Tautan Deteksi Anomali di Jaringan Temporal

32

Saya menemukan makalah ini yang menggunakan deteksi anomali tautan untuk memprediksi topik yang sedang tren, dan saya merasa sangat menarik: Makalah ini adalah "Menemukan Topik Muncul di Streaming Sosial melalui Tautan Anomali Deteksi" .

Saya ingin mereplikasi pada kumpulan data yang berbeda, tapi saya tidak cukup akrab dengan metode untuk mengetahui cara menggunakannya. Katakanlah saya memiliki serangkaian snapshot jaringan node selama enam bulan. Node memiliki distribusi derajat berekor panjang, dengan sebagian besar hanya memiliki beberapa koneksi, tetapi beberapa memiliki banyak sekali. Node baru muncul dalam periode waktu ini.

Bagaimana saya bisa menerapkan kalkulasi kemungkinan maksimum yang dinormalisasi secara diskonto yang dikurangi secara berkala yang digunakan dalam makalah untuk mendeteksi tautan anomali yang menurut saya mungkin merupakan pelopor dari ledakan? Apakah ada metode lain yang lebih sesuai?

Saya bertanya baik secara teoritis maupun praktis. Jika seseorang bisa mengarahkan saya ke cara untuk mengimplementasikan ini dalam python atau R, itu akan sangat membantu.

Siapa saja? Saya tahu Anda orang-orang pintar di luar sana memiliki beberapa pemikiran awal untuk sebuah jawaban,

Olga Mu
sumber
1
Jika Anda tidak keberatan melonggarkan preferensi R / python, mungkin pekerjaan saya ini dapat membantu? goo.gl/l7SLlB Beberapa keuntungan dari metode ini adalah Anda tidak perlu khawatir tentang jenis fitur, normalisasi dan banyak lagi.
arielf
1
Kecuali jika saya salah mengerti pertanyaan, Anda harus dapat mengimplementasikan metode dari makalah dengan cara yang sama seperti penulis makalah menerapkan metode. Jika metode ini tidak dapat direproduksi dari kertas, maka Anda harus menghubungi penulis. Para penulis juga mungkin bersedia memberikan kode mereka. Jika Anda memiliki pertanyaan teoretis khusus atau pertanyaan pemrograman, maka pertanyaan itu harus ditanyakan secara terpisah.
Nat

Jawaban:

0

Pertama-tama Anda harus membuat definisi skor anomali untuk simpul baru (lihat bagian 3.1, 3.2). Untungnya, korespondensi antara posting baru (dalam kasus mereka) dan node baru (dalam kasus Anda) hampir satu-ke-satu, karena kami hanya tertarik pada set node (pengguna) yang menjadi node (posting) adalah berhubungan dengan.

γ

Tanyakan lebih lanjut, jika Anda mengalami kesulitan untuk mengikuti langkah-langkah yang dijelaskan dalam ayat 3.4., Di mana SDNML diterapkan.

sdd
sumber