Saya mencoba mempelajari cara menggunakan Bidang Acak Markov untuk mengelompokkan wilayah dalam gambar. Saya tidak mengerti beberapa parameter dalam MRF atau mengapa maksimisasi ekspektasi yang saya lakukan gagal konvergen ke solusi kadang-kadang.
Mulai dari teorema Bayes, saya memiliki , di mana adalah nilai skala abu-abu piksel dan adalah label kelas. Saya telah memilih untuk menggunakan distribusi Gaussian untuk , sedangkan p (x) dimodelkan menggunakan MRF.
Saya menggunakan fungsi potensial untuk MRF yang memiliki potensi klik berpasangan dan nilai potensial untuk label kelas piksel yang diklasifikasi. Nilai potensial piksel tunggal adalah beberapa konstanta yang tergantung pada label kelas . Fungsi potensial berpasangan dievaluasi untuk tetangga yang terhubung 4 dan mengembalikan positif jika tetangga memiliki label kelas yang sama dengan piksel ini dan jika label berbeda.
Pada titik dalam maksimalisasi ekspektasi di mana saya harus menemukan nilai dan yang memaksimalkan nilai yang diharapkan dari log-kemungkinan saya menggunakan metode optimasi numerik (mencoba gradien konjugasi, BFGS, metode Powell) tetapi akan selalu menemukan bahwa nilai akan menjadi negatif, s akan meningkat secara dramatis dan satu atau dua iterasi kemudian seluruh gambar akan ditugaskan untuk satu label saja (latar belakang: menetapkan label kelas diberikan parameter MRF dilakukan menggunakan ICM) . Jika saya menghapus alfa, yaitu hanya menggunakan potensi klik berpasangan, maka maksimalisasi harapan akan berfungsi dengan baik.
Tolong jelaskan apa tujuan dari alfa untuk setiap kelas? Saya pikir mereka akan terkait dengan jumlah kelas yang ada pada gambar, tetapi tampaknya tidak. Begitu MRF berfungsi hanya dengan potensi berpasangan, saya membandingkannya dengan Model Campuran Gaussian yang lurus dan mendapati bahwa MRF menghasilkan hasil yang hampir sama. Saya mengharapkan potensi berpasangan untuk memuluskan kelas sedikit, tetapi itu tidak terjadi. Mohon beritahukan di mana kesalahan saya.
Jawaban:
Diagnosa
Ini terdengar seperti masalah inisialisasi.
Model MRF yang Anda gunakan adalah non-cembung dan, dengan demikian, memiliki beberapa minimum lokal. Sejauh yang saya tahu, semua teknik optimasi yang ada sensitif terhadap inisialisasi, yang berarti bahwa kualitas solusi akhir sangat dipengaruhi oleh tempat Anda memulai prosedur optimasi.
Solusi yang Disarankan
Saya menyarankan mencoba berbagai strategi untuk menginisialisasi model. Sebagai contoh, satu strategi yang muncul di benak saya adalah yang berikut:
latih model untuk terlebih dahulu dan abaikan istilah sebelumnya untuk saat ini; yaitu memperbaiki agar seragam, misalnya, dengan menetapkan dan menjaganya tetap . Jika Anda ingin menjadi pelamun, Anda dapat menetapkan sebagai distribusi mutinomimal yang mewakili frekuensi relatif label pada set pelatihan. Anda dapat melakukan ini dengan mengatur values dengan tepat.p(y|x) p(x) α=β=0 p(x) α
mencairkan persyaratan unary dan berpasangan dalam model MRF; yaitu, biarkan pengoptimal Anda mengubah nilai dan .α β
Inisialisasi yang disarankan adalah, tidak berarti, cara terbaik untuk menginisialisasi optimasi Anda, melainkan, hanya satu opsi yang mungkin.
Akhirnya, seperti yang disarankan Roman Shapovalov , Anda dapat mempertimbangkan untuk mengatur parameter sebelumnya; misalnya, dengan meletakkan Gaussian sebelumnya: mana dan adalah hiper-parameter yang dapat diartikan sebagai varian dari prior Gaussian.λα||α||2+λβ||β||2 λα λβ
sumber