Saya memiliki masalah klasifikasi dengan data yang sangat tidak seimbang. Saya telah membaca bahwa over dan undersampling serta mengubah biaya untuk output kategoris yang kurang terwakili akan mengarah pada pemasangan yang lebih baik. Sebelum ini dilakukan, tensorflow akan mengategorikan setiap input sebagai kelompok mayoritas (dan mendapatkan akurasi lebih dari 90%, sama tidak berartinya).
Saya perhatikan bahwa log persentase terbalik dari setiap grup telah membuat pengganda terbaik yang saya coba. Apakah ada manipulasi yang lebih standar untuk fungsi biaya? Apakah ini diterapkan dengan benar?
from collections import Counter
counts = Counter(category_train)
weightsArray =[]
for i in range(n_classes):
weightsArray.append(math.log(category_train.shape[0]/max(counts[i],1))+1)
class_weight = tf.constant(weightsArray)
weighted_logits = tf.mul(pred, class_weight)
cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(weighted_logits, y))
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(cost)
Jawaban:
Ini sepertinya solusi yang bagus untuk fungsi kerugian. Saya sudah sukses dengan pendekatan yang sama baru - baru ini, tetapi saya pikir Anda ingin memesan ulang tempat Anda berkembang biak di
class_weight
.Memikirkannya secara logis, maka
class_weight
akan menjadi konstan wrt output, sehingga akan dibawa dan diterapkan pada gradien dengan cara yang sama itu diterapkan pada fungsi biaya. Namun ada satu masalah.Cara Anda memilikinya,
class_weight
akan mempengaruhi nilai prediksi. Tetapi Anda ingin itu mempengaruhi skala gradien. Jika saya tidak salah, saya pikir Anda ingin membalik urutan operasi:Saya akan sangat tertarik untuk mengetahui bagaimana kinerjanya dibandingkan dengan hanya terlalu banyak mengawasi kelas yang kurang terwakili, yang lebih khas. Jadi, jika Anda mendapatkan beberapa wawasan di sana, posting tentang itu! :)
Menariknya saya berhasil menggunakan teknik yang sangat mirip di domain masalah yang berbeda baru-baru ini (yang membawa saya ke posting ini):
Pembelajaran multi-tugas, menemukan fungsi kerugian yang "mengabaikan" sampel tertentu
sumber
Checkout
tf.nn.weighted_cross_entropy_with_logits()
:Ini akan membuat Anda melakukan apa yang Anda inginkan.
sumber
Saya memiliki 2 implementasi yang berbeda:
Di mana class_weight adalah placeholder yang saya isi pada iterasi batch yang pernah ada.
Di mana saya menggunakan fungsi tensorflow yang diimplementasikan tetapi saya harus menghitung bobot untuk bets. Dokumen agak membingungkan tentang hal itu. Ada 2 cara untuk melakukannya dengan tf.gather atau seperti ini:
di sini ada diskusi yang bagus tentang itu
Dan akhirnya karena saya tidak ingin menikah dengan salah satu dari permen itu dengan baik, saya menambahkan sedikit. Saya dan saya meneruskan waktu pelatihan strategi yang ingin saya gunakan.
sumber