Di bawah campuran dua distribusi normal:
https://en.wikipedia.org/wiki/Multimodal_distribution#Mixture_of_two_normal_distributions
"Campuran dari dua distribusi normal memiliki lima parameter untuk diperkirakan: dua rata-rata, dua varian dan parameter pencampuran. Campuran dua distribusi normal dengan standar deviasi yang sama adalah bimodal hanya jika artinya berbeda setidaknya dua kali dari standar deviasi umum. . "
Saya mencari derivasi atau penjelasan intuitif mengapa ini benar. Saya percaya ini mungkin dapat dijelaskan dalam bentuk uji dua sampel:
di mana adalah deviasi standar gabungan.
Jawaban:
Angka dari makalah yang tertaut dalam artikel wiki ini memberikan ilustrasi yang bagus:
Bukti yang mereka berikan didasarkan pada fakta bahwa distribusi normal adalah cekung dalam satu SD dari rata-rata mereka (SD menjadi titik belok dari pdf normal, di mana ia berpindah dari cekung ke cembung). Jadi, jika Anda menambahkan dua pdf normal bersama-sama (dalam proporsi yang sama), maka selama artinya berbeda dengan kurang dari dua SD, jumlah-pdf (yaitu campuran) akan cekung di wilayah antara dua cara, dan oleh karena itu maksimum global harus berada pada titik tepat di antara kedua cara.
Referensi: Schilling, MF, Watkins, AE, & Watkins, W. (2002). Apakah Tinggi Bimodal Manusia? The American Statistician, 56 (3), 223–229. doi: 10.1198 / 00031300265
sumber
Ini adalah kasus di mana gambar dapat menipu, karena hasil ini adalah karakteristik khusus dari campuran normal : analog tidak selalu berlaku untuk campuran lain, bahkan ketika komponennya adalah distribusi unimodal simetris! Sebagai contoh, campuran yang sama dari dua distribusi t Student dipisahkan oleh sedikit kurang dari dua kali standar deviasi mereka akan bimodal. Untuk wawasan yang sebenarnya, kita harus melakukan beberapa matematika atau menarik properti khusus dari distribusi Normal.
Pilih satuan pengukuran (dengan memasukkan kembali dan mengganti ukuran sesuai kebutuhan) untuk menempatkan rata-rata distribusi komponen di dan untuk membuat kesatuan varians umum mereka. Misalkan menjadi jumlah komponen rata-rata yang lebih besar dalam campuran. Ini memungkinkan kami untuk mengekspresikan kerapatan campuran secara umum penuh sebagai±μ, μ≥0, p, 0<p<1,
Karena kedua kepadatan komponen meningkatkan di mana dan mengurangi di mana mode hanya mungkin terjadi di mana Temukan mereka dengan membedakan sehubungan dengan dan atur ke nol. Menghapus semua koefisien positif yang kami perolehx<−μ x>μ, −μ≤x≤μ. f x
Melakukan operasi serupa dengan turunan kedua dari dan mengganti dengan nilai yang ditentukan oleh persamaan sebelumnya memberi tahu kita tanda turunan kedua pada setiap titik kritis adalah tanda darif e2xμ
Karena penyebutnya negatif ketika tanda adalah tanda dariJelas bahwa ketika tandanya harus negatif. Namun, dalam distribusi multimodal (karena kepadatannya kontinu), harus ada antimode di antara dua mode mana pun, di mana tandanya non-negatif. Jadi, ketika kurang dari (SD), distribusi harus unimodal.−μ<x<μ, f′′ −(1−μ2+x2). μ≤1, μ 1
Karena pemisahan rata-rata adalah kesimpulan dari analisis ini adalah2μ,
Itu secara logis setara dengan pernyataan dalam pertanyaan.
sumber
Komentar dari atas ditempelkan di sini untuk kesinambungan:
"[F] secara lisan, untuk campuran 50:50 dari dua distribusi normal dengan SD σ yang sama, jika Anda menulis kerapatan dalam bentuk penuh yang menunjukkan parameter, Anda akan melihat bahwa perubahan turunan keduanya tanda di titik tengah antara dua rata-rata ketika jarak antara rata-rata meningkat dari bawah 2σ ke atas. "f(x)=0.5g1(x)+0.5g2(x)
Komentar berlanjut:
Dalam setiap kasus, dua kurva normal yang 'dicampur' memilikiDari kiri ke kanan jarak antara rata-rata adalah dan masing-masing. Konkavitas densitas campuran pada titik tengah (1.5) antara perubahan berarti dari negatif, menjadi nol, menjadi positif.σ=1. 3σ,2σ, σ,
Kode R untuk gambar:
sumber