Tes untuk distribusi bimodal

30

Saya ingin tahu apakah ada uji statistik untuk "menguji" pentingnya distribusi bimodal. Maksud saya, seberapa banyak data saya memenuhi distribusi bimodal atau tidak? Jika demikian, apakah ada tes dalam program R?

Pauloc
sumber
3
Apakah Anda tidak menemukan jawaban dengan mencari di situs kami ? Jika tidak, apa yang kurang?
whuber
7
Ada tes untuk bimodality atau multimodality, tetapi mereka cenderung satu sisi. Artinya, Anda dapat menyimpulkan hal-hal seperti "ada lebih dari satu mode", tetapi Anda tidak bisa mengatakan "ada kurang dari tiga mode" - Anda bisa mendapatkan batas bawah pada jumlah mode tetapi Anda tidak bisa mendapatkan batas atas karena distribusi multimodal dengan sejumlah mode dapat ditemukan yang secara sewenang-wenang dekat dengan distribusi dengan sejumlah mode yang lebih kecil. Saya akan melihat apakah saya dapat menggali beberapa tes atau referensi eksplisit.
Glen_b -Reinstate Monica
4
Halaman wikipedia pada distribusi bimodal mencantumkan delapan tes untuk multimodality terhadap unimodality dan memasok referensi untuk tujuh diantaranya. Saya tidak yakin apakah ada di R. Saya akan melihat.
Glen_b -Reinstate Monica

Jawaban:

17

Pendekatan lain yang mungkin untuk masalah ini adalah untuk memikirkan apa yang mungkin terjadi di balik layar yang menghasilkan data yang Anda lihat. Artinya, Anda dapat berpikir dalam hal model campuran , misalnya, model campuran Gaussian. Misalnya, Anda mungkin percaya bahwa data Anda diambil dari satu populasi normal tunggal, atau dari campuran dua distribusi normal (dalam proporsi tertentu), dengan rerata dan varian yang berbeda. Tentu saja, Anda tidak harus percaya bahwa hanya ada satu atau dua, Anda juga tidak harus percaya bahwa populasi tempat pengambilan data harus normal.

Ada (setidaknya) dua paket R yang memungkinkan Anda memperkirakan model campuran. Satu paket adalah flexmix , dan yang lainnya adalah mclust . Setelah memperkirakan dua model kandidat, saya percaya dimungkinkan untuk melakukan tes rasio kemungkinan. Atau, Anda bisa menggunakan metode cross-fitting bootstrap parametrik ( pdf ).

gung - Reinstate Monica
sumber
Hai @gung, untuk metode cross-fitting bootstrap parametrik, bagaimana Anda mendefinisikan kriteria optimal sehubungan dengan distribusi bimodal? Mungkin ada kasus di mana dua distribusi yang bersaing saling berhadapan di dua titik. Apa yang harus dilakukan dalam kasus seperti itu?
akashrajkn
32

Seperti disebutkan dalam komentar, halaman Wikipedia tentang 'distribusi Bimodal' mencantumkan delapan tes multimodalitas terhadap unimodalitas dan memasok referensi untuk tujuh diantaranya.

Setidaknya ada beberapa di R. Misalnya:

  1. Paket tersebut diptestmengimplementasikan uji celup Hartigan.

  2. The stampdata dalam bootstrappaket digunakan dalam Efron dan Tibshirani ini Pengantar Bootstrap (buku yang paket didasarkan) untuk melakukan contoh yang berkaitan dengan bootstrap pada jumlah mode; jika Anda memiliki akses ke buku Anda mungkin dapat menggunakan pendekatan itu.

    Efron, B. dan Tibshirani, R. (1993) Pengantar Bootstrap .
    Chapman dan Hall, New York, London.

-

Ada pertanyaan pada CV yang berbicara tentang mengidentifikasi (yaitu, memperkirakan dan bukannya menguji) jumlah mode yang muncul pada pencarian @ whuber. Ada baiknya membaca jawaban di sana. Salah satu respons di sana (milik saya, saat itu terjadi) memiliki tautan ke pencarian Google yang menghasilkan makalah ini oleh David Donoho tentang pembuatan CI satu sisi untuk sejumlah mode, yang tentu saja dapat digunakan sebagai tes (mis. , jika interval satu sisi tidak termasuk case unimodal, Anda dapat menolak unimodality). Sejauh yang saya tahu tidaksalah satu tes yang disebutkan oleh Wikipedia. Saya tidak berpikir ada implementasi R dari interval itu, tetapi (terlepas dari kenyataan bahwa Donoho cenderung menggunakan alat yang cukup canggih dalam pembahasannya) itu sebenarnya ide yang cukup sederhana untuk diterapkan. Ide itu secara langsung terkait dengan gagasan menggunakan estimasi kepadatan kernel.

Glen_b -Reinstate Monica
sumber
Itu pekerjaan yang berharga.
rolando2