Distribusi binomial negatif vs distribusi binomial

22

Apa perbedaan antara distribusi binomial negatif dan distribusi binomial?

Saya mencoba membaca online, dan saya menemukan bahwa distribusi binomial negatif digunakan ketika titik data terpisah, tetapi saya pikir bahkan distribusi binomial dapat digunakan untuk titik data terpisah.

alily
sumber
5
Mereka berdua diskrit.
Glen_b -Reinstate Monica
5
Ilustrasi sederhana: Anda menjual permen dari pintu ke pintu. Di setiap pintu yang Anda ketuk, Anda memiliki peluang 1/4 menjual 1 batang permen dan probabilitas 3/4 atau menjual 0 batang permen. Peluang Anda untuk menjual n bar jika Anda mengetuk 50 pintu adalah distribusi binomial dalam n. Peluang Anda untuk mengetuk m door untuk menjual 30 bar adalah distribusi binomial negatif di m. Perhatikan bahwa yang pertama memotong di 50 karena Anda tidak bisa menjual lebih dari 50 bar, sedangkan yang terakhir memiliki ekor di infinity karena Anda hanya bisa memiliki keberuntungan yang mengerikan hari itu dan tidak pernah menjual bar ke-30.
Jerry Guern

Jawaban:

30

Perbedaannya adalah apa yang kami minati. Kedua distribusi dibangun dari uji coba Bernoulli independen dengan probabilitas keberhasilan yang tetap, hal .

Dengan distribusi Binomial, variabel acak X adalah jumlah keberhasilan yang diamati dalam n percobaan. Karena ada jumlah percobaan yang tetap, nilai X yang mungkin adalah 0, 1, ..., n .

Dengan distribusi Binomial Negatif, variabel random Y adalah jumlah percobaan sampai mengamati r kesuksesan th diamati. Dalam hal ini, kami terus meningkatkan jumlah uji coba hingga mencapai r kesuksesan. Nilai yang mungkin dari Y adalah r , r + 1 , r + 2 , ... tanpa batas atas. Binomial Negatif juga dapat didefinisikan dalam hal jumlah kegagalan hingga keberhasilan ke- r , daripada jumlah uji coba hingga keberhasilan ke- r . Wikipedia mendefinisikan distribusi Binomial Negatif dengan cara ini.

Jadi untuk meringkas:

Binomial :

  • Memperbaiki jumlah percobaan ( n )
  • Probabilitas keberhasilan tetap ( p )
  • Variabel acak adalah X = Jumlah keberhasilan.
  • Nilai yang mungkin adalah 0 ≤ Xn

Binomial Negatif :

  • Jumlah keberhasilan tetap ( r )
  • Probabilitas keberhasilan tetap ( p )
  • Variabel acak adalah Y = Jumlah percobaan hingga keberhasilan ke- r .
  • Nilai yang mungkin adalah rY

Terima kasih kepada Ben Bolker untuk mengingatkan saya untuk menyebutkan dukungan dari dua distribusi. Dia menjawab pertanyaan terkait di sini .

Jelsema
sumber
4
diskusi lebih lanjut tentang NB di sini: stats.stackexchange.com/questions/6728/… . Mungkin perlu dicatat bahwa respons binomial dibatasi [0, N], respons NB tidak terikat [0, ...]
Ben Bolker
Poin bagus, saya sudah memperbarui jawaban saya untuk memasukkan ini.
Jelsema
terima kasih jelsema untuk jawaban terperinci, saya bisa memahaminya lebih baik sekarang
alily
19

Distribusi binomial negatif, meskipun nampak jelas hubungannya dengan binomial, sebenarnya lebih baik dibandingkan dengan distribusi Poisson. Ketiganya terpisah, btw.

λλ

Jika data Anda menunjukkan bahwa varians lebih besar dari mean (overdispersion), ini mengesampingkan Poisson, maka binomial negatif akan menjadi distribusi berikutnya untuk dilihat. Ini memiliki lebih dari satu parameter, sehingga variansnya dapat lebih besar dari rata-rata.

Hubungan NB dengan binomial berasal dari proses yang mendasarinya, seperti yang dijelaskan dalam jawaban @ Jelsema. Prosesnya terkait, jadi distribusinya juga, tetapi seperti yang saya jelaskan di sini, tautan ke distribusi Poisson lebih dekat dalam aplikasi praktis.

PEMBARUAN: Aspek lain adalah parameterisasi. Distribusi binomial memiliki dua parameter: p dan n. Domain bonafidnya adalah 0 hingga n. Dalam hal ini tidak hanya diskrit, tetapi juga didefinisikan pada himpunan angka yang terbatas.

λn

Aksakal
sumber
3
Saya tidak mengerti apa yang Anda maksud dengan "lebih baik dibandingkan dengan distribusi Poisson." Pertanyaan aslinya tidak mengatakan model seperti apa yang diinginkan. Bahkan tidak menyiratkan bahwa orang tertarik pada pemodelan sama sekali.
heropup
@heropup, OP jelas tertarik pada aplikasi, dan langsung membandingkan NB ke Binomial. Oleh karena itu, jawaban saya adalah tentang perbandingan itu, dan perbandingan dengan Poisson lebih relevan dalam aplikasi tipikal.
Aksakal
7

Keduanya diskrit dan mewakili jumlah saat Anda mengambil sampel.

DNS=(DDD,DDN,DND,DNN,NDD,NDN,NND,NNN)

S=(D,ND,NND,NNND,...)

hal

Bahgat Nassour
sumber