Mengapa semua distribusi dikenal unimodal?

13

Saya tidak tahu distribusi multimoda.

Mengapa semua distribusi dikenal unimodal? Apakah ada distribusi "terkenal" yang memiliki lebih dari satu mode?

Tentu saja, campuran distribusi seringkali multimodal, tetapi saya ingin tahu apakah ada distribusi "non-campuran" yang memiliki lebih dari satu mode.

Miroslav Sabo
sumber
5
Anda berbicara tentang distribusi "standar" daripada distribusi "dikenal"
Stéphane Laurent
12
Bagaimana dengan beta dengan α=β=0,5 ?
Amuba kata Reinstate Monica
1
Jika Anda tidak keberatan dengan distribusi bimodal terbatas , Wikipedia juga menyebutkan distribusi U-kuadratik dan arcsine . Saya pikir ini hanya kasus khusus dari distribusi beta ... Wikipedia juga menyebutkan beberapa contoh kejadian alami dari distribusi multimoda .
Nick Stauner
12
@ StéphaneLaurent: Saya suka "distribusi nama-merek" , karena menyampaikan bahwa namanya tidak dengan sendirinya menyiratkan status khusus untuk suatu distribusi. Distribusi "Diketahui" membuatnya terdengar seperti yang lain mungkin di luar sana menunggu untuk ditemukan, seperti monster Loch-Ness atau materi gelap.
Scortchi
5
Excellent @Scortchi, kosa kata yang bagus! Banyak ilmuwan non-matematikawan yang saya temui berada di bawah kesan bahwa distribusi tanpa nama tidak ada. Mungkin ada fakta filosofis yang lebih dalam terkait di balik itu, kebingungan nama dan hal yang dilambangkan dengan nama ini (seperti kata Russell, "Kata 'anjing' tidak memiliki kemiripan dengan anjing,")
Stéphane Laurent

Jawaban:

17

Bagian pertama dari pertanyaan dijawab dalam komentar untuk pertanyaan: banyak "merek-nama" distribusi adalah multimodal, seperti setiap Beta (Sebuah,b) distribusi dengan Sebuah<1 dan b<1 . Mari kita beralih ke bagian kedua dari pertanyaan.

Semua distribusi diskrit adalah campuran jelas (dari atom, yang unimodal).

Saya akan menunjukkan bahwa sebagian besar distribusi kontinu juga merupakan campuran dari distribusi unimodal. Intuisi di balik ini sederhana: kita dapat "mengampelas" benjolan dari grafik bergelombang dari PDF, satu per satu, sampai grafik horizontal. Benjolan menjadi komponen campuran, yang masing-masing jelas unimodal.

Akibatnya, kecuali mungkin untuk beberapa distribusi tidak biasa yang PDFnya sangat terputus-putus, jawaban atas pertanyaannya adalah "tidak ada": semua distribusi multimodal yang benar-benar kontinu, diskrit, atau kombinasi keduanya adalah campuran dari distribusi unimodal.


Pertimbangkan distribusi kontinu yang PDF f kontinu (ini adalah "benar-benar berkelanjutan" distribusi). (Kontinuitas tidak banyak batasan; ia dapat dilonggarkan lebih lanjut dengan analisis yang lebih hati-hati, dengan hanya menganggap bahwa titik diskontinuitas itu terpisah.) Ff

Untuk mengatasi "dataran tinggi" dari nilai konstan yang mungkin terjadi, tentukan "mode" menjadi interval (yang mungkin merupakan titik tunggal di mana x l = x u ) sedemikian rupa sehinggam=[xl,xkamu]xl=xkamu

  1. memiliki nilai konstan pada m , katakanlah y .fm,y

  2. tidak konstan pada interval apa pun yang secara ketat mengandung m .fm

  3. Ada angka positif sehingga nilai maksimum f yang diperoleh pada [ x l - ϵ , x u + ϵ ] sama dengan y .ϵf[xl-ϵ,xkamu+ϵ]y

Biarkan menjadi mode apa pun dari f . Karena f adalah kontinu, terdapat interval [ x l , x u ] yang mengandung m yang mana f tidak bertambah dalam [ x l , x l ] (yang merupakan interval yang tepat, bukan hanya titik) dan tidak bertambah dalam [ x kamu , x kamu ]m=[xl,xkamu]ff[xl,xkamu]mf[xl,xl][xkamu,xkamu](yang juga merupakan interval yang tepat). Biarkan menjadi tak terhingga dari semua nilai tersebut dan x u supremum dari semua nilai tersebut.xlxkamu

Konstruksi ini telah menetapkan satu "punuk" pada grafik memanjang dari x l ke x u . Biarkan y menjadi lebih besar dari f ( x l ) dan f ( x u ) . Dengan konstruksi, himpunan titik x dalam [ x l , x u ] yang f ( x ) y adalah interval yang tepat m fxlxkamuyf(xl)f(xkamu)x[xl,xkamu]f(x)ymsecara ketat mengandung (karena mengandung seluruh [ x l , x l ] atau [ x u , x u ] ).m[xl,xl][xkamu,xkamu]

Angka

Dalam ilustrasi PDF multimoda ini, mode diidentifikasi oleh titik merah pada sumbu horizontal. Tingkat horizontal dari bagian merah dari fill adalah interval m : itu adalah dasar punuk yang ditentukan oleh mode m . Basis punuk itu berada di ketinggian y 0,16 . PDF asli adalah jumlah dari isian merah dan isian biru. Perhatikan bahwa isian biru hanya memiliki satu mode di dekat 2 ; mode asli pada [ 0 , 0 ] telah dihapus.m=[0,0]mmy0,162[0,0]

Menulis untuk panjang m , tentukan|m|m

halm=PrF(m)-y|m|

dan

fm(x)=f(x)-yhalm

ketika dan f m ( x ) = 0 sebaliknya. (Ini menjadikan f m fungsi kontinu, secara kebetulan.) Pembilangnya adalah jumlah dimana f naik di atas y dan penyebut p m adalah area antara grafik f dan y . Jadi f m adalah non-negatif dan memiliki luas total 1 : itu adalah PDF dari distribusi probabilitas. Oleh konstruksi itu memiliki mode unik m .xmfm(x)=0fmfyhalmfyfm1m

Juga oleh konstruksi, fungsinya

fm(x)=f(x)-halmfm(x)1-halm

adalah PDF yang disediakan . (Tentunya jika p m = 1 tidak ada yang tersisa dari f , yang pasti unimodal untuk memulai dengan.) Selain itu, ia tidak memiliki modus dalam interval m ' (di mana itu adalah konstan, yang mengapa definisi hati sebelumnya dari mode sebagai interval diperlukan). Selanjutnya,halm<1halm=1f,m

f(x)=halmfm(x)+(1-halm)fm(x)

adalah campuran dari unimodal PDF dan PDF f ' m .fmfm

Iterasi prosedur ini dengan (yang sebagai kombinasi linear fungsi kontinu masih merupakan fungsi kontinu, memungkinkan kita untuk melanjutkan seperti sebelumnya), menghasilkan urutan mode m = m 1 , m 2 , ... ; urutan bobot yang sesuai p 1 = p m , p 2 = p m 2 , ; dan PDF f 1 = f m , f 2 = f m 2 , .fmm=m1,m2,...hal1=halm,hal2=halm2,...f1=fm,f2=fm2,.... Hasil pembatas ada karena (a) interval di mana diratakan termasuk interval yang tepat yang belum diratakan dalam operasi i - 1 sebelumnya dan (b) bilangan real tidak dapat didekomposisi menjadi lebih dari jumlah interval yang dapat dihitung seperti itu. . Batas tidak dapat memiliki mode apa pun dan oleh karena itu konstan, yang harus nol (karena jika tidak, integralnya akan berbeda). Akibatnya, f telah dinyatakan (mungkin tidak unik, karena urutan mode yang dipilih akan penting) sebagai campuranfsayasaya-1f

f(x)=sayahalsayafsaya(x)

distribusi unimodal, QED.

whuber
sumber
7

Dengan unimodal, saya pikir OP jelas berarti bahwa hanya ada satu mode interior (yaitu tidak termasuk solusi sudut). Pertanyaannya dengan demikian benar-benar bertanya ...

mengapa distribusi nama merek TIDAK memiliki lebih dari satu mode interior?

yaitu mengapa sebagian besar distribusi nama merek terlihat seperti ini:

masukkan deskripsi gambar di sini

... plus atau minus beberapa kemiringan atau beberapa ketidaksinambungan? Ketika pertanyaan diajukan demikian, distribusi Beta tidak akan menjadi contoh balasan yang valid.

Tampaknya dugaan OP memiliki beberapa validitas: distribusi nama merek paling umum tidak memungkinkan lebih dari satu mode interior. Mungkin ada alasan teoretis untuk ini. Misalnya, distribusi apa pun yang merupakan anggota keluarga Pearson (yang mencakup Beta) harus (interior) unimodal, sebagai konsekuensi dari persamaan diferensial orangtua yang mendefinisikan seluruh keluarga. Dan keluarga Pearson bersarang sebagian besar nama merek paling terkenal.

Namun demikian, berikut adalah beberapa contoh penghitung nama merek ...

Contoh penghitung

Salah satu contoh merek-nama adalah Sinc2 distribusi dengan pdf:

f(x)=dosa2(x)πx2

didefinisikan pada garis nyata. Berikut ini adalah plot dariSinc2 pdf:

masukkan deskripsi gambar di sini

We could also perhaps add the family of cardiod and distributions related to this class ... with pdf plots such as:

masukkan deskripsi gambar di sini

Keluarga distribusi nama merek yang direfleksikan juga mungkin akan menjadi pesaing nama merek (meskipun, ini mungkin dianggap sebagai 'solusi curang' ... tetapi mereka masih merupakan nama merek) seperti Refleksi Weibull yang diperlihatkan di sini:

masukkan deskripsi gambar di sini

serigala
sumber
1
Saya, plot dari Sinc2yakin sepertinya memiliki beberapa nilai negatif! (Mungkinkah itu artefak yang sedang merencanakan?) ... Dan distribusi cardioid terlihat seperti masing-masing hanya memiliki satu mode interior.
Whuber
1
Hai @whuber ... harus menyetujui artefak plotting (saya akan membahasnya di Mathematica SE!). Keluarga Re cardiod: ide adalah bahwa seseorang dapat memperluas domain keluarga seperti tolong, dan seperti gelombang sinus, ia terus memberi :)
serigala
1
(+1) Ini adalah artefak yang aneh: plot terakhir Anda (dari distribusi yang dipantulkan) tampaknya tidak menunjukkannya. Anda dapat melacak pembuatan titik plot diSinc2merencanakan untuk melihat di mana mereka berada; Saya menduga nilai negatif yang sedikit mungkin merupakan overshooting dari spline sejumlah kecil poin.
whuber
Saya pikir itu hanya karena garis yang diplot lebih tebal dari garis sumbu, sehingga muncul untuk 'melampaui' sumbu ketika mendekati nol. Jika garis diplot lebih tipis, artefak menghilang.
serigala
Tetapi tidak ada artefak seperti itu di gambar bawah Anda, yang juga memiliki garis lebih tebal dari sumbu.
whuber
3

Bahwa Anda mungkin tidak memikirkan apa pun tidak berarti tidak ada.

Saya dapat memberi nama distribusi "dikenal" yang bukan unimodal.

Misalnya, distribusi Beta dengan α dan β kedua <1.

http://en.wikipedia.org/wiki/Beta_distribution

lihat juga

http://en.wikipedia.org/wiki/U-quadratic_distribution

(Ini bukan kasus khusus dari distribusi beta, terlepas dari komentar yang mengatakan itu. Kedua keluarga memiliki beberapa tumpang tindih, namun.)

Distribusi campuran sudah pasti diketahui, dan banyak di antaranya bersifat multimodal.

Glen_b -Reinstate Monica
sumber
U-kuadrat adalah distribusi Beta terpotong.
becko
1

Distribusi alfa-miring-normal (Elal-Olivero 2010) memiliki PDF:

(1-αx-μσ)2+12+α2φ(x-μσ),

dimana φ adalah PDF dari Gaussian standar.

Untuk |α|>1.34distribusinya adalah bimodal. Contoh plot untukμ=1,σ=0,5,Sebuah=2:

masukkan deskripsi gambar di sini

corey979
sumber