Apa nama distribusi diskrit ini (persamaan perbedaan rekursif) yang saya peroleh?

11

Saya menemukan distribusi ini dalam permainan komputer dan ingin belajar lebih banyak tentang perilakunya. Itu datang dari keputusan, apakah suatu peristiwa tertentu harus terjadi setelah sejumlah tindakan pemain. Detail di luar ini tidak relevan. Tampaknya berlaku untuk situasi lain, dan saya merasa menarik karena mudah untuk menghitung dan membuat ekor panjang.

Setiap langkah , game menghasilkan angka acak seragam . Jika , maka acara tersebut dipicu. Setelah peristiwa itu terjadi, permainan mengatur ulang dan menjalankan kembali urutan tersebut. Saya hanya tertarik pada satu kejadian acara untuk masalah ini, karena itu mewakili distribusi yang digunakan permainan. (Juga, setiap pertanyaan tentang beberapa kejadian dapat dijawab dengan model kejadian tunggal.)0 X < 1 X < p ( n ) n = 0n0X<1X<p(n)n=0

"Kelainan" utama di sini adalah bahwa parameter probabilitas dalam distribusi ini meningkat seiring waktu, atau dengan kata lain, ambang batas naik seiring waktu. Dalam contoh itu berubah secara linear tetapi saya kira aturan lain bisa berlaku. Setelah langkah, atau tindakan oleh pengguna,n

p(n)=kn

untuk beberapa konstanta . Pada titik tertentu , kita mendapatkan p (n _ {\ max}) \ geq 1 . Acara dijamin hanya akan terjadi pada langkah itu.Maks 0 < k < 1 0<k<1nmaxp(nmax)1

Saya bisa menentukan itu

F ( n ) = p ( n ) + F ( n - 1 ) [ 1 - p ( n ) ] f ( n ) F ( n ) n p ( n )

f(n)=p(n)[1F(n1)]
dan untuk PMF dan CDF . Singkatnya, probabilitas bahwa peristiwa akan pada langkah ke- sama dengan probabilitas , kurang probabilitas bahwa itu telah terjadi pada langkah sebelumnya.
F(n)=p(n)+F(n1)[1p(n)]
f(n)F(n)np(n)

Berikut plot dari teman kami Monte Carlo, untuk bersenang-senang, dengan . Median berhasil ke 21 dan rata-rata ke 22. k0.003masukkan deskripsi gambar di sini

Ini secara luas setara dengan persamaan perbedaan tingkat pertama dari pemrosesan sinyal digital, yang merupakan latar belakang saya, dan saya menemukan hal itu cukup baru. Saya juga tertarik dengan gagasan bahwa dapat bervariasi sesuai dengan rumus arbitrer apa pun.p(n)

Pertanyaan saya:

  1. Apa nama distribusi ini, jika ada?
  2. Apakah ada cara untuk memperoleh ekspresi untuk tanpa referensi ke ?F ( n )f(n)F(n)
  3. Apakah ada contoh lain dari distribusi rekursif diskrit seperti ini?

Mengedit proses Klarifikasi tentang pembuatan angka acak.

jbarlow
sumber
1
Adakah alasan Anda memilih tanda kurung siku alih-alih ()?
Cam.Davidson.Pilon
1
@ Cam.Davidson.Pilon: Latar belakang DSP saya menyelinap masuk. Kita cenderung menggunakan tanda kurung siku untuk fungsi waktu diskrit. Saya kira ini pasti menggelegar jadi saya akan mengubahnya.
jbarlow
1
Proses yang Anda asumsikan tidak nampak jelas di sini. Anda mengatakan "Setiap langkah , permainan memutar angka acak Jika , maka acara tersebut dipicu." Tapi, Anda tidak memberikan spesifikasi bagaimana digambar. Saya pikir akan sangat membantu jika prosesnya dapat dijelaskan sedikit lebih tepat. X X < p ( n ) XnXX<p(n)X
kardinal
2
@ jbarlow: Maaf jika komentar saya sebelumnya tidak jelas. Jika untuk beberapa , maka tidak mungkin proses Anda dapat memiliki lebih dari langkah karena angka acak yang seragam antara nol dan satu pasti akan lebih kecil dari untuk . Kuantitas sebagai fungsi sangat erat terkait dengan apa yang disebut fungsi bahaya dalam subbidang statistik yang dikenal sebagai analisis survival . 0 < k < 1 k - 1p ( n ) n > 1 / k p ( n ) np(n)=kn0<k<1k1p(n)n>1/kp(n)n
kardinal
1
Untuk kecil , menggunakan analog diferensial dari persamaan perbedaan ini menunjukkan bahwa ( bukan !) Dekat dengan Gaussian. (Dari sini kita segera menyimpulkan, misalnya, bahwa mean harus dekat ) Harap dicatat juga, bahwa ada beberapa pembatasan (kuat) pada , untuk sebaliknya jika melebihi (yang akhirnya terjadi), tidak ada jaminan bahwa tetap kurang dari atau sama dengan . F f kF fkp(n)1F11/k=33318kp(n)1F1
whuber

Jawaban:

9

Dalam arti tertentu, apa yang telah Anda lakukan adalah mengkarakterisasi semua distribusi bernilai integer non-negatif.

Mari kita kesampingkan deskripsi proses acak sejenak dan fokus pada rekursi dalam pertanyaan.

Jika , maka tentunya . Jika kita menulis ulang rekursi kedua ini dalam hal fungsi survival (di mana memiliki distribusi ), kita mendapatkan sesuatu yang sangat sugestif dan mudah ditangani. Jelas, dan karenanya Jadi, selama urutan kita mengambil nilai dalam dan tidak konvergen terlalu cepat ke nol, maka kita akan memperoleh fungsi survival yang valid (yaitu, menurun secara monoton menjadi nol sebagai ).F n = p n + ( 1 - p n ) F n - 1 S n = 1 - F n = P ( T > n ) T F S n = 1 - F n = ( 1 - p n ) S nfn=pn(1Fn1)Fn=pn+(1pn)Fn1 Sn=1Fn=P(T>n)TFS n = n k = 0 ( 1 - p k )

Sn=1Fn=(1pn)Sn1,
( p n ) [ 0 , 1 ] n
Sn=k=0n(1pk).
(pn)[0,1]n

Lebih spesifik,

Proposisi : Urutan mengambil nilai dalam menentukan distribusi pada bilangan bulat negatif jika dan hanya jika dan semua distribusi tersebut memiliki urutan yang sesuai (meskipun mungkin tidak unik).[ 0 , 1 ] - Σ n = 0 log ( 1 - p n ) = (pn)[0,1]

n=0log(1pn)=,

Dengan demikian, rekursi yang ditulis dalam pertanyaan sepenuhnya bersifat umum : Setiap distribusi bernilai integer non-negatif memiliki urutan yang sesuai mengambil nilai adalah .[ 0 , 1 ](pn)[0,1]

Namun, kebalikannya tidak benar; yaitu, ada urutan dengan nilai dalam yang tidak sesuai dengan distribusi yang valid. (Khususnya, pertimbangkan untuk semua dan untuk )(pn)[0,1]0<pn<1nNpn=0n>N

Tapi, tunggu, masih ada lagi!

Kami telah mengisyaratkan koneksi ke analisis survival dan perlu mengeksplorasi ini sedikit lebih dalam. Dalam analisis survival klasik dengan distribusi benar-benar terus menerus dan sesuai kepadatan , yang fungsi bahaya didefinisikan sebagai Ff

h(t)=f(t)S(t).

The hazard kumulatif kemudian dan analisis sederhana derivatif menunjukkan bahwa Dari ini, kami dapat segera memberikan karakterisasi fungsi bahaya yang dapat diterima: Ini adalah fungsi apa pun yang dapat diukur sedemikian hingga untuk semua dan sebagai .Λ(t)=0th(s)ds

S(t)=exp(Λ(t))=exp(0th(s)ds).
hh(t)0t0th(s)dst

Kami mendapatkan rekursi yang serupa untuk fungsi survival dengan yang di atas dengan memperhatikan bahwa untukt>t0

S(t)=et0th(s)dsS(t0).

Amati secara khusus bahwa kita dapat memilih agar konstan sebagian dengan masing-masing bagian memiliki lebar 1 dan sedemikian rupa sehingga integral menyatu menjadi tak terbatas. Ini akan menghasilkan fungsi survival yang cocok dengan setiap bilangan bulat non-negatif yang diinginkan bernilai satu pada setiap bilangan bulat positif.h(t)S(t)

Menghubungkan kembali ke kasing diskrit

Untuk mencocokkan diskrit diinginkan pada setiap bilangan bulat, kita harus memilih fungsi bahaya yang konstan konstan sehingga pada . Hal ini memberikan bukti kedua dari kondisi yang diperlukan untuk urutan untuk menentukan distribusi valid.S(n)

h(t)=hn=log(1pn),
(n1,n](pn)

Perhatikan bahwa, untuk kecil , yang menyediakan koneksi heuristik antara fungsi bahaya dari distribusi kontinu dan distribusi diskrit dengan fungsi survival yang cocok pada bilangan bulat.pnlog(1pn)pn=fn/Sn1

Catatan tambahan : Sebagai catatan akhir, contoh dalam pertanyaan tidak memenuhi kondisi yang diperlukan tanpa modifikasi yang sesuai untuk pada dan pengaturan untuk semua .pn=knfnn=k1fn=0n>k1

kardinal
sumber
1
+1 Sangat mencerahkan. Tetapi, mengenai catatan tambahan, bagi saya tampaknya "pemotongan yang tepat" terjadi sebagai hal yang biasa untuk nilai-nilai khusus . Misalnya, dengan kita memperoleh , dan lebih umum, dengan kita mendapatkan . kk=1/2f=(0,1/2,1/2,0,)k=1/mf(m+1)=f(m+2)==0
whuber
2
@whuber: Seharusnya saya menentukan lebih jelas apa yang saya maksud dengan "pemotongan yang sesuai". Saya berpikir untuk memotong (menyusut) nilai pada titik yang ditentukan (sehingga menjadi satu). Saya pikir gagasan itu masih berlaku dalam kasus yang Anda sebutkan, hanya saja pemotongan tidak akan menghasilkan perubahan nilai . Saya akan mencoba mengklarifikasi hal ini dalam edit segera. Terima kasih! fnFnfn
kardinal
2
Jawaban yang bagus Ini sangat mendalam. Saya benar-benar tertarik melihat masalah ini terhubung dengan area dan konsep lain.
jbarlow
1
@ jbarlow: Terima kasih. Saya senang Anda menemukannya berguna! Saya senang berpikir sedikit tentang itu, karena ini pertanyaan yang bagus.
kardinal
8

Dalam kasus , kami memiliki beberapa properti yang dikenal. Kita bisa menyelesaikan hubungan perulanganp(n)=p<1

F(n)=p+F(n1)(1p);F(0)=p

punya solusinya

F(n)=P(Nn)=1(1p)n+1
yang merupakan distribusi geometris . Ini dipelajari dengan baik.

Kasus yang lebih umum dari mungkin tidak dapat dihitung dalam bentuk tertutup, dan dengan demikian kemungkinan tidak memiliki distribusi yang diketahui.p(n)

Kasus lain:

  1. p(n)=pn;p<1;F(0)=p memiliki solusi yang bukan distribusi yang umum dikenal.
    F(n)=1(1p)Γ(n+1p)Γ(1p)Γ(n+1)
  2. Tentukan (dikenal sebagai fungsi survival dalam statistik), relasi perulangan di atas berkurang ke bentuk yang lebih sederhana: S(n)=1F(n)
    S(n)=(1p(n))S(n1)
  3. Dari contoh Anda, tampaknya Anda menginginkan fungsi yang bertambah . Pilihan Anda tidak bagus secara analitik karena jeda pada . Matematikawan dan ahli statistik lebih menyukai hal-hal yang halus . Jadi saya usulkan yang dan konvergen ke 1. Memecahkan hubungan perulangan dengan , memiliki bentuk analitik yang bagus: Pertimbangkan . Fakta stat yang diketahui adalah p(n)np(n)=knp>1
    p(n)=1(1p)n+1p<1
    p(0)=pp(n)S(n)=1-F(n)=(1-p) n + 1
    F(n)=1(1p)n+1n!
    i=0S(i)=E[N]E[N]=(1-p)e(1-p)S(n)=1F(n)=(1p)n+1n!
    i=0S(i)=E[N]
    yang, jika Anda ingat beberapa kalkulus, sangat mirip dengan seri Taylor eksponensial, maka,
    E[N]=(1p)e(1p)
Cam.Davidson.Pilon
sumber
2
Cam, itu bukan fungsi bahaya., Melainkan fungsi bertahan hidup . :-)
kardinal
1
ty, * diedit untuk bertahan hidup
Cam.Davidson.Pilon