Apakah ada distribusi berbentuk dataran tinggi?

30

Saya mencari distribusi di mana kepadatan probabilitas berkurang dengan cepat setelah beberapa titik menjauh dari rata-rata, atau dengan kata-kata saya sendiri "distribusi berbentuk dataran tinggi".

Sesuatu di antara Gaussian dan seragam.

distributions normal-distribution uniform dontloo
sumber

8

Anda bisa menjumlahkan RV Gaussian dan RV seragam.

StrongBad

3

Seseorang kadang mendengar tentang apa yang disebut distribusi platykurtic .

JM bukan ahli statistik

53

Anda mungkin mencari distribusi yang dikenal dengan nama normal umum (versi 1) , distribusi Subbotin , atau distribusi daya eksponensial. Ini ditentukan oleh lokasi , skala dan bentuk dengan pdf $\mu$ $\sigma$ $\beta$

\frac{β}{2 σ Γ (1 / β)} \exp [- {(\frac{| x - μ |}{σ})}^{β}]

$\frac{\beta}{2\sigma\Gamma(1/\beta)} \exp\left[-\left(\frac{|x-\mu|}{\sigma}\right)^{\beta}\right]$

seperti yang Anda perhatikan, untuk itu menyerupai dan menyatu dengan distribusi Laplace, dengan konvergennya menjadi normal, dan ketika ke distribusi seragam. $\beta=1$ $\beta=2$ $\beta = \infty$

Jika Anda mencari perangkat lunak yang telah mengimplementasikannya, Anda dapat memeriksa normalpperpustakaan untuk R (Mineo dan Ruggieri, 2005). Yang menyenangkan dari paket ini adalah, antara lain, ia mengimplementasikan regresi dengan kesalahan umum yang didistribusikan secara umum, yaitu meminimalkan norma . $L_p$

Mineo, AM, & Ruggieri, M. (2005). Alat perangkat lunak untuk distribusi daya eksponensial: Paket normalp. Jurnal Perangkat Lunak Statistik, 12 (4), 1-24.

Tim
sumber

20

Komentar @ StrongBad adalah saran yang sangat bagus. Jumlah RV dan gaussian RV yang seragam dapat memberikan apa yang Anda cari jika Anda memilih parameter dengan benar. Dan itu sebenarnya memiliki solusi bentuk tertutup yang cukup bagus.

Pdf dari variabel ini diberikan oleh ekspresi:

\frac{1}{4 Sebuah} [e r f (\frac{x + Sebuah}{σ \sqrt{2}}) - e r f (\frac{x - Sebuah}{σ \sqrt{2}})]

$\dfrac{1}{4a}\left[\mathrm{erf}\left(\dfrac{x+a}{\sigma\sqrt{2}}\right)-\mathrm{erf}\left(\dfrac{x-a}{\sigma\sqrt{2}}\right) \right]$

$a$ adalah "jari-jari" dari RV seragam rata-rata nol. adalah standar deviasi dari RV gaussian rata-rata. $\sigma$

Steve Cox
sumber

3

Referensi: Bhattacharjee, GP, Pandit, SNN, dan Mohan, R. 1963. Rantai dimensi yang melibatkan distribusi kesalahan persegi panjang dan normal. Technometrics, 5, 404-406.

Tim

15

Ada jumlah tak terbatas dari distribusi "berbentuk dataran tinggi".

Apakah Anda mencari sesuatu yang lebih spesifik daripada "di antara Gaussian dan seragam"? Itu agak kabur.

Ini salah satu yang mudah: Anda selalu bisa menempel setengah normal di setiap ujung seragam:

Anda dapat mengontrol "lebar" seragam relatif terhadap skala normal sehingga Anda dapat memiliki dataran tinggi yang lebih luas atau lebih sempit, memberikan seluruh kelas distribusi, termasuk Gaussian dan seragam sebagai pembatas kasus.

Kepadatannya adalah:

$\frac{h}{\sqrt{2\pi}\sigma} e^{-\frac{1}{2\sigma^2}(x-\mu+w/2)^2} \mathbb{I}_{x\leq \mu-w/2} \\ + \:\frac{h}{\sqrt{2\pi}\sigma}\quad\mathbb{I}_{\mu-w/2< x\leq \mu+w/2} \\ + \frac{h}{\sqrt{2\pi}\sigma} e^{-\frac{1}{2\sigma^2}(x-\mu-w/2)^2} \mathbb{I}_{x > \mu+w/2}$

dimana $h = \frac{1}{1 + w/(\sqrt{2\pi}\sigma)}$

Sebagai untuk fixed , kita mendekati seragam pada dan sebagai untuk fixed kita mendekati . $\sigma \to 0$ $w$ $(\mu-w/2,\mu+w/2)$ $w \to 0$ $\sigma$ $N(\mu,\sigma^2)$

Berikut adalah beberapa contoh (dengan dalam setiap kasus): $\mu=0$

Kita mungkin menyebut kepadatan ini sebagai "seragam berekor Gaussian".

Glen_b -Reinstate Monica
sumber

1

Ach! Saya suka menghadiri bola resmi mengenakan seragam ekor Gausian! ;)

Alexis

7

Lihat distribusi "Menara Iblis" saya di sini [1]:

$f(x) = 0.3334$ $|x| < 0.9399$
$f(x) = 0.2945/x^2$ $0.9399 \leq |x| < 2.3242$
$f(x) = 0$ $2.3242 \leq |x|$

Distribusi "slip-dress" bahkan lebih menarik.

Sangat mudah untuk membangun distribusi yang memiliki bentuk apa pun yang Anda inginkan.

[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP"
Am. Stat. 68 (3): 191–195. doi: 10.1080 / 00031305.2014.917055
akses publik pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf

Peter Westfall
sumber

Hai Peter - Saya mengambil kebebasan memberikan fungsi dan memasukkan gambar serta memberikan referensi lengkap. (Jika ingatanku, saya pikir Kendall dan Stuart memberikan rincian dari sanggahan yang sama dalam teks klasik mereka. Jika saya ingat dengan benar - sudah lama - saya percaya mereka juga membahas bahwa itu bukan sifat berekor berat)

Glen_b -Reinstate Monica

Terima kasih, Glen_b. Saya tidak pernah mengatakan kurtosis mengukur apa yang diukur oleh angka-angka indeks ekor. Sebaliknya, artikel saya membuktikan kurtosis adalah, untuk kelas distribusi yang sangat luas, hampir sama dengan E (Z ^ 4 * I (| Z |> 1)). Dengan demikian, kurtosis dengan jelas tidak memberi tahu Anda tentang 'puncak', yang biasanya ditemukan dalam kisaran {Z: | Z | <1}. Sebaliknya, sebagian besar ditentukan oleh ekor. Sebut saja E (Z ^ 4 * I (| Z |> 1)) jika istilah "heavy-tailedness" memiliki arti lain.

Peter Westfall

Juga, @Glen_b indeks ekor mana yang Anda maksud? Ada banyak sekali. Penyeberangan ekor tidak mendefinisikan "tailedness" dengan benar. Menurut beberapa definisi tailing cross tail, N (0,1) lebih "berekor berat" daripada 0,9999 * U (-1,1) + .0001 * U (-1000,1000), meskipun yang terakhir adalah ekornya jelas lebih berat, meski memiliki ekor yang terbatas. Dan, BTW, yang terakhir memiliki kurtosis yang sangat tinggi, tidak seperti N (0,1).

Peter Westfall

Saya tidak dapat menemukan saya mengatakan "indeks ekor" di mana pun di komentar saya; Saya tidak yakin apa yang Anda maksud di sana ketika Anda mengatakan "indeks ekor mana yang Anda maksud". Jika yang Anda maksudkan sedikit tentang kekejaman berat, hal terbaik untuk dilakukan adalah memeriksa apa yang sebenarnya dikatakan Kendall dan Stuart; Saya percaya di sana mereka benar-benar membandingkan rasio kepadatan asimptotik untuk variabel standar simetris, tetapi mungkin fungsi yang bertahan mungkin; intinya adalah milik mereka, bukan milikku

Glen_b -Reinstate Monica

Aneh. Bagaimanapun, Kendall dan Stuart salah. Kurtosis jelas ukuran berat ekor seperti yang dibuktikan oleh teorema saya.

Peter Westfall

5

$f(x)$

f (x) = k \frac{1}{1 + x^{2 Sebuah}} untuk x \in R

$f(x) = k \frac{1}{1 + x^{2 a}} \quad \quad \text{for } x \in \mathbb{R}$

dimana:

$a$
$k$ $k = \frac{a}{\pi} \sin \left(\frac{\pi}{2 a}\right)$

$a$

.

$a$

serigala
sumber

3

Satu lagi ( EDIT : Saya menyederhanakannya sekarang. EDIT2 : Saya menyederhanakannya lebih jauh, meskipun sekarang gambar tidak benar-benar mencerminkan persamaan yang tepat ini):

f (x) = \frac{1}{3 \cdot α} \cdot \log (\frac{tongkat pendek (α \cdot Sebuah) + tongkat pendek (α \cdot x)}{tongkat pendek (α \cdot b) + tongkat pendek (α \cdot x)})

$f(x) = \frac{1}{3 \cdot \alpha} \cdot \log{\left( \frac{\cosh{\left(\alpha \cdot a\right)}+ \cosh{\left(\alpha \cdot x\right)}} {\cosh{\left(\alpha \cdot b\right)}+ \cosh{\left(\alpha \cdot x\right)}} \right)}$

$\log(\cosh(x))$ $x$

$alpha$ $a = 2$ $b = 1$

Berikut ini beberapa contoh kode dalam R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fadalah distribusi kami. Mari kita plot untuk urutanx

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Output konsol:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

Dan plot:

Anda dapat mengubah adan b, kira-kira awal dan akhir lereng masing-masing, tetapi kemudian diperlukan normalisasi lebih lanjut, dan saya tidak menghitungnya (itu sebabnya saya menggunakan a = 2dan b = 1dalam plot).

Pembakar
sumber

2

Jika Anda mencari sesuatu yang sangat sederhana, dengan dataran tinggi tengah dan sisi-sisi distribusi segitiga, Anda dapat misalnya menggabungkan distribusi segitiga N, N tergantung pada rasio yang diinginkan antara dataran tinggi dan keturunan. Mengapa segitiga, karena fungsi pengambilan sampelnya sudah ada di sebagian besar bahasa. Anda mengurutkan secara acak dari salah satunya.

Dalam R yang akan memberi:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

agenis
sumber

2

Inilah yang cantik: produk dari dua fungsi logistik.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Ini memiliki manfaat tidak menjadi bagian.

B mengatur lebar dan A mengatur kecuraman drop off. Di bawah ini ditunjukkan B = 1: 6 dengan A = 2. Catatan: Saya belum meluangkan waktu untuk mencari cara menormalkan ini dengan benar.

Adjwilley
sumber

Apakah ada distribusi berbentuk dataran tinggi?

Jawaban: