Contoh distribusi berekor berat yang tidak berekor panjang

14

Dari bacaan tentang distribusi berat , dan berekor panjang, saya mengerti bahwa semua distribusi berekor panjang adalah berekor berat , tetapi tidak semua distribusi berekor panjang berekor panjang .

Bisakah seseorang memberikan contoh:

  • fungsi densitas berkesinambungan, simetris, dan rata-rata nol yang berekor panjang
  • fungsi kepadatan rata-rata, simetris, rata-rata nol yang berekor berat tetapi tidak berekor panjang

jadi saya bisa lebih memahami arti dari definisi mereka?

Akan lebih baik jika keduanya bisa memiliki varian unit.

Toliveira
sumber
2
Di mana Anda menemukan definisi itu? Bisakah kamu memberikannya di sini? Saya memikirkan ini sebagai sinonim!
kjetil b halvorsen
@kjetilbhalvorsen: Mungkin di sini: en.wikipedia.org/wiki/…
Scortchi - Reinstate Monica
@kjetilbhalvorsen SA: Lihat, tautan E. LA: Saya sedang mempelajari definisi distribusi "berat-", "gemuk-" dan "berekor panjang", dan menemukan penjelasan yang berguna di: (A) [ stats.stackexchange.com/ pertanyaan / 10726 / ... , (B) [ en.wikipedia.org/wiki/Heavy-tailed_distribution] , (C) [ users.cms.caltech.edu/ ~adamw / papers/… , (lanjutan)
toliveira
(lanjutan) (E) math.stackexchange.com/questions/685921/... Saya mengerti bahwa (i) distribusi berat berekor didefinisikan dalam A, B, C, D, E, (ii) distribusi berekor panjang didefinisikan seperti dalam B, C, E (iii) definisi lemak-longgar, seperti yang dijelaskan dalam A.
toliveira

Jawaban:

16

Kedua definisi tersebut dekat, tetapi tidak persis sama. Satu perbedaan terletak pada perlunya rasio kelangsungan hidup untuk memiliki batas.

Untuk sebagian besar jawaban ini saya akan mengabaikan kriteria untuk distribusi yang kontinu, simetris, dan terbatas, karena ini mudah dicapai setelah kami menemukan setiap terbatas-varian distribusi berat berekor yang tidak berekor panjang.


Sebuah distribusi adalah berat-tailed saat untuk setiap t > 0 ,Ft>0

(1)RetxdF(x)=.

Distribusi dengan fungsi survival adalah ekor panjang ketikaGF=1F

(2)limxGF(x+1)GF(x)=1.

Distribusi ekor panjang itu berat. Lebih lanjut, karena tidak meningkat, batas rasio ( 2 ) tidak dapat melebihi 1 . Jika ada dan kurang dari 1 , maka G menurun secara eksponensial - dan itu akan memungkinkan integral ( 1 )G(2)11G(1) untuk bertemu.

Satu-satunya cara untuk menunjukkan distribusi berekor berat yang tidak berekor panjang, maka, adalah dengan mengubah distribusi berekor panjang sehingga terus bertahan sementara ( 2 ) dilanggar. Sangat mudah untuk mengacaukan batas: ubah di banyak tempat tanpa batas yang tak terhingga. Namun, hal itu akan membutuhkan beberapa hal dengan F , yang harus tetap meningkat dan menjadi cadlag. Salah satu caranya adalah dengan memperkenalkan beberapa lompatan ke atas dalam F , yang akan membuat G melompat ke bawah, menurunkan rasio G F ( x + 1 ) / G F ((1)(2)FFGGF(x+1)/GF(x) . Untuk tujuan ini, mari kita mendefinisikan transformasi yang bergantianTu ke dalam fungsi distribusi lain yang valid sekaligus menciptakan tiba-tiba melompat di nilai u , mengatakan lonjakan setengah dari F ( u ) ke 1 :FuF(u)1

Tu[F](x)={F(x)u<x12(1F(x))+F(x)ux

Ini tidak mengubah properti dasar : T u [ F ] masih merupakan fungsi distribusi.FTu[F]

Efek pada adalah untuk membuat drop oleh faktor 1 / 2 di u . Oleh karena itu, karena G tidak menurun, maka setiap kali u - 1 x < u ,GF1/2uGu1x<u

GTu[F](x+1)GTu[F](x)12.

Jika kita memilih urutan peningkatan i dan i , i = 1 , 2 , , dan menerapkan setiap T u i secara berurutan, ia menentukan urutan distribusi F i dengan F 0 = F danuii=1,2,TuiFiF0=F

Fi+1=Tui[Fi]

for i1. After the ith step, Fi(x),Fi+1(x), all remain the same for x<ui. Consequently the sequence of Fi(x) is a nondecreasing, bounded, pointwise sequence of distribution functions, implying its limit

F=limiFi

is a distribution function. By construction, it is not long-tailed because there are infinitely many points at which its survival ratio GF(x+1)/GF(x)) drops to 1/2 or below, showing it cannot have 1 as a limit.

Figure 1: An altered survival function

This plot shows a survival function G(x)=x1/5 that has been cut down in this manner at points u112.9,u240.5,u3101.6,. Note the logarithmic vertical axis.

The hope is to be able to choose (ui) so that F remains heavy-tailed. We know, because F is heavy-tailed, that there are numbers 0=u0<u1<u2<<un for which

ui1uiex/idF(x)2i1

i12i1Fuii1dF(x)dFj(x)ji2i11

Figure 2: A cut-down density function

xf(x) for densities f corresponding to the previous survival function and its "cut down" version. The areas under this curve contribute to the expectation. The area from 1 to u1 is 1; the area from u1 to u2 is 2, which when cut down (to the lower blue portion) becomes an area of 1; the area from u2 to u3 is 4, which when cut down becomes an area of 1, and so on. Thus, the area under each successive "stair step" to the right is 1.

Let us pick such a sequence (ui) to define F. We can check that it remains heavy-tailed by picking t=1/n for some whole number n and applying the construction:

RetxdF(x)=Rex/ndF(x)=i=1ui1uiex/ndF(x)i=n+1ui1uiex/ndF(x)i=n+1ui1uiex/idF(x)=i=n+1ui1uiex/idFi(x)i=n+11,

which still diverges. Since t is arbitrarily small, this demonstrates that F remains heavy-tailed, even though its long-tailed property has been destroyed.

Figure 3: plot of G(1+x)/G(x)

This is a plot of the survival ratio G(x+1)/G(x) for the cut down distribution. Like the ratio of the original G, it tends toward an upper accumulation value of 1--but for unit-width intervals terminating at the ui, the ratio suddenly drops to only half of what it originally was. These drops, although becoming less and less frequent as x increases, occur infinitely often and therefore prevent the ratio from approaching 1 in the limit.


If you would like a continuous, symmetric, zero-mean, unit-variance example, begin with a finite-variance long-tailed distribution. F(x)=1xp (for x>0) will do, provided p>1; so would a Student t distribution for any degrees of freedom exceeding 2. The moments of F cannot exceed those of F, whence it too has finite variance. "Mollify" it via convolution with a nice smooth distribution, such as a Gaussian: this will make it continuous but will not destroy its heavy tail (obviously) nor the absence of a long tail (not quite as obvious, but it becomes obvious if you change the Gaussian to, say, a Beta distribution whose support is compact).

Symmetrize the result--which I will still call F--by defining

Fs(x)=12(1+sgn(x)F(|x|))

for all xR. Its variance will remain finite, so it can be standardized to the desired distribution.

whuber
sumber
2
Brilliantly explained. You offered not just an example but also the justification for it. The clarity of the explanation allowed me to understand (almost) the whole of it. I will practice it in some numerical examples.
toliveira