Distribusi t memiliki ekor lebih berat dari distribusi normal

10

Dalam catatan kuliah saya dikatakan,

Distribusi t terlihat normal, meskipun dengan ekor yang sedikit lebih berat.

Saya mengerti mengapa itu akan terlihat normal (karena Central Limit Theorem). Tetapi saya mengalami kesulitan memahami bagaimana secara matematis membuktikan bahwa ia memiliki ekor yang lebih berat daripada distribusi normal dan jika ada cara untuk mengukur sejauh mana itu lebih berat daripada distribusi normal.

hmi2015
sumber

Jawaban:

12

Hal pertama yang harus dilakukan adalah memformalkan apa yang kita maksud dengan "ekor yang lebih berat". Orang dapat melihat seberapa tinggi kepadatan di ekor ekstrim setelah menstandarkan kedua distribusi untuk memiliki lokasi dan skala yang sama (mis. Standar deviasi):

masukkan deskripsi gambar di sini
(dari jawaban ini, yang juga agak relevan dengan pertanyaan Anda )

[Untuk kasus ini, penskalaan tidak terlalu penting pada akhirnya; t masih akan "lebih berat" dari normal bahkan jika Anda menggunakan skala yang sangat berbeda; yang normal selalu lebih rendah pada akhirnya]

Namun, definisi itu - walaupun berfungsi baik untuk perbandingan khusus ini - tidak menyamaratakan dengan sangat baik.

Secara umum, definisi yang jauh lebih baik ada di jawaban whuber di sini . Jadi jika lebih berat dari X , karena t menjadi cukup besar (untuk semua t > beberapa t 0 ), maka S Y ( t ) > S X ( t ) , di mana S = 1 - F , di mana F adalah cdf (untuk ekor yang lebih berat di sebelah kanan; ada definisi yang serupa dan jelas di sisi lain).YXtt>t0SY(t)>SX(t)S=1FF

masukkan deskripsi gambar di sini

Ini dia pada skala log, dan pada skala kuantil dari normal, yang memungkinkan kita untuk melihat lebih detail:

masukkan deskripsi gambar di sini

Jadi, "bukti" dari ekor yang lebih berat akan melibatkan membandingkan cdf dan menunjukkan bahwa ekor atas dari t-cdf akhirnya selalu terletak di atas yang normal dan ekor yang lebih rendah dari t-cdf akhirnya selalu berada di bawah yang normal.

Dalam hal ini hal yang mudah dilakukan adalah membandingkan kepadatan dan kemudian menunjukkan bahwa posisi relatif yang sesuai dari cdfs (/ fungsi penyintas) harus mengikuti dari itu.

Jadi misalnya jika Anda dapat berdebat bahwa (pada beberapa diberikan )ν

x2(ν+1)log(1+x2ν)>2log(k)

untuk konstanta diperlukan (fungsi ν ), untuk semua x > beberapa x 0 , maka akan mungkin untuk membuat ekor yang lebih berat untuk t ν juga pada definisi dalam hal lebih besar 1 - F (atau lebih besar F pada ekor kiri).kνx>x0tν1FF

(formulir ini mengikuti dari perbedaan log kepadatan, jika itu memegang hubungan yang diperlukan antara kepadatan memegang)

[Sebenarnya memungkinkan untuk menunjukkannya pada k apa pun (bukan hanya kita butuhkan berasal dari konstanta normalisasi kepadatan yang relevan), jadi hasilnya harus berlaku untuk k yang kita butuhkan.]kk

Glen_b -Reinstate Monica
sumber
1
Grafik dengan (dan mungkin meluas x sedikit) mungkin menunjukkan ekor yang lebih berat lebih jelas, dan juga dapat bekerja dengan tingkat kebebasan yang lebih tinggi,logS(x)x
Henry
1
@Henry Saya membuat plot seperti itu tetapi tidak yakin berapa banyak nilai yang ditambahkan sehingga saya tidak memasukkannya. Saya akan berpikir tentang memasukkannya.
Glen_b -Reinstate Monica
1
@ Henry saya memasukkan plotnya.
Glen_b -Reinstate Monica
2

Salah satu cara untuk melihat perbedaannya adalah dengan menggunakan momen E{xn}.

Ekor "lebih berat" akan berarti nilai yang lebih tinggi untuk momen daya genap (power 4, 6, 8), ketika variansnya sama. Secara khusus, momen urutan ke-4 (sekitar nol) disebut kurtosis dan membandingkan dalam arti tertentu beratnya ekor.

Lihat Wikipedia untuk detailnya ( https://en.wikipedia.org/wiki/Kurtosis )

Dacian Bonta
sumber
1
t34214
3
t(ν)+xνννtν
2

Ini adalah bukti resmi berdasarkan fungsi bertahan hidup. Saya menggunakan definisi "ekor yang lebih berat" yang diilhami oleh wikipedia :

YSy(t)XSx(t)

limtSy(t)Sx(t)=

YνaXN(0,σ2)

limtSy(t)Sx(t)=limtfy(t)fx(t)=explimt(logfy(t)logfx(t))=explimt(ν+12log(1+t2νa2)(12σ2t2)+C)=exp(limtν+12log(1+t2νa2)(12σ2t2)+C)=exp(limt12σ2t2ν+12log(1+t2νa2)+C)=exp(12limua2σ2u(ν+1)log(1+uν)+C)=exp(12limuu(a2σ2(ν+1)log(1+uν)u+Cu))
u=t2/a20<a2/σ2<limuC/u=0
limu(ν+1)log(1+uν)u=limu(ν+1)(1)(1+uν)(ν)=0
limtSy(t)Sx(t)=exp(12limuu(a2σ2(0)+(0)))=

aσ2ν

Will Townes
sumber
1
Hanya sebuah catatan bahwa "definisi" ekor yang lebih berat ini tidak selalu dapat diterima. Sebagai contoh, distribusi N (0,1), menurut definisi ini, memiliki ekor yang lebih berat daripada distribusi .9999 * U (-1,1) + .0001 * U (-1000, 1000), meskipun distribusi yang terakhir menghasilkan nilai sesekali hingga 175 standar deviasi dari rata-rata, meskipun telah membatasi dukungan. Tentu saja, N (0,1) juga menghasilkan nilai seperti itu, tetapi dengan probabilitas jauh di bawah apa yang dapat dianggap relevan untuk tujuan praktis.
Peter Westfall