Buktikan bahwa sebagai

8

Masalah statistik yang melibatkan interval kepercayaan untuk rata-rata populasi dapat dibingkai dalam hal fungsi pembobotan berikut :

w(α,n)tn1,α/2nfor 0<α<1 and n>1.

Misalnya, interval kepercayaan tingkat klasik 1- \ alpha standar 1αuntuk rata-rata populasi super tak terbatas dapat ditulis sebagai:

CI(1α)=[x¯n±w(α,n)sn].

Sepele untuk menetapkan batas limα0w(α,n)= dan limα1w(α,n)=0 menggunakan fungsi kuantil dari distribusi-T. Dalam konteks interval kepercayaan, ini memberitahu kita bahwa interval menyusut ke satu titik ketika kita menurunkan tingkat kepercayaan, dan meningkat ke seluruh garis nyata saat kita meningkatkan tingkat kepercayaan. Properti intuitif lain yang harus dimiliki adalah bahwa interval menyusut ke satu titik ketika kita mendapatkan lebih banyak data, yang berarti bahwa:

limnw(α,n)=0.

Pertanyaan: Berikan bukti untuk properti fungsi pembobotan ini.


Informasi lebih lanjut: Untuk setiap pembaca matematika yang tidak terbiasa dengan titik-titik kritis dari distribusi-T , nilai adalah fungsi dari didefinisikan oleh persamaan implisit:tn1,α/2n

α2=1(n1)πΓ(n2)Γ(n12)tn1,α/2(1+r2n1)n/2dr.
Ben - Pasang kembali Monica
sumber
2
Bukankah ini sepele karena fakta bahwa siswa t berkumpul ke normal dalam variasi total? Pembilangnya menuju konstanta . zα/2
pria
1
@ guy: Apa yang disebut "sepele" tergantung pada tingkat orang yang Anda tanyakan. Alasan saya mengajukan pertanyaan ini adalah bahwa ini adalah masalah yang saya ajukan kepada beberapa mahasiswa pascasarjana dalam pengajaran saya, dan saya ingin melihat bukti seperti apa yang muncul dari orang-orang di situs ini (sehingga saya dapat membandingkannya dengan macam jawaban yang diberikan oleh siswa). Lulusan-siswa biasanya memiliki gagasan kasar tentang bagaimana mendekati buktinya, tetapi berjuang dengan detail. Sebagian besar mencoba menunjukkan dan pergi dari sana, tetapi yang lain mencoba menyelesaikannya dengan membuat batasan pada integral. tn1,α/2zα/2<
Ben - Reinstate Monica
(Saya juga berharap untuk melihat bukti paling elegan, sebagai cara yang baik untuk menyajikan hasilnya.)
Ben - Reinstate Monica
2
Saya akan tertarik melihat seberapa elegan seseorang bisa mendapatkan ini. Pendapat pribadi, tetapi saya berpendapat bahwa menggunakan kepadatan tidak elegan karena membawa struktur tambahan yang tidak diperlukan. Buktinya dalam jawaban saya ada dua pelajaran penting. Pertama, proposisi adalah sedikit teori probabilitas yang berguna dan dapat memberikan gambaran bagaimana perilaku DF. Kedua, teknik pembuktian (yang dapat disajikan kembali dalam hal mencakup angka) sangat berguna untuk membuktikan banyak hal.
pria

Jawaban:

4

Bukti dengan ketidaksetaraan Chebyshev

Berikut ini adalah bukti yang menggunakan ketimpangan Chebyshev .Pr(|T|kσ)1k2

Jika kita mengisi dan mengatur maka kita memiliki batasanσtν=νν21/k2=α=Pr(|T|tν,α/2)

Pr(|T|νν21α)Pr(|T|tν,α/2)

dengan demikian akan dibatasi di atas olehtν,α/2

tν,α/2νν21α

menambahkan batas bawah yang jelas dan bagi denganν+1

0tn1,α/2ν+1νν+1(ν2)1α

yang menekan ke nol untuktn1,α/2/nn

Sextus Empiricus
sumber
Saya biasanya menghindari komentar "jawaban yang baik" tetapi yang ini benar-benar elegan! (+1 jelas!)
usεr11852
1
@ usεr11852 Anda mungkin menyukai bukti geometris saya di mana distribusi statistik-t terkait dengan distribusi sudut dalam ruang-n.
Sextus Empiricus
4

Saya yakin ada cara yang lebih mudah untuk melakukan ini, tetapi hasilnya langsung dari berikut ini:

Proposisi: Misalkan adalah fungsi distribusi kontinu dan urutan fungsi distribusi sedemikian sehingga lemah (yaitu, dalam distribusi). Kemudian secara seragam dalam .FFnFnFFn(x)F(x)x

Bukti: Dengan menggunakan kontinuitas dan monotonisitas, untuk setiap bilangan alami kita dapat memilih sedemikian sehingga (mengambil dan ). Dengan konvergensi yang lemah dan fakta bahwa adalah kontinu, . Untuk setiap , temukan interval berisi dan catat bahwa . Karenanya dan karenamx0,x1,,xmF(xj)=j/mx0=xm=FFn(xj)F(xj)y[xj1,xj]y|Fn(y)F(y)|supj|Fn(xj)F(xj)|+|F(xj)F(xj1)|1mlim¯nsupy|Fn(y)F(y)|1mmsewenang-wenang kita dapatkan .supy|Fn(y)F(y)|0

Selanjutnya, ini adalah aplikasi teorema Slutsky yang terkenal bahwa menyatu dalam distribusi ke distribusi normal standar. Hasil sebelumnya menyiratkan bahwa , yaitu, . Menerapkan fungsi kuantil normal pada kedua sisi, kita mendapatkan .tn1Fn(tn1,α)F(tn1,α)0F(tn1,α)αtn1,αzα

Karenanya menyiratkan untuk setiap (khususnya, ).tn1,αzαtn1,αg(n)0g(n)g(n)=n

orang
sumber
3

Bukti geometris

Tampilan geometris

Pertimbangkan sampel yang diamati sebagai titik dalam ruang Euclidean n-dimensi dan estimasi rata-rata sebagai proyeksi pengamatan x1,x2,...,xn ke garis model x1=x2=...=xn=x¯.

Skor-t dapat dinyatakan sebagai rasio dua jarak dalam ruang ini

  • jarak antara titik yang diproyeksikan dan rata-rata populasi
    n(x¯μ)
  • jarak antara titik ini dan pengamatan
    i=1n(x^xi)2

Ini terkait dengan garis singgung sudut antara pengamatan dan garis yang diproyeksikan.

tn1=n(x¯μ)i=1n(x^xi)2=1tanθ

Sketsa geometris

Distribusi t-ekivalen dan distribusi sudut

Dalam tampilan geometris ini, probabilitas skor-t lebih tinggi dari beberapa nilai setara dengan probabilitas sudut kurang dari beberapa nilai:

Pr(|T|>tn1,α/2)=2Pr(θθν,α)=α

Atau

tn1,α/2n1=1tanθν,α

Anda bisa mengatakan bahwa skor-t berhubungan dengan sudut pengamatan dengan garis model teoretis. Untuk poin di luar interval kepercayaan (laluμ lebih jauh dari x¯ dan sudut akan lebih kecil) sudut akan di bawah batas tertentu θν,α. Batas ini akan berubah dengan lebih banyak pengamatan. Jika batas sudut iniθν,α pergi ke 90 derajat untuk besar n (bentuk kerucut semakin datar, yaitu kurang runcing dan panjang) maka ini berarti bahwa ukuran interval kepercayaan menjadi lebih kecil dan mendekati nol.

sudut vs t

Distribusi sudut sebagai area relatif dari tutup bola-n

Karena simetri distribusi probabilitas gabungan variabel bebas terdistribusi normal, setiap arah adalah probabilitas yang sama dan probabilitas untuk sudut berada dalam wilayah tertentu sama dengan luas relatif tutup n-bola.

Area relatif n-cap ini ditemukan dengan mengintegrasikan area n-frustum :

2Pr(θθc)=211+tan(θc)21(1x2)n32B(12,n12)dx=11+tan(θc)21t0.5(1t)n32B(12,n12)dt=I11+tan(θc)2(12,n12)

dimana Ix(,) adalah fungsi beta tidak lengkap yang teregulasi atas.

Batas sudut

Jika θn,α pergi ke 90 derajat untuk n kemudian tn1,α/2/n pergi ke nol.

Atau pernyataan terbalik: untuk sudut apa pun yang lebih kecil dari 90 derajat area relatif sudut itu pada bola-n, berkurang menjadi nol saat n pergi hingga tak terbatas.

Secara intuitif ini berarti bahwa semua area bola-n berkonsentrasi ke ekuator sebagai dimensi n meningkat hingga tak terbatas.

Secara kuantitatif kita dapat menunjukkan ini dengan menggunakan ekspresi

a1t0.5(1t)n32B(12,n12)dt<a1(1a)n32B(12,n12)dt=(1a)n12B(12,n12)=L(n)

dan pertimbangkan perbedaannya L(n+2) dan L(n).

Di beberapa titik penurunan penyebut

B(12,x+1)B(12,x)=xx+12
akan diambil alih oleh penurunan pembilang
(1a)n+12(1a)n12=1a
dan fungsinya L(n) berkurang menjadi nol untuk n hingga tak terbatas.
Sextus Empiricus
sumber
1

Kita punya

α2=tn1,α/2limn1(n1)πΓ(n2)Γ(n12)(1+r2n1)n/2dr=tn1,α/212πe12r2dr=1Φ(tn1,α/2)1[12+φ(tn1,α/2)(tn1,α/2+(tn1,α/2)33+(tn1,α/2)515+)]

which implies that the second term in the boxed brackets can be at most 12 since the maximum α can be is 1. Note that φ(x) is the pdf of normal distribution. This approximation is also based on this.

So

0<α1+2φ(tn1,α/2)(tn1,α/2+(tn1,α/2)33+(tn1,α/2)515+)<1
guerhuerh
sumber
Welcome to the site, @guerhuerh. Please consider registering your account & becoming a regular member here (there is information in the My Account section of our help center). We'd love to have you. If you'd like, you can take our tour, which has information for new users.
gung - Reinstate Monica
2
This is an interesting approach, but it is unclear to me how you justify the first step (where you have added the limit operation inside the integral). This gives an implicit equation for tn1,α/2 that is false.
Ben - Reinstate Monica
@Ben: Wouldn't limnα2=α2?
PEV
@PEV: Yes, but then the right-hand-side should have the limit outside the integral, not inside it. Since the limits in the integral depend on n the right-hand-side is presently a function of n, so it is not equal to α/2.
Ben - Reinstate Monica
@PEV: I think the method could be modified by separating the integral into two parts, one which replaces the lower limit with zα/2 and one that gives the remainder. The former would then converge to what is already shown, and we would then have to show that the latter converges to zero. Like I said, I think this is an interesting approach. It might have merit as a method, and might be able to be altered to be correct, but it is presently incorrect.
Ben - Reinstate Monica