Masalah statistik yang melibatkan interval kepercayaan untuk rata-rata populasi dapat dibingkai dalam hal fungsi pembobotan berikut :
Misalnya, interval kepercayaan tingkat klasik 1- \ alpha standar untuk rata-rata populasi super tak terbatas dapat ditulis sebagai:
Sepele untuk menetapkan batas dan menggunakan fungsi kuantil dari distribusi-T. Dalam konteks interval kepercayaan, ini memberitahu kita bahwa interval menyusut ke satu titik ketika kita menurunkan tingkat kepercayaan, dan meningkat ke seluruh garis nyata saat kita meningkatkan tingkat kepercayaan. Properti intuitif lain yang harus dimiliki adalah bahwa interval menyusut ke satu titik ketika kita mendapatkan lebih banyak data, yang berarti bahwa:
Pertanyaan: Berikan bukti untuk properti fungsi pembobotan ini.
Informasi lebih lanjut: Untuk setiap pembaca matematika yang tidak terbiasa dengan titik-titik kritis dari distribusi-T , nilai adalah fungsi dari didefinisikan oleh persamaan implisit:
sumber
Jawaban:
Bukti dengan ketidaksetaraan Chebyshev
Berikut ini adalah bukti yang menggunakan ketimpangan Chebyshev .Pr(|T|≥kσ)≤1k2
Jika kita mengisi dan mengatur maka kita memiliki batasanσtν=νν−2 1/k2=α=Pr(|T|≥tν,α/2)
dengan demikian akan dibatasi di atas olehtν,α/2
menambahkan batas bawah yang jelas dan bagi denganν+1−−−−√
yang menekan ke nol untuktn−1,α/2/n−−√ n→∞
sumber
Saya yakin ada cara yang lebih mudah untuk melakukan ini, tetapi hasilnya langsung dari berikut ini:
Selanjutnya, ini adalah aplikasi teorema Slutsky yang terkenal bahwa menyatu dalam distribusi ke distribusi normal standar. Hasil sebelumnya menyiratkan bahwa , yaitu, . Menerapkan fungsi kuantil normal pada kedua sisi, kita mendapatkan .tn−1 Fn(tn−1,α)−F(tn−1,α)→0 F(tn−1,α)→α tn−1,α→zα
Karenanya menyiratkan untuk setiap (khususnya, ).tn−1,α→zα tn−1,αg(n)→0 g(n)→∞ g(n)=n−−√
sumber
Bukti geometris
Tampilan geometris
Pertimbangkan sampel yang diamati sebagai titik dalam ruang Euclidean n-dimensi dan estimasi rata-rata sebagai proyeksi pengamatanx1,x2,...,xn ke garis model x1=x2=...=xn=x¯ .
Skor-t dapat dinyatakan sebagai rasio dua jarak dalam ruang ini
Ini terkait dengan garis singgung sudut antara pengamatan dan garis yang diproyeksikan.
Distribusi t-ekivalen dan distribusi sudut
Dalam tampilan geometris ini, probabilitas skor-t lebih tinggi dari beberapa nilai setara dengan probabilitas sudut kurang dari beberapa nilai:
Atau
Anda bisa mengatakan bahwa skor-t berhubungan dengan sudut pengamatan dengan garis model teoretis. Untuk poin di luar interval kepercayaan (laluμ lebih jauh dari x¯ dan sudut akan lebih kecil) sudut akan di bawah batas tertentu θν,α . Batas ini akan berubah dengan lebih banyak pengamatan. Jika batas sudut iniθν,α pergi ke 90 derajat untuk besar n (bentuk kerucut semakin datar, yaitu kurang runcing dan panjang) maka ini berarti bahwa ukuran interval kepercayaan menjadi lebih kecil dan mendekati nol.
Distribusi sudut sebagai area relatif dari tutup bola-n
Karena simetri distribusi probabilitas gabungan variabel bebas terdistribusi normal, setiap arah adalah probabilitas yang sama dan probabilitas untuk sudut berada dalam wilayah tertentu sama dengan luas relatif tutup n-bola.
Area relatif n-cap ini ditemukan dengan mengintegrasikan area n-frustum :
dimanaIx(⋅,⋅) adalah fungsi beta tidak lengkap yang teregulasi atas.
Batas sudut
Jikaθn,α pergi ke 90 derajat untuk n→∞ kemudian tn−1,α/2/n−−√ pergi ke nol.
Atau pernyataan terbalik: untuk sudut apa pun yang lebih kecil dari 90 derajat area relatif sudut itu pada bola-n, berkurang menjadi nol saatn pergi hingga tak terbatas.
Secara intuitif ini berarti bahwa semua area bola-n berkonsentrasi ke ekuator sebagai dimensin meningkat hingga tak terbatas.
Secara kuantitatif kita dapat menunjukkan ini dengan menggunakan ekspresi
dan pertimbangkan perbedaannyaL(n+2) dan L(n) .
Di beberapa titik penurunan penyebut
sumber
Kita punya
which implies that the second term in the boxed brackets can be at most12 since the maximum α can be is 1 . Note that φ(x) is the pdf of normal distribution. This approximation is also based on this.
So
sumber