Hubungan Antara Persentil dan Interval Keyakinan (Rata-Rata)

9

Pertanyaan ini muncul di tempat kerja ketika seseorang bertanya kepada saya apa hubungan antara persentil dan interval kepercayaan, dan saya mengalami kesulitan mengartikulasikan pikiran saya. Konteksnya adalah pertanyaan yang sangat sederhana mengenai memperkirakan interval kepercayaan 95% pada rata-rata sampel.

Saya memahami bahwa teorema limit pusat menyatakan bahwa distribusi sampling dari rata-rata variabel independen dan acak akan normal atau hampir normal, jika ukuran sampel cukup besar. Dengan demikian, mean sampel memiliki distribusi normalN(x¯,s/n) dimana s adalah standar deviasi sampel.

Sekarang, katakanlah hipotesis nol H0:μx¯=μadalah benar. Kemudian di bawah hipotesis nol, interval kepercayaan 95% di sekitar mean sampel adalahμx¯±1.96s/n

Pertanyaan dari rekan kerja saya secara khusus adalah sebagai berikut: kesalahan standar hanyalah standar deviasi dari distribusi sampling rata-rata. Jadi, akanμx¯+1.96s/n setara dengan 97,5 persen dari distribusi yang dibuat dengan menghitung rata-rata sampel dari banyak sampel ukuran n?

Pertanyaan itu sangat aneh bagi saya karena persentil dan interval kepercayaan adalah dua konsep yang terpisah dan pertanyaan rekan kerja saya bertanya tentang hubungan antara keduanya, dan saya menjadi sangat bingung tetapi tidak bisa mengartikulasikan poin saya.

Bantuan apa pun akan sangat dihargai!

Vincent
sumber
1
Untuk pemahaman saya, untuk membangun interval kepercayaan 95% bootstrap paling sederhana untuk statistik yang menarik (di sini rata-rata), Anda melihat persentil 2,5% dari vektor nilai-nilai bootstrap (distribusi sampling) dan pada 97,5%. Jadi, persentil 2,5% adalah batas bawah dan persentil 97,5% adalah batas atas CI 95%.
Valentin

Jawaban:

6

Rekan kerja Anda benar, interval kepercayaan didasarkan pada persentil distribusi sampel statistik yang menarik. Dalam hal ini, statistiknya adalahμ^=1nXsaya. Persentil dariX berbeda.

Anda dapat mencoba sendiri untuk melakukan percobaan menggambar banyak μ^sayadan menghitung persentilnya. Anda akan menemukan persetujuan yang baik dengan rumus teori normal yang disediakann untuk setiap μ^sayacukup besar. Dan jika Anda terus memikirkannya, Anda mungkin akan menemukan kembali bootstrap, yang menggunakan persentil yang diamati dariX untuk menghasilkan banyak μ^saya dan kemudian menggunakan persentil dari sampel yang dihasilkan ini untuk membuat interval kepercayaan.

rasta
sumber