Pertanyaan ini muncul di tempat kerja ketika seseorang bertanya kepada saya apa hubungan antara persentil dan interval kepercayaan, dan saya mengalami kesulitan mengartikulasikan pikiran saya. Konteksnya adalah pertanyaan yang sangat sederhana mengenai memperkirakan interval kepercayaan 95% pada rata-rata sampel.
Saya memahami bahwa teorema limit pusat menyatakan bahwa distribusi sampling dari rata-rata variabel independen dan acak akan normal atau hampir normal, jika ukuran sampel cukup besar. Dengan demikian, mean sampel memiliki distribusi normal dimana adalah standar deviasi sampel.
Sekarang, katakanlah hipotesis nol adalah benar. Kemudian di bawah hipotesis nol, interval kepercayaan 95% di sekitar mean sampel adalah
Pertanyaan dari rekan kerja saya secara khusus adalah sebagai berikut: kesalahan standar hanyalah standar deviasi dari distribusi sampling rata-rata. Jadi, akan setara dengan 97,5 persen dari distribusi yang dibuat dengan menghitung rata-rata sampel dari banyak sampel ukuran ?
Pertanyaan itu sangat aneh bagi saya karena persentil dan interval kepercayaan adalah dua konsep yang terpisah dan pertanyaan rekan kerja saya bertanya tentang hubungan antara keduanya, dan saya menjadi sangat bingung tetapi tidak bisa mengartikulasikan poin saya.
Bantuan apa pun akan sangat dihargai!
sumber
Jawaban:
Rekan kerja Anda benar, interval kepercayaan didasarkan pada persentil distribusi sampel statistik yang menarik. Dalam hal ini, statistiknya adalahμ^=1n∑Xsaya . Persentil dariX berbeda.
Anda dapat mencoba sendiri untuk melakukan percobaan menggambar banyakμ^saya dan menghitung persentilnya. Anda akan menemukan persetujuan yang baik dengan rumus teori normal yang disediakann untuk setiap μ^saya cukup besar. Dan jika Anda terus memikirkannya, Anda mungkin akan menemukan kembali bootstrap, yang menggunakan persentil yang diamati dariX untuk menghasilkan banyak μ^saya dan kemudian menggunakan persentil dari sampel yang dihasilkan ini untuk membuat interval kepercayaan.
sumber