Saya membaca perhitungan estimasi yang tidak bias dari standar deviasi dan sumber yang saya baca menyatakan
(...) kecuali dalam beberapa situasi penting, tugas tersebut memiliki sedikit relevansi dengan aplikasi statistik karena kebutuhannya dihindari oleh prosedur standar, seperti penggunaan uji signifikansi dan interval kepercayaan, atau dengan menggunakan analisis Bayesian.
Saya bertanya-tanya apakah ada yang bisa menjelaskan alasan di balik pernyataan ini, misalnya tidakkah interval kepercayaan menggunakan standar deviasi sebagai bagian dari perhitungan? Oleh karena itu, bukankah interval kepercayaan akan dipengaruhi oleh standar deviasi yang bias?
EDIT:
Terima kasih atas jawabannya sejauh ini, tapi saya tidak yakin saya mengikuti beberapa alasan untuk mereka jadi saya akan menambahkan contoh yang sangat sederhana. Intinya adalah bahwa jika sumbernya benar, maka ada sesuatu yang salah dari kesimpulan saya ke contoh dan saya ingin seseorang menunjukkan bagaimana bagaimana nilai-p tidak tergantung pada standar deviasi.
Misalkan seorang peneliti ingin menguji apakah skor rata-rata siswa kelas lima pada tes di kotanya berbeda dari rata-rata nasional 76 dengan tingkat signifikansi 0,05. Peneliti secara acak mengambil sampel dari 20 siswa. Rata-rata sampel adalah 80,85 dengan standar deviasi sampel 8,87. Ini berarti: t = (80.85-76) / (8.87 / sqrt (20)) = 2.44. T-tabel kemudian digunakan untuk menghitung bahwa nilai probabilitas dua sisi pada 2,44 dengan 19 df adalah 0,025. Ini di bawah tingkat signifikansi kami 0,05 sehingga kami menolak hipotesis nol.
Jadi dalam contoh ini, bukankah nilai-p (dan mungkin kesimpulan Anda) akan berubah tergantung pada bagaimana Anda memperkirakan standar deviasi sampel Anda?
sumber
Jawaban:
Saya setuju dengan Glen_b dalam hal ini. Mungkin saya bisa menambahkan beberapa kata untuk membuat poin lebih jelas. Jika data berasal dari distribusi normal (situasi saat ini) dengan varian yang tidak diketahui, statistik t adalah jumlah penting yang digunakan untuk menghasilkan interval kepercayaan dan melakukan pengujian hipotesis. Satu-satunya hal yang penting untuk kesimpulan itu adalah distribusi di bawah hipotesis nol (untuk menentukan nilai kritis) dan di bawah alternatif (untuk menentukan kekuatan dan sampel). Mereka adalah distribusi t pusat dan noncentral, masing-masing. Sekarang mempertimbangkan sejenak masalah satu sampel, uji t bahkan memiliki sifat optimal sebagai tes untuk rata-rata distribusi normal. Sekarang varians sampel adalah penaksir yang tidak bias dari varians populasi tetapi akar kuadratnya adalah penaksir BIASED dari standar deviasi populasi. Tidak Tidak penting bahwa penaksir BIASED ini masuk dalam penyebut kuantitas penting. Sekarang ia memainkan peran dalam hal ini adalah penduga yang konsisten. Itulah yang memungkinkan distribusi t untuk mendekati standar normal ketika ukuran sampel mencapai tak terbatas. Tapi menjadi bias untuk semua yang diperbaiki tidak memengaruhi sifat uji yang bagus.n
Menurut pendapat saya, ketidakberpihakan terlalu ditekankan dalam kelas statistik pengantar. Keakuratan dan konsistensi penduga adalah sifat nyata yang pantas ditekankan.
Untuk masalah lain di mana metode parametrik atau nonparametrik diterapkan, perkiraan standar deviasi bahkan tidak masuk ke dalam rumus.
sumber
Pertimbangkan interval yang dihitung berdasarkan kuantitas penting, seperti statistik-t. Nilai rata-rata estimator untuk standar deviasi tidak benar-benar masuk ke dalamnya - intervalnya didasarkan pada distribusi statistik. Jadi pernyataan itu benar sejauh itu.
sumber
Interpretasi selalu merupakan spekulasi bagian, tetapi saya pikir makna tersirat adalah bahwa sering kali Anda bisa mendapatkan hasil yang Anda inginkan tanpa memperkirakan standar deviasi secara eksplisit. Dengan kata lain, saya pikir penulis mengacu pada situasi di mana Anda akan menggunakan tidak ada perkiraan standar deviasi, daripada perkiraan bias.
Misalnya, jika Anda dapat membuat estimasi seluruh distribusi statistik, Anda dapat menghitung interval kepercayaan tanpa menggunakan standar deviasi. Bahkan, untuk banyak distribusi (tidak normal) standar deviasi itu sendiri (dan rata-rata) tidak cukup untuk menghitung estimasi interval kepercayaan. Dalam kasus lain, seperti tes masuk , Anda tidak perlu perkiraan untuk standar deviasi.
(Tentu saja, tidak sepele untuk membangun estimasi yang tidak bias dari distribusi penuh, dan dalam statistik Bayesian sebenarnya cukup umum untuk memperkenalkan bias secara eksplisit melalui yang sebelumnya.)
sumber