Karena seseorang dapat menghitung interval kepercayaan untuk nilai-p dan karena kebalikan dari estimasi interval adalah estimasi titik: Apakah nilai-p merupakan estimasi titik?
32
Karena seseorang dapat menghitung interval kepercayaan untuk nilai-p dan karena kebalikan dari estimasi interval adalah estimasi titik: Apakah nilai-p merupakan estimasi titik?
Jawaban:
Estimasi titik dan interval kepercayaan untuk parameter yang menggambarkan distribusi, misalnya mean atau standar deviasi.
Tetapi tidak seperti statistik sampel lain seperti mean sampel dan standar deviasi sampel, nilai-p bukan penaksir yang berguna untuk parameter distribusi yang menarik. Lihatlah jawabannya oleh @whuber untuk detail teknis.
Nilai p untuk statistik uji memberikan probabilitas untuk mengamati penyimpangan dari nilai yang diharapkan dari uji-statistik setidaknya sebesar yang diamati dalam sampel, dihitung dengan asumsi bahwa hipotesis nol adalah benar. Jika Anda memiliki seluruh distribusi itu konsisten dengan hipotesis nol, atau tidak. Ini dapat dijelaskan dengan oleh variabel indikator (sekali lagi, lihat jawabannya oleh @whuber).
Tetapi nilai-p tidak dapat digunakan sebagai penaksir yang berguna dari variabel indikator karena tidak konsisten karena nilai-p tidak konvergen ketika ukuran sampel meningkat jika hipotesis nol benar. Ini adalah cara alternatif yang cukup rumit untuk menyatakan bahwa tes statistik dapat menolak atau gagal untuk menolak nol, tetapi tidak pernah mengkonfirmasi.
sumber
Ya, bisa jadi (dan telah) berpendapat bahwa nilai-p adalah estimasi titik.
Untuk mengidentifikasi properti apa pun dari suatu distribusi yang mungkin diperkirakan oleh nilai-p, kita harus menganggapnya tidak berpihak asimtotik. Tetapi, asimptotik, nilai p rata-rata untuk hipotesis nol adalah (idealnya; untuk beberapa tes mungkin beberapa angka bukan nol lainnya) dan untuk hipotesis lainnya adalah . Dengan demikian, nilai-p dapat dianggap sebagai penduga dari setengah fungsi indikator untuk hipotesis nol.01/2 0
Memang perlu kreativitas untuk melihat nilai-p dengan cara ini. Kita bisa melakukan sedikit lebih baik dengan melihat estimator yang dipermasalahkan sebagai keputusan yang kita buat dengan menggunakan nilai-p: apakah distribusi yang mendasari anggota dari hipotesis nol atau hipotesis alternatif? Mari kita sebut ini set mungkin keputusan . Jack Kiefer menulisD
Dalam hal ini, karena adalah diskrit, "cukup halus" bukanlah batasan sama sekali. Terminologi Kiefer mencerminkan hal ini dengan merujuk pada prosedur statistik dengan ruang keputusan yang terpisah sebagai "tes" dan bukan "penduga titik."D
Meskipun menarik untuk mengeksplorasi batasan (dan batasan) dari definisi tersebut, seperti yang diminta oleh pertanyaan ini untuk kita lakukan, mungkin kita tidak boleh bersikeras terlalu kuat bahwa nilai-p adalah penduga titik, karena perbedaan antara penduga dan pengujian ini sama-sama berguna dan konvensional.
Dalam komentar untuk pertanyaan ini, Christian Robert membawa perhatian pada makalah 1992 di mana ia dan rekan penulis mengambil sudut pandang yang tepat ini dan menganalisis penerimaan nilai p sebagai penaksir fungsi indikator . Lihat tautan dalam referensi di bawah ini. Makalah dimulai,
[Penekanan ditambahkan.]
Referensi
Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells, dan Roger H. Farrell, Estimasi Akurasi dalam Pengujian . Ann. Statist. Volume 20, Nomor 1 (1992), 490-509. Akses terbuka .
Jack Carl Kiefer, Pengantar Inferensi Statistik . Springer-Verlag, 1987.
sumber
sumber