Saya membaca buku Larry Wasserman, All of Statistics , dan saat ini tentang nilai-p (halaman 187). Ijinkan saya memperkenalkan beberapa definisi (saya kutip):
Definisi 1 Fungsi daya pengujian dengan wilayah penolakan didefinisikan oleh Ukuran tes didefinisikan sebagai Suatu tes dikatakan memiliki level \ alpha jika ukurannya kurang dari atau sama dengan \ alpha .
Ini pada dasarnya mengatakan bahwa , ukurannya adalah probabilitas "terbesar" dari kesalahan tipe I. Nilai- kemudian didefinisikan melalui (saya kutip)
Definisi 2 Misalkan untuk setiap kami memiliki tes ukuran dengan rejection region . Kemudian,
mana .
Bagi saya ini berarti: diberi \ alpha tertentu ada daerah pengujian dan penolakan sehingga . Untuk -value saya cukup mengambil yang terkecil dari semua ini .
Pertanyaan 1 Jika ini masalahnya, maka saya dapat dengan jelas memilih untuk ukuran kecil \ epsilon yang sewenang-wenang . Apa interpretasi saya yang salah dari definisi 2, yaitu apa artinya sebenarnya?
Sekarang Wasserman terus menerus dan menyatakan teorema untuk memiliki definisi "ekuivalen" dari -nilai yang saya kenal (saya kutip):
Teorema Misalkan ukuran test adalah dari bentuk Kemudian, mana adalah nilai yang diamati dari .
Jadi inilah pertanyaan kedua saya:
Pertanyaan 2 Bagaimana saya dapat benar-benar membuktikan teorema ini? Mungkin karena kesalahpahaman saya tentang definisi nilai- , tapi saya tidak bisa mengetahuinya.
sumber
Jawaban:
Kami memiliki beberapa data multivarian , diambil dari distribusi dengan beberapa parameter yang tidak diketahui . Perhatikan bahwa adalah hasil sampel.x D θ x
Kami ingin menguji beberapa hipotesis tentang parameter yang tidak diketahui , nilai bawah hipotesis nol ada di set .θ θ θ0
Dalam ruang , kita dapat mendefinisikan daerah penolakan , dan kekuatan wilayah ini kemudian didefinisikan sebagai . Jadi kekuatan dihitung untuk nilai tertentu dari sebagai probabilitas bahwa hasil sampel berada di daerah penolakan ketika nilai adalah . Jelas daya tergantung pada wilayah dan pada .X R R PRθ¯=Pθ¯(x∈R) θ¯ θ x R θ θ¯ R θ¯
Definisi 1 mendefinisikan ukuran wilayahR sebagai supremum dari semua nilai untuk di , jadi hanya untuk nilai bawah . Jelas ini tergantung pada daerah, sehingga .PRθ¯ θ¯ θ0 θ¯ H0 αR=supθ¯∈θ0PRθ¯
Karena tergantung pada kita memiliki nilai lain ketika kawasan berubah, dan ini adalah dasar untuk mendefinisikan nilai-p: mengubah wilayah, tetapi sedemikian rupa sehingga nilai sampel yang diamati masih menjadi milik wilayah, untuk masing-masing daerah tersebut, menghitung sebagaimana didefinisikan di atas dan mengambil infimum yang: . Jadi nilai-p adalah ukuran terkecil dari semua wilayah yang mengandung .αR R αR pv(x)=infR|x∈RαR x
Teorema ini kemudian hanya merupakan 'terjemahannya', yaitu kasus di mana daerah didefinisikan menggunakan statistik dan untuk nilai Anda mendefinisikan suatu daerah sebagai . Jika Anda menggunakan tipe wilayah dalam alasan di atas, maka teorema berikut.R T c R R={x|T(x)≥c} R
Sunting karena komentar:
@ user8: untuk teorema; jika Anda mendefinisikan daerah penolakan seperti dalam teorema, maka wilayah penolakan ukuran adalah himpunan yang terlihat seperti untuk beberapa .α Rα={X|T(X)≥cα} cα
Untuk menemukan nilai p dari nilai yang diamati , yaitu Anda harus menemukan wilayah terkecil , yaitu nilai sehingga masih mengandung , yang terakhir (wilayah berisi ) adalah setara (karena cara daerah didefinisikan) untuk mengatakan bahwa , jadi Anda harus menemukan terbesar sehinggax pv(x) R c {X|T(X)≥c} x x c≥T(x) c {X|T(X)≥c&c≥T(x)}
Jelas, terbesar sehingga harus dan kemudian supra set menjadic c≥T(x) c=T(x) {X|T(X)≥c=T(x)}={X|T(X)≥T(x)}
sumber
Dalam Definisi 2, nilai dari statistik uji adalah batas bawah terbesar semua sehingga hipotesis ditolak untuk uji ukuran . Ingatlah bahwa semakin kecil kita membuat , semakin sedikit toleransi untuk kesalahan Tipe I yang kami izinkan, sehingga wilayah penolakan juga akan berkurang. Jadi (sangat) berbicara secara informal, -value adalah terkecil yang dapat kita pilih yang masih memungkinkan kita menolak untuk data yang kami amati. Kami tidak dapat secara sewenang-wenang memilih lebih kecil karena pada titik tertentu,p α α α Rα p α H0 α Rα akan sangat kecil sehingga akan mengecualikan (yaitu, gagal mengandung) peristiwa yang kami amati.
Sekarang, sehubungan dengan hal di atas, saya mengundang Anda untuk mempertimbangkan kembali teorema.
sumber