Ini murni pertanyaan hipotetis. Pernyataan yang sangat umum adalah bahwa tidak pernah benar, itu hanya masalah ukuran sampel.
Mari kita asumsikan bahwa sebenarnya tidak ada perbedaan terukur antara dua rata-rata ( ) yang diambil dari populasi yang berdistribusi normal (untuk dan diperkirakan ). Kami menganggap per grup dan kami menggunakan uji- . Ini berarti bahwa -value adalah menunjukkan bahwa sama sekali tidak ada perbedaan dari . Ini akan menunjukkan bahwa statistik uji adalah . Perbedaan rata-rata antar kelompok adalah . Apa yang akan menjadi batas interval kepercayaan untuk perbedaan rata-rata dalam kasus ini? Akankah mereka ?
Poin utama dalam pertanyaan saya adalah kapan kami dapat benar-benar mengatakan bahwa benar, yaitu dalam kasus ini? Atau ketika dalam kerangka kerja yang sering kita dapat benar-benar mengatakan "tidak ada perbedaan" ketika membandingkan dua cara?
sumber
Jawaban:
Interval kepercayaan untuk uji-t adalah dalam bentuk , di mana dan adalah sampel rata-rata, adalah nilai kritis pada diberikan , dan adalah kesalahan standar dari perbedaan rata-rata. Jika , maka . Jadi rumusnya hanya , dan batasannya hanya { ,x¯1−x¯2±tcrit,αsx¯1−x¯2 x¯1 x¯2 tcrit,α t α sx¯1−x¯2 p=1.0 x¯1−x¯2=0 ±tcrit,αsx¯1−x¯2 −tcrit,αsx¯1−x¯2 tcrit,αsx¯1−x¯2 }.
Saya tidak yakin mengapa Anda berpikir batasnya adalahNilai kritis bukan nol dan kesalahan standar perbedaan rata-rata bukan nol.{0,0}. t
sumber
Menjadi sangat malas, menggunakan R untuk menyelesaikan masalah secara numerik daripada melakukan perhitungan dengan tangan:
Tetapkan fungsi yang akan memberikan nilai yang terdistribusi normal dengan rata-rata (hampir!) Tepat nol dan SD persis 1:
Jalankan uji-t:
Berarti tidak persis nol karena ketidaktepatan floating-point.
Lebih langsung, CI adalah ; varians dari setiap rata-rata adalah 1/16, jadi varians yang dikumpulkan adalah 1/8.±
sqrt(1/8)*qt(0.975,df=30)
sumber
CI dapat memiliki batas apa pun, tetapi berpusat tepat di sekitar nol
Untuk uji-T dua sampel (menguji perbedaan dalam rata-rata dua populasi), nilai p tepat satu sesuai dengan kasus di mana rata-rata sampel yang diamati sama persis. (Varians sampel dapat mengambil nilai apa pun.) Untuk melihat ini, perhatikan bahwa fungsi nilai-p untuk pengujian ini adalah:†
Dengan demikian, pengaturan menghasilkan:x¯=y¯
Sekarang, anggaplah Anda membentuk interval kepercayaan standar (perkiraan) menggunakan perkiraan Welch-Satterwaite. Dalam hal ini, dengan asumsi bahwa (untuk memberikan nilai p yang tepat dari salah satu) memberikan interval kepercayaan:x¯=y¯
di mana derajat kebebasan ditentukan oleh perkiraan Welch-Satterwaite. Bergantung pada varian sampel yang diamati dalam masalah, interval kepercayaan dapat berupa interval hingga yang terpusat di sekitar nol. Artinya, interval kepercayaan dapat memiliki batas, asalkan dipusatkan tepat di sekitar nol.DF
sumber
Sulit untuk mengadakan diskusi filosofis yang meyakinkan tentang hal-hal yang memiliki kemungkinan terjadi. Jadi saya akan menunjukkan beberapa contoh yang berhubungan dengan pertanyaan Anda.
Jika Anda memiliki dua sampel independen besar dari distribusi yang sama, maka kedua sampel masih akan memiliki beberapa variabilitas, statistik t sampel 2-sampel yang dikumpulkan akan dekat, tetapi tidak tepat 0, nilai-P akan didistribusikan sebagai dan interval kepercayaan 95% akan sangat pendek dan terpusat sangat dekatUnif(0,1), 0.
Contoh satu dataset dan uji t seperti:
Berikut adalah hasil ringkasan dari 10.000 situasi seperti itu. Pertama, distribusi nilai-P.
Selanjutnya statistik uji:
Dan seterusnya untuk lebar CI.
Hampir tidak mungkin untuk mendapatkan P-value of unity yang melakukan pengujian tepat dengan data kontinu, di mana asumsi dipenuhi. Sedemikian rupa sehingga seorang ahli statistik yang bijak akan merenungkan apa yang salah dengan melihat nilai-P 1.
Misalnya, Anda dapat memberikan perangkat lunak dua sampel besar yang identik . Pemrograman akan melanjutkan seolah-olah ini adalah dua sampel independen , dan memberikan hasil yang aneh. Tetapi meskipun demikian CI tidak akan dari 0 lebar.
sumber
Jawaban langsung (+1 ke Nuh) akan menjelaskan bahwa interval kepercayaan untuk perbedaan rata-rata mungkin masih panjang nol karena tergantung pada variasi yang diamati dalam sampel dengan cara yang berbeda dari nilai p.
Namun Anda mungkin masih bertanya-tanya mengapa seperti itu. Karena tidak aneh membayangkan bahwa nilai p yang tinggi juga berarti interval kepercayaan yang kecil. Lagi pula mereka berdua berhubungan dengan sesuatu yang dekat dengan konfirmasi hipotesis nol. Jadi mengapa pemikiran ini tidak benar?
Nilai p tinggi tidak sama dengan interval kepercayaan kecil.
Nilai-p adalah indikator seberapa ekstrim pengamatan tertentu (ekstrim diberi beberapa hipotesis) dengan menyatakan seberapa besar kemungkinannya untuk mengamati penyimpangan yang diberikan. Ini adalah ekspresi dari ukuran efek yang diamati dalam kaitannya dengan keakuratan percobaan (ukuran efek yang diamati besar mungkin tidak berarti banyak ketika percobaan sedemikian 'tidak akurat' sehingga pengamatan ini tidak ekstrem dari sudut pandang statistik / probabilistik pandang ). Ketika Anda mengamati p-nilai 1 maka ini (hanya) berarti bahwa Anda mengamati nol efek karena probabilitas untuk mengamati seperti nol hasil atau lebih besar sama dengan 1 (tapi ini tidak sama dengan yang ada adalah nol efek).
Sidenote: Mengapa nilai-p? Nilai-p mengungkapkan ukuran efek yang diamati aktual dalam kaitannya dengan ukuran efek yang diharapkan (probabilitas). Ini relevan karena percobaan mungkin, dengan desain, menghasilkan pengamatan dari beberapa ukuran efek yang relevan dengan kebetulan murni karena fluktuasi umum dalam data / pengamatan. Meminta observasi / eksperimen memiliki nilai p rendah berarti eksperimen memiliki presisi tinggi - yaitu: ukuran efek yang diamati lebih jarang / kemungkinan terjadi karena kebetulan / fluktuasi (dan mungkin juga karena efek sebenarnya) .
Sidenote: untuk variabel kontinu nilai p ini sama dengan 1 terjadi hampir tidak pernah karena ini adalah peristiwa yang memiliki ukuran nol (Misalnya untuk variabel terdistribusi normal Anda memiliki ). Tetapi untuk variabel diskrit atau variabel kontinu diskrit dapat menjadi kasus (setidaknya probabilitas adalah nol).X∼N(0,1) P(X=0)=0
Interval kepercayaan mungkin dilihat sebagai rentang nilai yang akan berhasil dilakukan uji hipotesis tingkat (untuk nilai-p di atas ).α α
Anda harus mencatat bahwa nilai-p tinggi bukan (necis) bukti / dukungan / apa pun untuk hipotesis nol. Nilai p yang tinggi hanya berarti bahwa pengamatan tidak luar biasa / ekstrim untuk hipotesis nol yang diberikan, tetapi ini mungkin juga menjadi kasus untuk hipotesis alternatif (yaitu hasilnya sesuai dengan kedua hipotesis, ya / tidak efek). Ini biasanya terjadi ketika data tidak membawa banyak informasi (mis. Noise tinggi atau sampel kecil).
Contoh: Bayangkan Anda memiliki sekantong koin yang Anda miliki koin yang adil dan tidak adil dan Anda ingin mengklasifikasikan koin tertentu dengan membalik 20 kali. (katakanlah koin adalah variabel bernoulli dengan untuk koin adil dan untuk koin tidak adil. Dalam hal ini, ketika Anda mengamati 10 kepala dan 10 ekor, maka Anda mungkin mengatakan p- nilainya sama dengan 1, tapi saya kira jelas bahwa koin yang tidak adil mungkin juga menciptakan hasil ini dan kita tidak boleh mengesampingkan kemungkinan bahwa koin itu tidak adil.p≈0.5 p∼U(0,1)
sumber
Tidak, karena "tidak adanya bukti bukanlah bukti ketidakhadiran." Probabilitas dapat dianggap sebagai perpanjangan logika , dengan ketidakpastian tambahan, jadi bayangkan sejenak bahwa alih-alih bilangan real pada interval satuan, tes hipotesis hanya akan mengembalikan nilai biner: 0 (salah) atau 1 (benar). Dalam kasus tersebut, aturan dasar logika berlaku, seperti dalam contoh berikut :
Tentang interval kepercayaan, jika sampel Anda besar, dan , maka interval kepercayaan untuk perbedaan akan menjadi sangat sempit, tetapi tidak nol. Seperti yang diperhatikan oleh orang lain, Anda bisa mengamati hal-hal seperti yang tepat dan nol, tetapi lebih karena keterbatasan presisi floating-point.μ1−μ2→0
Bahkan jika Anda mengamati dan interval kepercayaan , Anda masih perlu diingat bahwa tes hanya memberi Anda jawaban perkiraan. Saat melakukan pengujian hipotesis, kami tidak hanya membuat asumsi bahwa benar, tetapi juga membuat sejumlah asumsi lain, seperti bahwa sampel independen dan berasal dari distribusi normal, yang tidak pernah menjadi kasus untuk data dunia nyata. Tes memberi Anda jawaban perkiraan , untuk pertanyaan yang salah, sehingga tidak bisa "membuktikan" hipotesis, itu hanya bisa mengatakan "di bawah asumsi yang tidak masuk akal, ini tidak mungkin" .p=1 ±0 H0
sumber
Tidak ada yang menghentikan Anda dari menggunakan rumus t atau Gauss standar untuk menghitung interval kepercayaan - semua informasi yang diperlukan diberikan dalam pertanyaan Anda. p = 1 tidak berarti ada yang salah dengan itu. Perhatikan bahwa p = 1 tidak berarti Anda dapat yakin bahwa H0 benar. Variasi acak masih ada dan jika u0 = u1 dapat terjadi di bawah H0, itu juga dapat terjadi jika nilai sebenarnya u0 sedikit berbeda dari u1 yang benar, sehingga akan ada lebih banyak dalam interval kepercayaan daripada sekadar kesetaraan.
sumber
Tidak di antara orang yang tahu apa yang mereka bicarakan, dan berbicara dengan tepat. Pengujian hipotesis tradisional tidak pernah menyimpulkan bahwa nol itu benar, tapi apakah nol adalah benar atau tidak terpisah dari apakah nol tersebut disimpulkan untuk menjadi kenyataan.
Untuk tes dua sisi, ya.
Untuk perkiraan pertama, batas interval kepercayaan 95% adalah sekitar dua kali standar deviasi yang berlaku. Tidak ada diskontinuitas di nol. Jika Anda menemukan fungsi yang menemukan interval kepercayaan 95% untuk perbedaan dalam , Anda bisa menggunakan untuk menemukan interval kepercayaan untuk perbedaan rata-rata nol.f(ϵ) ϵ limϵ→0f(ϵ)
Kita dapat mengatakan apa pun yang kita inginkan. Namun, mengatakan bahwa tes menunjukkan nol menjadi benar tidak konsisten dengan pengujian hipotesis tradisional, terlepas dari hasilnya. Dan melakukannya tidak beralasan dari sudut pandang pembuktian. Hipotesis alternatif, bahwa rerata tidak sama, mencakup semua kemungkinan perbedaan rerata. Hipotesis alternatif adalah "Perbedaan dalam mean adalah , atau , atau , atau , atau1 2 3 .5 .1 , ... "Kita dapat menempatkan perbedaan kecil yang sewenang-wenang dalam rata-rata, dan itu akan konsisten dengan hipotesis alternatif. Dan dengan perbedaan kecil yang sewenang-wenang, probabilitas yang diberikan rata-rata mendekati arbitrase dengan probabilitas yang diberikan nol. Juga, hipotesis alternatif mencakup tidak hanya kemungkinan bahwa parameter distribusi, seperti rata-rata, berbeda, tetapi bahwa ada distribusi yang sama sekali berbeda. Misalnya, hipotesis alternatif mencakup "Dua sampel akan selalu memiliki perbedaan dalam cara bahwa ini adalah tepat 1 atau tepat 0, dengan probabilitas .5 untuk setiap ". Hasilnya lebih konsisten dengan itu maka mereka dengan nol.
sumber