Bisakah kita menolak hipotesis nol dengan interval kepercayaan yang dihasilkan melalui pengambilan sampel alih-alih hipotesis nol?

9

Saya telah diajarkan bahwa kita dapat menghasilkan estimasi parameter dalam bentuk interval kepercayaan setelah pengambilan sampel dari suatu populasi. Misalnya, interval kepercayaan 95%, tanpa asumsi yang dilanggar, harus memiliki tingkat keberhasilan 95% berisi apa pun parameter sebenarnya yang kami perkirakan ada dalam populasi.

Yaitu,

  1. Menghasilkan estimasi titik dari sampel.
  2. Menghasilkan rentang nilai yang secara teoritis memiliki peluang 95% berisi nilai sebenarnya yang kami coba perkirakan.

Namun, ketika topik beralih ke pengujian hipotesis, langkah-langkahnya dijelaskan sebagai berikut:

  1. Asumsikan beberapa parameter sebagai hipotesis nol.
  2. Menghasilkan distribusi probabilitas dari kemungkinan mendapatkan berbagai estimasi titik mengingat hipotesis nol ini benar.
  3. Tolak hipotesis nol jika estimasi titik yang kita peroleh akan dihasilkan kurang dari 5% dari waktu jika hipotesis nol itu benar.

Pertanyaan saya adalah ini:

Apakah perlu untuk menghasilkan interval kepercayaan kami menggunakan hipotesis nol untuk menolak nol? Mengapa tidak hanya melakukan prosedur pertama dan mendapatkan estimasi kami untuk parameter sebenarnya (tidak secara eksplisit menggunakan nilai hipotesis kami dalam menghitung interval kepercayaan) kemudian menolak hipotesis nol jika tidak masuk dalam interval ini?

Ini nampak secara logis setara dengan saya secara intuitif, tetapi saya khawatir bahwa saya kehilangan sesuatu yang sangat mendasar karena mungkin ada alasan mengapa hal itu diajarkan dengan cara ini.

Nikli
sumber
Maafkan saya karena tidak jelas, Martijn. Saya akan mengedit posting saya segera sehingga lebih jelas bagi orang-orang yang mencari pertanyaan yang sama di masa depan. Yang saya maksudkan adalah kita dapat menghitung estimasi parameter dari sampel, atau kita dapat menghitung berbagai estimasi yang akan kita anggap mendukung hipotesis nol menggunakan hipotesis nol. Saya tidak mengerti mengapa perlu menggunakan nol untuk melihat apakah estimasi titik kami dalam interval ini, daripada hanya menggunakan estimasi parameter kami dan memeriksa untuk melihat apakah nol itu dalam batas estimasi parameter. Saya harap itu masuk akal!
Nikli
Eksperimen pemikiran yang menarik adalah jika seseorang mencoba menjual dadu berbobot kepada Anda. Mereka menggulungnya, lalu menyatakan bahwa mereka ditimbang ke arah yang Anda amati (misalnya 6 muncul 20% dari waktu). Apakah mereka diberi bobot (sudah cukup lemparan sampel), seberapa banyak, dan apa yang layak untuk dilakukan tes lemparan dadu (ekstra) Anda sendiri? Penjual dan pembeli memiliki tujuan yang berbeda ...
Philip Oakley

Jawaban:

5

Masalah sederhana, sebagai contoh, diberikan dengan menguji rata-rata populasi normal dengan varians yang diketahui . Kemudian, pivot - kuantitas yang distribusinya tidak bergantung pada parameter, diberikan oleh . Nilai kritis memuaskan, dalam kasus simetris ini, dan .ˉ Y - μ N ( 0 , 1 / n ) z α / 2 Φ ( - z α / 2 ) = α / 2 Φ ( z α / 2 ) = 1 - α / 2σ2=1Y¯μN(0,1/n)zα/2Φ(zα/2)=α/2Φ(zα/2)=1α/2

Karenanya, sehingga adalah interval kepercayaan level .

1α=Pr{(X¯μ)/(1/n)(zα/2,zα/2)}=Pr{zα/2(X¯μ)nzα/2}=Pr{zα/2(μX¯)nzα/2}=Pr{zα/2/nμX¯zα/2/n}=Pr{X¯zα/2/nμX¯+zα/2/n}=Pr{(X¯zα/2/n,X¯+zα/2/n)μ}
(X¯zα/2/n,X¯+zα/2/n)
1α

Pada saat yang sama, peristiwa pada baris pertama tampilan adalah persis juga peristiwa bahwa hipotesis nol tidak ditolak untuk . Karena sisanya hanya berisi reformulasi setara, ci memang berisi semua yang nol tidak ditolak, dan tidak ada referensi untuk "di bawah nol" diperlukan.μμ

Berikut adalah plot analog dengan visualisasi +1 Martijn yang bertujuan untuk menunjukkan apa yang dikenal sebagai dualitas antara interval kepercayaan dan tes. menunjukkan interval kepercayaan yang dimiliki oleh beberapa dan wilayah penerimaan yang dimiliki oleh beberapa hipotesis .Cx¯A(μ0)μ=μ0

masukkan deskripsi gambar di sini

Christoph Hanck
sumber
10

Ya, Anda dapat mengganti tes hipotesis (membandingkan sampel dengan distribusi hipotetis hasil tes) dengan perbandingan dengan interval kepercayaan yang dihitung dari sampel. Tetapi secara tidak langsung interval kepercayaan sudah menjadi semacam tes hipotesis, yaitu:

  • Anda mungkin melihat interval kepercayaan sebagai sedang dibangun sebagai rentang nilai yang mana tes hipotesis tingkat akan berhasilα dan di luar kisaran tes hipotesis tingkat akan gagal.α

Konsekuensi dari membuat berbagai tersebut adalah bahwa rentang hanya gagal sebagian kecil waktu.α

Contoh

Saya menggunakan gambar dari jawaban untuk pertanyaan di bawah ini: Interval Keyakinan: bagaimana cara berurusan secara formal denganP(L(X)θ,U(X)θ)=1α

Ini adalah variasi dari grafik dari Clopper-Pearson . Bayangkan kasus 100 percobaan Bernoulli mana probabilitas keberhasilan adalah dan kita amati jumlah total keberhasilan .θX

probabilitas fidusia

Perhatikan bahwa:

  • Dalam arah vertikal Anda melihat pengujian hipotesis. Misalnya untuk nilai hipotesis yang diberikan Anda menolak hipotesis jika diukur berada di atas atau di bawah garis putus-putus merah atau hijau.θX

  • Dalam arah horizontal Anda melihat interval kepercayaan Clopper-Pearson. Jika untuk setiap pengamatan X yang Anda gunakan interval kepercayaan ini maka Anda akan salah hanya 5% dari waktu

    (karena Anda hanya akan mengamati X seperti itu, di mana Anda mendasarkan interval 'salah', 5% dari waktu)

Sextus Empiricus
sumber