Pemahaman saya saat ini tentang gagasan "interval kepercayaan dengan tingkat kepercayaan " adalah bahwa jika kita mencoba menghitung interval kepercayaan berkali-kali (setiap kali dengan sampel baru), itu akan berisi parameter dari waktu.1 - α
Meskipun saya menyadari bahwa ini tidak sama dengan "probabilitas bahwa parameter sebenarnya terletak pada interval ini", ada sesuatu yang ingin saya perjelas.
[Pembaruan Utama]
Sebelum kita menghitung interval kepercayaan 95%, ada kemungkinan 95% bahwa interval yang kita hitung akan mencakup parameter sebenarnya. Setelah kami menghitung interval kepercayaan dan mendapatkan interval tertentu , kami tidak bisa lagi mengatakan ini. Kami bahkan tidak dapat membuat semacam argumen non-sering bahwa kami 95% yakin parameter sebenarnya akan terletak pada ; karena jika kita bisa, itu akan bertentangan dengan contoh tandingan seperti ini: Apa, tepatnya, interval kepercayaan?[ a , b ]
Saya tidak ingin membuat ini menjadi perdebatan tentang filosofi probabilitas; sebaliknya, saya mencari penjelasan matematis yang tepat tentang bagaimana dan mengapa melihat interval tertentu berubah (atau tidak berubah) probabilitas 95% yang kami miliki sebelum melihat interval itu. Jika Anda berpendapat bahwa "setelah melihat interval, gagasan probabilitas tidak lagi masuk akal", maka baik, mari kita bekerja dalam interpretasi probabilitas di mana ia tidak masuk akal.
Lebih tepatnya:
Misalkan kita memprogram komputer untuk menghitung interval kepercayaan 95%. Komputer melakukan beberapa angka, menghitung suatu interval, dan menolak untuk menunjukkan kepada saya interval sampai saya memasukkan kata sandi. Sebelum saya memasukkan kata sandi dan melihat intervalnya (tetapi setelah komputer menghitungnya), berapa probabilitas interval tersebut akan berisi parameter yang benar? 95%, dan bagian ini tidak cocok untuk diperdebatkan : ini adalah interpretasi probabilitas yang saya minati untuk pertanyaan khusus ini (saya menyadari ada masalah filosofis utama yang saya tekan, dan ini disengaja).
Tetapi begitu saya mengetikkan kata sandi dan membuat komputer menunjukkan kepada saya interval yang dihitungnya, probabilitas (bahwa interval tersebut berisi parameter sebenarnya) dapat berubah. Klaim apa pun yang probabilitas ini tidak pernah berubah akan bertentangan dengan sampel tandingan di atas. Dalam contoh tandingan ini, probabilitas dapat berubah dari 50% menjadi 100%, tetapi ...
Apakah ada contoh di mana probabilitas berubah menjadi sesuatu selain 100% atau 0% (EDIT: dan jika demikian, apa itu)?
Adakah contoh di mana probabilitas tidak berubah setelah melihat interval tertentu (yaitu probabilitas bahwa parameter sebenarnya terletak pada masih 95%)?[ a , b ]
Bagaimana (dan mengapa) perubahan probabilitas secara umum setelah melihat komputer meludahkan ?
[Sunting]
Terima kasih atas semua jawaban dan diskusi bermanfaat!
sumber
Jawaban:
Saya pikir masalah mendasar adalah bahwa statistik frequentist hanya dapat menetapkan probabilitas untuk sesuatu yang dapat memiliki frekuensi jangka panjang. Apakah nilai sebenarnya dari suatu parameter terletak pada interval tertentu atau tidak, tidak memiliki frekuensi jangka panjang, karena kami hanya dapat melakukan eksperimen satu kali, sehingga Anda tidak dapat menetapkan probabilitas yang sering terjadi padanya. Masalah muncul dari definisi probabilitas. Jika Anda mengubah definisi probabilitas menjadi probabilitas Bayesian, maka masalah tersebut langsung hilang karena Anda tidak lagi terikat pada diskusi tentang frekuensi jangka panjang.
Lihat jawaban saya (agak tersinggung di pipi) untuk pertanyaan terkait di sini :
" Seorang Frequentist adalah seseorang yang percaya bahwa probabilitas mewakili frekuensi jangka panjang yang dengannya peristiwa terjadi; jika perlu, ia akan menciptakan populasi fiktif yang darinya situasi khusus Anda dapat dianggap sebagai sampel acak sehingga ia dapat berbicara dengan bermakna tentang frekuensi jangka panjang. Jika Anda bertanya kepadanya tentang situasi tertentu, dia tidak akan memberikan jawaban langsung, tetapi malah membuat pernyataan tentang populasi (mungkin imajiner) ini. "
Dalam kasus interval kepercayaan, pertanyaan yang biasanya ingin kita tanyakan (kecuali kita memiliki masalah dalam kontrol kualitas misalnya) adalah "diberikan sampel data ini, kembalikan interval terkecil yang berisi nilai sebenarnya dari parameter dengan probabilitas X ". Namun seorang frequentist tidak dapat melakukan ini karena percobaan hanya dilakukan sekali dan karenanya tidak ada frekuensi jangka panjang yang dapat digunakan untuk menetapkan suatu probabilitas. Jadi alih-alih yang sering harus menemukan populasi percobaan (yang tidak Anda lakukan) dari mana percobaan yang Anda lakukan dapat dianggap sebagai sampel acak. Sering itu kemudian memberi Anda jawaban tidak langsung tentang populasi percobaan fiktif itu, daripada jawaban langsung untuk pertanyaan yang benar-benar ingin Anda tanyakan tentang eksperimen tertentu.
Pada dasarnya ini adalah masalah bahasa, definisi popuation yang sering muncul tidak memungkinkan diskusi tentang kemungkinan nilai sebenarnya dari sebuah parameter yang terletak pada interval tertentu. Itu tidak berarti statistik frequentist buruk, atau tidak berguna, tetapi penting untuk mengetahui keterbatasannya.
Mengenai pembaruan utama
Saya tidak yakin kita dapat mengatakan bahwa "Sebelum kita menghitung interval kepercayaan 95%, ada kemungkinan 95% bahwa interval yang kita hitung akan mencakup parameter sebenarnya." dalam kerangka kerja frequentist. Ada kesimpulan implisit di sini bahwa frekuensi jangka panjang yang dengannya nilai sebenarnya dari parameter terletak pada interval kepercayaan yang dibangun oleh beberapa metode tertentu juga kemungkinan bahwa nilai sebenarnya dari parameter akan terletak pada interval kepercayaan untuk sampel tertentu. data yang akan kita gunakan. Ini adalah kesimpulan yang masuk akal, tetapi merupakan kesimpulan Bayesian, bukan yang sering, karena probabilitas bahwa nilai sebenarnya dari parameter terletak pada interval kepercayaan yang kami buat untuk sampel data tertentu tidak memiliki freqency jangka panjang, karena kami hanya memiliki satu sampel data.
Namun kita dapat "membuat semacam argumen non-sering bahwa kita 95% yakin parameter sebenarnya akan terletak pada [a, b]", itulah yang merupakan interval kredibel Bayesian, dan untuk banyak masalah interval kredibel Bayesian persis bertepatan dengan interval kepercayaan yang sering terjadi.
"Saya tidak ingin membuat ini menjadi perdebatan tentang filosofi probabilitas", sayangnya hal ini tidak dapat dihindari, alasan mengapa Anda tidak dapat menetapkan probabilitas frequentist untuk apakah nilai sebenarnya dari statistik terletak pada interval kepercayaan adalah konsekuensi langsung dari filosofi probabilitas probabilitas. Frequentists hanya dapat menetapkan probabilitas untuk hal-hal yang dapat memiliki frekuensi jangka panjang, karena itulah bagaimana frequentist menentukan probabilitas dalam filosofi mereka. Itu tidak membuat filosofi frequentist salah, tetapi penting untuk memahami batasan yang ditentukan oleh definisi probabilitas.
"Sebelum saya memasukkan kata sandi dan melihat intervalnya (tetapi setelah komputer menghitungnya), berapa probabilitas interval tersebut berisi parameter sebenarnya? Ini 95%, dan bagian ini tidak cocok untuk diperdebatkan:" Ini tidak benar, atau setidaknya dalam membuat pernyataan seperti itu, Anda telah berangkat dari kerangka kerja statistik frequentist dan telah membuat kesimpulan Bayesian yang melibatkan tingkat masuk akal dalam kebenaran pernyataan, daripada frekuensi jangka panjang. Namun, seperti yang telah saya katakan sebelumnya, ini adalah kesimpulan yang masuk akal dan alami.
Tidak ada yang berubah sebelum atau setelah memasukkan kata sandi, karena peristiwa niether dapat ditetapkan sebagai probabilitas yang sering terjadi. Statistik Frequentist dapat menjadi agak kontra-intuitif karena kita sering ingin bertanya tentang tingkat pernyataan yang masuk akal mengenai peristiwa-peristiwa tertentu, tetapi ini berada di luar jangkauan statistik frequentist, dan ini adalah asal dari kebanyakan interpretasi yang keliru dari prosedur yang sering terjadi.
sumber
Pembaruan besar, jawaban baru utama. Biarkan saya mencoba untuk dengan jelas membahas hal ini, karena di situlah masalahnya:
"Jika Anda berpendapat bahwa" setelah melihat interval, gagasan tentang probabilitas tidak lagi masuk akal ", maka baiklah, mari kita bekerja dalam interpretasi probabilitas di mana ia masuk akal."
Aturan probabilitas tidak berubah tetapi model Anda untuk semesta tidak berubah. Apakah Anda bersedia untuk mengukur keyakinan Anda sebelumnya tentang parameter menggunakan distribusi probabilitas? Apakah memperbarui distribusi probabilitas setelah melihat data merupakan hal yang wajar untuk dilakukan? Jika Anda berpikir demikian maka Anda dapat membuat pernyataan seperti . Distribusi saya sebelumnya dapat mewakili ketidakpastian saya tentang keadaan alam yang sebenarnya , bukan hanya keacakan seperti yang biasa dipahami - yaitu, jika saya menetapkan distribusi sebelumnya ke jumlah bola merah dalam sebuah guci itu tidak berarti saya pikir jumlahnya bola merah adalah acak. Sudah diperbaiki, tapi saya tidak yakin tentang itu.P( θ ∈ [ L ( X) , U( X) ] | X= x )
Beberapa orang termasuk saya telah mengatakan ini, tetapi jika Anda tidak bersedia memanggil sebagai variabel acak maka pernyataan tidak berarti. Jika saya sering, saya memperlakukan sebagai kuantitas tetap DAN saya tidak bisa menganggap distribusi probabilitas untuk itu. Mengapa? Karena sudah diperbaiki, dan interpretasi saya tentang probabilitas adalah dalam hal frekuensi jangka panjang. Jumlah bola merah di dalam guci tidak pernah berubah. adalah apa itu . Jika saya mengeluarkan beberapa bola maka saya memiliki sampel acak. Saya dapat bertanya apa yang akan terjadi jika saya mengambil banyak sampel acak - artinya, saya dapat berbicara tentangP ( θ ∈ [ L ( X ) , U ( X ) ] | X = x ) θ θ θ P ( θ ∈ [ L ( X ) , U ( X ) ] )θ P( θ ∈ [ L ( X) , U( X) ] | X= x ) θ θ θ P( θ ∈ [ L ( X) , U( X) ] ) karena interval tergantung pada sampel, yang (tunggu!) acak.
Tetapi Anda tidak menginginkan itu. Anda ingin - berapa probabilitas interval yang saya buat dengan sampel yang saya amati (dan sekarang diperbaiki) ini berisi parameter. Namun, setelah Anda mengkondisikan lalu kepada saya, sering, tidak ada yang tersisa secara acak dan pernyataan tidak Tidak masuk akal dengan cara apa pun yang berarti.X = x P ( θ ∈ [ L ( X ) , U ( X ) ] | X = x )P( θ ∈ [ L ( X) , U( X) ] | X= x ) X= x P( θ ∈ [ L ( X) , U( X) ] | X= x )
Satu-satunya cara berprinsip (IMO) untuk membuat pernyataan tentang adalah untuk mengukur ketidakpastian kita tentang suatu parameter dengan distribusi probabilitas (sebelum) dan perbarui distribusi itu dengan informasi baru melalui Bayes Theorem. Setiap pendekatan lain yang saya lihat adalah pendekatan yang kurang bagus untuk Bayes. Anda tentu tidak dapat melakukannya dari perspektif yang sering.P( θ ∈ [ L ( X) , U( X) ] | X= x )
Itu bukan untuk mengatakan bahwa Anda tidak dapat mengevaluasi prosedur frequentist tradisional dari perspektif Bayesian (misalnya interval kepercayaan hanya interval yang kredibel di bawah prior uniform, misalnya) atau bahwa mengevaluasi estimator Bayesian / interval kredibel dari perspektif frequentist tidak berharga (Saya pikir itu bisa). Bukan untuk mengatakan bahwa statistik klasik / sering tidak berguna, karena tidak. Itu adalah apa adanya, dan kita seharusnya tidak mencoba membuatnya lebih.
Apakah menurut Anda masuk akal untuk memberikan parameter distribusi sebelumnya untuk mewakili keyakinan Anda tentang alam semesta? Kedengarannya seperti itu dari komentar Anda yang Anda lakukan; dalam pengalaman saya kebanyakan orang akan setuju (itulah setengah-lelucon kecil yang saya buat dalam komentar saya ke @G. Jawaban Jay Kerns). Jika demikian, paradigma Bayesian menyediakan cara yang logis dan koheren untuk membuat pernyataan tentang . Pendekatan frequentist tidak.P( θ ∈ [ L ( X) , U( X) ] | X= x )
sumber
OKE, sekarang kamu bicara! Saya memilih untuk menghapus jawaban saya sebelumnya karena tidak masuk akal dengan pertanyaan besar yang diperbarui ini.
Dalam pertanyaan baru yang diperbarui ini, dengan komputer yang menghitung interval kepercayaan 95%, di bawah interpretasi ortodoks yang sering terjadi, berikut adalah jawaban untuk pertanyaan Anda:
(Ngomong-ngomong, di dunia nyata, pelaku eksperimen tidak pernah tahu bahwa , yang berarti pelaku eksperimen tidak akan pernah tahu apakah probabilitas sebenarnya mencakup adalah nol atau satu. (S) ia hanya dapat mengatakan bahwa itu harus salah satu atau yang lain.) Itu, ditambah eksperimen dapat mengatakan bahwa 95% dari interval komputer mencakup , tetapi kami sudah tahu itu.[ 1 , 3 ] θ θθ = 7 [ 1 , 3 ] θ θ
Semangat pertanyaan Anda terus mengisyaratkan kembali ke pengetahuan pengamat , dan bagaimana itu berhubungan dengan di mana berada. Itu (mungkin) adalah mengapa Anda berbicara tentang kata sandi, tentang komputer yang menghitung interval tanpa Anda melihatnya, dll . Saya telah melihat di komentar Anda untuk jawaban yang tampaknya tidak memuaskan / tidak pantas untuk berkomitmen untuk 0 atau 1, setelah semua, mengapa kita tidak percaya itu 87%, atau , atau bahkan 99% ?? ? Tapi itu persis kekuatan - dan sekaligus tumit Achilles - dari kerangka kerja yang sering terjadi: pengetahuan / kepercayaan subjektif dari pengamat tidak relevan. Yang penting hanyalah frekuensi relatif jangka panjang. Tidak lebih, tidak kurang.15 / 16θ 15/16
Sebagai BTW final: jika Anda mengubah interpretasi probabilitas Anda (yang Anda pilih untuk tidak melakukan pertanyaan ini), maka jawaban baru adalah:
(Tetapi untuk pengungkapan penuh, pengaturan yang Anda gambarkan tidak cocok dengan interpretasi subjektif dengan sangat baik. Misalnya, kami biasanya memiliki interval kredibel sebelum 95% bahkan sebelum menyalakan komputer, kemudian kami jalankan dan gunakan komputer untuk memberikan kami interval kredibel posterior 95% yang biasanya jauh lebih kurus dari yang sebelumnya.)
sumber
Saya akan memasukkan dua sen saya (mungkin menguji ulang beberapa jawaban sebelumnya). Bagi seorang frequentist, interval kepercayaan itu sendiri pada dasarnya adalah variabel acak dua dimensi: jika Anda mengulang eksperimen sebanyak satu kali, interval kepercayaan yang Anda perkirakan (yaitu: menghitung dari data yang baru Anda temukan setiap kali) akan berbeda setiap kali . Dengan demikian, dua batas interval adalah variabel acak.
Maka, 95% CI berarti tidak lebih dari jaminan (mengingat semua asumsi Anda yang mengarah ke CI ini benar) bahwa rangkaian variabel acak ini akan berisi nilai sebenarnya (ekspresi yang sangat sering) pada 95% kasus.
Anda dapat dengan mudah menghitung interval kepercayaan untuk rata-rata 100 penarikan dari distribusi normal standar. Kemudian, jika Anda menggambar 10.000 kali nilai 100 dari distribusi normal standar, dan setiap kali menghitung interval kepercayaan untuk rata-rata, Anda memang akan melihat bahwa 0 ada di sana sekitar 9500 kali.
Kenyataan bahwa Anda telah menciptakan sebuah interval kepercayaan hanya sekali (dari data Anda yang sebenarnya) memang mengurangi kemungkinan nilai sebenarnya berada di bahwa interval 0 atau 1, tapi itu tidak mengubah probabilitas interval kepercayaan sebagai variabel acak mengandung nilai sebenarnya.
Jadi, intinya: probabilitas setiap (yaitu rata-rata) 95% interval kepercayaan yang mengandung nilai sebenarnya (95%) tidak berubah, dan begitu juga dengan probabilitas interval tertentu (CI atau apa pun) untuk mengandung nilai sebenarnya (0 atau 1). Probabilitas interval yang diketahui komputer tetapi Anda tidak benar-benar 0 atau 1 (karena ini adalah interval tertentu), tetapi karena Anda tidak mengetahuinya (dan, secara sering, tidak dapat menghitung ulang interval yang sama ini) berkali-kali tak terhingga dari data yang sama), yang harus Anda lakukan adalah probabilitas interval apa pun.
sumber
Alasan bahwa interval kepercayaan tidak menentukan "probabilitas bahwa parameter sebenarnya terletak pada interval" adalah karena begitu interval ditentukan, paramater berada di dalamnya atau tidak. Namun, untuk interval kepercayaan 95% misalnya, Anda memiliki peluang 95% untuk membuat interval kepercayaan yang memang mengandung nilai. Ini adalah konsep yang cukup sulit untuk dipahami, jadi saya mungkin tidak mengartikulasikannya dengan baik. Lihat http://frank.itlab.us/datamodel/node39.html untuk klarifikasi lebih lanjut.
sumber
Saya tidak berpikir seorang frequentist dapat mengatakan ada kemungkinan nilai (populasi) sebenarnya dari suatu statistik terletak pada interval kepercayaan untuk sampel tertentu. Entah itu benar atau tidak, tetapi tidak ada frekuensi jangka panjang untuk peristiwa tertentu, hanya populasi peristiwa yang akan Anda peroleh dengan kinerja prosedur statistik yang berulang. Inilah sebabnya mengapa kita harus tetap dengan pernyataan seperti "95% interval kepercayaan yang dibangun akan mengandung nilai sebenarnya dari statistik", tetapi tidak "ada p% probabilitas bahwa nilai sebenarnya terletak pada interval kepercayaan yang dihitung untuk khusus ini Sampel". Ini berlaku untuk setiap nilai p, itu tidak mungkin dengan definisi sering tentang apa sebenarnya probabilitas. Seorang Bayesian dapat membuat pernyataan seperti itu menggunakan interval yang kredibel.
sumber
Edit: @G. Jay Kerns membuat argumen lebih baik dari saya, dan mengetik lebih cepat, jadi mungkin hanya bergerak :)
sumber
sumber
Ada begitu banyak penjelasan panjang di sini sehingga saya tidak punya waktu untuk membacanya. Tapi saya pikir jawaban atas pertanyaan dasar bisa pendek dan manis. Ini adalah perbedaan antara probabilitas yang tidak bersyarat pada data. Probabilitas 1-alpha sebelum mengumpulkan tanggal adalah probabilitas bahwa prosedur yang didefinisikan dengan baik akan memasukkan parameter. Setelah Anda mengumpulkan data dan mengetahui interval spesifik yang telah Anda hasilkan, intervalnya tetap dan karena parameternya konstan, probabilitas kondisional ini adalah 0 atau 1. Tetapi karena kita tidak tahu nilai sebenarnya dari parameter tersebut, bahkan setelah mengumpulkan data, kami tidak tahu nilainya.
Perpanjangan pos oleh Michael Chernick menyalin komentar formulir:
ada pengecualian patologis untuk ini yang bisa disebut estimasi sempurna. Misalkan kita memiliki proses autoregresif urutan pertama yang diberikan oleh X (n) = pX (n-1) + en. Itu diam sehingga kita tahu p bukan 1 atau -1 dan <1 dalam nilai absolut. Sekarang en terdistribusi secara independen identik dengan distribusi campuran, ada probabilitas positif q bahwa en = 0
Ada pengecualian patologis untuk ini yang bisa disebut estimasi sempurna. Misalkan kita memiliki proses autoregresif urutan pertama yang diberikan oleh X (n) = pX (n-1) + en. Itu diam sehingga kita tahu p bukan 1 atau -1 dan <1 dalam nilai absolut.
Sekarang en secara independen terdistribusi secara identik dengan distribusi campuran, ada probabilitas positif q bahwa en = 0 dan dengan probabilitas 1-q memiliki distribusi yang benar-benar kontinu (katakanlah bahwa kepadatannya bukan nol dalam interval yang dibatasi dari 0. Kemudian kumpulkan data dari deret waktu secara berurutan dan untuk masing-masing pasangan estimasi nilai berturut-turut p oleh X (i) / X (i-1). Sekarang ketika ei = 0 rasionya akan sama dengan p tepat.
Karena q lebih besar dari 0 akhirnya rasio akan mengulangi nilai dan nilai itu harus menjadi nilai tepat dari parameter p karena jika bukan nilai ei yang bukan 0 akan mengulangi dengan probabilitas 0 dan ei / x (i -1) tidak akan diulang.
Jadi aturan pemberhentian berurutan adalah untuk sampel sampai rasio berulang tepat kemudian menggunakan nilai yang diulang sebagai estimasi p. Karena p persis interval apa pun yang Anda buat yang berpusat pada perkiraan ini memiliki probabilitas 1 termasuk parameter sebenarnya. Meskipun ini adalah contoh patologis yang tidak praktis ada proses stochastic stasioner dengan sifat-sifat yang kita butuhkan untuk distribusi kesalahan
sumber
Dua pengamatan tentang banyak pertanyaan dan tanggapan yang mungkin masih membantu.
Bagian dari kebingungan datang dari menyelinap beberapa matematika yang lebih dalam dari teori probabilitas, yang, omong-omong, tidak pada pijakan matematika perusahaan sampai sekitar 1940-an. Ini masuk ke dalam apa yang merupakan ruang sampel, ruang probabilitas, dll.
Pertama, Anda telah menyatakan bahwa setelah flip koin kita tahu bahwa ada kemungkinan 0% itu tidak muncul ekor jika muncul kepala. Pada titik itu, tidak masuk akal untuk berbicara tentang probabilitas; apa yang terjadi terjadi, dan kita tahu itu. Probabilitas adalah tentang yang tidak diketahui di masa depan, bukan yang diketahui di masa sekarang.
Sebagai konsekuensi kecil terhadap arti nol probabilitas sebenarnya, pertimbangkan ini: kita asumsikan jumlah yang adil memiliki probabilitas 0,5 untuk muncul kepala, dan 0,5 untuk muncul ekor. Ini berarti ia memiliki peluang 100% untuk muncul baik kepala atau ekor, karena hasil tersebut adalah MECE (saling eksklusif dan sepenuhnya lengkap). Namun, perubahan nol persen untuk menyusun kepala dan ekor : Gagasan kami tentang 'kepala' dan 'ekor' adalah bahwa mereka saling eksklusif. Dengan demikian, ini memiliki peluang nol persen karena tidak mungkin dalam cara kita memikirkan (atau mendefinisikan) 'melempar koin'. Dan tidak mungkin sebelum dan sesudah lemparan.
Sebagai konsekuensi lebih lanjut dari ini, apa pun yang tidak, menurut definisi, tidak mungkin adalah mungkin. Di dunia nyata, saya benci ketika pengacara bertanya "tidak mungkin Anda menandatangani dokumen ini dan melupakannya?" karena jawabannya selalu 'ya' dengan sifat pertanyaannya. Untuk itu, jawabannya juga 'ya' untuk pertanyaan "bukankah mungkin Anda diangkut melalui dematerialisasi ke planet Remulak 4 dan dipaksa untuk melakukan sesuatu kemudian diangkut kembali tanpa ingatan akan hal itu?". Kemungkinannya mungkin sangat rendah - tetapi apa yang tidak mustahil adalah mungkin. Dalam konsep probabilitas reguler kami, ketika kita berbicara tentang membalik koin, itu mungkin muncul di kepala; mungkin muncul ekor; dan bahkan mungkin berdiri di ujung atau (entah bagaimana, seperti jika kita tertidur di pesawat ruang angkasa saat dibius dan dibawa ke orbit) mengapung di udara selamanya. Tapi, sebelum atau sesudah lemparan, ekor pada saat yang sama: mereka adalah hasil yang saling eksklusif dalam ruang sampel percobaan (lihat 'ruang sampel probabilitas' dan 'sigma-aljabar').
Kedua, pada semua filosofi Bayesian / Frequentist tentang interval kepercayaan, memang benar itu berkaitan dengan frekuensi jika seseorang bertindak sebagai frequentist. Jadi, ketika kita mengatakan interval kepercayaan untuk rata-rata sampel dan estimasi adalah 95%, kita tidak mengatakan bahwa kita 95% yakin nilai 'nyata' terletak di antara batas. Kami mengatakan bahwa, jika kami dapat mengulangi percobaan ini berulang kali, 95% dari waktu kami akan menemukan bahwa rata-rata, memang, di antara batas. Ketika kita melakukannya dengan sekali jalan, bagaimanapun, kita mengambil jalan pintas mental dan mengatakan 'kita 95% yakin kita benar'.
Akhirnya, jangan lupa apa pengaturan standar pada tes hipotesis berdasarkan percobaan. Jika kita ingin tahu apakah hormon pertumbuhan tanaman membuat tanaman tumbuh lebih cepat, mungkin kita pertama-tama menentukan ukuran rata-rata tomat setelah 6 bulan pertumbuhan. Lalu kami ulangi, tetapi dengan hormon, dan dapatkan ukuran rata-rata. Hipotesis nol kami adalah 'hormon tidak bekerja', dan kami menguji bahwa . Tetapi, jika tanaman yang diuji rata-rata lebih besar, dengan kepercayaan 99%, itu berarti 'akan selalu ada variasi acak karena tanaman dan seberapa akurat kami menimbang, tetapi jumlah keacakan yang akan menjelaskan hal ini akan terjadi kurang dari satu waktu dalam seratus. "
sumber
Masalah ini dapat dicirikan sebagai kebingungan probabilitas sebelum dan posterior atau mungkin sebagai ketidakpuasan karena tidak mengetahui distribusi bersama variabel acak tertentu.
Pengkondisian
Tidak mengkondisikan bukti berarti mengabaikan bukti. Namun, kita hanya dapat mengkondisikan pada apa yang dapat diungkapkan dalam model probabilistik. Dalam contoh kita dengan dua bola dari guci, kita tidak bisa mengkondisikan cuaca atau bagaimana perasaan kita hari ini. Jika kami memiliki alasan untuk percaya bahwa itu adalah bukti yang relevan dengan percobaan, kami harus mengubah model kami terlebih dahulu agar kami dapat mengekspresikan bukti ini sebagai peristiwa formal.
Interval Keyakinan
Belajar Lebih Banyak, Lebih Sedikit Mengetahui
sumber
Jika saya mengatakan probabilitas skor Knicks antara xbar - 2sd (x) dan xbar + 2sd (x) adalah sekitar 0,95 dalam beberapa permainan di masa lalu, itu adalah pernyataan yang masuk akal mengingat beberapa asumsi distribusi khusus tentang distribusi skor bola basket . Jika saya mengumpulkan data tentang skor yang diberikan beberapa sampel game dan menghitung interval itu, probabilitas bahwa mereka mencetak skor dalam interval itu pada hari tertentu di masa lalu jelas nol atau satu, dan Anda dapat google hasil permainan untuk mencari tahu. Satu-satunya anggapan itu mempertahankan non-nol atau satu probabilitas untuk frequentist berasal dari pengambilan sampel berulang, dan realisasi estimasi interval sampel tertentu adalah titik ajaib di mana itu terjadi atau tidak memberikan perkiraan interval sampel itu . Itu bukan titik di mana Anda mengetikkan kata sandi,
Inilah yang dikemukakan Dikran di atas, dan saya telah memilih jawabannya. Titik ketika sampel berulang di luar pertimbangan adalah titik dalam paradigma frequentist di mana probabilitas non-diskrit menjadi tidak dapat diperoleh , bukan ketika Anda mengetikkan kata sandi seperti dalam contoh Anda di atas, atau ketika Anda google hasilnya dalam contoh saya dari Game Knicks, tetapi intinya saat jumlah sampel Anda = 1.
sumber
Pemodelan
Langkah (1) memungkinkan beberapa kelonggaran. Ketepatan pemodelan kadang-kadang dapat diuji dengan membandingkan probabilitas peristiwa tertentu dengan apa yang kita harapkan secara intuitif. Secara khusus, melihat probabilitas marginal atau kondisional tertentu dapat membantu untuk mendapatkan gambaran seberapa tepat pemodelannya.
Estimator Interval Keyakinan
Preferensi
Contoh dengan Prioritas Sederhana
sumber
Jika kita bisa mengatakan "probabilitas bahwa parameter sebenarnya terletak pada interval kepercayaan ini" maka kita tidak akan memperhitungkan ukuran sampel. Tidak peduli seberapa besar sampelnya, asalkan meannya sama, maka interval kepercayaannya akan sama lebar. Tetapi ketika kita mengatakan "jika saya mengulangi ini 100 kali, maka saya akan berharap bahwa dalam 95 kasus parameter sebenarnya akan berada dalam interval", kami memperhitungkan ukuran ukuran sampel, dan seberapa yakin perkiraan kami . Semakin besar ukuran sampel, semakin sedikit varians yang akan memiliki estimasi rata-rata. Jadi itu tidak akan berubah banyak, dan ketika kita mengulangi prosedur 100 kali, kita tidak perlu interval besar untuk memastikan bahwa dalam 95 kasus parameter sebenarnya dalam interval.
sumber