Bisakah seseorang tolong jelaskan statistik yang cukup dalam istilah yang sangat mendasar? Saya berasal dari latar belakang teknik, dan saya telah melalui banyak hal tetapi gagal menemukan penjelasan yang intuitif.
sumber
Bisakah seseorang tolong jelaskan statistik yang cukup dalam istilah yang sangat mendasar? Saya berasal dari latar belakang teknik, dan saya telah melalui banyak hal tetapi gagal menemukan penjelasan yang intuitif.
Statistik yang memadai merangkum semua informasi yang terkandung dalam sampel sehingga Anda akan membuat taksiran parameter yang sama apakah kami memberi Anda sampel atau hanya statistik itu sendiri. Ini pengurangan data tanpa kehilangan informasi.
Ini salah satu contohnya. Misalkan memiliki distribusi simetris tentang nol. Alih-alih memberi Anda sampel, saya memberikan sampel nilai absolut sebagai gantinya (itulah statistik). Anda tidak bisa melihat tandanya. Tetapi Anda tahu bahwa distribusinya simetris, jadi untuk nilai yang diberikan x , - x dan x kemungkinan sama besar (probabilitas bersyarat 0,5 ). Jadi Anda bisa melempar koin yang adil. Jika muncul kepala, buat itu x negatif. Jika berbuntut, buatlah positif. Ini memberi Anda sampel dari X ′ , yang memiliki distribusi yang sama dengan data asli X. Anda pada dasarnya dapat merekonstruksi data dari statistik. Itu yang membuatnya cukup.
Dalam istilah Bayesian, Anda memiliki beberapa propertiX dapat diamati dan parameter Θ . Distribusi gabungan untuk X, Θ ditentukan, tetapi diperhitungkan sebagai distribusi bersyarat dari X∣ Θ dan distribusi sebelumnya Θ . Statistik T cukup untuk model ini jika dan hanya jika distribusi posterior Θ ∣ X sama dengan Θ ∣ T( X) , untuk setiap distribusi Θ . Dengan kata lain, ketidakpastian Anda yang diperbarui tentang Θ setelah mengetahui nilaiX sama dengan ketidakpastian Anda yang diperbarui tentangΘ setelah mengetahui nilaiT( X) ,apa pun informasi sebelumnya yang Anda miliki tentang Θ . Ingatlah bahwa kecukupan adalah konsep yang bergantung pada model.
sumber
Katakanlah Anda memiliki koin, dan Anda tidak tahu apakah itu adil atau tidak. Dengan kata lain, ia memiliki probabilitashal untuk muncul kepala ( H ) dan 1 - hal muncul ekor ( T ), dan Anda tidak tahu nilai hal .
Anda mencoba untuk mendapatkan ide tentang nilaihal dengan melemparkan koin beberapa kali, katakanlah n kali.
Katakanlahn = 5 dan hasil yang Anda dapatkan adalah urutan ( H, H, T, H, T) .
Sekarang Anda ingin teman ahli statistik Anda memperkirakan nilaihal untuk Anda, dan mungkin memberi tahu Anda apakah koin itu kemungkinan adil atau tidak. Informasi apa yang perlu Anda sampaikan kepada mereka sehingga mereka dapat melakukan perhitungan dan membuat kesimpulan?
Anda bisa memberi tahu mereka semua data, yaitu( H, H, T, H, T) . Apakah ini perlu? Bisakah Anda meringkas data ini tanpa kehilangan informasi yang relevan?
Jelas bahwa urutan lemparan koin tidak relevan, karena Anda melakukan hal yang sama untuk setiap lemparan koin, dan lemparan koin tidak saling memengaruhi. Jika hasilnya( H, H, T, T,H) sebagai gantinya, misalnya, kesimpulan kami tidak akan berbeda. Oleh karena itu, yang benar-benar Anda butuhkan untuk memberi tahu teman ahli statistik Anda adalah hitungan dari berapa banyak kepala di sana.
Kami menyatakan ini dengan mengatakan jumlah kepala adalah statistik yang cukup untuk hal .
Contoh ini memberi aroma konsep. Baca terus jika Anda ingin melihat bagaimana itu terhubung dengan definisi formal.
Secara formal, statistik cukup untuk suatu parameter jika, mengingat nilai statistik, distribusi probabilitas dari hasil tidak melibatkan parameter.
Dalam contoh ini, sebelum kita mengetahui jumlah kepala, probabilitas hasil adalahhaljumlah kepala( 1 - hal )n - jumlah kepala . Jelas ini tergantung pada hal .
sumber