Apa perbedaan antara probabilitas dan statistik, dan mengapa mereka dipelajari bersama?
116
Apa perbedaan antara probabilitas dan statistik, dan mengapa mereka dipelajari bersama?
Jawaban singkat untuk ini yang saya dengar dari Persi Diaconis adalah sebagai berikut: masalah yang dipertimbangkan oleh probabilitas dan statistik saling terbalik. Dalam teori probabilitas kami mempertimbangkan beberapa proses mendasar yang memiliki beberapa keacakan atau ketidakpastian dimodelkan oleh variabel acak, dan kami mencari tahu apa yang terjadi. Dalam statistik kami mengamati sesuatu yang telah terjadi, dan mencoba mencari tahu proses apa yang akan menjelaskan pengamatan itu.
Saya suka contoh toples jeli kacang merah dan hijau.
Seorang probabilis mulai dengan mengetahui proporsi masing-masing dan menanyakan kemungkinan menggambar jeli kacang merah. Seorang ahli statistik menyimpulkan proporsi biji jeli merah dengan mengambil sampel dari toples.
sumber
Menyesatkan mengatakan bahwa statistik hanyalah kebalikan dari probabilitas. Ya, pertanyaan statistik adalah pertanyaan tentang probabilitas terbalik, tetapi itu adalah masalah terbalik yang salah , dan ini membuat perbedaan besar dalam hal bagaimana mereka ditangani.
Probabilitas adalah cabang matematika murni - pertanyaan probabilitas dapat diajukan dan diselesaikan menggunakan penalaran aksiomatik, dan oleh karena itu ada satu jawaban yang benar untuk setiap pertanyaan probabilitas.
Pertanyaan statistik dapat dikonversi menjadi pertanyaan probabilitas dengan menggunakan model probabilitas . Setelah kami membuat asumsi tertentu tentang mekanisme menghasilkan data, kami dapat menjawab pertanyaan statistik menggunakan teori probabilitas. NAMUN, formulasi yang tepat dan pengecekan model-model probabilitas ini sama pentingnya, atau bahkan lebih penting, daripada analisis masalah selanjutnya menggunakan model-model ini.
Dapat dikatakan bahwa statistik terdiri dari dua bagian. Bagian pertama adalah pertanyaan tentang bagaimana merumuskan dan mengevaluasi model probabilistik untuk masalah tersebut; usaha ini terletak dalam domain "filsafat ilmu". Bagian kedua adalah pertanyaan untuk mendapatkan jawaban setelah model tertentu diasumsikan. Bagian statistik ini memang masalah teori probabilitas terapan, dan dalam praktiknya, berisi banyak analisis numerik juga.
Lihat: http://bactra.org/reviews/error/
sumber
Saya suka ini dari Taruhan Terhitung Steve Skienna (lihat tautan untuk diskusi lengkap):
sumber
Probabilitas adalah ilmu murni (matematika), statistik adalah tentang data. Mereka terhubung karena probabilitas membentuk semacam dasar untuk statistik, memberikan ide-ide dasar.
sumber
Tabel 3.1 dari Intuitif Biostatistik menjawab pertanyaan ini dengan diagram yang ditunjukkan di bawah ini. Perhatikan bahwa semua panah menunjuk ke kanan untuk probabilitas, dan menunjuk ke kiri untuk statistik.
KEMUNGKINAN; PELUANG; PROBABILITAS
STATISTIK
sumber
Probabilitas jawaban pertanyaan tentang apa yang akan terjadi, statistik menjawab pertanyaan tentang apa itu terjadi.
sumber
Probabilitas adalah tentang mengukur ketidakpastian sedangkan statistik menjelaskan variasi dalam beberapa ukuran minat (misalnya, mengapa tingkat pendapatan bervariasi?) Yang kami amati di dunia nyata.
Kami menjelaskan variasi dengan menggunakan beberapa faktor yang dapat diamati (misalnya, jenis kelamin, tingkat pendidikan, usia dll untuk contoh pendapatan). Namun, karena kami tidak mungkin memperhitungkan semua faktor yang mungkin memengaruhi pendapatan, kami membiarkan variasi yang tidak dapat dijelaskan sebagai kesalahan acak (yang merupakan asal ketidakpastian yang masuk).
Karena, kami mengaitkan "Variasi = Pengaruh Faktor yang Dapat Diamati + Pengaruh Kesalahan Acak" kita memerlukan alat yang disediakan oleh probabilitas untuk menjelaskan pengaruh kesalahan acak pada variasi yang kami amati.
Beberapa contoh mengikuti:
Mengukur Ketidakpastian
Contoh 1: Anda menggulung dadu 6 sisi. Berapa probabilitas mendapatkan 1?
Contoh 2: Berapa probabilitas bahwa pendapatan tahunan orang dewasa yang dipilih secara acak dari Amerika Serikat kurang dari $ 40.000?
Menjelaskan Variasi
Contoh 1: Kami mengamati bahwa pendapatan tahunan seseorang bervariasi. Faktor-faktor apa yang menjelaskan variasi dalam pendapatan seseorang?
Jelas, kami tidak dapat menjelaskan semua faktor. Dengan demikian, kami menghubungkan pendapatan seseorang dengan beberapa faktor yang dapat diamati (misalnya, tingkat pendidikan, jenis kelamin, usia dll) dan membiarkan variasi yang tersisa untuk ketidakpastian (atau dalam bahasa statistik: untuk kesalahan acak).
Contoh 2: Kami mengamati bahwa beberapa konsumen memilih Tide sebagian besar waktu mereka membeli deterjen sedangkan beberapa konsumen lain memilih deterjen merek xyz. Apa yang menjelaskan variasi dalam pilihan? Kami mengaitkan variasi dalam pilihan dengan beberapa faktor yang dapat diobservasi seperti harga, nama merek, dll. Dan membiarkan variasi yang tidak dapat dijelaskan sebagai kesalahan acak (atau ketidakpastian).
sumber
Probabilitas adalah pelukan dari ketidakpastian, sementara statistik adalah pengejaran empiris, kebenaran yang kejam (tentu saja pembohong terkucilkan dikecualikan).
sumber
Mirip dengan apa yang dikatakan Mark, Statistik secara historis disebut Inverse Probability , karena statistik mencoba menyimpulkan sebab-sebab peristiwa yang diamati, sementara probabilitas cenderung sebaliknya.
sumber
The probabilitas dari suatu peristiwa adalah frekuensi relatif jangka panjang. Jadi itu pada dasarnya memberi tahu Anda kesempatan , misalnya, mendapatkan 'kepala' pada flip koin berikutnya, atau mendapatkan '3' pada gulungan dadu berikutnya.
Sebuah statistik adalah setiap ukuran numerik dihitung dari sampel dari populasi. Misalnya, mean sampel. Kami menggunakan ini sebagai statistik yang memperkirakan rata-rata populasi, yang merupakan parameter. Jadi pada dasarnya itu memberi Anda semacam ringkasan sampel.
sumber
Studi probabilitas, well, seberapa besar kemungkinan kejadian itu. Secara intuitif Anda tahu apa itu probabilitas.
Statistik adalah studi tentang data: menunjukkannya (menggunakan alat-alat seperti grafik), meringkasnya (menggunakan cara dan standar deviasi, dll.), Mencapai kesimpulan tentang dunia dari mana data itu diambil (pas garis ke data dll), dan - ini adalah kunci - mengukur seberapa yakin kita tentang kesimpulan kita.
Untuk mengukur seberapa yakin kita tentang kesimpulan kita, kita perlu menggunakan Probabilitas. Katakanlah Anda memiliki data tahun lalu tentang curah hujan di wilayah tempat Anda tinggal dan tempat saya tinggal. Tahun lalu hujan rata-rata 1/4 inci per minggu tempat tinggal Anda, dan 3/8 inci tempat tinggal saya. Jadi bisa dikatakan bahwa curah hujan di wilayah saya rata-rata 50% lebih besar dari tempat Anda tinggal, bukan? Tidak secepat itu, Sparky. Ini bisa jadi kebetulan: mungkin saja sering terjadi hujan tahun lalu di tempat saya tinggal. Kita dapat menggunakan Probabilitas untuk memperkirakan seberapa yakin kita dalam kesimpulan bahwa rumah saya 50% lebih soggier daripada milik Anda.
Jadi pada dasarnya Anda dapat mengatakan bahwa Probabilitas adalah dasar matematika untuk Teori Statistik.
sumber
Dalam teori probabilitas, kita diberi variabel acak X1, X2, ... dalam beberapa cara, dan kemudian kita mempelajari sifat-sifatnya, yaitu menghitung probabilitas P {X1 \ dalam B1}, mempelajari konvergensi X1, X2, ... dll .
Dalam statistik matematika, kita diberikan realisasi beberapa variabel acak X, dan set distribusi D; masalahnya adalah menemukan di antara distribusi dari D yang paling mungkin menghasilkan data yang kami amati.
sumber
Dalam probabilitas, distribusi diketahui dan diketahui sebelumnya - Anda mulai dengan fungsi distribusi probabilitas yang diketahui (atau serupa), dan sampel darinya.
Dalam statistik, distribusi tidak diketahui sebelumnya. Bahkan mungkin tidak diketahui. Asumsi dihipotesiskan tentang distribusi probabilitas di balik data yang diamati, untuk dapat menerapkan teori probabilitas pada data tersebut untuk mengetahui apakah hipotesis nol tentang data tersebut dapat ditolak atau tidak.
Ada diskusi filosofis tentang apakah ada yang namanya probabilitas di dunia nyata, atau apakah itu isapan jempol ideal dari imajinasi matematika kita, dan semua pengamatan kita hanya bisa statistik.
sumber
Statistik adalah pengejaran kebenaran di tengah ketidakpastian. Probabilitas adalah alat yang memungkinkan kita untuk mengukur ketidakpastian.
(Saya telah memberikan jawaban lain yang lebih panjang, yang mengasumsikan bahwa apa yang ditanyakan adalah sesuatu seperti "bagaimana Anda akan menjelaskannya kepada nenek Anda?")
sumber
Jawaban # 2: Probabilitas adalah tentang melangkah maju; Statistik adalah tentang mundur. Probabilitas adalah tentang proses menghasilkan (mensimulasikan) data yang diberi nilai . Statistik adalah tentang proses pengambilan data untuk menarik kesimpulan tentang .θθ θ
Penafian: jawaban di atas adalah matematika. Pada kenyataannya, banyak Statistik juga tentang merancang / menemukan model yang sesuai, mempertanyakan model yang ada, merancang eksperimen, berurusan dengan data yang tidak sempurna, dll. "Semua model salah."
sumber
Probabilitas : Diberikan parameter yang diketahui, temukan probabilitas mengamati sekumpulan data tertentu.
Statistik : Diberikan seperangkat data yang diamati, buat kesimpulan tentang apa parameternya.
Statistik "lebih subyektif" dan "lebih banyak seni daripada sains" (relatif terhadap probabilitas).
sumber
Perbedaan antara probabilitas dan statistik adalah bahwa dalam probabilitas tidak ada kesalahan. Kami yakin akan kemungkinannya karena kami tahu persis berapa banyak pihak yang memiliki koin, atau berapa banyak karamel biru dalam vas. Tetapi dalam statistik kami memeriksa sebagian dari populasi apa pun yang kami periksa, dan dari sini, kami mencoba melihat kebenaran, tetapi selalu ada% dari kesimpulan yang salah. Satu-satunya hal dalam statistik yang benar, apakah ini% kesalahan, yang sebenarnya adalah probabilitas.
sumber
https://en.wikipedia.org/wiki/Foundations_of_statistics
Jadi poin yang Teori Probabilitas adalah Yayasan Statistik hampir tidak diperdebatkan. Yang lainnya adalah permainan yang adil.
Tetapi dalam mencoba menjadi lebih bermanfaat, praktis dengan jawaban ...
https://en.wikipedia.org/wiki/Probability_and_statistics
Hal di atas tidak lengkap atau otoritatif dengan cara apa pun, tapi saya yakin ini berguna.
Biasanya itu membantu saya untuk melihat hal-hal seperti ...
Dengan masing-masing sangat banyak digunakan, rata-rata, di dasar berikutnya. Itu adalah ada persimpangan besar dalam cara kita mempelajari fondasi berikutnya.
PS. Ada Statistik induktif dan deduktif, jadi di situlah perbedaannya.
sumber
Banyak orang dan ahli matematika mengatakan bahwa 'STATISTIK adalah kebalikan dari PROBABILITY', tetapi itu tidak terlalu benar. Cara pendekatan atau metode penyelesaian 2 ini sangat berbeda tetapi mereka TERHUBUNG .
saya ingin merujuk ke teman saya John D Cook .....
"Saya suka contoh toples jeli kacang merah dan hijau.
Probabilis mulai dengan mengetahui proporsi masing-masing dan katakanlah menemukan kemungkinan menggambar jeli kacang merah. Seorang ahli statistik menyimpulkan proporsi biji jeli merah dengan mengambil sampel dari toples. "
Sekarang proporsi kacang jeli merah yang diperoleh dengan sampling dari toples digunakan oleh probabilist untuk menemukan kemungkinan menggambar kacang merah dari toples.
Pertimbangkan contoh ini ---- >>>
Dalam ujian, 30% siswa gagal dalam fisika, 25% gagal dalam matematika, 12% gagal dalam fisika dan matematika. Seorang siswa yang dipilih secara acak menemukan kemungkinan bahwa siswa tersebut telah gagal dalam Fisika, jika diketahui bahwa ia gagal dalam matematika.
Jumlah di atas adalah masalah probabilitas, tetapi jika kita perhatikan dengan teliti kita akan menemukan bahwa jumlah tersebut diberikan dengan beberapa data statistik
30% siswa gagal dalam fisika, 25% "" "matematika '' 'Ini pada dasarnya adalah frekuensi jika persentase dihitung. Dengan demikian kita diberikan data statistik yang pada gilirannya membantu kita menemukan probabilitas
SO PROBABILITAS DAN STATISTIK SANGAT BANYAK TERKAIT ATAU SANGAT KITA BISA MENGATAKAN BAHWA PROBABILITAS TERGANTUNG BANYAK PADA STATISTIK
sumber
Istilah "statistik" dengan indah dijelaskan oleh JC Maxwell dalam artikel Molecules (dalam Nature 8, 1873, hlm. 437-441). Izinkan saya mengutip bagian yang relevan:
Ia memberikan penjelasan tentang metode statistik ini dalam beberapa karya lainnya. Misalnya, "Dalam metode statistik penyelidikan, kami tidak mengikuti sistem selama gerakannya, tetapi kami memusatkan perhatian pada fase tertentu, dan memastikan apakah sistem berada dalam fase itu atau tidak, dan juga ketika memasuki fase dan ketika ia meninggalkannya "(Trans. Cambridge Philos. Soc. 12, 1879, hlm. 547–570).
Ada bagian lain yang indah dari Maxwell tentang "probabilitas" (dari sepucuk surat hingga Campbell, 1850, dicetak ulang dalam The Life of James Clerk Maxwell , hlm. 143):
Jadi kita dapat mengatakan:
- Dalam statistik kami "memusatkan perhatian kami pada sejumlah kecil kelompok buatan" atau jumlah; kami membuat semacam katalogisasi atau sensus.
- Kemungkinan kami menghitung ketidakpastian kami tentang beberapa peristiwa atau jumlah.
Keduanya berbeda, dan kita bisa melakukan yang satu tanpa yang lain.
Misalnya, jika kami membuat sensus lengkap dari seluruh populasi suatu negara dan menghitung jumlah pasti orang yang termasuk dalam kelompok tertentu seperti usia, jenis kelamin, dan sebagainya, kami sedang melakukan statistik. Tidak ada ketidakpastian - probabilitas - yang terlibat, karena angka yang kami temukan tepat dan diketahui.
Di sisi lain, bayangkan seseorang lewat di depan kita di jalan, dan kita bertanya-tanya tentang umur mereka. Dalam hal ini kami tidak pasti dan kami menggunakan probabilitas, tetapi tidak ada statistik yang terlibat, karena kami tidak membuat semacam sensus atau katalog.
Namun keduanya juga bisa terjadi bersamaan. Jika kita tidak dapat membuat sensus lengkap dari suatu populasi, kita harus menebak berapa banyak orang dalam kelompok gender usia tertentu. Karenanya kita menggunakan probabilitas saat melakukan statistik. Begitu juga sebaliknya, kita dapat mempertimbangkan data statistik yang tepat tentang usia orang, dan dari data tersebut cobalah membuat tebakan yang lebih baik tentang orang yang lewat di depan kita. Karenanya kami menggunakan statistik sambil memutuskan suatu kemungkinan.
sumber