Saya belajar bahwa statistik adalah atribut yang dapat Anda peroleh dari sampel. Mengambil banyak sampel dengan ukuran yang sama, menghitung atribut ini untuk semuanya dan memplot pdf, kami mendapatkan distribusi atribut yang sesuai atau distribusi statistik yang sesuai.
Saya juga mendengar bahwa statistik dibuat menjadi penduga, bagaimana perbedaan kedua konsep ini?
Jawaban:
Definisi
Dari Wikipedia:
Dan
Perbedaan penting adalah:
(Untuk arti "Kuantitas", lihat bagian di bawah ini.)
Statistik bukan merupakan penaksir
Sebuah estimator adalah statistik dengan sesuatu yang ditambahkan. Untuk mengubah statistik menjadi penaksir, Anda cukup menguraikan jumlah target yang ingin Anda perkirakan. Ini membingungkan, karena Anda tidak menambahkan sesuatu yang "nyata" ke dalam statistik, tetapi hanya beberapa bermaksud.
Untuk melihat bahwa perbedaan itu penting, Anda harus menyadari bahwa Anda tidak dapat menghitung properti estimator (misalnya bias , varians , dll.) Hanya untuk statistik. Untuk menghitung bias , Anda harus menemukan perbedaan antara nilai yang diberikan statistik kepada Anda dan nilai sebenarnya. Hanya estimator yang dilengkapi dengan "nilai sebenarnya" yang memungkinkan untuk menghitung bias. Statistik hanyalah fungsi dari data, dan itu tidak benar atau salah.
Penduga yang berbeda berdasarkan statistik yang sama
Anda dapat menguraikan jumlah target yang berbeda untuk statistik yang sama, sehingga menghasilkan penaksir yang berbeda. Setiap penaksir tersebut memiliki biasnya sendiri, meskipun semuanya (berdasarkan) nilai yang sama, statistik yang sama.
Jadi mengatakan "sampel rata-rata tidak bias" tidak masuk akal. Rata-rata sampel tidak bias ketika Anda menggunakannya untuk memperkirakan rata-rata distribusi. Tetapi pada saat yang sama itu bias ketika menggunakannya untuk memperkirakan varian distribusi.
Jumlah distribusi dan jumlah sampel
Di sini kuantitas mengacu pada beberapa sifat distribusi, yang biasanya tidak diketahui dan karenanya harus diperkirakan. Ini berbeda dengan statistik , yang merupakan properti dari sampel, misalnya mean distribusi adalah jumlah distribusi Anda, sedangkan mean sampel adalah statistik (jumlah sampel Anda).
sumber
Utas ini agak lama, tetapi tampaknya Wikipedia mungkin telah mengubah definisinya dan jika akurat, ia menjelaskannya dengan lebih jelas kepada saya:
Jadi statistik mengacu pada data itu sendiri dan perhitungan dengan data itu. Sedangkan estimator mengacu pada parameter dalam suatu model.
Jika saya memahaminya dengan benar, maka, mean adalah statistik dan mungkin juga merupakan penaksir. Rata-rata sampel adalah statistik (jumlah sampel dibagi dengan ukuran sampel). Rata-rata sampel juga merupakan penaksir rata-rata populasi, dengan asumsi terdistribusi normal.
Saya akan bertanya pada @ whuber dan orang lain yang benar-benar mengetahui hal ini jika kutipan Wikipedia (baru?) Akurat.
sumber
Karena jawaban lain yang mengatakan bahwa mereka sama tidak memberikan referensi resmi, izinkan saya memberi Anda dua kutipan dari buku pegangan inferensi statistik oleh Casella dan Berger:
dan
Saya tidak mengatakan di sini bahwa ini adalah jawaban yang pasti untuk pertanyaan itu, karena saya tampaknya setuju dengan dua jawaban yang paling banyak dipilih yang menunjukkan bahwa ada perbedaan, hanya memberikan referensi yang mengatakan sebaliknya untuk menekankan bahwa ini bukan kasus yang jelas.
sumber
"6" adalah contoh estimator. Katakan pertanyaan Anda, "apa kemiringan pemetaan fungsi linear terbaik x ke y?" Jawaban Anda bisa "6". Atau bisa juga . Keduanya adalah penaksir. Mana yang lebih baik diserahkan kepada Anda untuk memutuskan.( X′X)- 1X′Y
TA yang sangat bagus sekali menjelaskan konsep estimator kepada saya seperti itu.
Pada dasarnya, estimator adalah hal yang Anda terapkan pada data untuk mendapatkan kuantitas yang Anda tidak tahu nilainya. Anda tahu nilai statistik - ini adalah fungsi data tanpa "terbaik" atau "optimal" tentangnya. Tidak ada maksud "terbaik". Hanya ada maksud.
Katakanlah Anda memiliki dataset tentang jumlah kambing yang dimiliki per orang, dan kebahagiaan setiap orang. Anda tertarik pada bagaimana kebahagiaan orang berubah dengan jumlah kambing yang mereka miliki. Penaksir dapat membantu Anda memperkirakan hubungan itu dari data Anda. Statistik hanyalah fungsi dari data yang Anda miliki. Misalnya, varians kepemilikan kambing mungkin sama dengan 7. Forula untuk menghitung varians akan sama antara kambing dan pemanggang roti, atau apakah Anda tertarik pada kebahagiaan atau kecenderungan untuk terkena kanker. Dalam pengertian itu, semua penaksir yang masuk akal adalah statistik.
sumber
Pertanyaan menarik. Estimator dan statistik tidak perlu hal yang berbeda. Mereka adalah konsep yang berbeda.
Statistik adalah fungsi (dalam arti luas) di mana inputnya adalah (statistik) data. Efeknya adalah Anda memperoleh hasil, biasanya angka, dari statistik ini. Dalam istilah yang lebih abstrak, suatu statistik dapat menghasilkan lebih dari satu angka. Statistik tergantung pada data, tetapi prosedurnya deterministik. Jadi statistiknya mungkin: "Jumlahkan semua angka dan bagi dengan hitungan" atau, dalam arti yang lebih luas "ambil data gdp dan siapkan laporannya".
Dalam pengertian statistik kita tentu saja berbicara tentang fungsi matematika sebagai statistik.
Signifikansi ini adalah bahwa jika Anda mengetahui properti data yang Anda input (misalnya itu menjadi variabel acak), maka Anda dapat menghitung properti statistik Anda, tanpa benar-benar memasukkan data empiris.
Pengukur adalah penaksir karena niat Anda: untuk memperkirakan properti. Ternyata, beberapa statistik adalah penduga yang baik.
Misalnya jika Anda menarik poin data dari kumpulan variabel iid, maka mean aritmatika - statistik berdasarkan data yang Anda tarik, mungkin akan menjadi penaksir yang baik untuk nilai yang diharapkan dari distribusi itu. Tetapi sekali lagi segala hal yang menghasilkan estimasi adalah estimator.
Dalam praktiknya, penaksir yang Anda gunakan adalah statistik, tetapi ada statistik yang bukan penaksir. Misalnya statistik uji - meskipun orang dapat memperdebatkan semantik pernyataan ini dan memperburuk keadaan, statistik uji mungkin tidak hanya berupa tetapi juga menyertakan penduga. Meskipun secara konseptual hal ini tidak harus terjadi.
Dan tentu saja Anda dapat memiliki estimator yang bukan statistik, meskipun mereka mungkin tidak pandai memperkirakan.
sumber
Saya pikir pemahaman yang lebih baik tentang apa yang membantu sampel .
[Diperbarui: Sampel adalah konsep yang sangat luas, saya berbicara tentang "sampel acak". Saya tidak tahu apakah estimator masuk akal atau tidak ketika sampel tidak acak .]
dari wikipedia :
Kami mengganti sampel dalam estimator dengan nilai sampel. Kami mendapatkan nilai estimator, ini adalah ukuran khusus. Dan ukuran spesifik ini adalah statistik.
(Periksa tautan ini untuk definisi penaksir, kalimat terakhir mengungkapkan mengapa kita selalu bingung.)
sumber
Tujuan Tulisan Ini:
Yang ingin saya lakukan di sini adalah untuk memberi Anda persamaan dan perbedaan antara dua konsep yang saling terkait yang disebut "statistik" dan "penaksir". Namun, saya tidak ingin membahas perbedaan antara parameter dan statistik, yang saya anggap cukup jelas bagi semua orang yang berjuang dengan perbedaan antara statistik dan estimator. Jika tidak demikian halnya dengan Anda, Anda harus mempelajari posting sebelumnya terlebih dahulu, dan kemudian mulai mempelajari posting ini.
Hubungan:
Pada dasarnya, setiap fungsi bernilai nyata dari variabel acak yang dapat diamati dalam sampel disebut statistik. Ada beberapa statistik bahwa jika mereka dirancang dengan baik, dan memiliki beberapa sifat yang baik (misalnya konsistensi, ...), mereka dapat digunakan untuk memperkirakan parameter distribusi yang mendasari populasi. Oleh karena itu, statistik adalah himpunan besar, dan penduga adalah himpunan bagian dalam himpunan statistik. Karenanya, setiap estimator adalah statistik, tetapi tidak setiap statistik adalah estimator.
Kesamaan:
Berbicara tentang kesamaan, seperti yang disebutkan sebelumnya, keduanya adalah fungsi dari variabel acak. Selain itu, keduanya memiliki distribusi yang disebut "distribusi sampel."
Perbedaan:
Berbicara tentang perbedaan, mereka berbeda dalam hal tujuan dan tugas mereka. Tujuan dan tugas statistik dapat meringkas informasi dalam sampel (dengan menggunakan statistik yang cukup), dan kadang-kadang melakukan tes hipotesis, dll. Sebaliknya, tujuan utama dan tugas penduga, seperti namanya, adalah memperkirakan parameter populasi yang diteliti. Penting untuk menyebutkan bahwa ada berbagai macam penaksir, yang masing-masing memiliki logika komputasi sendiri di belakang, seperti MOME, MLE, penduga OLS, dan sebagainya. Perbedaan lain antara kedua konsep ini berkaitan dengan sifat yang diinginkan. Sementara salah satu sifat yang paling diinginkan dari suatu statistik adalah "kecukupan", sifat yang diinginkan dari penaksir adalah hal-hal seperti "konsistensi", "tidak memihak", "presisi", dll.
Peringatan:
Karena itu, Anda harus berhati-hati dalam menggunakan terminologi dengan benar ketika berhadapan dengan statistik dan estimator. Sebagai contoh, tidak masuk akal untuk berbicara tentang bias dari statistik belaka, yang tidak berarti penduga, karena tidak ada parameter yang terlibat dalam konteks seperti itu agar kita dapat menghitung bias, dan bicarakan itu. Jadi, Anda perlu berhati-hati tentang terminologi!
Garis bawah:
Singkatnya, setiap fungsi variabel acak yang dapat diamati dalam sampel adalah statistik. Jika suatu statistik memiliki kemampuan untuk mengestimasi parameter populasi, maka kami menyebutnya sebagai estimator (dari parameter yang diminati). Namun, ada beberapa statistik yang tidak dirancang untuk memperkirakan parameter, jadi statistik ini bukan penaksir, dan di sini kami menyebutnya "sekadar statistik".
Apa yang saya tawarkan di atas adalah cara saya memandang dan memikirkan dua konsep ini, dan saya mencoba yang terbaik untuk menuliskannya dengan kata-kata sederhana. Saya harap ini membantu!
sumber
Jawaban baru untuk Q lama:
Definisi 1. Sebuah statistik adalah fungsi yang memetakan setiap sampel ke nomor nyata.
Setiap estimator adalah statistik.
Tetapi kami cenderung menyebut hanya statistik yang digunakan untuk menghasilkan taksiran ("tebakan") beberapa parameter sebagai penduga.
Jadi misalnya, t-statistik dan mean sampel adalah KEDUA statistik. Sampel rata-rata juga merupakan penaksir (karena kita sering menggunakannya untuk memperkirakan rata-rata populasi sebenarnya).
Sebaliknya, kita jarang / tidak pernah menyebut statistik-t sebagai penduga, karena kita jarang / tidak pernah menggunakannya untuk memperkirakan parameter apa pun.
sumber
Dalam pengujian hipotesis :
Suatu uji-statistik adalah tentang pengujian hipotesis. Uji-statistik adalah variabel acak yang diberikan / di bawah hipotesis nol. Sekarang, beberapa orang mungkin menyebut statistik nilai / ukuran uji-statistik yang diberikan sampel.
Dengan dua ini Anda bisa mendapatkan nilai-p yang merupakan ukuran yang membantu untuk menolak atau tidak menolak hipotesis nol. Secara keseluruhan, statistik adalah perkiraan seberapa jauh / dekat dengan hipotesis Anda.
Tautan ini mungkin bermanfaat.
sumber