Apa perbedaan antara statistik deskriptif dan inferensial?

21

Pemahaman saya adalah bahwa statistik deskriptif menggambarkan fitur sampel data secara kuantitatif, sementara statistik inferensial membuat kesimpulan tentang populasi dari mana sampel diambil.

Namun, halaman wikipedia untuk status inferensi statistik :

Sebagian besar, kesimpulan statistik membuat proposisi tentang populasi, menggunakan data yang diambil dari populasi yang diminati melalui beberapa bentuk pengambilan sampel acak.

"Sebagian besar" telah membuat saya berpikir saya mungkin tidak memahami konsep-konsep ini dengan benar. Apakah ada contoh statistik inferensial yang tidak membuat proposisi tentang populasi?

user1205901 - Pasang kembali Monica
sumber
Statistik deskriptif: Koin dilemparkan sepuluh kali dan jatuh enam kali. Kesimpulan statistik: Estimasi kemungkinan maksimum dari probabilitas Kepala adalah , atau, Informasi ini tidak cukup untuk menolak hipotesis bahwa koin adalah koin yang adil. 0,6
Dilip Sarwate
2
Kesimpulan tanpa konsep "populasi": Asumsikan data Anda dihasilkan oleh beberapa mekanisme / aturan acak (sebagian) tidak dikenal. Metode inferensial memungkinkan untuk menilai sifat-sifat mekanisme ini berdasarkan data. Contoh: Anda ingin memverifikasi rumus elektro-fisik berdasarkan hasil yang dapat diukur hanya sekitar atau di bawah kondisi yang tidak sempurna.
Michael M
1
@Michael: Ya; atau memang membuat data Anda dihasilkan oleh mekanisme acak yang dikenal - penugasan acak perawatan eksperimental.
Scortchi

Jawaban:

19

Berasal dari latar belakang ilmu-ilmu perilaku, saya mengasosiasikan istilah ini khususnya dengan buku teks statistik pengantar. Dalam konteks ini perbedaannya adalah:

  • Statistik deskriptif adalah fungsi dari data sampel yang secara intrinsik menarik dalam menggambarkan beberapa fitur data. Statistik deskriptif klasik termasuk rata-rata, min, maks, standar deviasi, median, condong, kurtosis.
  • Statistik inferensial adalah fungsi dari data sampel yang membantu Anda untuk menarik kesimpulan tentang hipotesis tentang parameter populasi. Statistik inferensial klasik meliputi z, t, , F-rasio, dll.χ2

Poin penting adalah bahwa setiap statistik, inferensial atau deskriptif, adalah fungsi dari data sampel. Parameter adalah fungsi dari populasi, di mana istilah populasi sama dengan mengatakan proses pembuatan data yang mendasarinya.

Dari perspektif ini status fungsi yang diberikan data sebagai statistik deskriptif atau inferensial tergantung pada tujuan yang Anda gunakan.

Yang mengatakan, beberapa statistik jelas lebih berguna dalam menggambarkan fitur yang relevan dari data, dan beberapa cocok untuk membantu inferensi.

  • Statistik inferensial: Statistik uji standar seperti t dan z, untuk proses pembuatan data yang diberikan, di mana hipotesis nol salah, nilai yang diharapkan sangat dipengaruhi oleh ukuran sampel. Sebagian besar peneliti tidak akan melihat statistik seperti itu sebagai estimasi parameter populasi dari minat intrinsik.
  • Statistik deskriptif: Statistik deskriptif kontras tidak mengestimasi parameter populasi yang biasanya merupakan kepentingan intrinsik. Misalnya mean sampel dan standar deviasi memberikan perkiraan parameter populasi yang setara. Bahkan statistik deskriptif seperti minimum dan maksimum memberikan informasi tentang parameter populasi yang setara atau serupa, meskipun tentu saja dalam kasus ini, diperlukan lebih banyak perawatan. Selain itu, banyak statistik deskriptif mungkin bias atau kurang dari penduga yang ideal. Namun, mereka masih memiliki beberapa utilitas dalam memperkirakan parameter populasi yang diminati.

Jadi dari perspektif ini, hal-hal penting untuk dipahami adalah:

  • statistik : fungsi dari data sampel
  • parameter : fungsi populasi (proses menghasilkan data)
  • estimator : fungsi data sampel yang digunakan untuk memberikan estimasi parameter
  • inference : proses mencapai kesimpulan tentang suatu parameter

Dengan demikian, Anda bisa mendefinisikan perbedaan antara deskriptif dan inferensial berdasarkan niat peneliti menggunakan statistik, atau Anda dapat menentukan statistik berdasarkan bagaimana biasanya digunakan.

Jeromy Anglim
sumber
Bagaimana bisa dibenarkan untuk memanggil skor t atau F (daripada misalnya t- tes ) statistik inferensial?
jona
@jona Skor-t adalah "statistik" yang digunakan dalam uji-t, oleh karena itu orang dapat menggambarkan skor-t sebagai statistik inferensial bila digunakan sebagai bagian dari proses inferensial tersebut. Saya kira saya sudah mulai dengan asumsi bahwa statistik adalah fungsi dari data. Tapi mungkin Anda menyinggung hal yang sering kita anggap statistik inferensial sebagai serangkaian teknik yang lebih luas yang digunakan untuk melakukan inferensi?
Jeromy Anglim
Izinkan saya mengutarakannya secara berbeda - bukankah statistik-t adalah deskripsi sampel, alih-alih pernyataan inferensial (seperti nilai-p)?
jona
Ya, fungsi data setara dengan deskripsi sampel. Saya kira saya berpikir bahwa statistik seperti itu digunakan dalam proses inferensial (misalnya, para peneliti menghubungkan statistik-t dengan distribusi-t untuk mendapatkan nilai-p dan kemudian menghubungkan p dengan alpha untuk menarik kesimpulan). Saya sering melihat buku teks menggunakan contoh-contoh ini. Tapi saya kira nilai-p dan inferensi biner itu sendiri dapat dilihat sebagai statistik (yaitu, fungsi data sampel). Dan inferensi biner itu sendiri dapat dilihat sebagai yang paling jelas selaras dengan inferensi. Apakah itu yang Anda maksudkan?
Jeromy Anglim
1
Jadi misalnya, Anda menggunakan data untuk mendapatkan t yang terkait dengan distribusi, yang memberi Anda p , yang pada gilirannya menghasilkan inferensi biner tentang parameter populasi. Jadi dari perspektif frequentist, t, p, dan inferensi biner adalah semua variabel acak. Semua terlibat dalam proses inferensial. Saya tidak yakin apa kelebihan dan kekurangan dari pelabelan semua atau hanya beberapa statistik seperti inferensial.
Jeromy Anglim
8

Salah satu bentuk kesimpulan didasarkan pada penetapan acak dari perawatan eksperimental, & bukan pada pengambilan sampel acak dari suatu populasi (bahkan secara hipotesis). Oscar Kempthorne adalah pendukung.

SEBUAHBtt10/252=0,04

Prediksi adalah bidang lain di mana Anda tidak perlu merumuskan proposisi tentang populasi. (Saya tidak tahu bahwa semua orang ingin menyebut prediksi "inferensi", tetapi ada Geisser (1993), Predictive Inference: An Introduction ). Seringkali prediksi mengikuti dari model populasi yang sesuai, tetapi tidak selalu; misalnya, contoh klasifikasi @ Matt, rata-rata model (Bayesian atau berdasarkan bobot Akaike), atau algoritma peramalan seperti pemulusan eksponensial.

NB Saya pikir "statistik inferensial vs deskriptif" lebih sering merujuk pada disiplin Statistik, daripada jumlah yang dihitung dari sampel. Tidak ada perbedaan mendasar antara statistik inferensial & deskriptif; seperti yang ditunjukkan oleh @Jeremy, ini adalah masalah apa gunanya Anda menggunakannya.

Scortchi - Reinstate Monica
sumber
2

Saya tidak yakin bahwa klasifikasi perlu membuat pernyataan tentang populasi tempat data diambil. Klasifikasi, seperti yang mungkin Anda ketahui, menggunakan data pelatihan yang terdiri dari beberapa vektor "fitur", masing-masing dilabeli dengan kelas tertentu, untuk memprediksi label kelas milik vektor fitur yang tidak berlabel lainnya. Sebagai contoh, kita mungkin menggunakan tanda-tanda vital pasien dan diagnosis dokter untuk memprediksi apakah pasien lain sehat atau sakit.

P(kelas=c|fitur)c

Namun, pengklasifikasi lain mencari perbedaan antara kelas tanpa memodelkan kelas itu sendiri; ini disebut pengklasifikasi diskriminatif. Salah satu contoh klasik adalah penggolong tetangga terdekat, yang memberikan contoh tidak berlabel untuk kelas tetangga terdekatnya (di mana dekat didefinisikan dalam beberapa cara yang masuk akal untuk masalah). Ini sepertinya tidak mengandung banyak, jika ada, informasi tentang populasi dari mana titik data diambil.

t

Matt Krause
sumber
0

Dalam satu baris, dengan data yang diberikan, statistik deskriptif mencoba untuk meringkas konten data Anda dengan kehilangan informasi minimum (tergantung pada ukuran apa yang Anda gunakan). Anda bisa melihat geografi data. (Sesuatu seperti, lihat grafik kinerja kelas dan katakan siapa yang di atas, di bawah dan seterusnya)

Dalam satu baris, mengingat data, Anda mencoba memperkirakan dan menyimpulkan dengan sifat-sifat populasi hipotetis dari mana data berasal. (Sesuatu seperti, memahami siswa kelas 7 melalui sampel yang baik dari kelas, dengan asumsi bahwa populasi yang mendasarinya cukup besar sehingga Anda tidak dapat memperhitungkannya secara total)

Vani
sumber
3
Saya tidak berpikir itu adalah definisi atau karakterisasi statistik deskriptif yang bertujuan untuk kehilangan informasi minimum. Sangat mungkin untuk memiliki statistik deskriptif yang meninggalkan detail yang sangat penting dan itu sering menjadi masalah.
Nick Cox
0

Pendeknya

Statistik deskriptif adalah analisis data yang menggambarkan, menunjukkan atau meringkas data secara bermakna; itu hanya cara untuk menggambarkan data kami / bicara tentang seluruh populasi. beberapa di antaranya adalah Ukuran kecenderungan pusat dan Ukuran dispersi

Statistik inferensial adalah teknik yang memungkinkan kita untuk menggunakan sampel untuk membuat generalisasi tentang populasi dari mana sampel diambil. Contoh pengujian hipotesis dan

Frehiwot Mulugeta
sumber
0

statistik deskriptif adalah analisis data yang menggambarkan, menunjukkan atau meringkas data secara bermakna; itu hanya cara untuk menggambarkan data kami / bicara tentang seluruh populasi. beberapa di antaranya adalah Ukuran kecenderungan pusat dan Ukuran dispersi

Statistik inferensial adalah teknik yang memungkinkan kita menggunakan sampel untuk membuat generalisasi tentang populasi dari mana sampel diambil. Contoh pengujian hipotesis dan bagikan jawaban ini

MUSEFA NURU
sumber
Selamat Datang di Cross Divalidasi ! Silakan luangkan waktu sejenak untuk melihat tur kami . Sepertinya Anda akan menyelesaikan jawaban yang bagus tetapi sesuatu terjadi. Anda bebas mengedit jawaban Anda untuk melengkapi pemikiran Anda. Anda mungkin juga ingin meningkatkan jawaban Anda dengan menambahkan kutipan / referensi yang mengolaborasikan apa yang Anda masukkan di sini. Anda juga perlu menjawab pertanyaan "Apakah ada contoh statistik inferensial yang tidak membuat proposisi tentang populasi?"
Tavrock