Bagaimana cara menggambarkan statistik dalam satu kalimat?

27

Ketika saya pertama kali mulai belajar statistik, prosedur seperti uji-t, ANOVA, chi-square dan regresi linier masing-masing tampaknya makhluk yang sangat berbeda. Tetapi sekarang saya menyadari prosedur ini masing-masing melakukan kurang lebih hal yang sama. Dan juga, nilai-nilai seperti varians, residual, standard error dan mean juga mengukur kurang lebih hal yang sama.

Jadi saya rasa semua prosedur dan nilai-nilai ini, dan memang semua statistik, dapat dijelaskan hanya dalam satu kalimat sederhana:

Apa nilai yang diharapkan dan apa variasi di sekitar nilai ini?

Kata yang diharapkan dapat diganti dengan kata-kata ini: dihipotesiskan, diramalkan, atau sentral.

Bagaimana orang lain menggambarkan statistik dalam satu kalimat?

luciano
sumber
10
@Trynna Deskripsi ini jauh terlalu sempit: itu ciri-satunya titik estimasi. Ini seperti menggambarkan matematika sebagai menambah dan mengalikan angka - yang mungkin merupakan perspektif seseorang yang telah mempelajari aritmatika selama beberapa tahun di sekolah - tetapi masih jauh dari apa yang ada di bidangnya.
whuber

Jawaban:

26

Statistik menyediakan alasan dan metode untuk menghasilkan dan memahami data.

Asosiasi Statistik Amerika

whuber
sumber
+1 Saya mencoba menampilkan ekspresi sesuatu yang sangat dekat dengan gagasan ini. Saya telah menambahkan sesuatu tentang kesimpulan berdasarkan data, tetapi tidak terlalu ringkas.
Glen_b -Reinstate Monica
3
@ Glen Anda dapat mengatakan bahwa banyak pemikiran dimasukkan ke dalam karakterisasi ini. Saya suka memilikinya di suatu tempat di situs kami. Itu, dan deskripsi mesin belajar yang mirip, seharusnya ada di halaman bantuan kami.
whuber
2
Saya tidak yakin saya setuju dengan kutipan (meskipun itu adalah aspirasi yang indah). Sebagai seorang ahli epidemiologi, saya tahu bahwa saya tahu hal-hal tentang desain studi dan produksi data dan inferensial kausal di sekitar yang sama yang berada di luar ken banyak ahli statistik baik di sekitar saya. Memang kesimpulan kausal yang bagus untuk grafik kausal rekursif berasal dari tiga bidang yang tidak bernama statistik (epidemiologi, ilmu komputer, dan sosiologi, seperti yang saya pahami). Bukan mengangkat ini dalam semangat yang suka berkelahi, tetapi karena kalimat yang dikutip menggambarkan banyak ilmu pengetahuan , dan tidak menghitung statistik per se .
Alexis
3
Deskripsi ASA jauh lebih banyak tentang statistik sebagai domain pengetahuan dan aktivitas manusia, tidak menunjukkan siapa "ahli statistik". Sampai ahli statistik profesional WW2 jarang terjadi, tetapi itu tidak berarti statistik tidak diterapkan dalam pengaturan komersial dan akademik. Saya tidak berpikir definisi statistik yang baik dapat dibatasi pada apa yang dilakukan oleh ahli statistik profesional.
Silverfish
1
@Alexis Mungkin ada beberapa kesulitan dengan tingkat pemahaman yang tersirat oleh kata "pengertian", yang menurut definisi ASA agak ambigu dalam singkatnya. Penafsiran yang lebih luas mungkin mencakup yang berlebihan. Tentu saja jika kita memasukkan interpretasi fisik atau sosial substantif dan mekanisme yang mendasari sebagai bagian dari "pemahaman", maka itu melampaui statistik "semata". Di sisi lain, tidak jelas bagi saya mengapa kesimpulan dari data, kausal atau sebaliknya, tidak dapat terletak dalam domain dari upaya ilmiah dan statistik.
Silverfish
13

Statistik pada dasarnya berkaitan dengan pemahaman struktur dalam data.

Bill Venables dan Brian Ripley, kalimat pertama dalam Bab 1 Statistik Terapan Modern dengan S

mark999
sumber
1
Ini adalah pandangan yang menarik tentang statistik, meskipun terbatas. Ambiguitas yang mungkin terungkap: seorang ilmuwan komputer akan memahami "struktur data" dengan cara non-statistik. (Venables dan Ripley bekerja di persimpangan statistik dan komputasi.)
whuber
@whuber aku setuju denganmu. Tidak ada yang menyarankan bahwa V&R bermaksud untuk menjadi deskripsi satu kalimat dari semua statistik, tetapi sejak saya pertama kali membacanya, saya pikir itu adalah deskripsi yang bagus. Saya menafsirkan "struktur dalam data" sebagai "karakteristik populasi dari mana sampel diambil".
mark999
10

Statistik menyediakan alasan dan metode untuk mengkonversi data menjadi informasi yang bermakna.

IrishStat
sumber
8

Dalam kata-kata almarhum Leo Breiman:

Tujuan dalam statistik adalah menggunakan data untuk memprediksi dan mendapatkan informasi tentang mekanisme data yang mendasarinya.

http://projecteuclid.org/euclid.ss/1009213726

Richard Border
sumber
5

Secara pribadi, saya suka kutipan berikut dari Stephen Senn di Dicing with death. Peluang, Risiko dan Kesehatan (Cambridge University Press, 2003). Saya menyoroti satu kalimat (atau dua) yang, saya percaya, merangkum poin utamanya, meskipun seluruh paragraf layak dibaca.

Statistik adalah dan statistik.
Statistik, tunggal, bertentangan dengan persepsi populer, sebenarnya bukan tentang fakta; ini adalah tentang bagaimana kita tahu, atau curiga, atau percaya, bahwa sesuatu adalah fakta. Karena mengetahui tentang berbagai hal melibatkan penghitungan dan pengukurannya, maka, memang benar, bahwa statistik jamak adalah bagian dari kepedulian statistik tunggal, yang merupakan ilmu penalaran kuantitatif. Ilmu ini memiliki lebih banyak kesamaan dengan filsafat (khususnya epistemologi) daripada ilmu akuntansi. Ahli statistik adalah filsuf terapan. Para filsuf berdebat berapa banyak malaikat dapat menari di atas kepala jarum; ahli statistik menghitungnya . Atau lebih tepatnya, hitung berapa banyak yang mungkin bisa menari.Probabilitas adalah jantung dari materi, jantung dari semua materi jika fisikawan kuantum dapat dipercaya. Sejauh menyangkut ahli statistik, ini benar, apakah dunia benar-benar deterministik seperti yang diyakini Einstein atau apakah ada ketidakpastian yang tidak dapat dihindarkan. Kita tidak dapat memprediksi apa pun dengan pasti, tetapi kita dapat memprediksi seberapa tidak pastinya prediksi kita. Statistik adalah ilmu yang memberi tahu kita caranya.

chl
sumber
5

Statistik adalah ilmu belajar dari data dan mengukur, mengendalikan, dan mengomunikasikan ketidakpastian.

Marie Davidian & Thomas Louis

Mereka melanjutkan:

; dan dengan demikian menyediakan navigasi yang penting untuk mengendalikan jalannya kemajuan ilmiah dan sosial

Momo
sumber
Saya suka definisi ini karena ini memilih aspek "ketidakpastian". Bagian kedua bagus karena dikatakan bahwa statistik tidak hanya ada dengan sendirinya, tetapi harus dilihat dalam konteks yang lebih luas. Agar benar-benar puas, saya mungkin akan menggabungkan itu dengan ASA satu ke:
Momo
1
Statistik sebagai ilmu belajar dari data dan mengukur, mengendalikan, dan mengomunikasikan ketidakpastian memberikan alasan dan metode untuk menghasilkan dan memahami data.
Momo
2

Statistik adalah sekumpulan metode dan mode pemikiran yang membantu orang untuk membuat kesimpulan yang jelas dari informasi yang berisik.

Michael Lew
sumber
2

Karena kita bukan makhluk yang tahu segalanya seperti dewa, kita harus berurusan dengan ketidakpastian dan Statistik menyediakan metode untuk menggabungkan dan mencerminkan ketidakpastian itu.

elevendollar
sumber
2

statistik adalah sub-bidang filsafat yang berkaitan dengan pertanyaan berikut 'bagaimana kita belajar dari pengamatan' menggunakan konsep matematika yang ketat.

hanya sebagai catatan Anda dapat membuat 'satu kalimat' sangat panjang, ada buku yang ditulis oleh B. Hrabal yang terdiri dari satu kalimat panjang, lihat: Pelajaran Menari untuk Lanjut Usia

pes
sumber
2

Statistik adalah ilmu ketidakpastian dan teknologi penggalian informasi dari data

David J. Hand

Momo
sumber
2

Statistik adalah seperangkat prinsip logis dan metode matematika untuk merangkum informasi terkuantifikasi dengan cara yang akurat dan relevan.

SQLServerSteve
sumber
1

Dengan kata-kata saya sendiri

Statistics is the science of what might be

Ini semacam lidah di pipi .

MCP_infiltrator
sumber
1
Jika Anda menutupi kata pertama dan meminta orang untuk mengisi yang kosong, saya kira "statistik" tidak akan menjadi hal pertama yang mereka buat - dan mungkin juga bukan yang kedua atau ketiga. "Futurologi," "spekulasi," "fiksi ilmiah," dan mungkin - semakin mendekati niat Anda - "prediksi" dan "perkiraan" - kemungkinan akan menjadi pilihan populer. Bahkan "oneirology" dan "apotropaism" akan menjadi kemungkinan. :-)
whuber
1

Fisher ( 1922 ) memberikan pandangannya tentang esensi statistik dalam kutipan berikut (huruf tebal ditambahkan oleh saya untuk persyaratan satu kalimat ):

Untuk sampai pada rumusan masalah statistik yang berbeda, perlu untuk menentukan tugas yang ditetapkan oleh ahli statistik sendiri: secara singkat, dan dalam bentuk yang paling konkret, objek metode statistik adalah pengurangan data . Sejumlah data, yang biasanya hanya dengan jumlah besar tidak mampu memasuki pikiran, harus diganti dengan jumlah yang relatif sedikit yang akan secara memadai mewakili keseluruhan, atau yang, dengan kata lain, harus mengandung sebanyak mungkin, idealnya keseluruhan , dari informasi yang relevan yang terkandung dalam data asli.

ekvall
sumber
0

One -liner yang berorientasi pada hasil (dan jadi tidak terlalu deskriptif ) akan menjadi, bagi saya,

Statistik adalah apa yang membuat dunia manusia berputar, terlepas dari apa yang melakukan hal yang sama untuk Alam.

Alecos Papadopoulos
sumber
3
Apakah Anda membingungkan statistik dengan politik? Atau mungkin dengan cinta?
whuber
@whuber (+1) No. Keduanya membuat sebagian besar keputusan berdasarkan Statistik, apakah mereka menyadarinya atau tidak.
Alecos Papadopoulos
2
Aku bisa melihatnya sekarang, di film mendatang, ketika pemeran utama pria berlutut untuk mengusulkan: "Sayang, kau UMVUE-ku, maukah kau menikah denganku?" :-) (Mari kita gunakan estimator penyusutan dan
kumpulkan
@whuber (2) ... ini adalah "tidak menyadarinya" bagian: ini adalah apa yang memimpin laki-laki berarti , meskipun ia tidak menggunakan bahasa! (Saya mengakui bahwa saya mungkin bersalah atas imperialisme filosofis di sini).
Alecos Papadopoulos
2
Latar belakang budaya Anda yang sangat terhormat (sejauh nama dan lokasi Anda memungkinkan orang untuk menyimpulkannya), yang dapat ditelusuri kembali setidaknya ke para Sofis awal, memungkinkan Anda memiliki sedikit kebebasan dalam hal itu. :-)
whuber
0

Statistik adalah alat untuk memodelkan pembuatan data dengan proses yang tidak pasti dan / atau probabilistik.

thecity2
sumber
-1

Statistik adalah tentang menyiksa data cukup lama sampai ia mengakui apa pun yang ingin Anda perlihatkan.

Saya memparafrasekan Ronald Coase, lihat tautan

xeon
sumber
-1, apakah ini dimaksudkan sebagai lidah di pipi?
gung - Reinstate Monica
@ung ya dan tidak, saya mengutip Ronald Coase.
Vladislavs Dovgalecs
3
Berdasarkan versi di sini , yang terbaik adalah parafrase buruk. Itu bukan ringkasan 1-kalimat yang baik tentang apa itu statistik.
gung - Reinstate Monica
3
@ ya ampun, OP bertanya bagaimana orang yang berbeda akan menggambarkannya. Itu akan selalu menjadi sudut pandang atau pendapatnya. Ini akan berbeda untuk orang yang berbeda. OP mencoba mengumpulkan pendapat yang berbeda IMHO.
Vladislavs Dovgalecs
2
xeon akan sangat baik untuk Coase untuk mengedit jawaban Anda untuk mengutip dan sumber atribusi dengan benar.
Alexis
-2

Statistik adalah ilmu matematika yang memungkinkan Anda untuk mengetahui apakah perbedaan antara set pengamatan hanya acak atau tidak.

Sympa
sumber
1
Menjelaskan subset sempit dari apa bidang itu.
rolando2
Saya melihatnya secara berbeda. Pada akhirnya, apakah Anda melakukan pengujian hipotesis, pemodelan regresi, atau estimasi lain yang paling Anda selalu mengukur apakah perbedaan antara estimasi Anda dengan model yang naif, atau perbedaan dalam pengamatan secara statistik signifikan atau tidak. Kalimat saya menangkap esensi signifikansi statistik vs keacakan. Jika orang lain setuju, dapatkah Anda memberikan saya suara, jadi komentar saya yang mudah dibenarkan tidak diperlakukan sebagai jawaban yang salah hanya karena interpretasi subyektif satu orang tentang kesempitan.
Sympa
2
tolong pertimbangkan jenis-jenis pertanyaan yang sering ingin dijawab dengan menggunakan statistik: Bagaimana bentuk distribusi ini? Apa sifat hubungan antara 2 variabel ini? Bagaimana banyak variabel ini dapat dikelompokkan sehingga kita dapat melihat masalah / tema / topik / dimensi umum? Bagaimana banyak kasus ini dapat dikelompokkan sehingga kita dapat melihat tipe / profil umum? Apa cara terbaik untuk menggambarkan jaringan hubungan ini dengan mata terhadap kausalitas? Apa yang menangkap tren variabel ini dari waktu ke waktu? Apa cara terbaik untuk memperkirakan nilai masa depan?
rolando2
Dalam masing-masing kasus, jawaban atas pertanyaan-pertanyaan tersebut memiliki unsur signifikansi statistik yang kuat dan apakah apa yang Anda lihat dalam bentuk atau bentuk apa pun berbeda dengan apa yang dapat terjadi karena keacakan semata. Bagi kebanyakan dari kita, pemungutan suara negatif berarti jawaban yang salah secara eksplisit. Saya tidak melihat bagaimana jawaban saya dapat dikategorikan seperti itu.
Sympa
1
Teks kursor di atas panah ke bawah menyatakan "jawaban ini tidak berguna." Saya menemukan itu menarik - dan karena itu tidak tidak berguna - karena itu pemikiran, tetapi saya belum memutarnya karena beberapa alasan. Yang pertama adalah pernyataan bahwa statistik adalah "ilmu matematika": yang tidak nyaman dekat dengan kesalahpahaman (terutama di antara ahli matematika tertentu) bahwa statistik hanyalah cabang matematika. Yang kedua adalah bahwa tampaknya hanya untuk mencirikan pengujian hipotesis dua sampel, yang merupakan bagian statistik yang sangat sempit (meskipun meresap).
whuber