Saya bukan ahli statistik tetapi pekerjaan penelitian saya melibatkan statistik (menganalisis data, membaca literatur, dll.). Saya diingatkan kembali dari komentar pada salah satu pertanyaan saya yang diposting di sini bahwa ada beberapa kata umum yang memiliki makna atau konotasi khusus bagi mereka yang terlatih baik dalam bidang statistik.
Akan sangat membantu untuk memiliki daftar kata-kata seperti itu dan mungkin frasa bersama dengan beberapa komentar.
terminology
user4045
sumber
sumber
Jawaban:
" signifikan " - di sini penggunaan bahasa yang umum dari kata ini adalah untuk mengartikan sesuatu seperti 'penting' atau 'bermakna'. Makna statistik secara informal lebih dekat ke "dapat dilihat dari variasi acak tentang nol"; itu tidak menandakan bahwa perbedaan itu cukup besar.
Berikut adalah beberapa contoh di mana perbedaan ini mungkin menjadi penyebab kebingungan: 1 2
" parameter " - sepertinya sering terjadi - khususnya dalam percobaan ilmiah - bahwa kata 'parameter' digunakan dalam cara seorang ahli statistik akan menggunakan kata 'variabel'. Wikipedia menyatakannya sebagai berikut:
Contoh di mana ini mungkin menjadi masalah: 1 - mungkin pos yang mengarah ke pertanyaan ini. (Saya melihat yang lain baru-baru ini tetapi saya tidak dapat menemukannya sekarang)
sumber
"Kesalahan" - Dalam statistik seringkali berarti penyimpangan antara nilai yang diamati dan yang diperkirakan. Dalam kehidupan nyata itu berarti kesalahan.
sumber
Saya menemukan kertas referensi dari 2010 yang membahas pertanyaan ini.
Anderson-Cook CM. Jargon tersembunyi: Kata sehari-hari dengan makna khusus untuk statistik. ICOTS8, Konferensi Internasional tentang Statistik Pengajaran, Ljubljana, Slovenia, 11-17 Juli 2010.
Makalah ini tersedia secara online gratis , jadi saya hanya memberikan sebagian daftar istilah yang penulis bahas:
sumber
Saya telah menemukan masalah dalam menggunakan "pemalsuan" seperti dalam "memalsukan hipotesis", sementara yang lain berpikir saya mengacu pada "membuat data". Juga " bias " hampir tidak mungkin untuk disebutkan tanpa menimbulkan kebingungan.
sumber
"normal" - Dalam pembicaraan umum, normal berarti seperti yang diharapkan, bukan di luar kebiasaan. Dalam statistik, jika suatu variabel terdistribusi secara normal, itu merujuk pada distribusi Gaussian. Saya tidak percaya itu standar untuk menggunakan huruf besar kata "normal" untuk membedakannya dari makna ucapan umum.
"normalisasi / standarisasi" - Dalam statistik, untuk menormalkan variabel berarti mengurangi rata-rata dan membagi dengan standar deviasi.
"standar deviasi versus kesalahan standar" - Standar deviasi biasanya dihitung menggunakan seluruh populasi sedangkan kesalahan standar dihitung menggunakan sampel.
sumber
"Parametrik" versus "Non-Parametrik": kategori tes yang membutuhkan data "Normal" atau "bukan Normal". Tes parametrik lebih disukai daripada non-parametrik.
Tes umum: T-test (berpasangan), Mann-Whitney U, ANOVA, Anderson-Darling, dll.
Istilah lain termasuk "signifikan". Ini adalah ukuran apakah data menunjukkan hipotesis Anda valid atau tidak. Ketika Anda menguji hipotesis Anda ke tingkat kemungkinan tertentu (biasanya 95%), "nilai-p" kurang dari 0,05 akan menunjukkan bahwa Anda akan menolak "hipotesis nol" Anda (yaitu kumpulan data tidak berbeda) dan menerima Anda " hipotesis alternatif "(yaitu kumpulan data berbeda).
sumber
Statistik yang condong menyiratkan asimetris dalam distribusi.
Dalam bahasa biasa, dan bahkan dalam sains, kecondongan sering digunakan (dan semakin?) Untuk mengartikan apa yang oleh orang statistik biasa disebut bias , seperti dalam "Hasil untuk tinggi rata-rata condong dengan memasukkan begitu banyak pemain bola basket".
sumber
Perkirakan - Dalam statistik ini adalah hasil perhitungan. Misalnya, rata-rata sampel adalah perkiraan rata-rata populasi, dan interval kepercayaan rata-rata adalah estimasi interval dari rata-rata populasi. Ini adalah hasil perhitungan yang tepat. "Estimasi" adalah generalisasi yang tepat untuk mencoba membuat kesimpulan tentang populasi dari data dalam sampel.
Dalam penggunaan biasa, perkiraan kata berarti perkiraan atau dugaan terinformasi, atau hasil dari perkiraan perkiraan.
sumber
Kemungkinan - dalam bahasa biasa, sinonim dari probabilitas , tetapi dalam statistik memiliki hubungan terbalik khusus dengan probabilitas, dalam hal itu, untuk setiap set parameter dan set data , .θ X L(θ|X)=Pr(X|θ)
Representatif - memiliki sejumlah makna yang terkadang saling bertentangan baik dalam keseharian maupun ilmiah. Lihat Kruskal & Mosteller 1979a , 1979b , 1979c dan 1980 . Kebanyakan ahli statistik yang saya tahu akan mempertimbangkan sampel yang representatif jika sampel tersebut diambil sampelnya dengan probabilitas yang diketahui; kebanyakan orang awam yang saya kenal akan menganggapnya representatif jika distribusi marjinal sama dengan populasi.
sumber
Sampel : sementara dalam statistik ini merujuk pada serangkaian kasus , dalam banyak disiplin ilmu lain sampel adalah satu spesimen fisik . Tentu saja, ukuran sampel juga ambigu, merujuk pada jumlah kasus dalam sampel statistik atau ukuran fisik (massa, volume, ...) dari spesimen.
Sensitivitas : untuk diagnosa medis, fraksi dari kasus yang sakit yang dikenali oleh tes. Dalam kimia analitik: kemiringan kurva kalibrasi (lihat di bawah).
Spesifisitas : dalam diagnosis medis, fraksi kasus non-penyakit ini dikenali dengan benar oleh tes. Dalam kimia analitik, metode tertentu jika tidak ada sensitivitas silang.
Kalibrasi : sebenarnya, dua makna sudah terdaftar untuk statistik dalam artikel Wiki. Dalam kimia dan fisika, makna regresi terbalik adalah yang biasa. Namun, kebingungan muncul:
Kumpulan validasi : di sini saya ingin menarik perhatian pada kemungkinan penggunaan istilah yang menurut saya sudah muncul dalam bidang terkait statistik yang berbeda, meskipun saya sekali lagi kontras. Dalam konteks nested / double validation atau optimization vs. validation / testing, satu baris terminologi membagi pelatihan - validasi - tes dan menggunakan set "validasi" untuk optimalisasi hyperparameters.
Misalnya dalam Elemen Pembelajaran Statistik, hal. 222 dalam edisi ke-2. :
Sebaliknya, misalnya dalam validasi kimia analitik adalah prosedur yang menunjukkan bahwa model (sebenarnya, penilaian model akhir hanya bagian dari validasi metode analitik) berfungsi dengan baik untuk aplikasi, dan mengukur kinerjanya, lihat misalnya John K. Taylor: Validasi metode analitik, Analytical Chemistry 1983 55 (6), 600A-608A atau pedoman oleh institusi seperti FDA. Ini akan menjadi "pengujian" di baris terminologi lain, di mana "validasi" sebenarnya digunakan untuk optimasi.
Perbedaan penting adalah, bahwa hasil "optimasi-validasi" akan digunakan untuk mengubah (pilih) model, sedangkan perubahan dalam metode analitik yang divalidasi (termasuk model analitik data) berarti bahwa Anda harus memvalidasi ulang (yaitu membuktikan bahwa metode ini masih berfungsi sebagaimana mestinya bekerja).
Jika Anda harus berbicara dengan ahli kimia, referensi yang baik tentang terminologi kimia analitik adalah Danzer: Kimia Analitik - Dasar-dasar Teoretis dan Metrologi, DOI 10.1007 / b103950
sumber