Kami ahli statistik menggunakan banyak kata dengan cara yang sedikit berbeda dari cara orang lain menggunakannya. Ini menyebabkan banyak masalah ketika kita mengajar atau menjelaskan apa yang sedang kita lakukan. Saya akan memulai daftar (dan sekarang saya akan menambahkan beberapa definisi, per komentar):
- Kekuatan adalah kemampuan untuk menolak hipotesis nol palsu yang benar. Biasanya, ini berarti mengatakan "sesuatu sedang terjadi" dengan benar.
- Bias - suatu statistik bias jika secara sistematis berbeda dari parameter populasi yang terkait dengannya.
- Signifikasi 5% dari waktu.
- Interaksi - Dua variabel independen berinteraksi jika hubungan antara variabel dependen dan satu variabel independen berbeda pada tingkat yang berbeda dari variabel independen lainnya
Tetapi harus ada banyak lainnya!
terminology
communication
Peter Flom
sumber
sumber
Jawaban:
"Significant" adalah yang terbesar yang saya temui, karena ia memiliki kedua makna bahasa Inggris yang umum dan makna yang akan muncul dalam diskusi hasil penelitian. Saya bahkan menemukan diri saya mencampuradukkan "signifikan" dengan arti penting dalam kalimat yang sama di mana saya berbicara tentang hasil statistik.
Dengan begitu terletak kegilaan.
sumber
Saya sarankan menambahkan Linear ke daftar.
Aku bertanya pertanyaan tentang math.SE tentang apa yang saya, sebagai seorang insinyur, anggap sebagai linear minimum rata-rata estimasi square error dari variabel acak diberikan nilai dari suatu variabel acak X (yang berarti memperkirakan Y sebagai Y = a X + b dengan a dan b dipilih untuk meminimalkan E [ ( Y - a X - b ) 2 ] ), dan memberikan jawaban parsial. Salah satu komentar pada pertanyaan itu berkataY X Y Y^= a X+ b Sebuah b E[ ( Y- a X- b )2]
"Saya agak tidak nyaman dengan bahasa Anda, karena saya khawatir cara menggunakan kata" linear "ini dapat menimbulkan kesalahpahaman populer bahwa alasan mengapa regresi linier dalam disebut regresi linier adalah karena seseorang sesuai dengan garis. Orang yang berpikir bahwa kemudian menemukan itu membingungkan ketika seorang ahli statistik bersikeras bahwa seseorang sedang melakukan regresi linier ketika seseorang cocok dengan parabola atau gelombang sinus, dll. "
Jadi, apa arti regresi linier bagi ahli statistik?
sumber
kemungkinan; Peluang; probabilitas
Tampak bagi saya bahwa sebagian besar masalah yang terkait dengan menafsirkan tes hipotesis dan interval kepercayaan berasal dari penerapan definisi Bayesian tentang "probabilitas" ketika prosedur didasarkan pada yang sering. Sebagai contoh nilai-p adalah probabilitas hipotesis nol itu benar, ketika AFAICS tidak ada probabilitas yang dapat dikaitkan dengan kebenaran hipotesis tertentu dalam pengaturan yang sering terjadi.
sumber
"Kepercayaan"
Sangat sulit untuk mencegah non-ahli statistik bahwa interval kepercayaan mereka bukan (langsung) pernyataan tentang kredibilitas nilai parameter yang berbeda.
Untuk memiliki kepercayaan, dalam arti teknis dari istilah tersebut, kita perlu membayangkan beberapa rangkaian percobaan berulang, masing-masing menghitung interval dalam beberapa cara yang telah ditentukan sebelumnya. Untuk menjadi interval kepercayaan 95%, 95% dari penggunaan rumus ini akan menjebak parameter minat yang relevan.
(Tentu saja ada situasi di mana kedua konsep setuju, kira-kira atau tepatnya. Tetapi secara umum tidak, dan kesepakatan numerik tidak menghilangkan masalah penyalahgunaan istilah teknis.)
sumber
"Kemungkinan" - identik dengan "probabilitas" dalam percakapan sehari-hari, tetapi dalam Statistik memiliki arti khusus: itu adalah fungsi dari parameter model statistik, yang nilainya adalah probabilitas dari hasil yang diamati dengan asumsi bahwa parameter sama dengan nilai parameter.
sumber
Kesalahan.
Dalam statistik, "kesalahan" adalah penyimpangan nilai data aktual dari prediksi model.
Dalam kehidupan nyata, kesalahan adalah kesalahan atau kesalahan lain.
sumber
"Kesimpulan"
Bagian penting lainnya tentang inferensi adalah teorema limit pusat. Setelah Anda menyadari bahwa Anda hanya mengambil sampel dari suatu populasi - meskipun pengambilan sampel adalah fitur rumit yang mirip dengan inferensi - maka Anda memahami bahwa meskipun mean sampel memiliki satu nilai, nilai tersebut tidak harus berarti sama dengan populasi. .
Mungkin saya mengambil pemahaman yang relatif longgar tentang pertanyaan Anda, tetapi begitu seseorang memahami kesimpulan atau perbedaan antara sampel dan populasi, maka keseluruhan statistik terbuka bagi mereka.
sumber
Bagi kami (atau setidaknya saya), "keacakan" dari "sampel" menunjukkan bahwa ia mewakili "populasi".
Bagi orang lain, "keacakan" kadang-kadang menyiratkan bahwa seseorang / sesuatu itu tidak biasa.
sumber
Saya pikir orang harus membedakan antara istilah membingungkan masyarakat dan istilah membingungkan statistik. Saran di atas, sebagian besar istilah dipahami dengan baik oleh ahli statistik dan (mungkin) disalahpahami oleh publik. Saya ingin menambahkan ke daftar beberapa istilah yang tidak dimengerti oleh ahli statistik:
sumber
Ekologis, umumnya digunakan untuk merujuk pada sistem biologis, tetapi juga kekeliruan statistik. Dari Wikipedia:
Kekeliruan ekologis (atau keliru inferensi ekologis) adalah kesalahan dalam interpretasi data statistik dalam studi ekologi, di mana kesimpulan tentang sifat individu tertentu didasarkan hanya pada statistik agregat yang dikumpulkan untuk kelompok yang menjadi tempat individu tersebut berada. Kekeliruan ini mengasumsikan bahwa anggota individu suatu kelompok memiliki karakteristik rata-rata kelompok pada umumnya.
sumber
Apakah "survei" adalah jenis matematika ("sampling survei") atau selembar kertas ("kuesioner")?
Saya belum melakukan survei mengenai hal ini, tetapi saya curiga banyak masyarakat menganggap "survei" sebagai yang terakhir. Saya menduga lebih lanjut bahwa mereka tidak memikirkan yang pertama.
sumber
"Memuat", "Koefisien" dan "Bobot"; ketika berbicara tentang Analisis Komponen Utama.
Saya biasanya menemukan orang-orang cukup ad-hoc ketika menggunakannya, mempekerjakan mereka secara bergantian tanpa terlebih dahulu mendefinisikan secara jelas apa yang mereka maksud dan saya benar-benar menemukan makalah yang merujuk pada "memuat vektor" dan kadang-kadang berarti PC sendiri dan kadang-kadang "bobot" terkait dengan PC tertentu.
Mungkin fakta bahwa referensi Jollifee yang sangat baik tentang Komponen Utama menyatakan di akhir bagian 1.1 "Beberapa penulis membedakan antara istilah 'pemuatan' dan 'koefisien,' tergantung pada batasan normalisasi yang digunakan, tetapi mereka akan digunakan secara bergantian dalam buku ini." hanya membuat orang berpikir mereka memiliki pass bebas untuk mencampur dan mencocokkan terminologi dengan keinginan mereka ....
sumber
Model aditif. Masih tidak begitu yakin apa artinya ini. Saya pikir ini mengacu pada model tanpa syarat interaksi. Tapi kemudian saya akan menemukan artikel di mana mereka menggunakannya untuk merujuk pada sesuatu yang lain, yaitu model spline.
sumber
Salah satu istilah yang saya anggap paling membingungkan adalah "matriks kebingungan". Tentu saja, istilah yang digunakan itu sendiri membingungkan, bukan konsepnya.
Saya mencoba melacak sejarah istilah itu dan itu juga cukup menarik. Matriks kebingungan ditemukan pada tahun 1904 oleh ( http://en.wikipedia.org/wiki/Karl_Pearson ). Dia menggunakan istilah http://en.wikipedia.org/wiki/Contingency_table . Itu muncul di Karl Pearson, FRS (1904). Kontribusi matematika untuk teori evolusi (PDF). Dulau and Co. http://ia600408.us.archive.org/18/items/cu31924003064833/cu31924003064833.pdf
Selama Perang Dunia 2, h ttps: //en.wikipedia.org/wiki/Detection_theory dikembangkan sebagai penyelidikan hubungan antara stimulus dan tanggapan. Matriks kebingungan digunakan di sana.
Karena teori deteksi, istilah itu digunakan psikologi. Dari sana istilah tersebut mencapai pembelajaran mesin.
Tampaknya meskipun konsep itu ditemukan dalam statistik, suatu catatan yang sangat terkait dengan pembelajaran mesin, konsep tersebut mencapai pembelajaran mesin setelah jalan memutar selama periode 100 tahun.
Untuk beberapa referensi penggunaan istilah, lihat: Apa asal usul matriks kebingungan?
sumber
"Statistik"
Kepada masyarakat umum, pengganti, "sekarang aku akan membohongimu dan berbicara dengan cara yang tidak kau mengerti."
sumber