Mengapa distribusi 0 dan standar deviasi 1 selalu digunakan?

15

Statistik saya telah diajarkan sendiri, tetapi banyak materi yang saya baca menunjuk ke dataset yang memiliki mean 0 dan standar deviasi 1.

Jika demikian, maka:

  1. Mengapa 0 dan SD 1 berarti properti yang baik untuk dimiliki?

  2. Mengapa variabel acak yang diambil dari sampel ini sama dengan 0,5? Peluang menggambar 0,001 sama dengan 0,5 jadi ini harus distribusi datar ...

  3. Ketika orang berbicara tentang Skor Z, apa yang sebenarnya mereka maksud di sini?

Jack Kada
sumber

Jawaban:

11
  1. Pada awalnya jawaban yang paling berguna mungkin adalah bahwa rata-rata 0 dan sd 1 adalah nyaman secara matematis. Jika Anda dapat menghitung probabilitas untuk distribusi dengan rata-rata 0 dan standar deviasi 1, Anda dapat menghitungnya untuk distribusi skor yang serupa dengan persamaan yang sangat sederhana.

  2. Saya tidak mengikuti pertanyaan ini. Rata-rata 0 dan standar deviasi 1 biasanya berlaku untuk distribusi normal standar, sering disebut kurva lonceng. Nilai yang paling mungkin adalah nilai tengah dan jatuh saat Anda semakin jauh. Jika Anda memiliki distribusi yang benar-benar datar maka tidak ada nilai yang lebih mungkin daripada yang lain. Pertanyaan Anda di sini tidak terbentuk dengan baik. Apakah Anda melihat pertanyaan tentang membalik koin mungkin? Cari distribusi binomial dan teorema limit pusat.

  3. "maksud di sini"? Dimana? Jawaban sederhana untuk z-skor adalah bahwa skor Anda diskalakan seolah-olah nilai rata-rata Anda adalah 0 dan standar deviasi adalah 1. Cara lain untuk memikirkannya adalah bahwa dibutuhkan skor individual karena jumlah standar deviasi yang diperoleh adalah dari berarti. Persamaannya menghitung (skor rata-rata) / standar deviasi. Alasan Anda melakukan itu cukup bervariasi tetapi satu adalah bahwa dalam kursus statistik intro Anda memiliki tabel probabilitas untuk berbagai skor-z (lihat jawaban 1).

Jika Anda mencari skor-z pertama, bahkan di wikipedia, Anda akan mendapatkan jawaban yang cukup bagus.

John
sumber
Pada 2) Saya percaya kebingungan adalah apa yang p (X = 0,01) artinya ketika X adalah variabel acak kontinu. Secara intuitif, probabilitas tampaknya nol di mana-mana karena tidak ada peluang X persis 0,01. Penanya harus meninjau definisi fungsi kerapatan dalam kasus kontinu, yang didefinisikan sebagai turunan dari fungsi kerapatan kumulatif.
Tristan
7

Untuk memulai dengan apa yang kita bicarakan di sini adalah distribusi normal standar, distribusi normal dengan rata-rata 0 dan standar deviasi 1. Tangan pendek untuk variabel yang didistribusikan sebagai distribusi normal standar adalah Z.

Inilah jawaban saya untuk pertanyaan Anda.

(1) Saya pikir ada dua alasan utama mengapa distribusi normal standar menarik. Pertama, setiap variabel yang terdistribusi normal dapat dikonversi atau diubah menjadi standar normal dengan mengurangi rata-rata dari setiap pengamatan sebelum membagi setiap pengamatan dengan standar deviasi. Ini disebut transformasi-Z atau penciptaan skor-Z. Ini sangat berguna terutama pada hari-hari sebelum komputer.

(xsaya-x¯)σx=Z(75-65.6)10.2=0,9215

Alasan kedua mengapa distribusi normal standar sering digunakan adalah karena interpretasi disediakan dalam hal skor-Z. Setiap "pengamatan" dalam variabel Z-transformed adalah berapa banyak standar deviasi dari pengamatan asli yang tidak ditransformasi dari mean. Ini sangat berguna untuk pengujian standar di mana kinerja mentah atau absolut kurang penting daripada kinerja relatif.

(2) Saya tidak mengikuti Anda di sini. Saya pikir Anda mungkin bingung tentang apa yang kami maksud dengan fungsi distribusi kumulatif. Perhatikan bahwa nilai yang diharapkan dari distribusi normal standar adalah 0, dan nilai ini sesuai dengan nilai .5 pada fungsi distribusi kumulatif terkait.

(xsaya-x¯)σx=Z(75-65.6)10.2=0,9215
Graham Cookson
sumber
1

Karena Anda menerima penjelasan luar biasa dari Graham dan John, saya hanya akan menjawab pertanyaan terakhir Anda:

Ketika orang berbicara tentang Skor Z, apa yang sebenarnya mereka maksud di sini?

Cara terbaik untuk menjawab ini adalah dengan memikirkan pertanyaan ini: Nilai-nilai di kelas CS 101 terdistribusi normal μ = 80 dan σ = 5. Berapa skor-z untuk kelas 65?

Jadi: (65-80) / 5 = -3

Anda dapat mengatakan skor-z untuk kelas 65 adalah -3 ; atau dengan kata lain 3 standar deviasi ke kiri.

adhg
sumber