Saya bertanya-tanya apakah standar deviasi selalu dibangun dengan asumsi distribusi normal. Dengan kata lain, jika sampel tidak terdistribusi secara normal, maka haruskah menggunakan standar deviasi dianggap sebagai kesalahan?
10
Saya bertanya-tanya apakah standar deviasi selalu dibangun dengan asumsi distribusi normal. Dengan kata lain, jika sampel tidak terdistribusi secara normal, maka haruskah menggunakan standar deviasi dianggap sebagai kesalahan?
Jawaban:
Tidak. Penggunaan standar deviasi tidak mengasumsikan normal.
Varian dari variabel acak didefinisikan sebagai . Selama varians ada, standar deviasi juga ada. Simpangan baku adalah akar kuadrat dari varians.Var(X)=E[(X−E[X])2]
Anda dapat menggunakan varians atau standar deviasi kapan saja keduanya ada. Varians muncul dalam situasi yang tak terhitung jumlahnya.Var(X)
Ada teorema khusus, lemmas dll ... meskipun untuk kasus khusus di mana mengikuti distribusi normal.X
Penggunaan standar deviasi yang umum yang bergantung pada normalitas:
Jika mengikuti distribusi normal, maka ada kemungkinan sekitar 95% bahwa X berada dalam dua standar deviasi dari rata-rata.X X
Pernyataan itu benar jika mengikuti distribusi normal (dan beberapa lainnya) tetapi itu tidak benar secara umum.X
Penggunaan umum varian yang tidak bergantung pada normalitas:
Misalkan menjadi variabel acak dengan rata-rata E [ X ] = μ dan varians Var ( X ) = σ 2 . Tentukan X i untuk i = 1 , ... , n sebagai variabel acak independen, masing-masing mengikuti distribusi identik sebagai X .X E[X]=μ Var(X)=σ2 Xi i=1,…,n X
Tetapkan mean sampel berdasarkan pada pengamatan sebagai: ˉ X n = 1n
Dengan Teorema Limit Pusat, bertemu menuju variabel acak yang terdistribusi normal dengan mean μ dan varians σ 2X¯n μ . (Lebih tepatnya√σ2n menyatu dalam distribusi keN(0,σ2)sebagain→∞.)n−−√(X¯n−μ) N(0,σ2) n→∞
Implikasi praktis adalah bahwa mean sampel untuk besar n dapat diperlakukan sebagai variabel acak berdistribusi normal yang varians σ 2X¯n n adalah fungsi dari varians dariX. (IngatVar(X)=σ2.) Dan hasil ini tidak mengharuskanXnormal. (Memang membutuhkann yanglebih rendahuntuk bekerja dengan baik jikaXlebih dekat dalam arti dengan distribusi normal.)σ2n X Var(X)=σ2 X n X
Teorema Limit Pusat adalah alat di mana-mana yang menggunakan varian dan tidak perlu X untuk mengikuti distribusi normal.X X
sumber
sumber