Mengapa saya tidak bisa menghitung 1,5 standar deviasi menggunakan matematika dasar?

8

Masalah distribusi normal

Saya tidak mengerti mengapa saya tidak bisa menambahkan 1,5 standar deviasi untuk mendapatkan jawabannya.

Jika 1 standar deviasi adalah 10kg dan rata-rata 400kg, maka 415kg adalah 1,5 standar deviasi.

Jadi saya hitung seperti ini: .3413 + ((.4772-.3413)/2) = 0.40925

Persamaan ini mengambil setengah dari perbedaan antara dua standar deviasi dan satu standar deviasi, kemudian menambahkannya ke standar deviasi pertama.

Mengapa ini tidak berhasil? Mengapa saya harus menggunakan tabel yang disediakan?

Ben
sumber
5
Di mana Anda mendapatkan angka 0,3413, 0,4772 dan 0,3413? Bagaimanapun, alasan Anda tidak bisa hanya menambahkan 1,5 SD adalah karena mereka meminta Anda untuk area di bawah kurva, di mana Anda harus menggunakan tabel normal yang memberi Anda area seperti itu.
mb7744
3
@ Ben Masalahnya menyatakan bahwa standar deviasi adalah 10. Kecuali Anda berarti bahwa Anda menghitung beberapa nilai yang sesuai dengan 1 standar deviasi, dan menghitung nilai lain yang sesuai dengan 2 standar deviasi. Tetapi jika demikian, itulah yang ditanyakan mb7744.
Jelsema
1
@elsels ya sisi kanan 1 standar deviasi terdiri dari 34,13% dari hasil. Deviasi standar kedua terdiri dari 47,72% dari hasil. Karena hanya 1,5 standar deviasi kami mengambil perbedaan antara standar deviasi pertama dan standar deviasi kedua dan mendapatkan setengahnya karena hanya 1,5 standar deviasi.
Ben
8
@ Ben, Anda menginterpolasi secara linear. Itu tidak valid, maksud saya itu tidak sepenuhnya benar, karena area di bawah kurva (katakanlah dari mean) bukan fungsi linier dari jumlah standar deviasi; jika ya, maka angka deviasi standar 2 0,4772 akan menjadi dua kali lipat angka deviasi standar 0,3413, yang bukan.
Mark L. Stone
1
Saya ingin tahu 5 kuadrat. Jadi mengapa saya tidak bisa hanya mengambil 10 kuadrat (yang 100) dan membagi dua?
user253751

Jawaban:

20

Alasan bahwa kita tidak dapat (secara linear) menginterpolasi antara 0,3413 dan 0,4772 adalah karena pdf dari distribusi Normal tidak seragam (datar pada nilai tunggal).

Perhatikan contoh yang lebih sederhana ini, di mana kita dapat menggunakan geometri untuk menemukan area.

masukkan deskripsi gambar di sini

Luas total plot adalah 1(ini adalah potongan persegi secara diagonal, dengan dua potongan disusun ulang menjadi segitiga). Dengan menggunakan Base*Height/2kita dapat menemukan bahwa luas wilayah A adalah 0.5, dan total luas wilayah B dan C juga 0.5.

Tetapi area B dan C tidak sama. Luas wilayah C adalah 0.5*0.5/2 = 0.125, dan karenanya wilayah wilayah B adalah 0.375. Jadi meskipun daerah B dan C sama-sama lebar di sepanjang sumbu x, karena ketinggiannya tidak konstan, mereka memiliki daerah yang berbeda.

Distribusi normal yang Anda hadapi dalam latihan Anda serupa, tetapi dengan fungsi yang lebih rumit untuk tinggi daripada segitiga sederhana. Karena itu, area antara dua nilai tidak dapat dipecahkan secara sederhana - maka penggunaan skor-Z dan tabel untuk menemukan probabilitas.

Jelsema
sumber
1
Bisakah saya menggunakan interpolasi linier untuk menebak jawaban pilihan ganda? Karena mereka begitu jauh? Apakah itu ide yang buruk?
Ben
2
@ Ben Itu umumnya ide bagus. Tes pilihan ganda dibangun untuk manipulasi semacam ini. Mampu memperkirakan ukuran jawaban adalah kemampuan yang sangat berguna sepanjang hidup. Tetap juga baik jika Anda bertanya dan memahami masalah ini karena saat Anda melanjutkan akan ada semakin banyak pertanyaan seperti ini yang tidak memiliki formula untuk jawaban.
rhaskett
6
@rhaskett meskipun kehadiran "tidak ada di atas" jenis strategi rampasan itu.
David Z
@ Ben Sekali waktu ujian, tentu saja, gunakan metode apa pun yang Anda bisa untuk mendapatkan jawaban yang benar. Namun, satu masalah dengan tes pilihan ganda adalah mereka memungkinkan tebak dan periksa strategi untuk menghindari keharusan untuk benar-benar memecahkan suatu nilai. Dalam jangka panjang, kecuali ini adalah kelas matematika terminal Anda, ketergantungan pada strategi itu akan lebih menyakiti Anda daripada membantu.
Dean MacGregor
@ DavidZ Benar. Saya melewatkan opsi itu.
rhaskett
6

Hanya untuk memberikan ilustrasi berbeda tentang topik yang sama ...

Dalam perhitungan awal Anda, Anda akan memperlakukan kurva normal sebagai distribusi yang seragam, dalam hal ini pendekatan awal Anda akan menjadi perhitungan matematis yang tepat untuk persegi panjang berarsir ganda dalam plot di bawah ini (dengan nilai aktual berbeda), hanya karena Anda akan menjadi dapat mengekspresikan daerah sebagai ketergantungan linear sederhana dari x jarak sumbu:

A1.5SD=A2SDA1SD2=heightX2SDX1SD2

Tetapi Anda ingin menghitung area yang ditetaskan secara diagonal di bawah kurva distribusi Gaussian, yang seperti yang dinyatakan sebelumnya tidak akan menjaga hubungan linier dengan jarak sepanjang x sumbu bahkan jika distribusinya berbentuk segitiga:

7

Antoni Parellada
sumber
2

Rumus untuk distribusi Gaussian adalah:

persamaan gauss

Di mana sigma = deviasi std dan mu = mean

(dicuri dari wikipedia)

Saat Anda meminta area, Anda mengintegrasikan fungsi ini pada rentang yang ditentukan. Integral ini tidak memiliki solusi "bentuk tertutup": tidak ada cara untuk menghasilkan ekspresi menggunakan fungsi matematika "normal" seperti faktorial, perkalian, eksponensial, akar, dll. Yang sama dengan integral itu.

Ini seperti fungsi logaritma atau trigonometri: Anda tidak bisa menghasilkan persamaan bentuk tertutup untuk mereka menggunakan fungsi aljabar lainnya (Anda bisa menggunakan deret tak hingga, tapi itu bukan "tertutup"). Jadi, Anda menggunakan tabel (jika Anda merasa retro, atau kalkulator, yang hanya menggunakan tabel untuk Anda di belakang layar yang tertanam dalam prosesornya sebagai titik awal) ketika Anda harus benar-benar menghitungnya.

Bahkan, paralel dengan logaritma cukup tepat: kita juga dapat mendefinisikan logaritma dengan integral, yaitu ln (x) = integral dari (1 / x) dari 0 hingga x.

Neologisme yang Pintar
sumber
0

Secara geometris,, .4772 - .3413mewakili area di bawah grafik antara 1 standar deviasi dan 2 standar deviasi. Jika Anda membagi wilayah ini setengah horizontal, bagian di sebelah kiri split akan menjadi area antara 1 dan 1,5 standar deviasi, seperti yang Anda inginkan. Sejauh ini baik-baik saja.

Namun ketika Anda mengambil (.4772 - .3413) / 2Anda mendapatkan setengah area , tetapi belum tentu apa yang Anda cari, yang bagaimanapun luasnya setengah jalan secara horizontal. Dengan grafik ini, bagian kiri dari perpecahan itu bukan bagian dari area - garisnya miring ke bawah (pergi dari kiri atas ke kanan bawah) sehingga ada lebih banyak ruang di bagian kiri daripada bagian kanan. Jika grafik ini adalah garis horizontal lurus, maka area yang Anda bagikan akan menjadi persegi panjang, dan setengah area tersebut akan benar-benar setengah jalan.

rakslice
sumber