Jadi, saya memiliki kumpulan data persentase seperti ini:
100 / 10000 = 1% (0.01)
2 / 5 = 40% (0.4)
4 / 3 = 133% (1.3)
1000 / 2000 = 50% (0.5)
Saya ingin menemukan standar deviasi dari persentase, tetapi ditimbang untuk volume data mereka. yaitu, titik data pertama dan terakhir harus mendominasi perhitungan.
Bagaimana aku melakukan itu? Dan adakah cara sederhana untuk melakukannya di Excel?
Jawaban:
The formula untuk tertimbang deviasi standar adalah:
dimana
adalah jumlah pengamatan.N
adalah jumlah bobot bukan nol.M
adalah bobotwi
adalah pengamatan.xi
adalah rata-rata tertimbang.x¯∗
Ingat bahwa rumus untuk rata-rata tertimbang adalah:
Gunakan bobot yang sesuai untuk mendapatkan hasil yang diinginkan. Dalam kasus Anda, saya akan menyarankan untuk menggunakan .Jumlah kasus dalam segmenTotal jumlah kasus
Untuk melakukan ini di Excel, Anda harus menghitung rata-rata tertimbang terlebih dahulu. Kemudian hitung di kolom terpisah. Sisanya pasti sangat mudah.( xsaya- x¯∗)2
sumber
Formula tersedia berbagai tempat, termasuk Wikipedia .
Kuncinya adalah memperhatikan bahwa itu tergantung pada apa artinya bobot . Secara khusus, Anda akan mendapatkan jawaban yang berbeda jika bobotnya adalah frekuensi (yaitu Anda hanya berusaha menghindari menjumlahkan seluruh jumlah Anda), jika bobot sebenarnya adalah varian dari setiap pengukuran, atau jika itu hanya beberapa nilai eksternal yang Anda memaksakan data Anda.
Dalam kasus Anda, ini tampak seperti bobot adalah frekuensi tetapi tidak . Anda menghasilkan data dari frekuensi, tetapi bukan hal yang mudah untuk memiliki 45 catatan 3 dan 15 catatan 4 dalam kumpulan data Anda. Sebagai gantinya, Anda perlu menggunakan metode terakhir. (Sebenarnya, semua ini adalah sampah - Anda benar - benar perlu menggunakan model proses yang lebih canggih yang menghasilkan angka-angka ini! Anda tampaknya tidak memiliki sesuatu yang mengeluarkan angka yang terdistribusi secara normal, jadi karakterisasi sistem dengan standar deviasi bukan hal yang benar untuk dilakukan.)
Bagaimanapun, rumus untuk varians (dari mana Anda menghitung standar deviasi dengan cara normal) dengan bobot "keandalan" adalah
Anda tidak memiliki perkiraan untuk bobot, yang saya anggap Anda ingin menjadi proporsional dengan reliabilitas. Mengambil persentase dengan cara Anda akan membuat analisis menjadi rumit bahkan jika itu dihasilkan oleh proses Bernoulli, karena jika Anda mendapatkan skor 20 dan 0, Anda memiliki persentase tak terbatas. Pembobotan oleh kebalikan dari SEM adalah hal yang umum dan terkadang optimal untuk dilakukan. Anda mungkin harus menggunakan perkiraan Bayesian atau interval skor Wilson .
sumber
Kolom
G
adalah bobot, KolomH
adalah nilaisumber
sumber
sumber