Bagaimana menjumlahkan dua variabel yang ada pada skala yang berbeda?

9

Jika saya memiliki dua variabel mengikuti dua distribusi yang berbeda dan memiliki standar deviasi yang berbeda ... Bagaimana saya perlu mengubah dua variabel sehingga ketika saya menjumlahkan, kedua hasilnya tidak "didorong" oleh yang lebih volatil.

Sebagai contoh ... Variabel A lebih tidak stabil daripada variabel B (berkisar dari 0 hingga 3000) dan variabel B pergi ke sana kemari. 300 hingga 350.

Jika hanya menambahkan dua variabel secara bersamaan, hasilnya jelas akan didorong oleh A.

pengguna333
sumber

Jawaban:

14

Praktik yang umum adalah untuk membakukan dua variabel, , untuk menempatkan mereka pada skala yang sama dengan mengurangi mean sampel dan membaginya dengan standar deviasi sampel. Setelah Anda melakukan ini, kedua variabel akan berada pada skala yang sama dalam arti bahwa mereka masing-masing memiliki rata-rata sampel 0 dan standar deviasi sampel 1. Dengan demikian, mereka dapat ditambahkan tanpa satu variabel yang memiliki pengaruh yang tidak semestinya hanya karena skala.A,B

Yaitu, hitung

AA¯SD(A),  BB¯SD(B)

di mana menunjukkan mean sampel dan standar deviasi , dan juga untuk B. Versi standar dari variabel ditafsirkan sebagai jumlah standar deviasi di atas / di bawah rata-rata a observasi khusus adalah. A¯,SD(A)A

Makro
sumber
1
apakah ini akan berfungsi jika variabel tidak terdistribusi secara normal?
user333
1
standardisasi tidak ada hubungannya dengan distribusi normal - itu hanyalah cara menempatkan variabel pada skala yang sama. Jadi iya.
Makro
Jika saya membagi dengan sd dan tidak mengurangi mean ... Saya akan mendapatkan volatilitas yang sama, tetapi rentang yang berbeda bukan?
user333
Ya - jika Anda hanya skala mereka (dibagi dengan standar deviasi) maka mereka dengan keduanya berakhir dengan varian yang sama, tetapi rata-rata dan jangkauan mereka akan berbeda.
Makro
@ Macro Bagaimana jika saya tidak memiliki data tetapi hanya memiliki data berurutan untuk variabel. Jadi, jumlah dua variabel bertindak lebih seperti skor. Saya percaya ada beberapa implikasi buruk seperti skor sangat awal dalam urutan. Apakah Anda tahu cara lain?
tintinthong