Kapan harus menggunakan jarak Euclidean tertimbang dan bagaimana menentukan bobot untuk digunakan?

16

Saya memiliki satu set data di mana setiap data terdiri dari n ukuran berbeda. Untuk setiap ukuran, saya memiliki nilai tolok ukur. Saya ingin tahu seberapa dekat setiap data dengan nilai tolok ukur.

Saya berpikir untuk menggunakan Weighted Euclidean Distance seperti ini:

dx,b=(saya=1nwsaya(xsaya-bsaya)2))1/2

dimana

xsaya adalah nilai ukuran ke-i untuk data tertentu

bsaya adalah nilai patokan yang sesuai untuk ukuran itu.

wsaya adalah nilai bobot antara saya akan lampirkan ke subjek pengukuran ke-i sebagai berikut:

0<wsaya<1 dansaya=1n1

Namun, berdasarkan dokumen ini , saya menemukan bahwa bobot yang digunakan adalah kebalikan dari varian ukuran ke-i. Saya tidak berpikir bobot semacam ini akan menjelaskan pentingnya bahwa saya akan lampirkan pada setiap ukuran.

Karena itu:

  1. Apakah ada metode untuk menghasilkan serangkaian bobot yang mencerminkan kepentingan relatif pengamat dari suatu ukuran atau dapatkah pengamat memberikan nilai arbitrer apa pun untuk bobot?

  2. Apakah pantas menggunakan Jarak Euclidean Tertimbang untuk menyelesaikan masalah ini?

Sara
sumber

Jawaban:

16

Bobot untuk standardisasi

w

Bobot untuk kepentingan

Anda bebas untuk meletakkan apa pun yang Anda suka sebagai bobot, termasuk ukuran 'penting' (walaupun Anda mungkin ingin membuat standar sebelum bobot penting jika unit pengukuran berbeda).

xb mungkin posisi dua aktor di sayamasalah -th, dan wsayaarti-penting dari masalah itu. Sebagai contoh,bsayamungkin posisi status quo pada beberapa dimensi, dari mana berbagai posisi aktor berbeda. Dalam aplikasi ini orang tentu akan lebih suka mengukur daripada menegaskan arti-penting dan posisi. Either way, bobot besar akan membuat perbedaan pada masalah yang tidak menonjol memiliki efek yang lebih kecil pada jarak keseluruhan antara aktor jika mereka dihitung sesuai dengan persamaan pertama Anda. Perhatikan juga bahwa dalam versi ini kami secara implisit menganggap tidak ada kovarians yang relevan di antara posisi, yang merupakan klaim yang cukup kuat.

Berfokus sekarang pada pertanyaan 2: Dalam aplikasi saya baru saja menjelaskan justifikasi untuk bobot dan alasan jarak dalam asumsi teori permainan tentang struktur preferensi transitif dan sejenisnya. Pada akhirnya, ini adalah satu-satunya alasan 'tepat' untuk menghitung jarak dengan cara ini. Tanpa mereka kita hanya punya banyak angka yang mematuhi ketimpangan segitiga.

Bobot sebagai pengukuran implisit

Pada tema kovarians, mungkin berguna untuk menganggap masalah Anda sebagai salah satu dari mengidentifikasi subruang yang relevan di mana jarak masuk akal secara substantif, dengan asumsi bahwa banyak pengukuran yang Anda lakukan sebenarnya mengukur hal-hal serupa. Model pengukuran, misalnya analisis faktor, akan memproyeksikan segalanya melalui kombinasi berbobot ke ruang bersama tempat jarak dapat dihitung. Tetapi, sekali lagi, kita harus mengetahui konteks penelitian Anda untuk mengatakan apakah itu masuk akal.

conjugateprior
sumber
terima kasih atas informasi yang berharga. tetapi saya memiliki keprihatinan tentang Bagaimana cara menghitung bobot?