Ringkasan : Mencoba menemukan metode terbaik merangkum kesamaan antara dua set data yang disejajarkan dengan menggunakan nilai tunggal.
Detail :
Pertanyaan saya paling baik dijelaskan dengan diagram. Grafik di bawah ini menunjukkan dua set data yang berbeda, masing-masing dengan nilai berlabel nf
dan nr
. Titik-titik di sepanjang sumbu x mewakili tempat pengukuran dilakukan, dan nilai pada sumbu y adalah nilai yang diukur diukur.
Untuk setiap grafik, saya ingin satu angka untuk merangkum persamaan nf
dan nr
nilai pada setiap titik pengukuran. Dalam contoh ini secara visual jelas bahwa hasil dalam grafik pertama kurang mirip daripada yang ada di grafik kedua. Tapi saya punya banyak data lain di mana perbedaannya kurang jelas, sehingga dapat peringkat ini secara kuantitatif akan sangat membantu.
Saya pikir mungkin ada teknik standar yang biasanya digunakan. Mencari kesamaan statistik telah memberikan banyak hasil berbeda, tetapi saya tidak yakin apa yang terbaik untuk dipilih atau jika hal-hal yang saya siapkan berlaku untuk masalah saya. Jadi saya pikir pertanyaan ini mungkin layak ditanyakan di sini kalau-kalau ada jawaban sederhana.
sumber
Jawaban:
Area antara 2 kurva dapat memberi Anda perbedaan. Karenanya jumlah (nr-nf) (jumlah dari semua perbedaan) akan menjadi perkiraan area antara 2 kurva. Jika Anda ingin membuatnya relatif, jumlah (nr-nf) / jumlah (nf) dapat digunakan. Ini akan memberi Anda nilai tunggal yang menunjukkan kesamaan antara 2 kurva untuk setiap grafik.
Sunting: Metode di atas jumlah perbedaan akan berguna bahkan jika ini adalah titik atau pengamatan yang terpisah dan tidak terhubung garis atau kurva, tetapi dalam hal itu, rata-rata perbedaan juga dapat menjadi indikator dan mungkin lebih baik karena akan mempertimbangkan jumlah pengamatan.
sumber
Anda perlu lebih mendefinisikan apa yang Anda maksud dengan 'kesamaan'. Apakah besaran itu penting? Atau hanya bentuk?
Jika hanya masalah bentuk, Anda ingin menormalkan kedua seri waktu dengan nilai maksimalnya (sehingga keduanya dari 0 hingga 1).
Jika Anda mencari korelasi linier, korelasi pearson sederhana akan berfungsi dengan baik - yang pada dasarnya mengukur kovarians.
Ada teknik lain, misalnya, yang bisa cocok dengan garis atau polinomial ke deret waktu (pada dasarnya merapikannya), dan kemudian membandingkan polinomial halus.
Jika Anda mencari kesamaan periodik (yaitu deret waktu memiliki komponen sinusoidal atau musiman tertentu), pertimbangkan untuk menggunakan dekomposisi deret waktu ke dalam tren, dan gabungkan komponen musim terlebih dahulu. Atau menggunakan sesuatu seperti FFT untuk membandingkan data dalam domain frekuensi.
Itulah semua yang saya tahu tanpa lebih banyak definisi tentang apa yang 'mirip' seharusnya. Semoga ini bisa membantu.
sumber
Anda bisa menggunakan (nr-nf) untuk setiap titik pengukuran, semakin kecil angkanya (nilai absolut) semakin banyak nilainya. Bukan pendekatan yang paling ilmiah, maafkan saya, saya tidak punya pelatihan formal nyata dalam hal ini. Jika Anda hanya mencari representasi numerik dari visual, itu harus dilakukan.
sumber