Saya bekerja dengan satu set besar data accelerometer yang dikumpulkan dengan beberapa sensor yang dikenakan oleh banyak subjek. Sayangnya, tidak ada orang di sini yang tahu spesifikasi teknis perangkat dan saya pikir mereka tidak pernah dikalibrasi ulang. Saya tidak punya banyak info tentang perangkat. Saya sedang mengerjakan tesis master saya, accelerometer itu dipinjam dari universitas lain dan secara keseluruhan situasinya agak tidak transparan. Jadi, preprocessing on-board perangkat? Tidak tahu.
Yang saya tahu adalah mereka adalah accelerometer triaksial dengan laju sampling 20Hz; digital dan mungkin MEMS. Saya tertarik pada perilaku dan gerak tubuh nonverbal, yang menurut sumber saya sebagian besar harus menghasilkan aktivitas dalam kisaran 0,3-3,5Hz.
Normalisasi data tampaknya sangat diperlukan, tetapi saya tidak yakin apa yang harus digunakan. Sebagian besar data dekat dengan nilai lainnya (nilai mentah ~ 1000, dari gravitasi), tetapi ada beberapa ekstrem seperti hingga 8000 dalam beberapa log, atau bahkan 29000 pada yang lain. Lihat gambar di bawah . Saya pikir ini membuatnya menjadi ide yang buruk untuk dibagi dengan max atau stdev untuk dinormalisasi.
Apa pendekatan yang biasa dalam kasus seperti ini? Dibagi dengan median? Nilai persentil? Sesuatu yang lain
Sebagai masalah sampingan, saya juga tidak yakin apakah saya harus memotong nilai-nilai ekstrem ..
Terima kasih atas sarannya!
Sunting : Berikut adalah sebidang data sekitar 16 menit (20.000 sampel), untuk memberi Anda gambaran tentang bagaimana data biasanya didistribusikan.
sumber
Jawaban:
Sinyal mentah yang Anda perlihatkan di atas tampak tanpa filter dan tidak dikalibrasi. Sesuai filtering dan kalibrasi , dengan beberapa artefak penolakan akan berlaku menormalkan data. Pendekatan standar dengan data accelerometer adalah sebagai berikut:
Dianjurkan untuk melakukan penolakan artefak pada data sensor inersia. Saya akan khawatir bahwa Anda tidak tahu asal-usul data, sehingga Anda tidak dapat menjamin bahwa sensor ditempelkan dengan benar dan konsisten (dalam hal orientasi dan penempatan fisik) untuk semua subjek. Jika sensor tidak ditempelkan dengan benar, Anda bisa mendapatkan banyak artefak dalam sinyal, karena sensor dapat bergerak relatif terhadap segmen tubuh. Demikian pula, jika sensor diorientasikan secara berbeda (dalam cara mereka ditempatkan) pada subjek yang berbeda, data akan sulit untuk dibandingkan antar subjek.
Mengingat ukuran outlier yang Anda laporkan, mereka sepertinya merupakan artefak. Artefak semacam itu hampir pasti akan memiringkan perhitungan kalibrasi apa pun (meskipun efeknya akan dikurangi dengan penyaringan yang sesuai) dan karenanya kalibrasi harus dilakukan setelah penolakan artefak.
Ambang batas sederhana dapat bekerja dengan baik untuk rutinitas penolakan artefak awal, yaitu menghapus (atau mengganti dengan
NaN
) semua sampel di atas ambang empiris tertentu. Teknik yang lebih canggih akan secara adaptif menghitung ambang ini menggunakan running mean atau moving window.Tergantung pada lokasi sensor Anda juga mungkin ingin mengoreksi pengaruh gravitasi pada sinyal akselerasi, meskipun pemahaman rinci tentang sumbu sensor dan pemosisian sangat penting di sini. Metode Moe-Nillson ( R. Moe-Nilssen, Metode baru untuk mengevaluasi kontrol motor dalam gaya berjalan di bawah kondisi lingkungan kehidupan nyata. Bagian 1: Instrumen, Biomekanik Klinis, Volume 13, Masalah 4-5, Juni-Juli 1998, Halaman 320-327 ) adalah yang paling umum digunakan dan bekerja dengan baik untuk sensor inersia yang dipasang di punggung bawah.
Tempat yang baik untuk mulai memeriksa data untuk pengenalan gerakan adalah dengan memecah data yang disaring dan dikalibrasi menjadi zaman (misal 10-an) dan menghitung sejumlah fitur per zaman dan menghubungkannya dengan label yang Anda miliki untuk data, saya bisa ' t menawarkan saran yang lebih spesifik tanpa mengetahui lebih lanjut tentang kumpulan data dan label terkait.
Semoga ini membantu.
sumber