Saya baru di komunitas ini dan semoga pertanyaan saya cocok di sini. Sebagai bagian dari kursus analisis data sarjana saya, saya telah memilih untuk melakukan proyek pengenalan aktivitas manusia menggunakan set data ponsel cerdas. Sejauh yang saya ketahui, topik ini berkaitan dengan Pembelajaran Mesin dan Dukungan Mesin Vektor. Saya belum terbiasa dengan teknologi ini, jadi saya akan membutuhkan bantuan.
Saya telah memutuskan untuk mengikuti ide proyek ini http://www.inf.ed.ac.uk/teaching/courses/dme/2014/datasets.html (proyek pertama di atas) Tujuan proyek adalah menentukan kegiatan apa yang dilakukan seseorang. terlibat dalam (misalnya, WALKING, WALKING_UPSTAIRS, WALKING_DOWNSTAIRS, SITTING, STANDING, LAYING) dari data yang direkam oleh telepon pintar (Samsung Galaxy S II) di pinggang subjek. Dengan menggunakan accelerometer dan giroskop yang tertanam, data mencakup akselerasi linear 3-aksial dan kecepatan sudut 3-aksial pada kecepatan konstan 50Hz.
Semua kumpulan data diberikan dalam satu folder dengan beberapa deskripsi dan label fitur. Data dibagi untuk file 'test' dan 'train' di mana data direpresentasikan dalam format ini:
2.5717778e-001 -2.3285230e-002 -1.4653762e-002 -9.3840400e-001 -9.2009078e-001 -6.6768331e-001 -9.5250112e-001 -9.2524867e-001 -6.7430222e-001 -8.9408755e-001 -5.5457721e-001 -4.6622295e-001 7.1720847e-001 6.3550240e-001 7.8949666e-001 -8.7776423e-001 -9.9776606e-001 -9.9841381e-001 -9.3434525e-001 -9.7566897e-001 -9.4982365e-001 -8.3047780e-001 -1.6808416e-001 -3.7899553e-001 2.4621698e-001 5.2120364e-001 -4.8779311e-001 4.8228047e-001 -4.5462113e-002 2.1195505e-001 -1.3489443e-001 1.3085848e-001 -1.4176313e-002 -1.0597085e-001 7.3544013e-002 -1.7151642e-001 4.0062978e-002 7.6988933e-002 -4.9054573e-001 -7.0900265e-001
Dan itu hanya sampel yang sangat kecil dari isi file tersebut.
Saya tidak benar-benar tahu apa yang diwakili oleh data ini dan bagaimana bisa ditafsirkan. Juga untuk menganalisis, klasifikasi, dan pengelompokan data, alat apa yang harus saya gunakan? Apakah ada cara saya bisa memasukkan data ini ke excel dengan label yang disertakan dan misalnya menggunakan R atau python untuk mengekstrak data sampel dan bekerja pada ini?
Petunjuk / tips akan sangat dihargai.
features.txt
file, dan 561 kolom dalamX_train.txt
file, satu untuk setiap variabel.Sepertinya ini (atau kumpulan data yang sangat mirip) digunakan untuk kursus Coursera. Membersihkan dataset ini adalah tugas untuk Mendapatkan dan Membersihkan Data , tetapi juga digunakan untuk studi kasus untuk analisis Data Eksplorasi . Video dari studi kasus ini tersedia dalam video untuk minggu ke-4 kursus-EDA. Mungkin membantu Anda memulai dengan data ini.
sumber