Algoritma pembelajaran mesin mana yang dapat digunakan untuk mengidentifikasi pola dalam dataset kinerja cache dari CPU?

9

Saya membutuhkan algoritma pembelajaran mesin untuk mengidentifikasi pola dalam dataset (disimpan dalam file CSV) yang berisi rincian kinerja cache CPU. Lebih khusus lagi, dataset berisi kolom seperti Readhits, Readmissatau Writehits.

Pola-pola yang diidentifikasi algoritma harus membantu dengan cara-cara berikut.

  1. membantu pengguna untuk meningkatkan kinerja beban kerja lain kali,

  2. membantu mengidentifikasi masalah apa pun berdasarkan fitur, atau

  3. membantu pengguna untuk memprediksi nilai data masa depan atau peristiwa di masa depan yang mungkin terjadi berdasarkan pola.

Algoritma ML mana yang dapat saya gunakan?

aAAAAAAa
sumber

Jawaban:

0

Mesin Boltzmann Terbatas (RBM) dapat mengidentifikasi pola dalam file CSV tanpa pengguna menentukan kondisi apa pun. Mereka sangat cocok untuk menghasilkan, "representasi terdistribusi dan bertingkat," dari, "serangkaian fitur kompleks yang menyusun data dimensi tinggi nyata sangat penting untuk mencapai kinerja tinggi dalam tugas pembelajaran mesin." 1

Karena format CSV dirancang khusus untuk merepresentasikan instance dalam baris dan sekumpulan atribut statis dalam kolom, pengaturan pelatihan menjadi mudah. Jika tujuannya adalah untuk mengidentifikasi pola temporal, strategi windowing mungkin diperlukan.

K-RBM adalah penggabungan pendekatan k-mean dengan RBM. Pilihan pendekatan banyak berkaitan dengan jenis pola apa yang dicari. Pola jangka dapat berlaku untuk tren sederhana dalam jumlah dari waktu ke waktu, pola umum ditemukan di kolom tekstual, atau pola kompleks disimpulkan dari banyak kolom.

Referensi

[1] Munculnya Representasi Komposisi dalam Mesin Boltzmann Terbatas , J. Tubiana, R. Monasson, 2017)

[2] Belajar Beberapa Sub-Spasi Non-Linear menggunakan K-RBM , Siddhartha Chandra, Shailesh Kumar & CV Jawahar

Douglas Daseeco
sumber
0

Saya pribadi akan menggunakan k-means clustering. Ini dirancang untuk masalah seperti ini.

William Scott
sumber
0

Saya memerlukan algoritma pembelajaran mesin untuk mengidentifikasi pola dalam file CSV

Anda ingin melakukan pembelajaran tanpa pengawasan . Definisi Wikipedia yang sama adalah:

Pembelajaran mesin tanpa pengawasan adalah tugas pembelajaran mesin untuk menyimpulkan fungsi untuk menggambarkan struktur tersembunyi dari data "tidak berlabel" (klasifikasi atau kategorisasi tidak termasuk dalam pengamatan).

Saya akan merekomendasikan Anda untuk pergi melalui daftar algoritma pembelajaran yang tidak diawasi di sini dan menggunakan yang sesuai dengan kebutuhan Anda.

Jika Anda memulai, maka saya akan merekomendasikan memulai dengan mempelajari algoritma pengelompokan K-means .

Dawny33
sumber
0

Pertama, Anda harus mengklasifikasikan setiap potongan file CSV dan memberi label berdasarkan situasi saat ini, seperti A) situasi optimal B) kritis.

Kemudian Anda mengelompokkan data Anda dengan algoritma pembelajaran yang tidak diawasi, seperti SOM atau k-means, dan kemudian Anda cukup mengklasifikasikan kelas yang akan Anda dapatkan.

simonepi
sumber
0

Pada dasarnya yang Anda cari adalah pembelajaran tanpa pengawasan (UL). Ada banyak teknik UL di sekitar, tetapi saya tidak yakin Anda akan menemukan yang melakukan persis apa yang Anda inginkan tanpa input pengguna sama sekali. Namun, jika Anda membaca literatur tentang pendekatan ini, Anda mungkin menemukan sesuatu yang bermanfaat.

Salah satu pilihan adalah DBSCAN , algoritma pengelompokan yang sangat populer yang tidak mengharuskan pengguna untuk memasukkan jumlah target awal dari kluster (sesuatu yang dibutuhkan sebagian besar algoritma pengelompokan). Tetapi meskipun demikian, Anda masih harus memberikan nilai-nilai algoritma untuk epsilon(jarak yang digunakan dalam menghitung cluster) dan minPts(jumlah minimum poin yang diperlukan untuk membentuk wilayah "padat").

Anda mungkin juga melihat peta yang mengatur diri sendiri , sebuah pendekatan untuk pembelajaran tanpa pengawasan untuk jaringan saraf.

Beberapa istilah pencarian lain yang mungkin mengarahkan Anda ke arah yang bermanfaat termasuk "penambangan data" dan "penemuan pengetahuan dalam database" (KDD).

mindcrime
sumber