Saya memiliki masalah berikut:
Masukan yang diberikan (-dimensi vektor) skalar, bilangan bulat terurut, dan bilangan bulat tak berurut (yaitu label) dan satu atau beberapa keluaran , Saya ingin memperkirakan:
- Input mana yang menjelaskan output terbaik.
- Sejauh mana variasi dari satu input menyiratkan variasi dari output.
Ini seharusnya terkait dengan analisis ketidakpastian dan sensitivitas, yang merupakan bidang yang cukup luas. Apakah Anda tahu ada metode / sumber daya dengan pendekatan yang terkait dengan masalah saya?
Jawaban:
Anda dapat mencoba salah satu alat yang disediakan di sini . Itu adalah solusi matlab, kode yang sangat bagus dan metode modern. Pertama saya sarankan Anda untuk mencoba alat grafis dari perpustakaan untuk memahami data.
Karena Anda tidak memberikan rincian tentang apa yang Anda butuhkan di sini, ada beberapa komentar tentang metode yang tersirat:
Analisis Sensitivitas Global . Analisis sensitivitas global adalah studi tentang bagaimana ketidakpastian dalam output suatu model (numerik atau lainnya) dapat dibagi secara proporsional ke berbagai sumber ketidakpastian dalam input model. Global bisa menjadi spesifikasi yang tidak perlu di sini, kalau bukan karena fakta bahwa sebagian besar analisis yang bertemu dalam literatur adalah lokal atau satu faktor pada satu waktu.
Analisis Monte-Carlo (atau Berbasis Sampel) . Analisis Monte Carlo (MC) didasarkan pada melakukan beberapa evaluasi dengan input model yang dipilih secara acak, dan kemudian menggunakan hasil evaluasi ini untuk menentukan ketidakpastian dalam prediksi model dan membagi faktor input kontribusi mereka terhadap ketidakpastian ini. Analisis MC melibatkan pemilihan rentang dan distribusi untuk setiap faktor input; pembuatan sampel dari rentang dan distribusi yang ditentukan pada langkah pertama; evaluasi model untuk setiap elemen sampel; analisis ketidakpastian dan analisis sensitivitas.
Metodologi Permukaan Respon . Prosedur ini didasarkan pada pengembangan perkiraan permukaan respons terhadap model yang sedang dipertimbangkan. Perkiraan ini kemudian digunakan sebagai pengganti untuk model asli dalam analisis ketidakpastian dan sensitivitas. Analisis ini melibatkan pemilihan rentang dan distribusi untuk setiap faktor input, pengembangan desain eksperimental yang mendefinisikan kombinasi nilai-nilai faktor yang mengevaluasi model, evaluasi model, konstruksi perkiraan permukaan respons terhadap model asli, analisis ketidakpastian dan analisis sensitivitas.
Desain Pemutaran . Penapisan faktor mungkin berguna sebagai langkah pertama ketika berhadapan dengan suatu model yang mengandung sejumlah besar faktor input (ratusan). Yang kami maksud dengan faktor input adalah jumlah yang dapat diubah dalam model sebelum pelaksanaannya. Ini bisa berupa parameter model, atau variabel input, atau skenario model. Seringkali, hanya beberapa faktor input dan pengelompokan faktor, memiliki efek signifikan pada output model.
Lokal (Analisis Diferensial) . SA lokal menyelidiki dampak faktor input pada model secara lokal, yaitu pada titik tertentu dalam ruang faktor input. SA lokal biasanya dilakukan dengan menghitung turunan parsial dari fungsi output sehubungan dengan variabel input (analisis diferensial). Untuk menghitung turunan secara numerik, parameter input bervariasi dalam interval kecil di sekitar nilai nominal. Interval tidak terkait dengan tingkat pengetahuan kami tentang variabel dan biasanya sama untuk semua variabel.
FORM-SORM . FORMULIR dan SORM adalah metode yang berguna ketika analis tidak tertarik pada besarnya Y (dan karenanya variasi potensial) tetapi dalam probabilitas Y melebihi beberapa nilai kritis. Batasan (Y-Ycrit <0) menentukan hyper-surface dalam ruang faktor input, X. Jarak minimum antara beberapa titik desain untuk X dan hyper-surface adalah jumlah yang diinginkan.
Semoga berhasil!
sumber
Untuk menjawab pertanyaan pertama, saya sarankan Anda melihat analisis korelasi kanonik dan teknik pengurangan dimensi yang lebih baru yang disebut regresi irisan irisan . Pada yang terakhir, lihat makalah awal oleh Ker Chau Li
Ini tersedia secara bebas di Internet. Versi dengan komentar (menarik) yang mungkin harus Anda pertimbangkan.
Beberapa parameter penting untuk pemilihan metode dalam situasi Anda adalah:
Anda juga menyebutkan kemungkinan hasil multivarian. Jika Anda memiliki beberapa dari mereka yang mewakili hal yang sama sekali berbeda, lakukan saja beberapa analisis sensitivitas independen.
Jika mereka berkorelasi tinggi atau fungsional maka itu juga mengubah banyak masalah.
Anda harus menjelaskan semua poin ini sebelum mengikuti metodologi yang diberikan.
sumber
Anda mungkin dapat menggunakan pendekatan analisis sensitivitas global berbasis varians untuk menjawab pertanyaan kedua. Menurut Saltelli (2008) , analisis sensitivitas adalah
Pendekatan, seperti yang disebutkan dalam buku Saltelli, biasanya fokus pada pertama-tama menghasilkan sampel input, yang selanjutnya dijalankan melalui model untuk menghasilkan output, dan kemudian dianalisis. Metrik keluaran yang dihasilkan, seperti indeks sensitivitas totalSti dan indeks sensitivitas tingkat pertama Si mewakili kontribusi efek utama dari masing-masing faktor input terhadap varian output. Pendekatan berbasis varians menguraikan varians dalam output. Mereka menuntut komputasi, dan membutuhkan sampel input spesifik.
Untuk keperluan Anda, mengingat bahwa Anda memiliki peternakan data yang ada adalah metode alternatif seperti yang disarankan oleh Delta Moment-Independent Measure (Borgonovo 2007, Plischke et al. 2013) dan diimplementasikan di perpustakaan Python SALib .
Kode berikut, diambil dari contoh memungkinkan Anda untuk menghasilkan indeks sensitivitas dari data yang ada:
sumber