Apa persamaan dan perbedaan antara 3 metode ini: Mengantongi, Meningkatkan, Susun? Mana yang terbaik? Dan mengapa? Bisakah Anda memberi saya contoh untuk
Apa persamaan dan perbedaan antara 3 metode ini: Mengantongi, Meningkatkan, Susun? Mana yang terbaik? Dan mengapa? Bisakah Anda memberi saya contoh untuk
Saya membaca bahwa 'jarak Euclidean bukan jarak yang baik dalam dimensi tinggi'. Saya kira pernyataan ini ada hubungannya dengan kutukan dimensi, tetapi apa sebenarnya? Selain itu, apa itu 'dimensi tinggi'? Saya telah menerapkan pengelompokan hierarkis menggunakan jarak Euclidean dengan 100 fitur....
Mungkin konsepnya, mengapa itu digunakan, dan sebuah
Halaman bantuan di R menganggap saya tahu apa arti angka-angka itu, tetapi saya tidak tahu. Saya mencoba untuk benar-benar memahami setiap angka di sini. Saya hanya akan memposting output dan mengomentari apa yang saya temukan. Mungkin ada (akan) kesalahan, karena saya hanya akan menulis apa yang...
Saya membaca beberapa catatan kuliah oleh Cosma Shalizi (khususnya, bagian 2.1.1 dari kuliah kedua ), dan diingatkan bahwa Anda bisa mendapatkan sangat rendah bahkan ketika Anda memiliki model yang sepenuhnya linier.R2R2R^2 Mengutip contoh Shalizi: misalkan Anda memiliki model , di mana dikenal....
Pertukaran Joris dan Srikant di sini membuat saya bertanya-tanya (lagi) apakah penjelasan internal saya untuk perbedaan antara interval kepercayaan dan interval kredibel adalah yang benar. Bagaimana Anda akan menjelaskan
Dicari tinggi dan rendah dan belum dapat menemukan apa AUC, seperti yang terkait dengan prediksi, singkatan atau
Tampaknya melalui berbagai pertanyaan terkait di sini, terdapat konsensus bahwa bagian "95%" dari apa yang kita sebut "interval kepercayaan 95%" mengacu pada fakta bahwa jika kita harus secara tepat mereplikasi prosedur pengambilan sampel dan perhitungan CI kita berkali-kali. , 95% dari CI yang...
Saya seorang mahasiswa pascasarjana dalam bidang psikologi, dan ketika saya melanjutkan studi statistik yang semakin mandiri, saya semakin kagum dengan tidak memadainya pelatihan formal saya. Baik pengalaman pribadi dan tangan kedua menunjukkan bahwa kurangnya kekakuan statistik dalam pelatihan...
Saat melatih jaringan saraf, apa bedanya untuk mengatur: ukuran batch ke dan jumlah iterasi ke bSebuahSebuahabbb vs. ukuran batch ke dan jumlah iterasi ke dcccddd di mana ?a b = c dSebuahb=cd ab = cd Dengan kata lain, dengan asumsi bahwa kita melatih jaringan saraf dengan jumlah contoh...
AIC dan BIC adalah kedua metode menilai model yang dikenakan sanksi untuk jumlah parameter yang diestimasi. Seperti yang saya pahami, BIC menghukum model lebih banyak untuk parameter gratis daripada AIC. Di luar preferensi berdasarkan ketatnya kriteria, apakah ada alasan lain untuk memilih AIC...
Tampaknya sejumlah paket statistik yang saya gunakan membungkus kedua konsep ini bersama-sama. Namun, saya bertanya-tanya apakah ada asumsi atau data 'formalitas' yang berbeda yang harus benar digunakan satu sama lain. Contoh nyata akan sangat
Apa perbedaan antara penambangan data, statistik, pembelajaran mesin dan AI? Apakah akurat untuk mengatakan bahwa mereka adalah 4 bidang yang berusaha menyelesaikan masalah yang sangat mirip tetapi dengan pendekatan yang berbeda? Apa sebenarnya kesamaan yang mereka miliki dan di mana mereka...
Bayangkan skenario pembelajaran mesin standar: Anda dihadapkan dengan dataset multivariat yang besar dan Anda memiliki pemahaman yang cukup buram tentang itu. Yang perlu Anda lakukan adalah membuat prediksi tentang beberapa variabel berdasarkan apa yang Anda miliki. Seperti biasa, Anda...
... dengan asumsi bahwa saya dapat menambah pengetahuan mereka tentang varians secara intuitif ( Memahami "varians" secara intuitif ) atau dengan mengatakan: Ini adalah jarak rata-rata dari nilai data dari 'rata-rata' - dan karena varians berada dalam kuadrat unit, kami mengambil akar kuadrat untuk...
Jadi kita memiliki mean aritmatika (AM), mean geometrik (GM) dan rata-rata harmonik (HM). Formulasi matematis mereka juga terkenal bersama dengan contoh-contoh stereotip mereka yang terkait (misalnya, rata-rata Harmonik dan aplikasinya untuk masalah-masalah terkait 'kecepatan'). Namun, pertanyaan...
Saya ingin menerapkan algoritma untuk pemilihan model otomatis. Saya berpikir untuk melakukan regresi bertahap tetapi apa pun akan dilakukan (itu harus didasarkan pada regresi linier). Masalah saya adalah bahwa saya tidak dapat menemukan metodologi, atau implementasi open source (saya bangun di...
Yang mana buku teks pengantar terbaik untuk statistik Bayesian? Tolong, satu buku per
Jika saya memiliki data positif yang sangat miring saya sering mengambil log. Tapi apa yang harus saya lakukan dengan data non-negatif yang sangat miring yang menyertakan nol? Saya telah melihat dua transformasi yang digunakan: catatan( X + 1 )log(x+1)\log(x+1) yang memiliki fitur rapi yang 0...
Saya yakin banyak orang akan merespons dengan tautan ke 'biarkan saya mencari Google untuk Anda', jadi saya ingin mengatakan bahwa saya telah mencoba untuk mencari tahu ini jadi tolong maafkan kurangnya pemahaman saya di sini, tapi saya tidak tahu bagaimana caranya implementasi praktis dari...