Statistik dan Big Data

19

Apa yang dilakukan lapisan yang terhubung sepenuhnya di CNN?

Saya memahami lapisan convolutional dan pooling, tetapi saya tidak dapat melihat alasan untuk lapisan yang sepenuhnya terhubung di CNN. Mengapa tidak lapisan sebelumnya terhubung langsung ke lapisan

neural-networks deep-learning conv-neural-network

19

Antonim dari varian

Apakah ada kata yang berarti 'kebalikan dari varians'? Yaitu, jika memiliki varian tinggi, maka memiliki rendah ? Tidak tertarik dengan antonim dekat (seperti 'perjanjian' atau 'kesamaan') tetapi secara khusus berarti

bayesian variance terminology precision

19

Bagaimana cara memahami kelemahan Hierarchical Clustering?

Adakah yang bisa menjelaskan pro dan kontra Hierarchical Clustering? Apakah Hierarchical Clustering memiliki kelemahan yang sama dengan K means? Apa keuntungan dari Hierarchical Clustering over K means? Kapan kita harus menggunakan K means lebih dari Hierarchical Clustering &...

clustering k-means unsupervised-learning hierarchical-clustering

19

Kapan harus menggunakan efek tetap vs menggunakan kluster SE?

Misalkan Anda memiliki satu bagian penampang data di mana individu berada di dalam kelompok (misalnya siswa di sekolah) dan Anda ingin memperkirakan model bentuk di Y_i = a + B*X_imana Xmerupakan vektor karakteristik tingkat individu dan akonstanta. Dalam hal ini, anggaplah bias heterogenitas...

econometrics multilevel-analysis fixed-effects-model endogeneity clustered-standard-errors

19

Metodologi peramalan VAR

Saya sedang membangun model VAR untuk memperkirakan harga suatu aset dan ingin tahu apakah metode saya baik secara statistik, apakah tes yang saya sertakan relevan atau tidak, dan jika lebih banyak diperlukan untuk memastikan perkiraan yang andal berdasarkan variabel input saya. Di bawah ini...

r forecasting modeling var

19

Dapatkah regularisasi bermanfaat jika kita hanya tertarik pada pemodelan, bukan pada peramalan?

Dapatkah regularisasi bermanfaat jika kita hanya tertarik dalam memperkirakan (dan menafsirkan) parameter model, bukan dalam peramalan atau prediksi? Saya melihat bagaimana regularisasi / validasi silang sangat berguna jika tujuan Anda adalah membuat perkiraan yang baik tentang data baru. Tetapi...

cross-validation econometrics model-selection interpretation regularization

19

Apa namanya: hyperparameters

Jadi dalam distribusi normal, kami memiliki dua parameter: mean dan variance . Dalam buku Pattern Recognition dan Machine Learning , tiba-tiba muncul hyperparameter dalam istilah regularisasi fungsi kesalahan.μμ\muσ2σ2\sigma^2λλ\lambda Apa itu hiperparameter? Mengapa mereka dinamai demikian? Dan...

terminology definition parameterization hyperparameter

19

Dengan data kategorikal, dapatkah ada kelompok tanpa variabel yang terkait?

Ketika mencoba menjelaskan analisis kluster, adalah umum bagi orang-orang untuk salah memahami proses yang terkait dengan apakah variabel berkorelasi. Salah satu cara untuk membuat orang melewati kebingungan itu adalah plot seperti ini: Ini jelas menampilkan perbedaan antara pertanyaan apakah...

clustering categorical-data independence

19

Apa yang harus diajarkan terlebih dahulu: Probabilitas atau Statistik?

Saya baru saja bergabung sebagai anggota fakultas di departemen matematika. dari sebuah institusi terkenal. Saya akan mengajarkan Probabilitas dan Statistik program studi di tingkat sarjana. Lembaga ini sudah memiliki silabus untuk kursus ini yang saya tidak puas. Dalam silabus itu, statistik...

teaching

19

Mengapa varians tidak didefinisikan sebagai perbedaan antara setiap nilai yang mengikuti satu sama lain?

Ini mungkin pertanyaan sederhana bagi banyak orang tetapi ini dia: Mengapa varians tidak didefinisikan sebagai perbedaan antara setiap nilai yang mengikuti satu sama lain, bukannya perbedaan dengan rata-rata nilai? Ini akan menjadi pilihan yang lebih logis bagi saya, saya kira saya jelas...

variance

19

Bagaimana cara sampel dari distribusi Cantor?

Apa cara terbaik untuk mengambil sampel dari distribusi Cantor ? Ini hanya memiliki cdf dan kami tidak dapat

distributions simulation random-generation

19

Apakah tunggul keputusan merupakan model linier?

Decision stump adalah pohon keputusan dengan hanya satu split. Ini juga dapat ditulis sebagai fungsi piecewise. Misalnya, anggap adalah vektor, dan adalah komponen pertama , dalam pengaturan regresi, beberapa tunggul keputusan dapatxxxx1x1x_1xxx f(x)={35x1≤2x1>2f(x)={3x1≤25x1>2f(x)=...

machine-learning cart linear boosting

19

Metrik klasifikasi multilabel pada scikit

Saya mencoba membangun multi-label classifier untuk menetapkan topik ke dokumen yang ada menggunakan scikit Saya sedang memproses dokumen saya melewati mereka melalui TfidfVectorizerlabel melalui MultiLabelBinarizerdan membuat OneVsRestClassifierdengan SGDClassifiersebagai penaksir. Namun ketika...

scikit-learn multi-class multilabel

19

Apakah menyetel hyperparameter pada sampel dataset adalah ide yang buruk?

Saya memiliki dataset 140000 contoh dan 30 fitur yang saya latih beberapa pengklasifikasi untuk klasifikasi biner (SVM, Regresi Logistik, Hutan Acak dll) Dalam banyak kasus, penyetelan hyperparameter pada keseluruhan dataset menggunakan pencarian Grid atau Random terlalu memakan waktu. Saya mulai...

machine-learning cross-validation hyperparameter

19

Bagaimana kita bisa menilai keakuratan prediksi Nate Silver?

Pertama, ia memberikan probabilitas hasil. Jadi, misalnya, prediksinya untuk pemilihan AS saat ini adalah 82% Clinton vs 18% Trump. Sekarang, bahkan jika Trump menang, bagaimana saya tahu bahwa itu bukan hanya 18% dari waktu yang seharusnya dia menangkan? Masalah lainnya adalah probabilitasnya...

forecasting prediction validation accuracy scoring-rules

19

Bagaimana cara kerja pengambilan sampel negatif di word2vec?

Saya telah berusaha keras untuk memahami konsep pengambilan sampel negatif dalam konteks word2vec. Saya tidak dapat mencerna ide pengambilan sampel [negatif]. Misalnya dalam makalah Mikolov, harapan pengambilan sampel negatif dirumuskan sebagai catatanσ( ⟨ W , c ⟩ ) + k ⋅ EcN∼ P.D[ logσ( - ⟨ w ,...

machine-learning word2vec word-embeddings

19

Kehilangan fungsi untuk autoencoder

Saya bereksperimen sedikit autoencoder, dan dengan tensorflow saya membuat model yang mencoba merekonstruksi dataset MNIST. Jaringan saya sangat sederhana: X, e1, e2, d1, Y, di mana e1 dan e2 adalah lapisan pengkodean, d2 dan Y adalah lapisan decoding (dan Y adalah output yang direkonstruksi). X...

mse autoencoders tensorflow cross-entropy

19

Lapisan Konvolusional: Pad atau tidak pad?

Arsitektur AlexNet menggunakan zero-paddings seperti yang ditunjukkan pada gambar: Namun, tidak ada penjelasan dalam makalah mengapa padding ini diperkenalkan. Standford CS 231n tentu saja mengajarkan kita menggunakan bantalan untuk menjaga ukuran spasial: Saya bertanya-tanya apakah ini...

conv-neural-network convolution

19

Apa yang dimaksud dengan prior implisit dalam statistik frequentist?

Saya pernah mendengar gagasan bahwa Jaynes mengklaim sering beroperasi dengan "sebelumnya implisit". Apa itu prior implisit? Apakah ini berarti model frequentist semua kasus khusus model Bayesian menunggu untuk

bayesian prior posterior frequentist

19

Bagaimana , koordinat kutub, didistribusikan ketika dan kapan ?

Biarkan koordinat Cartesian dari titik acak dipilih st .x,yx,yx,y(x,y)∼U(−10,10)×U(−10,10)(x,y)∼U(−10,10)×U(−10,10)(x,y) \sim U(-10,10) \times U(-10,10) Dengan demikian, jari-jari, , tidak merata seperti yang tersirat oleh 's pdf .ρ=x2+y2−−−−−−√ρ=x2+y2\rho = \sqrt{x^2 + y^2}ρρ\rho Meskipun...

normal-distribution matlab pdf uniform