Pertanyaan yang diberi tag tsne

78

Clustering pada output t-SNE

Saya punya aplikasi di mana akan berguna untuk mengelompokkan dataset yang berisik sebelum mencari efek subkelompok di dalam kluster. Saya pertama kali melihat PCA, tetapi dibutuhkan ~ 30 komponen untuk mencapai 90% dari variabilitas, jadi pengelompokan hanya pada beberapa PC akan membuang banyak...

39

Mengapa kita menggunakan Kullback-Leibler divergence daripada cross entropy dalam fungsi objektif t-SNE?

Dalam pikiran saya, perbedaan KL dari distribusi sampel ke distribusi sebenarnya hanyalah perbedaan antara cross entropy dan entropy. Mengapa kita menggunakan cross entropy untuk menjadi fungsi biaya dalam banyak model pembelajaran mesin, tetapi menggunakan Kullback-Leibler divergence dalam t-sne?...

kullback-leibler tsne cross-entropy

39

Apakah ada kasus di mana PCA lebih cocok daripada t-SNE?

Saya ingin melihat bagaimana 7 ukuran perilaku koreksi teks (waktu yang dihabiskan untuk memperbaiki teks, jumlah penekanan tombol, dll.) Saling berhubungan. Ukurannya berkorelasi. Saya menjalankan PCA untuk melihat bagaimana langkah-langkah diproyeksikan ke PC1 dan PC2, yang menghindari tumpang...

pca tsne

37

Kapan t-SNE menyesatkan?

Mengutip dari salah satu penulis: t-Distributed Stochastic Neighbor Embedding (t-SNE) adalah teknik ( pemenang hadiah ) untuk pengurangan dimensi yang sangat cocok untuk visualisasi dataset dimensi tinggi. Jadi kedengarannya hebat, tapi itu yang penulis bicarakan. Kutipan lain dari penulis...

data-visualization dimensionality-reduction tsne

34

Mengapa t-SNE tidak digunakan sebagai teknik reduksi dimensi untuk pengelompokan atau klasifikasi?

Dalam penugasan terbaru, kami disuruh menggunakan PCA pada digit MNIST untuk mengurangi dimensi dari 64 (8 x 8 gambar) menjadi 2. Kami kemudian harus mengelompokkan digit menggunakan Gaussian Mixture Model. PCA hanya menggunakan 2 komponen utama tidak menghasilkan cluster yang berbeda dan akibatnya...

classification clustering pca dimensionality-reduction tsne

27

Apa yang salah dengan t-SNE vs PCA untuk pengurangan dimensi menggunakan R?

Saya memiliki matriks 336x256 angka titik apung (336 genom bakteri (kolom) x 256 frekuensi tetranukleotida yang dinormalisasi (baris), misalnya setiap kolom menambahkan hingga 1). Saya mendapatkan hasil yang bagus ketika saya menjalankan analisis saya menggunakan analisis komponen utama....

r pca tsne

23

Haruskah reduksi dimensi untuk visualisasi dianggap sebagai masalah "tertutup", diselesaikan oleh t-SNE?

Saya telah membaca banyak tentang algoritma -sne untuk pengurangan dimensi. Saya sangat terkesan dengan kinerja pada dataset "klasik", seperti MNIST, di mana ia mencapai pemisahan digit yang jelas ( lihat artikel asli ):ttt Saya juga menggunakannya untuk memvisualisasikan fitur yang dipelajari...

clustering data-visualization dimensionality-reduction high-dimensional tsne

21

t-SNE versus MDS

Telah membaca beberapa pertanyaan tentang t-SNE ( t-Distributed Stochastic Neighbor Embedding ) belakangan ini, dan juga mengunjungi beberapa pertanyaan tentang MDS ( Multidimensional Scaling ). Mereka sering digunakan secara analog, jadi sepertinya ide yang bagus membuat pertanyaan ini melihat...

data-visualization dimensionality-reduction multidimensional-scaling tsne

19

Apakah ada versi t-SNE untuk streaming data?

Pemahaman saya tentang t-SNE dan pendekatan Barnes-Hut adalah bahwa semua titik data diperlukan sehingga semua interaksi gaya dapat dihitung pada waktu yang sama dan setiap titik dapat disesuaikan dalam peta 2d (atau dimensi yang lebih rendah). Apakah ada versi t-sne yang secara efisien dapat...

data-visualization dimensionality-reduction multidimensional-scaling tsne

18

Haruskah data dipusatkan + diskalakan sebelum menerapkan t-SNE?

Beberapa fitur data saya memiliki nilai besar, sedangkan fitur lainnya memiliki nilai jauh lebih kecil. Apakah perlu memusatkan + skala data sebelum menerapkan t-SNE untuk mencegah bias terhadap nilai yang lebih besar? Saya menggunakan implementasi sklearn.manifold.TSNE dari Python dengan metrik...

normalization dimensionality-reduction high-dimensional tsne

13

Memilih hyperparameters menggunakan T-SNE untuk klasifikasi

Dalam masalah khusus yang saya kerjakan dengan (kompetisi) saya memiliki pengaturan follwoing: 21 fitur (angka pada [0,1]) dan output biner. Saya memiliki sekitar 100 K baris. Pengaturan tampaknya sangat bising. Saya dan peserta lain menerapkan pembuatan fitur untuk sementara waktu dan penyematan...

machine-learning dimensionality-reduction unsupervised-learning tsne

12

Apa gunanya untuk t-SNE, selain dari visualisasi data?

Dalam situasi apa kita harus menggunakan t-SNE (terlepas dari visualisasi data)? T-SNE digunakan untuk pengurangan dimensi. Jawaban untuk pertanyaan ini menunjukkan bahwa t-SNE harus digunakan hanya untuk visualisasi dan bahwa kita tidak boleh menggunakannya untuk pengelompokan. Lalu apa gunanya...

data-visualization dimensionality-reduction tsne

12

Algoritma klasifikasi apa yang harus digunakan setelah melihat bahwa t-SNE memisahkan kelas dengan baik?

Mari kita asumsikan kita memiliki masalah klasifikasi dan pada awalnya kita ingin mendapatkan beberapa wawasan dari data dan kita melakukan t-SNE. Hasil t-SNE memisahkan kelas dengan sangat baik. Ini menyiratkan bahwa adalah mungkin untuk membangun model klasifikasi yang juga akan memisahkan kelas...

classification tsne

12

Apa perbedaan antara autoencoder dan t-SNE?

Sejauh yang saya tahu, kedua autoencoder dan t-SNE digunakan untuk pengurangan dimensi nonlinier. Apa perbedaan di antara mereka dan mengapa saya harus menggunakan satu versus yang

neural-networks deep-learning dimensionality-reduction autoencoders tsne

12

Apa arti sumbu pada t-SNE?

Saat ini saya mencoba untuk membungkus kepala saya dengan matematika t-SNE . Sayangnya, masih ada satu pertanyaan yang tidak dapat saya jawab dengan memuaskan: Apa arti sebenarnya dari sumbu dalam grafik t-SNE? Jika saya akan memberikan presentasi tentang topik ini atau memasukkannya ke dalam...

machine-learning dimensionality-reduction tsne

11

Bagaimana cara menentukan parameter untuk t-SNE untuk mengurangi dimensi?

Saya sangat baru menggunakan kata embeddings. Saya ingin memvisualisasikan bagaimana dokumen mencari setelah belajar. Saya membaca bahwa t-SNE adalah pendekatan untuk melakukannya. Saya memiliki 100 ribu dokumen dengan 250 dimensi sebagai ukuran penyematan. Ada beberapa paket yang tersedia...

pca dimensionality-reduction word2vec word-embeddings tsne

10

Apa yang dimaksud dengan PCA hanya mempertahankan jarak berpasangan yang besar?

Saat ini saya membaca tentang teknik visualisasi t-SNE dan disebutkan bahwa salah satu kelemahan menggunakan analisis komponen utama (PCA) untuk memvisualisasikan data dimensi tinggi adalah bahwa ia hanya mempertahankan jarak berpasangan yang besar antara titik-titik. Makna titik-titik yang...

machine-learning data-visualization pca tsne

10

t-SNE dengan variabel kontinu dan biner campuran

Saat ini saya sedang menyelidiki visualisasi data dimensi tinggi menggunakan t-SNE. Saya punya beberapa data dengan variabel biner campuran dan kontinu dan data tersebut tampaknya terlalu mudah mengelompokkan data biner. Tentu saja ini diharapkan untuk data berskala (antara 0 dan 1): jarak...

python dimensionality-reduction unsupervised-learning tsne mixed-type-data

9

Pengurangan dimensi yang bisa diukur

Mempertimbangkan jumlah fitur yang konstan, Barnes-Hut t-SNE memiliki kompleksitas , proyeksi acak dan PCA memiliki kompleksitas menjadikannya "terjangkau" untuk set data yang sangat besar.O ( n logn )HAI(ncatatan⁡n)O(n\log n)O ( n )HAI(n)O(n) Di sisi lain, metode yang mengandalkan penskalaan...

pca dimensionality-reduction large-data multidimensional-scaling tsne

9

PCA terlalu lambat ketika keduanya n, p besar: Alternatif?

Pengaturan Masalah Saya memiliki titik data (gambar) dimensi tinggi (4096), yang saya coba visualisasikan dalam 2D. Untuk tujuan ini, saya menggunakan t-sne dengan cara yang mirip dengan kode contoh berikut oleh Karpathy . The scikit-belajar dokumentasi merekomendasikan menggunakan PCA untuk...

pca dimensionality-reduction high-dimensional java tsne