Pertanyaan yang diberi tag apache-hadoop

Hadoop adalah proyek sumber terbuka Apache yang menyediakan perangkat lunak untuk komputasi terdistribusi yang andal dan dapat diskalakan. Proyek itu sendiri mencakup berbagai tambahan pelengkap lainnya.

16
membuat peta panas seaborn lebih besar

Saya membuat corr()df dari df asli. The corr()df keluar 70 X 70 dan tidak mungkin untuk memvisualisasikan heatmap tersebut ... sns.heatmap(df). Jika saya mencoba untuk menampilkan corr = df.corr(), tabel tidak cocok dengan layar dan saya bisa melihat semua korelasinya. Apakah ini cara untuk...

11
Apakah ada model bahasa out-of-the-box yang bagus untuk python?

Saya membuat prototipe aplikasi dan saya membutuhkan model bahasa untuk menghitung kebingungan pada beberapa kalimat yang dihasilkan. Apakah ada model bahasa terlatih dalam python yang bisa saya gunakan? Sesuatu yang sederhana seperti model = LanguageModel('en') p1 = model.perplexity('This is a...

10
Apa kendala memori R?

Dalam mengulas “ Pemodelan Prediktif Terapan ", penulis menyatakan : Salah satu kritik yang saya miliki tentang pedagogi pembelajaran statistik (SL) adalah tidak adanya pertimbangan kinerja komputasi dalam evaluasi teknik pemodelan yang berbeda. Dengan penekanannya pada bootstrap dan validasi...

10
Bahasa terbaik untuk komputasi ilmiah [ditutup]

Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga berfokus pada satu masalah hanya dengan mengedit posting ini . Ditutup 5 tahun yang lalu . Sepertinya sebagian...

10
Bagaimana cara melakukan batch product dalam Tensorflow?

Saya memiliki dua tensor a:[batch_size, dim] b:[batch_size, dim]. Saya ingin melakukan produk dalam untuk setiap pasangan dalam batch, menghasilkan c:[batch_size, 1], di mana c[i,0]=a[i,:].T*b[i,:].

8
Kesalahan Bertingkat dalam Badai Apache

Melalui presentasi dan materi Summingbird oleh Twitter, salah satu alasan yang disebutkan untuk menggunakan cluster Storm dan Hadoop bersama-sama di Summingbird adalah bahwa pemrosesan melalui Storm menghasilkan cascading of error. Untuk menghindari cascading kesalahan dan akumulasi itu, cluster...