Pertanyaan yang diberi tag hadoop

Hadoop adalah proyek sumber terbuka Apache yang menyediakan perangkat lunak untuk komputasi terdistribusi yang andal dan dapat diskalakan. Inti terdiri dari sistem file terdistribusi (HDFS) dan pengelola sumber daya (YARN). Berbagai proyek sumber terbuka lainnya, seperti Apache Hive menggunakan Apache Hadoop sebagai lapisan persistensi.

193
Apache Spark: Jumlah inti vs jumlah pelaksana

Saya mencoba memahami hubungan jumlah core dan jumlah eksekutor ketika menjalankan pekerjaan Spark di BENANG. Lingkungan pengujian adalah sebagai berikut: Jumlah node data: 3 Spesifikasi mesin simpul data: CPU: Core i7-4790 (# core: 4, # utas: 8) RAM: 32GB (8GB x 4) HDD: 8TB (2TB x...

130
Perbedaan antara HBase dan Hadoop / HDFS

Ini semacam pertanyaan yang naif tapi saya baru dengan paradigma NoSQL dan tidak tahu banyak tentang itu. Jadi jika seseorang dapat membantu saya dengan jelas memahami perbedaan antara HBase dan Hadoop atau jika memberikan beberapa petunjuk yang dapat membantu saya memahami perbedaannya. Sampai...

124
Merangkai beberapa pekerjaan MapReduce di Hadoop

Dalam banyak situasi kehidupan nyata di mana Anda menerapkan MapReduce, algoritme akhir menjadi beberapa langkah MapReduce. yaitu Map1, Reduce1, Map2, Reduce2, dan seterusnya. Jadi Anda memiliki keluaran dari pengurangan terakhir yang diperlukan sebagai masukan untuk peta berikutnya. Data...

122
Node nama dalam mode aman. Tidak bisa pergi

root# bin/hadoop fs -mkdir t mkdir: org.apache.hadoop.hdfs.server.namenode.SafeModeException: Cannot create directory /user/root/t. Name node is in safe mode. tidak dapat membuat apa pun di hdfs aku melakukannya root# bin/hadoop fs -safemode leave Tapi menunjukkan safemode: Unknown...

110
Perbedaan antara tabel internal Hive dan tabel eksternal?

Adakah yang bisa memberi tahu saya perbedaan antara tabel eksternal Hive dan tabel internal. Saya tahu perbedaannya muncul saat menjatuhkan meja. Saya tidak mengerti apa yang Anda maksud dengan data dan metadata dihapus di internal dan hanya metadata yang dihapus di tabel eksternal. Adakah yang...

108
Gagal menemukan biner winutils di jalur biner hadoop

Saya mendapatkan kesalahan berikut saat memulai namenode untuk rilis hadoop-2.2 terbaru. Saya tidak menemukan file exe winutils di folder bin hadoop. Saya mencoba di bawah perintah $ bin/hdfs namenode -format $ sbin/yarn-daemon.sh start resourcemanager ERROR [main] util.Shell