Cara menyalin file dari HDFS ke sistem file lokal. Tidak ada lokasi fisik file di bawah file, bahkan direktori. bagaimana saya bisa memindahkan mereka ke lokal saya untuk validasi lebih lanjut. Saya dicoba melalui wincp.
135
bin/hadoop fs -get /hdfs/source/path /localfs/destination/path
bin/hadoop fs -copyToLocal /hdfs/source/path /localfs/destination/path
namenode_machine:50070
), ramban ke file yang ingin Anda salin, gulir ke bawah halaman dan klik unduh file .
Di Hadoop 2.0,
dimana,
hdfs_input_file_path
mungkin diperoleh darihttp://<<name_node_ip>>:50070/explorer.html
output_path
adalah jalur lokal file, tempat file akan disalin.Anda juga dapat menggunakan
get
di tempatcopyToLocal
.sumber
Untuk menyalin file dari HDFS ke sistem file lokal, perintah berikut ini dapat dijalankan:
hadoop dfs -copyToLocal <input> <output>
<input>
: jalur direktori HDFS (mis. / data) yang ingin Anda salin<output>
: jalur direktori tujuan (mis. ~ / Dokumen)sumber
hadoop fs -ls
?Anda dapat mencapai kedua cara ini.
Ex:
File saya terletak di /sourcedata/mydata.txt Saya ingin menyalin file ke sistem file lokal di jalur ini / user / ravi / mydata
sumber
Jika "file" sumber Anda terpecah di antara banyak file (mungkin sebagai akibat dari pengurangan peta) yang hidup di pohon direktori yang sama, Anda dapat menyalinnya ke file lokal dengan:
sumber
Ini bekerja untuk saya pada instance VM Ubuntu saya.
hdfs dfs -copyToLocal [direktori hadoop] [direktori lokal]
sumber
jika Anda menggunakan buruh pelabuhan, Anda harus melakukan langkah-langkah berikut:
salin file dari hdfs ke namenode (hadoop fs -dapatkan output / part-r-00000 / out_text). "/ out_text" akan disimpan di namenode.
salin file dari namenode ke disk lokal dengan (docker cp namenode: / out_text output.txt)
output.txt akan ada di direktori kerja Anda saat ini
sumber
sumber