Pertimbangkan kerangka data pyspark yang terdiri dari elemen 'nol' dan elemen numerik. Secara umum, elemen numerik memiliki nilai yang berbeda. Bagaimana mungkin untuk mengganti semua nilai numerik dari dataframe dengan nilai numerik yang konstan (misalnya dengan nilai 1)? Terima kasih sebelumnya!
Contoh untuk kerangka data pyspark:
Hasilnya harus:
python
apache-spark
hanya kita
sumber
sumber
Jawaban:
Menggunakan
lit
akan mengonversi semua nilai kolom ke nilai yang diberikan.Untuk melakukannya hanya untuk nilai-nilai dataframe yang bukan nol, Anda harus memfilter nilai-nilai yang bukan nol dari setiap kolom dan mengganti nilai Anda.
when
dapat membantu Anda mencapai ini.Ini akan menghasilkan:
Juga, jika Anda ingin mengganti nilai-nilai nol itu dengan beberapa nilai lain juga, Anda dapat menggunakan
otherwise
dalam kombinasi denganwhen
. Katakanlah Anda ingin menyalahkan di0
sana:Ini akan menghasilkan:
sumber
Sesuai masalah Anda, saya pikir itu akan lebih mudah untuk digunakan menyala . Coba ini-
Semoga ini bisa membantu!
sumber
Ini akan lebih mudah jika Anda memiliki banyak kolom:
sumber