Saya ingin menghapus semua baris yang berisi nilai NaN yang berkaitan dengan kolom. Mari kita asumsikan saya memiliki dataset seperti ini:
Age Height Weight Gender
12 5'7 NaN M
NaN 5'8 160 M
32 5'5 165 NaN
21 NaN 155 F
55 5'10 170 NaN
Saya ingin menghapus semua baris di mana 'Gender' memiliki nilai NaN. Output yang saya inginkan:
Age Height Weight Gender
12 5'7 NaN M
NaN 5'8 160 M
21 NaN 155 F
Terima kasih sebelumnya!
machine-learning
python
data-cleaning
data
uharsha33
sumber
sumber
Jawaban:
Nah jika dataset tidak terlalu besar saya sarankan menggunakan panda untuk membersihkan data. Jadi, Anda harus terlebih dahulu melakukannya
Python2
Python3
Jika Anda sudah menginstal anaconda, Anda dapat melewati langkah di atas. Selanjutnya Anda bisa melalui IDE (seperti jupyter) atau melalui shell ketik perintah berikut
Maka Anda ingin menyimpan hasil Anda dalam file dengan
sumber
Jika Anda bekerja pada Python Dataframe, Silakan coba ini.
Atau Anda bisa menggunakan notnull sebagai ganti isfinite.
sumber