Saya telah menggunakan panda untuk beberapa waktu. Tapi, saya tidak mengerti apa perbedaan antara isna()
dan isnull()
dalam panda. Dan, yang lebih penting, yang mana yang akan digunakan untuk mengidentifikasi nilai yang hilang dalam kerangka data.
Apa perbedaan mendasar yang mendasari bagaimana suatu nilai terdeteksi sebagai salah satu na
atau null
?
Jawaban:
Panda
isna()
vsisnull()
.Aku menduga maksud anda
pandas.DataFrame.isna()
vspandas.DataFrame.isnull()
. Tidak bingung denganpandas.isnull()
, yang berbeda dengan kedua di atas bukan metode kelas DataFrame.Kedua metode DataFrame ini melakukan hal yang persis sama! Bahkan dokumen mereka identik. Anda bahkan dapat mengkonfirmasi ini dalam kode panda .
Tetapi mengapa dua metode dengan nama berbeda melakukan hal yang sama?
Ini karena DataFrames panda didasarkan pada DataFrames R. Dalam R
na
dannull
dua hal terpisah. Baca posting ini untuk informasi lebih lanjut.Namun, dalam python, panda dibangun di atas numpy, yang tidak
na
null
memiliki nilai atau tidak . Sebaliknya numpy memilikiNaN
nilai (yang merupakan singkatan dari "Not a Number"). Akibatnya, panda juga menggunakanNaN
nilai.Pendeknya
Untuk mendeteksi
NaN
nilai-nilai digunakan numpynp.isnan()
.Untuk mendeteksi
NaN
nilai, panda menggunakan salah satu.isna()
atau.isnull()
.The
NaN
nilai-nilai yang diwariskan dari fakta bahwa panda dibangun di atas numpy, sedangkan nama kedua fungsi berasal dari DataFrames R, yang struktur dan panda fungsi mencoba untuk meniru.sumber