Perbedaan antara interpolasi () dan fillna () dalam panda

9

Karena metode interpolasi dan fillna melakukan pekerjaan yang sama untuk mengisi nilai-nilai na. Apa perbedaan mendasar antara keduanya. Apa pentingnya memiliki dua metode yang berbeda ini ?? Adakah yang bisa menjelaskan saya dalam istilah awam. Saya sudah mengunjungi melalui dokumentasi resmi dan ingin tahu bedanya

Sid_K
sumber

Jawaban:

12

fillnamengisi NaNnilai - nilai dengan angka tertentu yang ingin Anda gantikan. Ini memberi Anda pilihan untuk mengisi sesuai dengan indeks baris pd.DataFrameatau pada nama kolom dalam bentuk python dict.

Tetapi interpolateadalah dewa dalam mengisi. Ini memberi Anda fleksibilitas untuk mengisi nilai-nilai yang hilang dengan berbagai macam interpolasi antara nilai-nilai seperti linear (yang fillnatidak memberikan) dalam contoh yang diberikan di bawah ini dan banyak kemungkinan interpolasi. Sebagai contoh

>> import pandas as pd, numpy as np
>> df = pd.Series([1, np.nan, np.nan, 3])
>> df.interpolate()
0    1.000000
1    1.666667
2    2.333333
3    3.000000
dtype: float64

Dokumentasi panda tentang fillna dan interpolasi sangat jelas dalam hal ini.

Kiritee Gak
sumber
Dimengerti Misalkan jika saya ingin mengisi hanya beberapa nilai tertentu (mungkin dalam kisaran atau tanpa rentang) yang juga dapat dilakukan dengan menggunakan interpolasi. Baik ?
Sid_K
Apakah mengisi dengan nilai-nilai spesifik atau mengisi nilai-nilai spesifik seperti dalam sel-sel DataFrame?
Kiritee Gak
mengisi nilai spesifik dalam sel di beberapa lokasi tertentu saja tetapi pada suatu waktu banyak nilai harus diisi atau dalam beberapa rentang
Sid_K