Dalam set data saya, saya memiliki dua kolom kategori yang ingin saya hitung. Kedua kolom keduanya berisi negara, beberapa tumpang tindih (muncul di kedua kolom). Saya ingin memberikan nomor yang sama di kolom1 dan kolom2 untuk negara yang sama.
Data saya terlihat seperti:
import pandas as pd
d = {'col1': ['NL', 'BE', 'FR', 'BE'], 'col2': ['BE', 'NL', 'ES', 'ES']}
df = pd.DataFrame(data=d)
df
Saat ini saya sedang mengubah data seperti:
from sklearn.preprocessing import LabelEncoder
df.apply(LabelEncoder().fit_transform)
Namun ini tidak membuat perbedaan antara FR dan ES. Apakah ada cara sederhana lain untuk sampai pada hasil berikut?
o = {'col1': [2,0,1,0], 'col2': [0,2,4,4]}
output = pd.DataFrame(data=o)
output