Saya sedang mengerjakan tantangan Kaggle di mana beberapa variabel diwakili oleh baris, bukan kolom (Telstra Network Disrupt). Saat ini saya sedang mencari yang setara dengan kumpulkan (), pisahkan () dan sebarkan (), yang dapat ditemukan di alat Rtidyr.
18
Jawaban:
Saya akan mulai dengan fungsi melt () di panda. Saya menulis artikel tentang itu:
https://www.ibm.com/developerworks/community/blogs/jfp/entry/Tidy_Data_In_Python?lang=en
sumber
R pada
gather()
dasarnya berubah dari lebar menjadi panjang. Begitu,pandas.wide_to_long()
,gather
fungsi seperti- elegan di Python.sumber
Saya mencoba meniru paket tidyr secara sintaksis dalam python dalam sebuah paket yang disebut tidypython. Saya membuatnya kompatibel dengan paket dplython, yang mencakup penggunaan operator >> untuk perintah chaining.
Itu belum sepenuhnya diuji, tetapi harus bekerja dengan cukup baik:
https://github.com/durrantmm/tidypython
Beri tahu saya jika itu berhasil untuk Anda.
sumber