Adakah metode yang mudah di panda untuk digunakan groupby
pada berbagai peningkatan nilai? Misalnya diberikan contoh di bawah ini dapatkah saya bin dan kolom grup B
dengan 0.155
kenaikan sehingga misalnya, beberapa grup pertama dalam kolom B
dibagi menjadi rentang antara '0 - 0,155, 0,155 - 0,31 ...'
import numpy as np
import pandas as pd
df=pd.DataFrame({'A':np.random.random(20),'B':np.random.random(20)})
A B
0 0.383493 0.250785
1 0.572949 0.139555
2 0.652391 0.401983
3 0.214145 0.696935
4 0.848551 0.516692
Atau saya dapat terlebih dahulu mengkategorikan data dengan kenaikan tersebut ke dalam kolom baru dan kemudian menggunakan groupby
untuk menentukan statistik relevan yang mungkin berlaku di kolom A
?
Coba ini:
df = df.sort('B') bins = np.arange(0,1.0,0.155) ind = np.digitize(df['B'],bins) print df.groupby(ind).head()
Tentu saja Anda dapat menggunakan fungsi apa pun di grup tidak hanya
head
.sumber