Bagaimana cara mengakses kerangka grup yang sesuai dengan data di objek grup dengan tombol?
Dengan grup berikut:
rand = np.random.RandomState(1)
df = pd.DataFrame({'A': ['foo', 'bar'] * 3,
'B': rand.randn(6),
'C': rand.randint(0, 20, 6)})
gb = df.groupby(['A'])
Saya bisa mengulanginya untuk mendapatkan kunci dan grup:
In [11]: for k, gp in gb:
print 'key=' + str(k)
print gp
key=bar
A B C
1 bar -0.611756 18
3 bar -1.072969 10
5 bar -2.301539 18
key=foo
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
Saya ingin dapat mengakses grup dengan kuncinya:
In [12]: gb['foo']
Out[12]:
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
Tetapi ketika saya mencoba melakukan itu dengan gb[('foo',)]
saya mendapatkan pandas.core.groupby.DataFrameGroupBy
benda aneh ini yang sepertinya tidak memiliki metode yang sesuai dengan DataFrame yang saya inginkan.
Yang terbaik yang bisa saya pikirkan adalah:
In [13]: def gb_df_key(gb, key, orig_df):
ix = gb.indices[key]
return orig_df.ix[ix]
gb_df_key(gb, 'foo', df)
Out[13]:
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
tapi ini agak menjijikkan, mengingat betapa baiknya panda biasanya dalam hal ini.
Apa cara bawaan untuk melakukan ini?
groups = dict(list(gb))
kolom toko sajaC
? Katakanlah saya tidak tertarik pada kolom lain dan karena itu tidak ingin menyimpannya.dict(list( df.groupby(['A'])['C'] ))
dict(iter(g))
. (meskipunget_group
cara terbaik / karena tidak melibatkan pembuatan kamus / membuat Anda dalam panda!: D)gb_dict = {str(indx): str(val) for indx in gb.indx for val in gb.some_key}
dan kemudian mengambil nilai melaluigb_dict[some_key]
get_group()
, resep ini belum diperlukan selama bertahun-tahun.Daripada
Saya lebih suka menggunakan
gb.groups
Karena dengan cara ini Anda dapat memilih banyak kolom juga. sebagai contoh:
sumber
gb[["A", "B"]].get_group("foo")
.Jika Anda mencari objek groupby selektif kemudian, lakukan: gb_groups.keys (), dan masukkan kunci yang diinginkan ke key_list berikut ..
sumber
Saya sedang mencari cara untuk mencicipi beberapa anggota keberatan GroupBy - harus menjawab pertanyaan yang diposting untuk menyelesaikan ini.
buat objek groupby
pilih N dataframe dan ambil indeksnya
ambil grup
opsional - ubah semuanya menjadi objek dataframe tunggal
sumber
sampled_df_i = random.sample(grouped.indicies, N)
AttributeError: 'DataFrameGroupBy' object has no attribute 'indicies'