Saya mengerti bahwa untuk menjatuhkan kolom Anda menggunakan df.drop ('nama kolom', sumbu = 1). Apakah ada cara untuk menjatuhkan kolom menggunakan indeks numerik alih-alih nama
Saya mengerti bahwa untuk menjatuhkan kolom Anda menggunakan df.drop ('nama kolom', sumbu = 1). Apakah ada cara untuk menjatuhkan kolom menggunakan indeks numerik alih-alih nama
Bagaimana cara mengakses kerangka grup yang sesuai dengan data di objek grup dengan tombol? Dengan grup berikut: rand = np.random.RandomState(1) df = pd.DataFrame({'A': ['foo', 'bar'] * 3, 'B': rand.randn(6), 'C': rand.randint(0, 20, 6)}) gb = df.groupby(['A']) Saya bisa mengulanginya untuk...
Saya memiliki bingkai data seperti ini: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183"...
Saya ingin mengubah format (kelas) dari beberapa kolom objek data.frame saya ( mydf) dari charactor ke faktor . Saya tidak ingin melakukan ini ketika saya membaca file teks dengan read.table()fungsi. Bantuan apa pun akan
Saya bekerja dengan indeks boolean di Pandas. Pertanyaannya adalah mengapa pernyataan itu: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] berfungsi dengan baik sedangkan a[(a['some_column']==some_number) and
Saya memiliki DataFrame berikut: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1 Saya ingin menambahkan kolom 'e'yang merupakan jumlah kolom 'a', 'b'dan 'd'. Pergi melintasi...
Saya menggunakan R dan telah memuat data ke dalam dataframe menggunakan read.csv(). Bagaimana cara menentukan tipe data setiap kolom dalam bingkai
Kapan seseorang harus menggunakan a data.frame , dan kapan lebih baik menggunakan matrix? Keduanya menyimpan data dalam format persegi panjang, jadi terkadang tidak jelas. Apakah ada aturan umum praktis kapan harus menggunakan tipe data
Saya ingin menghitung jumlah NAnilai dalam kolom bingkai data. Katakanlah bingkai data saya dipanggil df, dan nama kolom yang saya pertimbangkan adalah col. Cara saya menemukan adalah sebagai berikut: sapply(df$col, function(x) sum(length(which(is.na(x))))) Apakah ini cara yang baik /...
Saya memiliki situasi di mana kadang-kadang ketika saya membaca csvdari dfsaya mendapatkan kolom seperti indeks yang tidak diinginkan bernama unnamed:0. file.csv ,A,B,C 0,1,2,3 1,4,5,6 2,7,8,9 CSV dibaca dengan ini: pd.read_csv('file.csv') Unnamed: 0 A B C 0 0 1 2 3 1 1 4 5 6 2 2 7 8 9 Ini...
Saya memiliki DataFrame dinamis yang berfungsi dengan baik, tetapi ketika tidak ada data untuk ditambahkan ke dalam DataFrame saya mendapatkan kesalahan. Dan karena itu saya membutuhkan solusi untuk membuat DataFrame kosong dengan hanya nama kolom. Untuk saat ini saya memiliki sesuatu seperti...
Hari ini saya sangat terkejut dengan fakta bahwa saat membaca data dari file data (misalnya) panda mampu mengenali jenis nilai: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Misalnya itu dapat diperiksa dengan cara ini: for i, r in df.iterrows(): print...
Saya memiliki file csv tanpa header, dengan indeks DateTime. Saya ingin mengganti nama indeks dan nama kolom, tetapi dengan df.rename () hanya nama kolom yang diganti. Bug? Saya menggunakan versi 0.12.0 In [2]: df = pd.read_csv(r'D:\Data\DataTimeSeries_csv//seriesSM.csv', header=None,...
df <- data.frame(var1 = c('a', 'b', 'c'), var2 = c('d', 'e', 'f'), freq = 1:3) Apa cara paling sederhana untuk memperluas setiap baris dua kolom pertama dari data.frame di atas, sehingga setiap baris diulang berapa kali ditentukan dalam kolom 'freq'? Dengan kata lain, pergi dari ini: df...
Saya memiliki data.table besar , dengan banyak nilai yang hilang tersebar di ~ 200r baris dan 200 kolom. Saya ingin mengkode ulang nilai-nilai NA ke nol seefisien mungkin. Saya melihat dua opsi: 1: Konversi ke data.frame, dan gunakan sesuatu seperti ini 2: Beberapa jenis perintah sub pengaturan...
Saya ingin menemukan semua nilai dalam kerangka data Pandas yang berisi spasi putih (jumlah sembarang) dan mengganti nilai-nilai itu dengan NaNs. Adakah ide bagaimana hal ini dapat diperbaiki? Pada dasarnya saya ingin mengubah ini: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar...
Saya mengalami masalah dengan kerangka data dan saya sendiri tidak bisa menyelesaikan masalah itu: Kerangka data memiliki sifat sewenang-wenang sebagai kolom dan setiap baris mewakili satu set data . Pertanyaannya adalah: Bagaimana cara menyingkirkan kolom di mana untuk SEMUA baris nilainya NA...
Apa cara pandas paling umum untuk memilih / memfilter baris dataframe yang indeksnya adalah MultiIndex ? Mengiris berdasarkan satu nilai / label Mengiris berdasarkan beberapa label dari satu atau lebih level Pemfilteran pada kondisi dan ekspresi boolean Metode mana yang dapat diterapkan dalam...
Saya memiliki data yang disimpan dalam database postgreSQL. Saya menanyakan data ini menggunakan Python2.7 dan mengubahnya menjadi Pandas DataFrame. Namun, kolom terakhir dari kerangka data ini memiliki kamus (atau daftar?) Dari nilai-nilai di dalamnya. DataFrame terlihat seperti ini: [1]...
Saya mencoba untuk mengisi nilai dalam dataframe Pandas dengan 0 untuk hanya beberapa subset kolom. Ketika saya melakukannya: import pandas as pd df = pd.DataFrame(data={'a':[1,2,3,None],'b':[4,5,None,6],'c':[None,None,7,8]}) print df df.fillna(value=0, inplace=True) print df Hasil: a b c 0...