Bagaimana cara memilih baris dari DataFrameberdasarkan pada beberapa kolom di Python Pandas? Dalam SQL, saya akan menggunakan: SELECT * FROM table WHERE colume_name = some_value Saya mencoba melihat dokumentasi panda tetapi tidak segera menemukan
Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.
Bagaimana cara memilih baris dari DataFrameberdasarkan pada beberapa kolom di Python Pandas? Dalam SQL, saya akan menggunakan: SELECT * FROM table WHERE colume_name = some_value Saya mencoba melihat dokumentasi panda tetapi tidak segera menemukan
Saya punya DataFramedari panda: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df Keluaran: c1 c2 0 10 100 1 11 110 2 12 120 Sekarang saya ingin beralih di barisan frame ini. Untuk setiap baris saya ingin dapat mengakses...
Saya memiliki DataFrame menggunakan panda dan label kolom yang perlu saya edit untuk mengganti label kolom asli. Saya ingin mengubah nama kolom dalam DataFrame di Amana nama kolom aslinya adalah: ['$a', '$b', '$c', '$d', '$e'] untuk ['a', 'b', 'c', 'd', 'e']. Saya memiliki nama kolom yang...
Saat menghapus kolom dalam DataFrame yang saya gunakan: del df['column_name'] Dan ini bekerja dengan baik. Mengapa saya tidak bisa menggunakan yang berikut ini? del df.column_name Karena dimungkinkan untuk mengakses kolom / Seri sebagai df.column_name, saya berharap ini
Saya ingin mengurutkan data.frame dengan beberapa kolom. Sebagai contoh, dengan data.frame di bawah ini saya ingin mengurutkan berdasarkan kolom z(turun) kemudian dengan kolom b(naik): dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), levels = c("Low", "Med", "Hi"), ordered = TRUE), x...
Diberikan dua frame data: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1))) df1 # CustomerId Product # 1 Toaster # 2 Toaster # 3 Toaster # 4 Radio # 5 Radio # 6...
Saya memiliki data dalam kolom yang berbeda tetapi saya tidak tahu cara mengekstraknya untuk menyimpannya dalam variabel lain. index a b c 1 2 3 4 2 3 4 5 Bagaimana saya memilih 'a', 'b'dan menyimpannya di df1? Saya mencoba df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Sepertinya tidak ada yang...
Saya ingin mendapatkan daftar tajuk kolom dari DataFrame panda. DataFrame akan berasal dari input pengguna jadi saya tidak akan tahu berapa banyak kolom akan ada atau apa namanya. Misalnya, jika saya diberi DataFrame seperti ini: >>> my_dataframe y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4...
Saya memiliki DataFrame yang diindeks berikut dengan kolom dan baris bernama tidak- nomor terus menerus: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493 Saya ingin menambahkan kolom baru 'e',, ke bingkai data yang ada...
Saya mencoba untuk mendapatkan jumlah baris dataframe df dengan Panda, dan di sini adalah kode saya. Metode 1: total_rows = df.count print total_rows +1 Metode 2: total_rows = df['First_columnn_label'].count print total_rows +1 Kedua cuplikan kode memberi saya kesalahan ini: TypeError:...
Saya memiliki yang berikut DataFrame( df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Saya menambahkan lebih banyak kolom berdasarkan tugas: df['mean'] = df.mean(1) Bagaimana saya bisa memindahkan kolom meanke depan, yaitu mengaturnya sebagai kolom pertama...
Saya memiliki sejumlah kolom yang ingin saya hapus dari bingkai data. Saya tahu bahwa kami dapat menghapusnya secara individual menggunakan sesuatu seperti: df$x <- NULL Tetapi saya berharap untuk melakukan ini dengan lebih sedikit perintah. Juga, saya tahu bahwa saya dapat menjatuhkan kolom...
Saya mengerti bahwa panda dirancang untuk memuat yang terisi penuh DataFrametetapi saya harus membuat DataFrame kosong lalu menambahkan baris, satu per satu . Apa cara terbaik untuk melakukan ini? Saya berhasil membuat DataFrame kosong dengan: res = DataFrame(columns=('lib', 'qty1',...
Saya ingin menghapus garis-garis dalam bingkai data ini yang: a) mengandung NAs di semua kolom. Di bawah ini adalah contoh kerangka data saya. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA NA 4 ENSG00000207604 0 NA NA 1 2 5...
Saya ingin mengonversi tabel, direpresentasikan sebagai daftar daftar, menjadi a Pandas DataFrame. Sebagai contoh yang sangat sederhana: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) Apa cara terbaik untuk mengubah kolom ke tipe yang sesuai, dalam hal ini...
Saya memiliki ini DataFramedan hanya ingin catatan yang EPSkolomnya bukan NaN: >>> df STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231...
Saya memiliki bingkai data dan beberapa kolom memiliki NAnilai. Bagaimana cara mengganti NAnilai - nilai ini dengan
Saya memiliki dataframe dalam panda yang ingin saya tulis ke file CSV. Saya melakukan ini menggunakan: df.to_csv('out.csv') Dan mendapatkan kesalahan: UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) Apakah ada cara untuk menyiasatinya...
Saya punya daftar kamus seperti ini: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] Dan saya ingin mengubah ini menjadi panda DataFrameseperti ini: month...
Saya sering bekerja dengan Series dan DataFrames di terminal. Default __repr__untuk Seri mengembalikan sampel yang dikurangi, dengan beberapa nilai kepala dan ekor, tetapi sisanya hilang. Apakah ada cara bawaan untuk cukup mencetak seluruh Seri / DataFrame? Idealnya, itu akan mendukung perataan...