Pertanyaan yang diberi tag dataframe

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.

1963

Bagaimana cara memilih baris dari DataFrame berdasarkan nilai kolom?

Bagaimana cara memilih baris dari DataFrameberdasarkan pada beberapa kolom di Python Pandas? Dalam SQL, saya akan menggunakan: SELECT * FROM table WHERE colume_name = some_value Saya mencoba melihat dokumentasi panda tetapi tidak segera menemukan

python pandas dataframe

1954

Bagaimana cara mengulangi baris dalam DataFrame di Pandas?

Saya punya DataFramedari panda: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df Keluaran: c1 c2 0 10 100 1 11 110 2 12 120 Sekarang saya ingin beralih di barisan frame ini. Untuk setiap baris saya ingin dapat mengakses...

python pandas rows dataframe

1827

Mengganti nama kolom dalam panda

Saya memiliki DataFrame menggunakan panda dan label kolom yang perlu saya edit untuk mengganti label kolom asli. Saya ingin mengubah nama kolom dalam DataFrame di Amana nama kolom aslinya adalah: ['$a', '$b', '$c', '$d', '$e'] untuk ['a', 'b', 'c', 'd', 'e']. Saya memiliki nama kolom yang...

python pandas replace dataframe rename

1332

Hapus kolom dari panda DataFrame

Saat menghapus kolom dalam DataFrame yang saya gunakan: del df['column_name'] Dan ini bekerja dengan baik. Mengapa saya tidak bisa menggunakan yang berikut ini? del df.column_name Karena dimungkinkan untuk mengakses kolom / Seri sebagai df.column_name, saya berharap ini

python pandas dataframe

1316

Cara mengurutkan dataframe berdasarkan beberapa kolom

Saya ingin mengurutkan data.frame dengan beberapa kolom. Sebagai contoh, dengan data.frame di bawah ini saya ingin mengurutkan berdasarkan kolom z(turun) kemudian dengan kolom b(naik): dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), levels = c("Low", "Med", "Hi"), ordered = TRUE), x...

r sorting dataframe r-faq

1233

Cara bergabung (menggabungkan) bingkai data (dalam, luar, kiri, kanan)

Diberikan dua frame data: df1 = data.frame(CustomerId = c(1:6), Product = c(rep("Toaster", 3), rep("Radio", 3))) df2 = data.frame(CustomerId = c(2, 4, 6), State = c(rep("Alabama", 2), rep("Ohio", 1))) df1 # CustomerId Product # 1 Toaster # 2 Toaster # 3 Toaster # 4 Radio # 5 Radio # 6...

r join merge dataframe r-faq

1113

Memilih beberapa kolom dalam bingkai data panda

Saya memiliki data dalam kolom yang berbeda tetapi saya tidak tahu cara mengekstraknya untuk menyimpannya dalam variabel lain. index a b c 1 2 3 4 2 3 4 5 Bagaimana saya memilih 'a', 'b'dan menyimpannya di df1? Saya mencoba df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Sepertinya tidak ada yang...

python pandas dataframe select

1016

Dapatkan daftar dari tajuk kolom DataFrame panda

Saya ingin mendapatkan daftar tajuk kolom dari DataFrame panda. DataFrame akan berasal dari input pengguna jadi saya tidak akan tahu berapa banyak kolom akan ada atau apa namanya. Misalnya, jika saya diberi DataFrame seperti ini: >>> my_dataframe y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4...

python pandas dataframe

979

Menambahkan kolom baru ke DataFrame yang ada di Python panda

Saya memiliki DataFrame yang diindeks berikut dengan kolom dan baris bernama tidak- nomor terus menerus: a b c d 2 0.671399 0.101208 -0.181532 0.241273 3 0.446172 -0.243316 0.051767 1.577318 5 0.614758 0.075793 -0.451460 -0.012493 Saya ingin menambahkan kolom baru 'e',, ke bingkai data yang ada...

python pandas dataframe chained-assignment

936

Bagaimana cara saya mendapatkan hitung baris dari DataFrame panda?

Saya mencoba untuk mendapatkan jumlah baris dataframe df dengan Panda, dan di sini adalah kode saya. Metode 1: total_rows = df.count print total_rows +1 Metode 2: total_rows = df['First_columnn_label'].count print total_rows +1 Kedua cuplikan kode memberi saya kesalahan ini: TypeError:...

python pandas dataframe

880

Bagaimana cara mengubah urutan kolom DataFrame?

Saya memiliki yang berikut DataFrame( df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Saya menambahkan lebih banyak kolom berdasarkan tugas: df['mean'] = df.mean(1) Bagaimana saya bisa memindahkan kolom meanke depan, yaitu mengaturnya sebagai kolom pertama...

python pandas dataframe

874

Letakkan kolom bingkai data berdasarkan nama

Saya memiliki sejumlah kolom yang ingin saya hapus dari bingkai data. Saya tahu bahwa kami dapat menghapusnya secara individual menggunakan sesuatu seperti: df$x <- NULL Tetapi saya berharap untuk melakukan ini dengan lebih sedikit perintah. Juga, saya tahu bahwa saya dapat menjatuhkan kolom...

r dataframe r-faq

871

Tambahkan satu baris ke panda DataFrame

Saya mengerti bahwa panda dirancang untuk memuat yang terisi penuh DataFrametetapi saya harus membuat DataFrame kosong lalu menambahkan baris, satu per satu . Apa cara terbaik untuk melakukan ini? Saya berhasil membuat DataFrame kosong dengan: res = DataFrame(columns=('lib', 'qty1',...

python pandas dataframe append

852

Hapus baris dengan semua atau beberapa NAS (nilai yang hilang) di data.frame

Saya ingin menghapus garis-garis dalam bingkai data ini yang: a) mengandung NAs di semua kolom. Di bawah ini adalah contoh kerangka data saya. gene hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA NA 4 ENSG00000207604 0 NA NA 1 2 5...

r dataframe filter missing-data r-faq

806

Ubah tipe data kolom di Panda

Saya ingin mengonversi tabel, direpresentasikan sebagai daftar daftar, menjadi a Pandas DataFrame. Sebagai contoh yang sangat sederhana: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) Apa cara terbaik untuk mengubah kolom ke tipe yang sesuai, dalam hal ini...

python pandas dataframe types casting

754

Cara menjatuhkan baris Pandas DataFrame yang nilainya dalam kolom tertentu adalah NaN

Saya memiliki ini DataFramedan hanya ingin catatan yang EPSkolomnya bukan NaN: >>> df STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231...

python pandas dataframe nan

728

Bagaimana cara mengganti nilai NA dengan nol dalam bingkai data R?

Saya memiliki bingkai data dan beberapa kolom memiliki NAnilai. Bagaimana cara mengganti NAnilai - nilai ini dengan

r dataframe na missing-data imputation

715

Menulis panda DataFrame ke file CSV

Saya memiliki dataframe dalam panda yang ingin saya tulis ke file CSV. Saya melakukan ini menggunakan: df.to_csv('out.csv') Dan mendapatkan kesalahan: UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) Apakah ada cara untuk menyiasatinya...

python csv pandas dataframe

657

Ubah daftar kamus menjadi panda DataFrame

Saya punya daftar kamus seperti ini: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] Dan saya ingin mengubah ini menjadi panda DataFrameseperti ini: month...

python dictionary pandas dataframe

654

Cukup cetak seluruh Seri Panda / DataFrame

Saya sering bekerja dengan Series dan DataFrames di terminal. Default __repr__untuk Seri mengembalikan sampel yang dikurangi, dengan beberapa nilai kepala dan ekor, tetapi sisanya hilang. Apakah ada cara bawaan untuk cukup mencetak seluruh Seri / DataFrame? Idealnya, itu akan mendukung perataan...

python pandas dataframe