Pertanyaan yang diberi tag dataframe

Frame data adalah struktur data tabular. Biasanya, ini berisi data di mana baris adalah pengamatan dan kolom adalah variabel dari berbagai jenis. Sementara "data frame" atau "dataframe" adalah istilah yang digunakan untuk konsep ini dalam beberapa bahasa (R, Apache Spark, deedle, Maple, panda library di Python dan pustaka DataFrames di Julia), "table" adalah istilah yang digunakan dalam MATLAB dan SQL.

1827
Mengganti nama kolom dalam panda

Saya memiliki DataFrame menggunakan panda dan label kolom yang perlu saya edit untuk mengganti label kolom asli. Saya ingin mengubah nama kolom dalam DataFrame di Amana nama kolom aslinya adalah: ['$a', '$b', '$c', '$d', '$e'] untuk ['a', 'b', 'c', 'd', 'e']. Saya memiliki nama kolom yang...

1332
Hapus kolom dari panda DataFrame

Saat menghapus kolom dalam DataFrame yang saya gunakan: del df['column_name'] Dan ini bekerja dengan baik. Mengapa saya tidak bisa menggunakan yang berikut ini? del df.column_name Karena dimungkinkan untuk mengakses kolom / Seri sebagai df.column_name, saya berharap ini

1316
Cara mengurutkan dataframe berdasarkan beberapa kolom

Saya ingin mengurutkan data.frame dengan beberapa kolom. Sebagai contoh, dengan data.frame di bawah ini saya ingin mengurutkan berdasarkan kolom z(turun) kemudian dengan kolom b(naik): dd <- data.frame(b = factor(c("Hi", "Med", "Hi", "Low"), levels = c("Low", "Med", "Hi"), ordered = TRUE), x...

1113
Memilih beberapa kolom dalam bingkai data panda

Saya memiliki data dalam kolom yang berbeda tetapi saya tidak tahu cara mengekstraknya untuk menyimpannya dalam variabel lain. index a b c 1 2 3 4 2 3 4 5 Bagaimana saya memilih 'a', 'b'dan menyimpannya di df1? Saya mencoba df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Sepertinya tidak ada yang...

1016
Dapatkan daftar dari tajuk kolom DataFrame panda

Saya ingin mendapatkan daftar tajuk kolom dari DataFrame panda. DataFrame akan berasal dari input pengguna jadi saya tidak akan tahu berapa banyak kolom akan ada atau apa namanya. Misalnya, jika saya diberi DataFrame seperti ini: >>> my_dataframe y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4...

880
Bagaimana cara mengubah urutan kolom DataFrame?

Saya memiliki yang berikut DataFrame( df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Saya menambahkan lebih banyak kolom berdasarkan tugas: df['mean'] = df.mean(1) Bagaimana saya bisa memindahkan kolom meanke depan, yaitu mengaturnya sebagai kolom pertama...

874
Letakkan kolom bingkai data berdasarkan nama

Saya memiliki sejumlah kolom yang ingin saya hapus dari bingkai data. Saya tahu bahwa kami dapat menghapusnya secara individual menggunakan sesuatu seperti: df$x <- NULL Tetapi saya berharap untuk melakukan ini dengan lebih sedikit perintah. Juga, saya tahu bahwa saya dapat menjatuhkan kolom...

871
Tambahkan satu baris ke panda DataFrame

Saya mengerti bahwa panda dirancang untuk memuat yang terisi penuh DataFrametetapi saya harus membuat DataFrame kosong lalu menambahkan baris, satu per satu . Apa cara terbaik untuk melakukan ini? Saya berhasil membuat DataFrame kosong dengan: res = DataFrame(columns=('lib', 'qty1',...

806
Ubah tipe data kolom di Panda

Saya ingin mengonversi tabel, direpresentasikan sebagai daftar daftar, menjadi a Pandas DataFrame. Sebagai contoh yang sangat sederhana: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) Apa cara terbaik untuk mengubah kolom ke tipe yang sesuai, dalam hal ini...

715
Menulis panda DataFrame ke file CSV

Saya memiliki dataframe dalam panda yang ingin saya tulis ke file CSV. Saya melakukan ini menggunakan: df.to_csv('out.csv') Dan mendapatkan kesalahan: UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) Apakah ada cara untuk menyiasatinya...

657
Ubah daftar kamus menjadi panda DataFrame

Saya punya daftar kamus seperti ini: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] Dan saya ingin mengubah ini menjadi panda DataFrameseperti ini: month...

654
Cukup cetak seluruh Seri Panda / DataFrame

Saya sering bekerja dengan Series dan DataFrames di terminal. Default __repr__untuk Seri mengembalikan sampel yang dikurangi, dengan beberapa nilai kepala dan ekor, tetapi sisanya hilang. Apakah ada cara bawaan untuk cukup mencetak seluruh Seri / DataFrame? Idealnya, itu akan mendukung perataan...