Pertanyaan yang diberi tag pandas

Pandas adalah pustaka Python untuk manipulasi dan analisis data, misalnya kerangka data, rangkaian waktu multidimensi, dan kumpulan data cross-sectional yang biasa ditemukan dalam statistik, hasil sains eksperimental, ekonometrik, atau keuangan. Panda adalah salah satu pustaka sains data utama di Python.

1827
Mengganti nama kolom dalam panda

Saya memiliki DataFrame menggunakan panda dan label kolom yang perlu saya edit untuk mengganti label kolom asli. Saya ingin mengubah nama kolom dalam DataFrame di Amana nama kolom aslinya adalah: ['$a', '$b', '$c', '$d', '$e'] untuk ['a', 'b', 'c', 'd', 'e']. Saya memiliki nama kolom yang...

1332
Hapus kolom dari panda DataFrame

Saat menghapus kolom dalam DataFrame yang saya gunakan: del df['column_name'] Dan ini bekerja dengan baik. Mengapa saya tidak bisa menggunakan yang berikut ini? del df.column_name Karena dimungkinkan untuk mengakses kolom / Seri sebagai df.column_name, saya berharap ini

1113
Memilih beberapa kolom dalam bingkai data panda

Saya memiliki data dalam kolom yang berbeda tetapi saya tidak tahu cara mengekstraknya untuk menyimpannya dalam variabel lain. index a b c 1 2 3 4 2 3 4 5 Bagaimana saya memilih 'a', 'b'dan menyimpannya di df1? Saya mencoba df1 = df['a':'b'] df1 = df.ix[:, 'a':'b'] Sepertinya tidak ada yang...

1016
Dapatkan daftar dari tajuk kolom DataFrame panda

Saya ingin mendapatkan daftar tajuk kolom dari DataFrame panda. DataFrame akan berasal dari input pengguna jadi saya tidak akan tahu berapa banyak kolom akan ada atau apa namanya. Misalnya, jika saya diberi DataFrame seperti ini: >>> my_dataframe y gdp cap 0 1 2 5 1 2 3 9 2 8 7 2 3 3 4...

880
Bagaimana cara mengubah urutan kolom DataFrame?

Saya memiliki yang berikut DataFrame( df): import numpy as np import pandas as pd df = pd.DataFrame(np.random.rand(10, 5)) Saya menambahkan lebih banyak kolom berdasarkan tugas: df['mean'] = df.mean(1) Bagaimana saya bisa memindahkan kolom meanke depan, yaitu mengaturnya sebagai kolom pertama...

871
Tambahkan satu baris ke panda DataFrame

Saya mengerti bahwa panda dirancang untuk memuat yang terisi penuh DataFrametetapi saya harus membuat DataFrame kosong lalu menambahkan baris, satu per satu . Apa cara terbaik untuk melakukan ini? Saya berhasil membuat DataFrame kosong dengan: res = DataFrame(columns=('lib', 'qty1',...

806
Ubah tipe data kolom di Panda

Saya ingin mengonversi tabel, direpresentasikan sebagai daftar daftar, menjadi a Pandas DataFrame. Sebagai contoh yang sangat sederhana: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) Apa cara terbaik untuk mengubah kolom ke tipe yang sesuai, dalam hal ini...

715
Menulis panda DataFrame ke file CSV

Saya memiliki dataframe dalam panda yang ingin saya tulis ke file CSV. Saya melakukan ini menggunakan: df.to_csv('out.csv') Dan mendapatkan kesalahan: UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128) Apakah ada cara untuk menyiasatinya...

657
Ubah daftar kamus menjadi panda DataFrame

Saya punya daftar kamus seperti ini: [{'points': 50, 'time': '5:00', 'year': 2010}, {'points': 25, 'time': '6:00', 'month': "february"}, {'points':90, 'time': '9:00', 'month': 'january'}, {'points_h1':20, 'month': 'june'}] Dan saya ingin mengubah ini menjadi panda DataFrameseperti ini: month...

654
Cukup cetak seluruh Seri Panda / DataFrame

Saya sering bekerja dengan Series dan DataFrames di terminal. Default __repr__untuk Seri mengembalikan sampel yang dikurangi, dengan beberapa nilai kepala dan ekor, tetapi sisanya hilang. Apakah ada cara bawaan untuk cukup mencetak seluruh Seri / DataFrame? Idealnya, itu akan mendukung perataan...

636
Bagaimana iloc, ix, dan loc berbeda?

Adakah yang bisa menjelaskan bagaimana ketiga metode mengiris ini berbeda? Saya telah melihat dokumen , dan saya telah melihat jawaban ini , tetapi saya masih tidak dapat menjelaskan bagaimana ketiganya berbeda. Bagi saya, mereka tampaknya dapat dipertukarkan sebagian besar, karena mereka berada...

511
Menghapus baris DataFrame di Panda berdasarkan nilai kolom

Saya memiliki DataFrame berikut: daysago line_race rating rw wrating line_date 2007-03-31 62 11 56 1.000000 56.000000 2007-03-10 83 11 67 1.000000 67.000000 2007-02-10 111 9 66 1.000000 66.000000 2007-01-13 139 10 83 0.880678 73.096278 2006-12-23 160 10 88 0.793033 69.786942 2006-11-09...