Pertanyaan yang diberi tag dataframe

92

Mengganti beberapa nilai di kolom dataframe pandas dengan nilai lain

Saya memiliki dataframe pandas df seperti yang diilustrasikan di bawah ini: BrandName Specialty A H B I ABC J D K AB L Saya ingin mengganti 'ABC' dan 'AB' di kolom BrandName oleh A. Adakah yang bisa membantu?

91

Impor file CSV sebagai DataFrame pandas

Apa cara Python untuk membaca dalam file CSV menjadi pandas DataFrame (yang kemudian dapat saya gunakan untuk operasi statistik, dapat memiliki kolom dengan tipe berbeda, dll.)? File CSV saya "value.txt"memiliki konten

python pandas csv dataframe

91

memilih dari panda multi-indeks

Saya memiliki bingkai data multi-indeks dengan kolom 'A' dan 'B'. Apakah ada cara untuk memilih baris dengan memfilter pada satu kolom multi-indeks tanpa menyetel ulang indeks ke indeks satu kolom? Sebagai contoh. # has multi-index (A,B) df #can I do this? I know this doesn't work because...

python pandas dataframe multi-index

91

bagaimana cara membagi kolom tupel di pandas dataframe?

Saya memiliki kerangka data panda (ini hanya sebagian kecil) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511)...

python numpy pandas dataframe tuples

91

Di manakah dokumentasi tentang tag 'Frek' Pandas? [Tutup]

Tutup. Pertanyaan ini tidak memenuhi pedoman Stack Overflow . Saat ini tidak menerima jawaban. Ingin memperbaiki pertanyaan ini? Perbarui pertanyaan agar sesuai dengan topik Stack Overflow. Tutup 2 tahun lalu . Perbaiki pertanyaan ini Saya...

python pandas documentation dataframe frequency

90

Buat DataFrame pandas dari item dalam kamus bertingkat

Misalkan saya memiliki kamus bersarang 'user_dict' dengan struktur: Level 1: UserId (Long Integer) Level 2: Kategori (String) Level 3: Atribut Aneka (float, int, dll ..) Misalnya, entri kamus ini adalah: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2":...

python pandas dataframe multi-index

90

Spark DataFrame groupBy dan urutkan dalam urutan menurun (pyspark)

Saya menggunakan pyspark (Python 2.7.9 / Spark 1.3.1) dan memiliki GroupObject dataframe yang perlu saya filter & urutkan dalam urutan menurun. Mencoba mencapainya melalui potongan kode ini. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Tapi itu...

python apache-spark dataframe pyspark apache-spark-sql

89

Tambahkan (sisipkan) kolom di antara dua kolom dalam data.frame

Saya memiliki bingkai data yang memiliki kolom a, b, dan c. Saya ingin menambahkan kolom baru d antara b dan c. Saya tahu saya bisa menambahkan d di akhir dengan menggunakan cbind tetapi bagaimana saya bisa memasukkannya di antara dua kolom?

r dataframe insert

89

Membandingkan dua kerangka data dan mendapatkan perbedaannya

Saya memiliki dua dataframe. Contoh: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6...

python pandas dataframe

89

Bagaimana cara menambahkan sufiks (atau awalan) ke setiap nama kolom?

Saya ingin menambahkan _xsufiks ke setiap nama kolom seperti ini: featuresA = myPandasDataFrame.columns.values + '_x' Bagaimana saya melakukan ini? Selain itu, jika saya ingin menambahkan x_sebagai sufiks, bagaimana solusinya akan berubah?

python pandas dataframe

88

Pisahkan kerangka data yang besar menjadi daftar bingkai data berdasarkan nilai umum di kolom

Saya memiliki bingkai data dengan 10 kolom, mengumpulkan tindakan "pengguna", di mana salah satu kolom berisi ID (tidak unik, mengidentifikasi pengguna) (kolom 10). panjang bingkai data sekitar 750000 baris. Saya mencoba untuk mengekstrak frame data individu (sehingga mendapatkan daftar atau...

r performance matrix split dataframe

87

Ubah Named Character Vector menjadi data.frame

Saya memiliki vektor karakter bernama yang dikembalikan dari xmlAttrs seperti ini: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Saya ingin mengubahnya menjadi bingkai data yang terlihat seperti ini: testDF <-...

r dataframe vector type-conversion

87

Terapkan fungsi ke setiap sel di DataFrame

Saya memiliki kerangka data yang mungkin terlihat seperti ini: A B C foo bar foo bar bar foo foo bar Saya ingin melihat setiap elemen dari setiap baris (atau setiap elemen dari setiap kolom) dan menerapkan fungsi berikut untuk mendapatkan DF berikutnya: def foo_bar(x): return...

python pandas dataframe apply

23

Tambahkan kolom baru ke bingkai data berdasarkan kamus

Saya memiliki kerangka data dan kamus. Saya perlu menambahkan kolom baru ke kerangka data dan menghitung nilainya berdasarkan kamus. Pembelajaran mesin, menambahkan fitur baru berdasarkan beberapa tabel: score = {(1, 45, 1, 1) : 4, (0, 1, 2, 1) : 5} df = pd.DataFrame(data = { 'gender' : [1, 1,...

python pandas dataframe dictionary

19

Hapus dan kembalikan nilai nilai untuk setiap variabel?

Saya memiliki kerangka data yang mencatat respons dari pilihan bahasa pemrograman 19717 orang melalui pertanyaan pilihan ganda. Kolom pertama tentu saja jenis kelamin responden sementara sisanya adalah pilihan yang mereka pilih. Dan karenanya jika saya memilih Python maka respons saya akan dicatat...

python pandas dataframe

16

Membandingkan daftar dalam dua kolom dengan bijaksana secara efisien

Saat memiliki Pandaf DataFrame seperti ini: import pandas as pd import numpy as np df = pd.DataFrame({'today': [['a', 'b', 'c'], ['a', 'b'], ['b']], 'yesterday': [['a', 'b'], ['a'], ['a']]}) today yesterday 0 ['a', 'b', 'c'] ['a', 'b'] 1 ['a', 'b'] ['a'] 2 ['b'] ['a'] ... etc Tetapi...

python pandas numpy dataframe

14

Hitung persentase nilai yang sama dalam bingkai data panda

Saya memiliki satu kerangka data df, dengan dua kolom: Script (dengan teks) dan Speaker Script Speaker aze Speaker 1 art Speaker 2 ghb Speaker 3 jka Speaker 1 tyc Speaker 1 avv Speaker 2 bhj Speaker 1 Dan saya memiliki daftar berikut: L = ['a','b','c'] Dengan kode berikut, df =...

python python-3.x pandas dataframe

14

Dapatkan jarak terdekat dengan dua geodataframe di panda

Ini adalah geodatframe pertama saya: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66},

python pandas dataframe geolocation geopandas

13

Mengapa menugaskan dengan [:] versus iloc [:] menghasilkan hasil yang berbeda dalam panda?

Saya sangat bingung dengan metode pengindeksan yang berbeda menggunakan ilocdi panda. Katakanlah saya sedang mencoba mengubah 1-d Dataframe menjadi 2-d Dataframe. Pertama saya memiliki Dataframe 1-d berikut a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T Dan saya akan mengubahnya...

python pandas dataframe

13

Panda lambat DataFrame MultiIndex reindex

Saya memiliki DataFrame panda dalam bentuk: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06...

python pandas numpy dataframe