Saya memiliki dataframe pandas df seperti yang diilustrasikan di bawah ini: BrandName Specialty A H B I ABC J D K AB L Saya ingin mengganti 'ABC' dan 'AB' di kolom BrandName oleh A. Adakah yang bisa membantu?
Saya memiliki dataframe pandas df seperti yang diilustrasikan di bawah ini: BrandName Specialty A H B I ABC J D K AB L Saya ingin mengganti 'ABC' dan 'AB' di kolom BrandName oleh A. Adakah yang bisa membantu?
Apa cara Python untuk membaca dalam file CSV menjadi pandas DataFrame (yang kemudian dapat saya gunakan untuk operasi statistik, dapat memiliki kolom dengan tipe berbeda, dll.)? File CSV saya "value.txt"memiliki konten
Saya memiliki bingkai data multi-indeks dengan kolom 'A' dan 'B'. Apakah ada cara untuk memilih baris dengan memfilter pada satu kolom multi-indeks tanpa menyetel ulang indeks ke indeks satu kolom? Sebagai contoh. # has multi-index (A,B) df #can I do this? I know this doesn't work because...
Saya memiliki kerangka data panda (ini hanya sebagian kecil) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511)...
Tutup. Pertanyaan ini tidak memenuhi pedoman Stack Overflow . Saat ini tidak menerima jawaban. Ingin memperbaiki pertanyaan ini? Perbarui pertanyaan agar sesuai dengan topik Stack Overflow. Tutup 2 tahun lalu . Perbaiki pertanyaan ini Saya...
Misalkan saya memiliki kamus bersarang 'user_dict' dengan struktur: Level 1: UserId (Long Integer) Level 2: Kategori (String) Level 3: Atribut Aneka (float, int, dll ..) Misalnya, entri kamus ini adalah: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2":...
Saya menggunakan pyspark (Python 2.7.9 / Spark 1.3.1) dan memiliki GroupObject dataframe yang perlu saya filter & urutkan dalam urutan menurun. Mencoba mencapainya melalui potongan kode ini. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Tapi itu...
Saya memiliki bingkai data yang memiliki kolom a, b, dan c. Saya ingin menambahkan kolom baru d antara b dan c. Saya tahu saya bisa menambahkan d di akhir dengan menggunakan cbind tetapi bagaimana saya bisa memasukkannya di antara dua kolom?
Saya memiliki dua dataframe. Contoh: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6...
Saya ingin menambahkan _xsufiks ke setiap nama kolom seperti ini: featuresA = myPandasDataFrame.columns.values + '_x' Bagaimana saya melakukan ini? Selain itu, jika saya ingin menambahkan x_sebagai sufiks, bagaimana solusinya akan berubah?
Saya memiliki bingkai data dengan 10 kolom, mengumpulkan tindakan "pengguna", di mana salah satu kolom berisi ID (tidak unik, mengidentifikasi pengguna) (kolom 10). panjang bingkai data sekitar 750000 baris. Saya mencoba untuk mengekstrak frame data individu (sehingga mendapatkan daftar atau...
Saya memiliki vektor karakter bernama yang dikembalikan dari xmlAttrs seperti ini: testVect <- structure(c("11.2.0.3.0", "12.89", "12.71"), .Names = c("db_version", "elapsed_time", "cpu_time")) Saya ingin mengubahnya menjadi bingkai data yang terlihat seperti ini: testDF <-...
Saya memiliki kerangka data yang mungkin terlihat seperti ini: A B C foo bar foo bar bar foo foo bar Saya ingin melihat setiap elemen dari setiap baris (atau setiap elemen dari setiap kolom) dan menerapkan fungsi berikut untuk mendapatkan DF berikutnya: def foo_bar(x): return...
Saya memiliki kerangka data dan kamus. Saya perlu menambahkan kolom baru ke kerangka data dan menghitung nilainya berdasarkan kamus. Pembelajaran mesin, menambahkan fitur baru berdasarkan beberapa tabel: score = {(1, 45, 1, 1) : 4, (0, 1, 2, 1) : 5} df = pd.DataFrame(data = { 'gender' : [1, 1,...
Saya memiliki kerangka data yang mencatat respons dari pilihan bahasa pemrograman 19717 orang melalui pertanyaan pilihan ganda. Kolom pertama tentu saja jenis kelamin responden sementara sisanya adalah pilihan yang mereka pilih. Dan karenanya jika saya memilih Python maka respons saya akan dicatat...
Saat memiliki Pandaf DataFrame seperti ini: import pandas as pd import numpy as np df = pd.DataFrame({'today': [['a', 'b', 'c'], ['a', 'b'], ['b']], 'yesterday': [['a', 'b'], ['a'], ['a']]}) today yesterday 0 ['a', 'b', 'c'] ['a', 'b'] 1 ['a', 'b'] ['a'] 2 ['b'] ['a'] ... etc Tetapi...
Saya memiliki satu kerangka data df, dengan dua kolom: Script (dengan teks) dan Speaker Script Speaker aze Speaker 1 art Speaker 2 ghb Speaker 3 jka Speaker 1 tyc Speaker 1 avv Speaker 2 bhj Speaker 1 Dan saya memiliki daftar berikut: L = ['a','b','c'] Dengan kode berikut, df =...
Ini adalah geodatframe pertama saya: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66},
Saya sangat bingung dengan metode pengindeksan yang berbeda menggunakan ilocdi panda. Katakanlah saya sedang mencoba mengubah 1-d Dataframe menjadi 2-d Dataframe. Pertama saya memiliki Dataframe 1-d berikut a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T Dan saya akan mengubahnya...
Saya memiliki DataFrame panda dalam bentuk: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06...