Saya memiliki kerangka data di panda dan saya mencoba mencari tahu apa jenis nilainya. Saya tidak yakin apa jenis kolomnya 'Test'. Namun, saat saya lari myFrame['Test'].dtype, saya mendapatkan; dtype('O') Apa artinya
Saya memiliki kerangka data panda dengan nama kolom berikut: Result1, Test1, Result2, Test2, Result3, Test3, dll ... Saya ingin membuang semua kolom yang namanya mengandung kata "Test". Jumlah kolom tersebut tidak statis tetapi bergantung pada fungsi sebelumnya. Bagaimana saya bisa melakukan...
Saya memiliki DataFrame: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'foo.fighters': [0, 1, np.nan, 0, 0, 0], 'foo.bars': [0, 0, 0, 0, 0, 1], 'bar.baz': [5, 5, 6, 5, 5.6, 6.8], 'foo.fox': [2, 4, 1, 0, 0, 5], 'nas.foo': ['NA', 0, 1,...
Saya memiliki dataframe dengan kolom A, B. Saya perlu membuat kolom Csedemikian rupa untuk setiap record / baris: C = max(A, B). Bagaimana saya harus melakukan ini?
Apa cara terbaik untuk membuat bingkai data panda berisi nol dengan ukuran tertentu? Saya telah menggunakan: zero_data = np.zeros(shape=(len(data),len(feature_list))) d = pd.DataFrame(zero_data, columns=feature_list) Apakah ada cara yang lebih baik untuk melakukannya?
Saya memiliki daftar 'abc' dan dataframe 'df': abc = ['foo', 'bar'] df = A B 0 12 NaN 1 23 NaN Saya ingin memasukkan daftar ke sel 1B, jadi saya ingin hasil ini: A B 0 12 NaN 1 23 ['foo', 'bar'] Ho bisakah saya melakukan itu? 1) Jika saya menggunakan ini: df.ix[1,'B'] = abc Saya...
Saya mengerjakan kerangka data dengan dua kolom, mvv dan hitungan. +---+-----+ |mvv|count| +---+-----+ | 1 | 5 | | 2 | 9 | | 3 | 3 | | 4 | 1 | saya ingin mendapatkan dua daftar yang berisi nilai mvv dan nilai hitungan. Sesuatu seperti mvv = [1,2,3,4] count = [5,9,3,1] Jadi, saya mencoba kode...
Saya ingin membaca file .xlsx menggunakan Pandas Library of python dan mem-port datanya ke tabel postgreSQL. Yang bisa saya lakukan sampai sekarang adalah: import pandas as pd data = pd.ExcelFile("*File Name*") Sekarang saya tahu bahwa langkah tersebut berhasil dijalankan, tetapi saya...
Misalnya jika saya punya ini: n = c(2, 3, 5) s = c("aa", "bb", "cc") b = c(TRUE, FALSE, TRUE) df = data.frame(n, s, b) n s b 1 2 aa TRUE 2 3 bb FALSE 3 5 cc TRUE Lalu bagaimana cara menggabungkan kedua kolom tersebut ndan smenjadi kolom baru yang diberi nama xsedemikian rupa sehingga...
Katakanlah saya memiliki DataFrame berikut Nomor Surat A 1 B 2 C 3 D 4 Yang bisa didapat melalui kode berikut import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) Sekarang...
Saya memiliki data.frame dengan header kolom. Bagaimana saya bisa mendapatkan baris tertentu dari data.frame sebagai daftar (dengan tajuk kolom sebagai kunci untuk daftar)? Secara khusus, data.frame saya adalah ABC 1 5 4.25 4.5 2 3.5 4 2.5 3 3.25 4 4 4 4.25 4.5 2.25 5 1,5 4,5 3 Dan...
Saya memiliki data.frame di mana variabel tertentu berisi string teks. Saya ingin menghitung jumlah kemunculan karakter tertentu di setiap string individu. Contoh: q.data<-data.frame(number=1:3, string=c("greatgreat", "magic", "not")) Saya ingin membuat kolom baru untuk q.data dengan jumlah...
Saya memiliki dataframe dengan kolom sebagai String. Saya ingin mengubah tipe kolom menjadi tipe Double di PySpark. Berikut caranya, saya lakukan: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Hanya ingin...
Saya memiliki kolom Data Frame dengan nilai numerik: df['percentage'].head() 46.5 44.2 100.0 42.12 Saya ingin melihat kolom sebagai jumlah bin: bins = [0, 1, 5, 10, 25, 50, 100] Bagaimana saya bisa mendapatkan hasil sebagai bin dengan mereka value counts? [0, 1] bin amount [1, 5] etc [5,...
Saya ingin menggeser kolom dalam Pandas DataFrame, tetapi saya belum dapat menemukan metode untuk melakukannya dari dokumentasi tanpa menulis ulang seluruh DF. Apakah ada yang tahu bagaimana melakukannya? DataFrame: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Output...
Di R, saya memiliki operasi yang membuat beberapa Infnilai ketika saya mengubah kerangka data. Saya ingin mengubah Infnilai - nilai ini menjadi NAnilai. Kode yang saya miliki lambat untuk data besar, apakah ada cara yang lebih cepat untuk melakukan ini? Katakanlah saya memiliki dataframe...
Apakah ada cara bawaan untuk digunakan read_csvhanya untuk membaca nbaris pertama file tanpa mengetahui panjang baris sebelumnya? Saya memiliki file besar yang membutuhkan waktu lama untuk membaca, dan kadang-kadang hanya ingin menggunakan yang pertama, katakanlah, 20 baris untuk mendapatkan...
Saya menghadapi beberapa masalah di sini, dalam paket python saya, saya telah menginstal numpy, tetapi saya masih memiliki kesalahan ini, objek 'DataFrame' tidak memiliki atribut 'sort' Siapapun bisa memberi saya ide .. Ini kode saya: final.loc[-1] =['', 'P','Actual'] final.index = final.index +...
Saya punya meja x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Saya ingin mengganti python None dengan pandas NaN. Saya mencoba: x.replace(to_replace=None, value=np.nan) Tapi saya mendapat: TypeError: 'regex' must be a string or a compiled regular expression or a list...
Saya agak baru mengenal panda. Saya memiliki bingkai data panda yaitu 1 baris kali 23 kolom. Saya ingin mengubahnya menjadi seri? Saya bertanya-tanya apa cara paling pythonic untuk melakukan ini? Saya sudah mencoba pd.Series(myResults)tapi mengeluh ValueError: cannot copy sequence with size 23...