Pertanyaan yang diberi tag dataframe

106

Apa itu dtype ('O'), di panda?

Saya memiliki kerangka data di panda dan saya mencoba mencari tahu apa jenis nilainya. Saya tidak yakin apa jenis kolomnya 'Test'. Namun, saat saya lari myFrame['Test'].dtype, saya mendapatkan; dtype('O') Apa artinya

106

Letakkan kolom yang namanya berisi string tertentu dari pandas DataFrame

Saya memiliki kerangka data panda dengan nama kolom berikut: Result1, Test1, Result2, Test2, Result3, Test3, dll ... Saya ingin membuang semua kolom yang namanya mengandung kata "Test". Jumlah kolom tersebut tidak statis tetapi bergantung pada fungsi sebelumnya. Bagaimana saya bisa melakukan...

python pandas dataframe

106

pandas: cara terbaik untuk memilih semua kolom yang namanya dimulai dengan X

Saya memiliki DataFrame: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'foo.fighters': [0, 1, np.nan, 0, 0, 0], 'foo.bars': [0, 0, 0, 0, 0, 1], 'bar.baz': [5, 5, 6, 5, 5.6, 6.8], 'foo.fox': [2, 4, 1, 0, 0, 5], 'nas.foo': ['NA', 0, 1,...

python pandas dataframe selection

105

Temukan jumlah maksimal dua atau lebih kolom dengan panda

Saya memiliki dataframe dengan kolom A, B. Saya perlu membuat kolom Csedemikian rupa untuk setiap record / baris: C = max(A, B). Bagaimana saya harus melakukan ini?

python dataframe pandas

105

Membuat bingkai data panda yang diisi nol

Apa cara terbaik untuk membuat bingkai data panda berisi nol dengan ukuran tertentu? Saya telah menggunakan: zero_data = np.zeros(shape=(len(data),len(feature_list))) d = pd.DataFrame(zero_data, columns=feature_list) Apakah ada cara yang lebih baik untuk melakukannya?

python pandas dataframe

105

Panda python menyisipkan daftar ke dalam sel

Saya memiliki daftar 'abc' dan dataframe 'df': abc = ['foo', 'bar'] df = A B 0 12 NaN 1 23 NaN Saya ingin memasukkan daftar ke sel 1B, jadi saya ingin hasil ini: A B 0 12 NaN 1 23 ['foo', 'bar'] Ho bisakah saya melakukan itu? 1) Jika saya menggunakan ini: df.ix[1,'B'] = abc Saya...

python list pandas insert dataframe

104

Ubah kolom DataFrame spark ke daftar python

Saya mengerjakan kerangka data dengan dua kolom, mvv dan hitungan. +---+-----+ |mvv|count| +---+-----+ | 1 | 5 | | 2 | 9 | | 3 | 3 | | 4 | 1 | saya ingin mendapatkan dua daftar yang berisi nilai mvv dan nilai hitungan. Sesuatu seperti mvv = [1,2,3,4] count = [5,9,3,1] Jadi, saya mencoba kode...

python apache-spark pyspark spark-dataframe

104

Bagaimana cara membaca file .xlsx menggunakan pandas Library di iPython?

Saya ingin membaca file .xlsx menggunakan Pandas Library of python dan mem-port datanya ke tabel postgreSQL. Yang bisa saya lakukan sampai sekarang adalah: import pandas as pd data = pd.ExcelFile("*File Name*") Sekarang saya tahu bahwa langkah tersebut berhasil dijalankan, tetapi saya...

python pandas ipython ipython-notebook dataframe

104

Gabungkan dua atau lebih kolom dalam kerangka data ke dalam kolom baru dengan nama baru

Misalnya jika saya punya ini: n = c(2, 3, 5) s = c("aa", "bb", "cc") b = c(TRUE, FALSE, TRUE) df = data.frame(n, s, b) n s b 1 2 aa TRUE 2 3 bb FALSE 3 5 cc TRUE Lalu bagaimana cara menggabungkan kedua kolom tersebut ndan smenjadi kolom baru yang diberi nama xsedemikian rupa sehingga...

r dataframe multiple-columns r-faq

104

Cara mendapatkan nilai dari Pandas DataFrame dan bukan indeks dan tipe objek

Katakanlah saya memiliki DataFrame berikut Nomor Surat A 1 B 2 C 3 D 4 Yang bisa didapat melalui kode berikut import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) Sekarang...

python pandas dataframe

103

Bagaimana mendapatkan baris dari R data.frame

Saya memiliki data.frame dengan header kolom. Bagaimana saya bisa mendapatkan baris tertentu dari data.frame sebagai daftar (dengan tajuk kolom sebagai kunci untuk daftar)? Secara khusus, data.frame saya adalah ABC 1 5 4.25 4.5 2 3.5 4 2.5 3 3.25 4 4 4 4.25 4.5 2.25 5 1,5 4,5 3 Dan...

r indexing dataframe

103

Bagaimana cara menghitung jumlah kemunculan karakter tertentu di setiap baris kolom string?

Saya memiliki data.frame di mana variabel tertentu berisi string teks. Saya ingin menghitung jumlah kemunculan karakter tertentu di setiap string individu. Contoh: q.data<-data.frame(number=1:3, string=c("greatgreat", "magic", "not")) Saya ingin membuat kolom baru untuk q.data dengan jumlah...

regex r dataframe

103

bagaimana mengubah kolom Dataframe dari tipe String ke tipe Double di pyspark

Saya memiliki dataframe dengan kolom sebagai String. Saya ingin mengubah tipe kolom menjadi tipe Double di PySpark. Berikut caranya, saya lakukan: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) Hanya ingin...

python apache-spark dataframe pyspark apache-spark-sql

102

Kolom binning dengan python pandas

Saya memiliki kolom Data Frame dengan nilai numerik: df['percentage'].head() 46.5 44.2 100.0 42.12 Saya ingin melihat kolom sebagai jumlah bin: bins = [0, 1, 5, 10, 25, 50, 100] Bagaimana saya bisa mendapatkan hasil sebagai bin dengan mereka value counts? [0, 1] bin amount [1, 5] etc [5,...

python pandas numpy dataframe binning

101

Cara menggeser kolom di Pandas DataFrame

Saya ingin menggeser kolom dalam Pandas DataFrame, tetapi saya belum dapat menemukan metode untuk melakukannya dari dokumentasi tanpa menulis ulang seluruh DF. Apakah ada yang tahu bagaimana melakukannya? DataFrame: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Output...

python pandas dataframe

101

Membersihkan nilai `Inf` dari kerangka data R.

Di R, saya memiliki operasi yang membuat beberapa Infnilai ketika saya mengubah kerangka data. Saya ingin mengubah Infnilai - nilai ini menjadi NAnilai. Kode yang saya miliki lambat untuk data besar, apakah ada cara yang lebih cepat untuk melakukan ini? Katakanlah saya memiliki dataframe...

r dataframe data.table

101

Cara membaca beberapa baris pertama untuk bingkai data panda

Apakah ada cara bawaan untuk digunakan read_csvhanya untuk membaca nbaris pertama file tanpa mengetahui panjang baris sebelumnya? Saya memiliki file besar yang membutuhkan waktu lama untuk membaca, dan kadang-kadang hanya ingin menggunakan yang pertama, katakanlah, 20 baris untuk mendapatkan...

python pandas csv dataframe

101

Objek 'DataFrame' tidak memiliki atribut 'sort'

Saya menghadapi beberapa masalah di sini, dalam paket python saya, saya telah menginstal numpy, tetapi saya masih memiliki kesalahan ini, objek 'DataFrame' tidak memiliki atribut 'sort' Siapapun bisa memberi saya ide .. Ini kode saya: final.loc[-1] =['', 'P','Actual'] final.index = final.index +...

python pandas numpy dataframe

99

Ganti Tidak Ada dengan NaN di pandas dataframe

Saya punya meja x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Saya ingin mengganti python None dengan pandas NaN. Saya mencoba: x.replace(to_replace=None, value=np.nan) Tapi saya mendapat: TypeError: 'regex' must be a string or a compiled regular expression or a list...

pandas dataframe replace nan nonetype

99

Ubah bingkai data panda menjadi seri

Saya agak baru mengenal panda. Saya memiliki bingkai data panda yaitu 1 baris kali 23 kolom. Saya ingin mengubahnya menjadi seri? Saya bertanya-tanya apa cara paling pythonic untuk melakukan ini? Saya sudah mencoba pd.Series(myResults)tapi mengeluh ValueError: cannot copy sequence with size 23...

python pandas dataframe series