Saya mencoba mengekstrak file csv dan menyebarkannya ke panda sehingga saya dapat mengerjakan file tersebut.
Kode yang saya coba sejauh ini adalah:
import requests, zipfile, StringIO
r = requests.get('http://data.octo.dc.gov/feeds/crime_incidents/archive/crime_incidents_2013_CSV.zip')
z = zipfile.ZipFile(StringIO.StringIO(r.content))
crime2013 = pandas.read_csv(z.read('crime_incidents_2013_CSV.csv'))
Setelah baris terakhir, meskipun python bisa mendapatkan file tersebut, saya mendapatkan "tidak ada" di akhir kesalahan.
Dapatkah seseorang memberi tahu saya apa yang saya lakukan dengan tidak benar?
quotechar
?.tar.gz
file, tetapi mungkin hanya berfungsi dengan.gz
file.Saya pikir Anda ingin
open
ZipFile, yang mengembalikan objek seperti file, daripadaread
:sumber
pd.read_csv(z.open('crime_incidents_2013_CSV.csv'), parse_dates=['REPORTDATETIME', 'LASTMODIFIEDDATE'])
pd.read_csv(z.open(z.infolist()[0].filename))
Sepertinya Anda bahkan tidak perlu menentukan kompresi lagi. Potongan berikut memuat data dari filename.zip ke df.
(Tentu saja Anda perlu menentukan pemisah, tajuk, dll. Jika berbeda dari default.)
sumber
Untuk file " zip ", Anda dapat menggunakan
import zipfile
dan kode Anda akan berfungsi hanya dengan baris berikut:Dan hasilnya adalah:
sumber
https://www.kaggle.com/jboysen/quick-gz-pandas-tutorial
Silakan ikuti tautan ini.
sumber