API data / umpan tersedia sebagai paket di R

53

EDIT: Tampilan tugas Teknologi dan Layanan Web CRAN berisi daftar sumber data dan API yang jauh lebih komprehensif yang tersedia di R. Anda dapat mengirimkan permintaan tarik di github jika Anda ingin menambahkan paket ke tampilan tugas.


Saya membuat daftar berbagai umpan data yang sudah terhubung ke R atau yang mudah diatur. Inilah daftar awal paket saya, dan saya bertanya-tanya apa lagi yang saya lewatkan.

Saya mencoba membatasi daftar ini menjadi umpan / API data "waktu nyata" atau "waktu dekat", tempat data yang mendasarinya mungkin berubah di antara unduhan. Ada banyak daftar di luar sana untuk kumpulan data statis, yang hanya memerlukan satu unduhan.

Daftar ini saat ini bias terhadap data seri waktu / keuangan, dan saya bisa menggunakan beberapa bantuan untuk mengembangkannya ke domain lain.

Gratis Data:
Data Source - Paket
data historis Google Finance - quantmod
neraca Google Finance - quantmod
data historis Yahoo Finance - quantmod
data historis Yahoo Finance - tseries
Yahoo Finance pilihan saat rantai - quantmod
Yahoo Finance perkiraan analis sejarah - fImport
Yahoo Finance statistik saat kunci - fImport - tampaknya rusak
nilai tukar historis OANDA / harga logam - kuantum
indikator ekonomi makro historis FRED - kuantmod
indikator ekonomi makro historis Bank Dunia - WDI
Google Trends data volume pencarian bersejarah - RGoogleTrends
Google Docs - RGoogleDocs
Google Storage - RGoogleStorage
Twitter - Twitter
Zillow - Zillow
New York Times - RNYTimes
Sensus AS 2000 - UScensus2000
infochimps - infochimps
datamarket - rdatamarket - memerlukan akun gratis
Factual.com - factualR
alamat Geocode - RDSTK
Map mengkoordinasikan batas-batas politik - RDSTK
Weather Underground - Gulung milik Anda
Google News - Roll data
Earth Sciences Anda sendiri Data CDCD - Roll
Data Iklim Anda sendiri - Roll
data kesehatan Publik Anda sendiri - Roll
OAI Harvester Anda sendiri - Open Archives Initiative pemanen
RAmazonS3 - S3 server penyimpanan Amazon
Rflikr - Flikr api

Membutuhkan berlangganan:
Bloomberg - RBloomberg
LIM - LIM
Perdagangan dan Penawaran dari NYSE - RTAQ
Interactive Brokers - IBrokers

Zach
sumber
1
tergantung pada apa yang Anda maksud dengan 'mudah diatur' ... Saya memiliki sejumlah skrip khusus yang 'mudah disetel'
David LeBauer
2
Saat ini saya sedang mendefinisikan "pengaturan yang mudah" sebagai "paket itu ada" atau "seseorang memposting / menerbitkan fungsi untuk mengunduh data"
Zach
Saya selanjutnya akan mendefinisikan "paket-paket itu ada" sebagai "paketnya ada di CRAN" atau "paketnya ada di R Forge," "paketnya ada di repositori publik mirip-CRAN."
Zach
Tambahan: API Daftar Federal (sedang dikerjakan).
Fr.
Thread ini juga mungkin menarik: harga saham Impor dari Yahoo Finance menjadi R .
gung - Reinstate Monica

Jawaban:

8
  1. Instruksi untuk menggunakan R untuk mengunduh data netCDF dapat ditemukan di sini , format umum yang digunakan untuk menyimpan data ilmu bumi, misalnya seperti dalam data geospasial laut dari OpenEarth atau driver model iklim dan prakiraan dari UCAR

  2. rnpn (sedang dikembangkan) memungkinkan Anda untuk mendapatkan data dari National Phenology Network - proyek sains warga untuk melacak waktu penghijauan tanaman, pembungaan, dan penuaan. Lihat posting blog pengembang .

  3. -obsolete- RClimate menyediakan alat untuk mengunduh dan memanipulasi data iklim file-datar (dengan tutorial, termasuk di sini -

  4. Unduh data keuangan historis dengan tseries::get.hist.quote

  5. Dokumen Michael Samuel mengunduh data kesehatan masyarakat

  6. raster::getData menyediakan akses ke variabel iklim melalui worldclim

David
sumber
Apa itu "data netCDF?"
Zach
@Zach NetCDF adalah semacam cara terstruktur universal untuk menyimpan kumpulan data besar. Pendekatan alternatif bergantung pada format HDF5 .
chl
@ David (+1) Terima kasih banyak untuk poin keempat!
chl
Apa yang terjadi pada RClimate? Saya tidak dapat menemukan paket di mana pun
Daniel Ryback
sekarang ada perpustakaan ncdf4 di R untuk menangani netcdf4. Itu lebih rumit untuk menginstal daripada ncdf tetapi nanti sudah usang saya pikir. Beberapa tahun yang lalu saya bahkan berhasil menginstal netcdf4 dengan Min GW64 untuk membuat paket ini bekerja di windows :) jika saya melakukannya, itu berarti layak ... dan tampaknya D. Pierce (pembuat paket) menyediakan sumber di situs webnya cirrus.ucsd.edu/~pierce/ncdf
robin
8

Ada proyek yang bertujuan untuk membuat paket R dengan tujuan ini (antarmuka R ke API waktu-nyata) yang disebut rOpenSci , yang memiliki 18 paket yang saat ini tersedia atau sedang dikembangkan. Beberapa (rnpn, rfishbase) sudah ada di daftar Anda.

Daftar hebat! dan pengungkapan penuh - saya bagian dari proyek rOpenSci.

cboettig
sumber
1
  1. ONETr - interaksi yang efisien dengan O * NET ™ API, menawarkan data deskriptor pekerjaan dari Departemen Tenaga Kerja AS.
RunChiRun
sumber