Di mana saya bisa mendapatkan data mentah publik gratis? [Tutup]

26

Dalam pengembangan web, mashup adalah halaman web atau aplikasi yang menggunakan dan menggabungkan data , presentasi, atau fungsionalitas dari dua sumber atau lebih untuk membuat layanan baru.

Ada banyak sumber untuk mendapatkan data (informasi mentah). Pemerintah adalah contoh yang baik.
Namun banyak dari biaya tersebut dan memiliki perizinan yang rumit. Misalnya SMHI di Swedia menjual data suhu sementara negara tetangga kami Norwegia memberikannya secara gratis.

Orang akan mengatakan aplikasi apa yang Anda bangun dan data apa yang Anda butuhkan? Saya akan mengatakan memberi saya beberapa data menarik dan saya akan melakukan penyatuan yang baik. Saya bisa saja memplotnya di Google maps misalnya.

Jadi pertanyaannya adalah: Di mana saya bisa mendapatkan data gratis?

Catatan: Saya tidak tertarik dalam penambangan data menggunakan webcrawler!

Silakan bagikan sumber Anda dengan saya.

Amir Rezaei
sumber
Jenis data apa yang Anda cari? Adakah data yang bisa Anda dapatkan secara gratis?
Jetti
Data apa pun yang dapat memiliki arti bagi sejumlah besar orang.
Amir Rezaei
1
Bagaimana dengan odata.stackexchange.com ?
ChrisF
@ ChrisF: "Halaman ini berisi kesalahan berikut: kesalahan pada baris 2 di kolom 29: Karakter 0x0 di luar rentang yang diizinkan Di bawah ini adalah rendering halaman hingga kesalahan pertama." Saat mengklik tautan odata.
Chris
@ Chris - Ini berfungsi baik untuk saya, tetapi jika Anda punya kasus berulang, laporkan masalahnya ke tim di MSO. Saya hanya seorang moderator;)
ChrisF

Jawaban:

11

Untuk informasi umum, tempat yang baik untuk memulai mungkin adalah halaman Data Terbuka Wikipedia - khususnya bagian bawah halaman ( Organisasi yang mempromosikan data terbuka , Lihat juga , dan Tautan Eksternal )

Saya akan mengubah sisa posting ini menjadi daftar sumber data untuk data berbasis negara dan regional ... tetapi Surat Kabar Guardian UK telah pergi dan menyusun Penyimpanan Data Pemerintah Dunia sehingga tidak ada gunanya menduplikasi upaya, sebagai gantinya saya ' saya hanya akan menunjuk ke ...

guardian.co.uk/world-government-data

... untuk katalog banyak Inisiatif Data Terbuka tingkat negara dan kota yang berbeda.
(Ini bukan berbasis di Inggris, meskipun tampaknya berfokus pada negara-negara berbahasa Inggris.)

Pada saat pengeditan, ini berisi data untuk Inggris, AS, Australia, Kanada, Selandia Baru, dan Basque Spanyol.

Satu hal yang tidak terdaftar di sana tetapi layak disebutkan adalah data pemetaan Ordnance Survey UK .

Peter Boughton
sumber
The Guardian juga terbiasa menyediakan data yang sering kali dirujuk dalam kisah mereka.
Jon Hopkins
6

Ada data di semua tempat dari setiap jenis. Pendekatan terbaik adalah mencari tahu jenis data apa yang Anda butuhkan, menemukan situs web yang memilikinya, dan melihat apakah situs tersebut menawarkan API. Namun, berikut adalah beberapa sumber umum:

Yevgeniy Brikman
sumber
3

Untuk katalog komprehensif data pemerintah AS dan format yang didukung, lihat di sini: http://www.data.gov/

Robert Harvey
sumber
3

Kota New York memiliki sejumlah feed data transit MTA gratis .

Ada juga banyak set data publik menarik lainnya di NYC seperti data inspeksi kesehatan restoran.

realworldcoder
sumber
3

Seseorang mengajukan pertanyaan yang hampir sama pada Reddit Compsci beberapa waktu lalu ... inilah yang harus saya katakan saat itu . Saya pikir semuanya masih berdiri.

Melihat-lihat beberapa situs ini, saya cukup yakin ada sesuatu di sana untuk menarik minat Anda.

Bergantung pada apa yang Anda coba lakukan, ada banyak sekali set data di luar sana. Salah satu yang menyenangkan untuk dimainkan, tetapi mungkin atau mungkin tidak relevan bagi Anda, adalah Enron Email Dataset . Ini adalah hasil dari BANYAK email internal perusahaan Enron yang dipanggil dan dirilis ke publik selama skandal besar Enron .

Dan jika Anda tidak dapat menemukan data yang Anda inginkan, jangan anggap remeh kemungkinan menulis crawler / scraper Anda sendiri. Bergantung pada data apa yang Anda inginkan, mungkin cukup mudah untuk hanya menjelajah web untuk dataset Anda sendiri. Ada berbagai macam alat - dari wget hingga apache droid - untuk membantu Anda mengambil informasi secara terprogram.

mindcrime
sumber
2

Data Air

Anda dapat menggunakan NOAA untuk mengambil data dalam jumlah besar untuk dimainkan. Saya telah menggunakannya beberapa kali dan API tidak setengah buruk. Jika Anda tidak peduli tentang apa dan seberapa banyak ke mana saya akan pergi.

Josh K.
sumber
0

Windows Azure Marketplace - meskipun sampai sekarang, sebagian besar sumber data mengatakan 'segera hadir'

Jason w
sumber