Apa pro dan kontra dari berbagai format data (kinerja, ukuran file, dll.) Ketika mempertimbangkan distribusi data terbuka?
Organisasi kami ingin menerbitkan data sebagai data terbuka. Namun, tidak ada ide yang jelas tentang format data yang digunakan. Tentu saja, semakin 'terbuka' format data, semakin mudah digunakan.
Format data mana yang paling 'terbuka' dan karena itu paling dapat digunakan untuk distribusi Data Terbuka ketika mempertimbangkan jenis-jenis berikut ?:
- data raster (saya berpikir: GeoTIFF, Erdas Imagine IMG?)
- data vektor (saya berpikir: GML, CSV, ESRI Shapefile, DXF?)
- data tabular (saya berpikir: CSV?)
- Data 3D (saya berpikir: CityGML?)
- Titik 3D bisa / LIDAR (Saya berpikir: LAS?)
- Apakah saya lupa sesuatu di sini?
Juga, jika ada dokumentasi tentang format data terbuka, saya sangat tertarik jika Anda ingin berbagi.
data
file-formats
Mark Verschuur
sumber
sumber
Jawaban:
Inisiatif data terbuka kota Wina ( http://data.wien.gv.at ) menggunakan Geoserver untuk menyediakan akses ke raster dan vektor geodata melalui Geoserver WMS dan layanan WFS . Ini memiliki banyak keuntungan: Pengguna dapat mengunduh data dalam berbagai format untuk penggunaan offline (mis. Geojson, KML, atau Shapefile yang di-zip) atau menggunakan layanan langsung dengan menyematkannya di peta online atau proyek GIS.
sumber
Untuk csv tabular. Excel sangat rumit dan paling buruk benar-benar tidak dapat diakses. Akses tidak dapat diakses dan PDF adalah tamparan di wajah.
Untuk penggunaan geospasial geojson, teksnya didukung dengan baik dan tidak memiliki batasan teknis yang hanya dimiliki oleh format lainnya (shapefile). Juga, kecuali Anda memiliki alasan yang sangat baik, itu harus dalam WGS84, mengingat bahwa sebagian besar pengguna akan berada di negara bagian lain dan tidak akan menginginkan pesawat negara.
sumber
Saya cukup suka NetCDF untuk data kontinu / array (yaitu raster). Kelebihan untuk NetCDF adalah:
Satu-satunya downside ke NetCDF4 yang bisa saya lihat adalah dukungan yang tidak terlalu bagus dalam paket GIS standar seperti ArcGIS dan QGIS (meskipun saya sangat ingin diperbaiki tentang ini!).
EDIT Beberapa paket lain yang mendukung NetCDF
Beberapa bahasa pemrograman standar yang mendukung NetCDF (meskipun harus adil, apa pun yang dapat membaca HDF dapat membaca NetCDF4):
Untuk pengguna matematika dan statistik yang Anda miliki:
Khususnya di GIS:
Jika Anda ingin dengan cepat melihat file NetCDF saya akan menggunakan Panoply lintas-platform dari NASA. Dan jika Anda tertarik lebih banyak, UCAR Unidata memiliki daftar perangkat lunak .
sumber
Saya akan mengatakan:
Format-format ini mudah dibaca oleh Perangkat Lunak Open Source dan mudah ditransformasikan ke format lain yang diperlukan untuk aplikasi tertentu.
Juga memberi +1 untuk membuat data terbuka!
sumber
Sebenarnya pertanyaan yang sama persis ini muncul di opendata.SE: Format apa yang paling berguna untuk mengeluarkan data geospasial?
Jadi, mudah-mudahan saya tidak melanggar kebijakan apa pun dalam mengutip jawaban saya sendiri di sana:
Pengalaman saya, membuat peta dari beberapa set data pemerintah:
Untuk data titik, CSV adalah yang terbaik, dengan kolom "lat" dan "lon". Sangat mudah untuk dikerjakan dengan berbagai alat, termasuk editor teks, spreadsheet, dll. Ada dua kelemahan:
.vrt
file pendamping.lat
danlon
tidak sepenuhnya standar. Banyak alat yang cukup liberal dalam apa yang mereka terima.Untuk garis dan poligon, dalam urutan preferensi yang menurun:
Jujur saja, jawaban terbaik mungkin adalah "mereka semua". Bantu semua orang dan lepaskan data dalam CSV (jika ada), GeoJSON, zip Shapefile dan KMZ.
sumber