Saya menemukan situs web yang menyediakan tabel besar yang dapat difilter dengan data terbaru tentang kota di suatu negara. Situs ini menggunakan pendekatan gulir tak terbatas untuk memuat baris untuk tabel.
Dengan menjelajahi situs menggunakan Alat Pengembang Chrome, saya menemukan itu membuat permintaan AJAX ke beberapa URL internal untuk mendapatkan data. URL ini mencakup banyak parameter kueri yang sesuai dengan filter.
Saya mencoba mengakses URL itu langsung di browser saya dan saya mendapatkan semua data dalam format JSON yang bagus. Saya bahkan dapat bermain-main dengan filter untuk mendapatkan data konkret yang saya butuhkan. URL ini sebenarnya dapat diakses, jadi saya tidak perlu melakukan apa pun hacky , saya hanya memanggil URL yang ada di internet.
Jadi pertanyaan saya adalah: seberapa legal atau ilegal bagi saya untuk menggunakan URL itu untuk mengambil data untuk keperluan saya sendiri?
Catatan : Saya tidak ingin membuat daftar kota yang sama , tetapi saya ingin menggunakan data itu untuk membuat game online kecil, yang berpotensi menghasilkan sedikit uang ...
PENTING Catatan tentang beberapa tanggapan dan komentar
Ini hanya contoh skenario, saya tidak mencari tempat untuk mengambil data tentang kota. Pertimbangkan situs web dengan data tentang kinerja pemain sepakbola yang diperbarui dalam satu musim jika Anda mau.
Adapun negara konkret, sekali lagi, saya tidak berpikir dalam undang-undang tertentu, jika Anda tahu negara di mana jelas (il) legal, itu akan menjadi info berguna.
Jawaban:
Biarkan saya jelas. Ada satu hal yang saya tahu cukup baik, yaitu hukum hak cipta. Saya bukan pengacara, namun, pengetahuan tentang hak cipta adalah persyaratan konstan konsultasi saya selama 30 tahun. Sebagai bonus tambahan, saya berkonsultasi terutama dengan telekomunikasi dan sering bekerja dengan data pelanggan dan analisis data dan penyajian data tersebut untuk dijual dan digunakan kembali. Saya setidaknya, memiliki kualifikasi unik untuk menjawab pertanyaan ini di forum ini.
Saya akan menjelaskan ini yang terbaik yang saya bisa dengan: satu, mendefinisikan ayat-ayat eksklusif dengan cara biasa; dua, mendefinisikan pengecualian kasus yang dikutip dan pertimbangan hak cipta terkait lainnya; dan tiga, jelas pada jawabannya.
Izinkan saya mengklarifikasi beberapa hak cipta. Contoh buku telepon adalah nama yang salah. Ketika Anda mendapatkan telepon, Anda telah menandatangani perjanjian kontrak pribadi sebagai warga negara dengan perusahaan swasta dan informasi yang dihasilkan, dipublikasikan atau tidak, adalah data hak milik pribadi dan oleh karena itu isi buku telepon adalah hak milik (perhatikan kata ini) hanya karena itu tidak dapat diperoleh secara umum melalui cara lain kecuali melalui sumber data perusahaan - data pelanggan. Jika data dapat diperoleh melalui cara biasa, seperti berjalan-jalan dan menuliskan nomor rumah dan nama jalan, maka itu adalah data yang tersedia untuk umum dan jelas untuk digunakan. Ini tidak berarti bahwa nomor telepon tidak dapat diperoleh melalui cara biasa. Itu bisa saja.
Untuk memperjelas lebih lanjut. Mengutip dari: http://www.lib.umich.edu/copyright/facts-and-data
Paragraf ini menyesatkan. Pengecualian ini dijelaskan dalam paragraf ini dilindungi oleh paten dan hukum lainnya. Hak cipta hanya mencakup penciptaan karya.
Itu:
... mengacu pada aktivitas apa pun seperti pergi dari rumah ke rumah dan mengumpulkan data secara manual. Ini adalah definisi cara biasa. Dimungkinkan untuk mengetuk pintu dan meminta data telepon yang sama. Hanya sebanyak yang Anda bisa mengumpulkan fakta dengan cara biasa adalah data atau bagian dari data milik publik.
Cara biasa menggunakan data telepon adalah dengan: satu, memperoleh data asli melalui cara hukum; dan dua, terapkan doktrin penggunaan yang adil. Ini akan memerlukan mendapatkan salinan buku telepon langsung dari perusahaan yang mungkin gratis atau dengan biaya, dan mengatur fakta-fakta dengan cara yang berbeda untuk menciptakan karya baru. Sudahkah Anda mencoba untuk mendapatkan buku telepon Seattle ketika Anda berada di Chicago? Anda akan menemukan bahwa perusahaan telepon kemungkinan akan membebankan biaya mengejutkan untuk Anda. Namun, jika Anda adalah pelanggan telepon di Seattle dan Anda meminta buku telepon Seattle, biayanya akan jauh lebih sedikit atau bahkan gratis. Saya harus melakukan ini berkali-kali. Ada orang yang pekerjaannya hanya untuk mendapatkan buku telepon dari perusahaan telekomunikasi secara langsung dan membayar biaya jika diperlukan.
Putusan tersebut dikutip dalam kasus Feist Publications v. Rural Telephonedalam tautan di atas (dalam jawaban ini) bergantung pada dua fakta: satu, yaitu bahwa data oleh operator koperasi pedesaan sebagai monopoli lokal harus disediakan untuk publik melalui perjanjian operasional; dan kedua, bahwa penyajian karya tersebut memiliki hak cipta dan bukan fakta yang terkandung di dalam karena fakta # 1. Oleh karena itu, hanya dalam parameter yang sempit kasus ini dapat dianggap sebagai kasus yang mendahului dan harus dibuang. Biasanya, data pelanggan perusahaan swasta tidak diharuskan oleh perjanjian untuk dipublikasikan. Anda harus ingat bahwa koperasi pedesaan didirikan sebagai perwalian / entitas publik untuk barang publik dan dimiliki oleh publik dan / atau anggota koperasi dan karena itu beroperasi di bawah batasan hukum yang memungkinkannya untuk disetujui untuk beroperasi atau ada. Setiap kasing berbeda.
Pada hari-hari awal perusahaan Bell Telephone, perusahaan diharuskan sebagai monopoli untuk membuat data telepon publik kecuali dibatasi oleh pelanggan. Ketika perusahaan Bell dipecah menjadi bayi Bells, Bell Atlantic, Bell South, dan sebagainya, perusahaan-perusahaan ini masih diperlukan sebagai monopoli untuk membuat data telepon publik seperti yang didefinisikan sebelumnya. Tetapi dengan deregulasi dan memang dengan VoIP, seluler, dan opsi lain, monopoli jarang terjadi. Hanya dalam skenario monopoli argumen yang dikutip di atas dapat dibuat.
Terus mengutip tautan di atas (dalam jawaban ini):
Ingatlah ini.
Setiap dataset yang diberikan dan presentasi di sana, terlepas dari asal data, adalah sebuah karya tersendiri. Presentasi publik tentang fakta-fakta, terlepas dari caranya, adalah pekerjaan tersendiri.
Mengingat bahwa Anda tidak memperoleh data melalui cara biasa, meskipun data tersebut dipublikasikan, dan terlepas dari asal mula data tersebut, itu tidak bebas untuk digunakan seperti yang Anda gambarkan dan Anda dapat dituntut secara kriminal dan secara sipil bertanggung jawab atas potensi pelanggaran hak cipta juga karena pelanggaran pidana dan penggunaan komputer dan peralatan komunikasi ilegal yang biasanya tidak diotorisasi dan dapat jatuh di bawah undang-undang RICO.
Apakah legal untuk digunakan? Tidak! Benar-benar tidak! Itu tidak diperoleh melalui cara biasa juga tidak mungkin maksud dari operator situs web untuk mengekspos data kepemilikan. Tidak adanya AUP (kebijakan penggunaan yang dapat diterima) tidak akan membantu Anda. Ada asumsi yang dibuat di bawah hukum tentang "orang yang masuk akal", "standar yang masuk akal", dan "asumsi yang masuk akal" yang melindungi pemilik situs web dalam kasus ini. Tidak masuk akal bahwa orang pintar akan menggunakan "kerentanan dalam desain / pembuatan" situs web untuk mendapatkan data untuk penggunaan lain. Selain itu, jika situs mendapat untung dari aktivitasnya, perlindungan lebih lanjut ikut berperan.
sumber
robots.txt
itu tidak membatasi URL, dan pertanyaan darinya tersedia di berbagai mesin pencari, apakah itu akan memengaruhi analisis Anda? Dengan JSON saya telah melihat lebih mudah dibaca daripada XML "yang bisa dibaca manusia" yang dipuji-puji (tetapi mereka mengatakan! ? Pada browser yang memiliki salah satu ekstensi yang mudah dilihat JSON diinstal, mengklik tautan dan melihat data akan sepele. Dan saya membayangkan tambahan auto-JSON-REST-query-field-search tidak jauh di belakang ...Satu hal yang tampaknya tidak begitu jelas dalam jawaban lain di sini ...
Apakah itu "legal" atau tidak, pertama dan terutama, tergantung pada negara. Jika kita berbicara tentang Amerika Serikat, misalnya, maka menggunakan data itu sendiri tidak ilegal. Namun, saya menyarankan Anda untuk menggunakan data nyata dari Sensus AS. Mereka menawarkan banyak data melalui apa yang mereka sebut produk TIGER. Kumpulan data ini adalah kumpulan data yang sama yang digunakan oleh profesional GIS untuk mengisi peta Bing, peta Google, dll.
Namun, sementara data mungkin tersedia secara bebas, itu tidak berarti bahwa data dari API yang terbuka ini tersedia secara hukum. Anda mengatakan itu dalam bentuk JSON, yang menyarankannya telah 'dipijat' dari format aslinya ke dalam format ini - dan format khusus itu dapat berada di bawah kekayaan intelektual. Bahwa, Saya percaya, akan ilegal untuk digunakan kecuali Anda memiliki lisensi untuk menggunakannya. Seperti orang lain di sini, saya bukan pengacara, tetapi perusahaan itu bahkan tidak perlu menunjukkan kepada Anda dan menyebut Anda seorang peretas. Data hak milik adalah data hak milik, meskipun itu diberikan secara tidak sengaja. Anda harus menghubungi perusahaan dan memberi tahu mereka semua data ini terekspos ke dunia luar, dan meminta izin untuk menggunakannya. Tanpa melakukan itu, dan dengan mengajukan pertanyaan tentang pertukaran tumpukan ini sebagai bukti, akan mudah untuk membangun kasus melawan Anda. Anda pada dasarnya berkata, "Ini tidak terlihat sah, tetapi saya tetap menyukainya dan saya ingin mendapat uang darinya." Sekali lagi, saya bukan pengacara, tapi itu sepertinya bukan cara yang bagus untuk memulai persidangan.
Masalahnya adalah, jika Anda tertarik pada nama kota dan data geografis lainnya, hampir semuanya tersedia secara bebas, terlepas dari negara. Terakhir saya tahu, AS menerbitkan sebagian besar data, tetapi ada data di luar sana untuk hampir setiap negara. Saya ragu untuk mengatakan semuanya hanya karena saya seorang programmer dan membuktikan pernyataan "untuk semua" itu sulit ... jika Anda memilih negara yang sewenang-wenang, kemungkinannya lebih baik daripada baiknya bahwa datanya ada di luar sana. Jika Anda memiliki negara tertentu, kepala ke GIS Stack Exchange . Hal utama yang Anda cari disebut "shapefile", jadi ajukan pertanyaan seperti "Di mana saya bisa mendapatkan shapefile untuk __________?" Ada juga OpenStreetMapyang merupakan peta sumber terbuka. Saya tidak yakin betapa mudahnya untuk mendapatkan data shapefile mereka, tetapi jika Anda bisa mendapatkannya dari mereka (dan saya tidak melihat mengapa Anda tidak bisa, Anda dapat menjalankan peta offline berdasarkan lokal informasi yang disimpan), maka Anda memiliki semua data yang Anda butuhkan dan Anda berada di tempat yang jelas secara hukum. Anda harus menghabiskan waktu memijat data dalam jumlah besar hingga yang Anda inginkan, tetapi shapefile selalu didefinisikan dengan sangat baik dan mudah diurai.
sumber
Sementara closetnoc telah membahas masalah data itu sendiri, ada masalah hukum yang lebih besar: Anda tidak berwenang mengakses API yang menawarkan data.
Baseline untuk sebagian besar undang-undang kejahatan komputer melibatkan gagasan "akses tidak sah ke sistem komputer". Anda tidak boleh bingung dengan referensi ini untuk otorisasi dalam arti hukum dengan konsep otorisasi ketika datang ke kontrol akses. Pemilik sistem tidak harus mengamankan sistemnya agar aksesnya menjadi ilegal, sama seperti Anda masih masuk tanpa izin saat memasuki rumah dengan pintu yang tidak terkunci.
Dalam hal ini kurangnya keamanan yang jelas tidak menyiratkan otorisasi untuk menggunakannya. Konsep internet memiliki sedikit preseden sejauh ini dalam hukum kasus tetapi Anda dapat membayangkan penggunaan protokol HTTP 80 untuk menyiratkan otorisasi publik untuk melihat situs web. Sebaliknya, protokol RPC latar belakang (bahkan jika protokol tersebut dapat berjalan pada permintaan HTTP) biasanya tidak dipahami tersedia untuk umum kecuali jika operator menerbitkan layanan seperti itu, memberikan otorisasi untuk digunakan kepada pihak ketiga.
Jadi penggunaan API yang sedang berlangsung untuk mengambil data akan ilegal. Tindakan mengambil dump data dari API untuk membangun dataset Anda sendiri juga akan ilegal. Apakah penggunaan data setelah itu ilegal adalah area abu-abu raksasa, tetapi closetnoc telah membahas sebagian besar kekhawatiran.
Tentu saja jika Anda memodifikasi dump data setelah fakta tidak dapat dikenali, hampir tidak mungkin untuk membuktikan bahwa Anda melakukan kejahatan. Tetapi jika Anda akan banyak kesulitan mengapa tidak sumber data dari sumber yang sah saja?
sumber
Mungkin tergantung pada sifat data. Data murni (pikirkan direktori telepon) tidak dapat dilindungi hak cipta . Jadi daftar kota dari API harus merupakan permainan yang adil untuk disalin dan ditampilkan kepada pengguna. Namun, jika API memiliki deskripsi kota, deskripsi tersebut akan berada di bawah undang-undang hak cipta dan Anda tidak akan dapat menggunakannya tanpa melanggar hak cipta.
Jika Anda dapat menyalin data secara legal, saya akan merekomendasikan menyalinnya ke situs Anda sendiri untuk mencegah penggunaan API Anda dimatikan sebelum waktunya.
sumber
(IANAL, dan hukum dan norma sangat bervariasi di seluruh dunia, tetapi hal-hal tertentu cenderung tetap konsisten karena perjanjian IP. Jika Anda memiliki masalah profesional di luar spesialisasi Anda, konsultasikan dengan profesional.)
Secara umum, secara hukum, API tidak dianggap "ditujukan untuk konsumsi publik" kecuali jika secara aktif didokumentasikan sebagai API publik, dengan ketentuan layanan yang ditentukan. Fakta bahwa publik dapat mencapai API tidak menjadikannya publik.
Dalam kasus-kasus di mana status data itu sendiri bukan domain publik, dan dalam beberapa kasus di mana itu jelas merupakan domain publik, maksud entitas yang menyediakan API sangat penting. Jika operator situs web yang dimaksudkan API yang akan digunakan untuk memberi makan halaman web dinamis, atau aplikasi mobile (untuk nama dua contoh umum) setiap penggunaan lain adalah "tidak sah" kecuali suatu tempat khusus berwenang. Jika konsumen yang dimaksud adalah potongan kode dinamis di halaman web tertentu, untuk tujuan menempatkan piksel yang dapat dipahami manusia pada tampilan dalam cara yang spesifik, mudah-mudahan menyenangkan dan bermanfaat, setiap penggunaan lainnya tidak sah.
Kemampuan teknis untuk memasuki gedung melalui jendela terbuka tanpa membuka atau menghancurkan apa pun tidak akan melindungi Anda dari penangkapan karena pelanggaran pidana ...
Juga, hampir tidak pernah bijaksana untuk bermain "kemampuan teknis" vs game "niat asli" dengan pengacara kekayaan intelektual. Jika tidak ada yang lain, ingatlah bahwa pengacara yang secara konsisten kehilangan kasus-kasus itu tidak terus mendapatkan bayaran untuk mereka.
sumber
Apa yang Anda bicarakan kemungkinan bagus. Anda hyperlink ke informasi kemudian mengubahnya.
Tekankan milikku. linky
Anda hanya menggunakan hyperlink, Anda tidak membuat salinan, Anda tidak menampilkan salinan, Anda tidak merugikan kepentingan bisnis, dan Anda sangat mengubahnya. Saya katakan Anda memiliki setiap elemen yang dibutuhkan untuk menjadi baik. Tapi, IANAL.
sumber
Itu legal selama Anda tidak harus memasukkan kata sandi untuk mendapatkannya, tetapi beberapa perusahaan yang kurang canggih mungkin mengklaim peretasan dan meminta pengacara untuk Anda. Anda harus siap untuk membela diri. Anda akan didapati tidak bersalah, karena mereka mempublikasikan data mereka kepada publik, tetapi mungkin perlu biaya untuk membela diri. Jaksa dan polisi tunduk pada perusahaan. Ini sering terjadi dalam pemberitahuan keamanan, di mana seseorang akan memberi tahu perusahaan tentang lubang keamanan maka perusahaan akan menagih mereka dengan peretasan. Perusahaan juga bebas mengubah API tanpa pemberitahuan, mungkin merusak aplikasi Anda.
http://www.extremetech.com/computing/146323-canadian-college-expels-student-for-white-hat-security-probing
http://www.bostonglobe.com/metro/2014/03/29/the-inside-story-mit-and-aaron-swartz/YvJZ5P6VHaPJusReuaN7SI/story.html
sumber