Lisensi Unicode

35

Ketentuan Penggunaan Unicode menyatakan bahwa perangkat lunak apa pun yang menggunakan file data mereka (atau modifikasi dari mereka) harus membawa referensi lisensi Unicode. Menurut saya, sebagian besar pustaka Unicode memiliki fungsi untuk memeriksa apakah sebuah karakter adalah digit, huruf, simbol, dll., Dan karenanya akan berisi modifikasi File Data Unicode (biasanya dalam bentuk tabel). Apakah itu berarti lisensi berlaku dan semua aplikasi yang menggunakan perpustakaan Unicode harus membawa lisensi?

Saya telah memeriksa sekitar, dan tampaknya sangat sedikit program Unicode membawa lisensi, meskipun bisa dibilang sebagian besar yang tidak membawa lisensi berasal dari perusahaan yang menjadi anggota konsorsium Unicode (apakah mereka mendapatkan pembebasan lisensi?).

Beberapa (mis., Mozilla) hanya "Anggota Penghubung", dan sementara perangkat lunak mereka tidak membawa lisensi (sejauh yang saya tahu), mereka jelas bergantung pada data yang berasal dari file data tersebut. Apakah Mozilla melanggar lisensi?

Haruskah kita membawa lisensi di semua aplikasi yang menyertakan segala bentuk dukungan Unicode canggih (yaitu, terikat untuk bergantung pada file data Unicode)? Atau apakah ada beberapa bentuk pembebasan luas (karena sangat sedikit program di luar sana yang membawa lisensi)?


Saya telah meneruskan pertanyaan ini ke staf Unicode. Saya akan mengirim balasan di sini ketika / jika saya mendapatkannya.

Eric Grange
sumber
FWIW Firefox memiliki banyak teks lisensi di dalamnya:about:license
Thilo
1
@Thilo Ya dan tidak ada yang merujuk ke Unicode AFAICT. Fakta bahwa mereka mengakui begitu banyak, tetapi bukan yang Unicode, adalah bagian dari apa yang mendorong pertanyaan ini.
Eric Grange
1
Firefox menggunakan perpustakaan ICU. Lisensi Unicode bukan lisensi viral.
Hans Passant
1
Lisensi Unicode memengaruhi data, bukan kode, jika ICU menyertakan data, maka Firefox juga demikian. Kecuali jika Anda adalah klausa pengecualian, tetapi saya tidak dapat menemukan ...
Eric Grange

Jawaban:

21

Komentar pendahuluan: Saya bukan pengacara lagi, dan tidak pernah mengkhususkan diri dalam hukum yang terkait dengan hak cipta dan kekayaan intelektual. Jika Anda menginginkan jawaban yang tidak perlu dipertanyakan, Anda harus berkonsultasi dengan pengacara.

1. Data dan file data tidak sama

Seperti yang dinyatakan, pameran 1 mencakup file data:

DENGAN MENGUNDUH, MENGINSTAL, MENYALIN, ATAU LAINNYA MENGGUNAKAN DATA FILES UNICODE INC. [...]

File data dan data itu sendiri tidak sama. Ketika Microsoft menerapkan metode huruf besar dan kecil dalam .NET Framework, standar unicode digunakan, tetapi ini tidak berarti bahwa .NET Framework berisi, di suatu tempat, file yang diunduh dari http://www.unicode.org/

Ilustrasi sederhana perbedaan antara data dan dukungan:

Bayangkan saya membuat database dengan daftar negara, kota, dan kode pos yang sesuai. Saya mengekspos data ini melalui layanan web dan di situs web saya.

Data itu sendiri berada dalam domain publik: Anda tidak dapat secara wajar memberi hak cipta pada daftar negara dan meminta setiap orang yang menggunakan daftar tersebut untuk membayar Anda atau mendistribusikan salinan hak cipta Anda.

Di sisi lain, tidak ada yang melarang saya untuk memberlakukan lisensi terbatas pada penggunaan layanan web atau situs web (terutama karena saya menginvestasikan banyak upaya saat membuat set data ini). Jika saya menemukan bahwa suatu aplikasi sedang mengikis situs web saya untuk mengunduh data, ini akan menjadi pelanggaran hak cipta, dan saya akan dapat menuntut orang yang membuat scraper tersebut.

2. Data terlalu kabur

Jika http://www.unicode.org/ menyatakan bahwa lisensi mencakup data itu sendiri, akan sangat sulit bagi organisasi ini untuk menegakkan hak cipta tersebut.

Bayangkan metode berikut:

public char ToUpper(char c)
{
    string upper = "ABCDEFGHIJKLMNOPQRSTUVWXYZ";
    if (upper.Contains(c))
    {
        return c;
    }

    string lower = "abcdefghijklmnopqrstuvwxyz";
    if (lower.Contains(c))
    {
        return upper[lower.IndexOf(c)];
    }

    throw new OutOfRangeException();
}

Apakah ini pelanggaran hak cipta? Apakah saya benar-benar menggunakan data dari http://www.unicode.org/ dan saya harus memasukkan salinan lisensi dalam jawaban saya di bawah ini? Atau mungkin saya sendiri yang mengetiknya saja?

Dengan kata lain, jika data itu sendiri dilisensikan, sejauh mana lisensinya?

3. Hak cipta dan data

Berikut ini beberapa kutipan menarik:

http://www.lib.umich.edu/copyright/facts-and-data : University of Michigan

Hukum hak cipta tidak berlaku untuk fakta, data, atau ide. [...]

Namun, hak cipta dapat melindungi kumpulan data yang terkandung dalam database atau kompilasi, tetapi hanya jika memenuhi persyaratan tertentu. Cukup bekerja sangat keras untuk mengumpulkan data [...] tidak cukup. [...]

Agar database memenuhi syarat untuk perlindungan hak cipta, penulis harus membuat pilihan tentang pemilihan, koordinasi, atau pengaturan fakta atau data, dan pilihan itu harus setidaknya sedikit kreatif. [...]

Penting untuk diingat bahwa meskipun database atau kompilasi disusun dengan orisinalitas yang cukup untuk memenuhi syarat untuk perlindungan hak cipta, fakta-fakta dan data dalam database itu masih dalam domain publik.

http://www.ands.org.au/guides/copyright-and-data-awareness.html : Layanan Data Nasional Australia

Sebuah tabel atau kompilasi, yang terdiri dari kata-kata, gambar atau simbol (atau kombinasi dari semuanya) dilindungi jika ada

  1. sebuah karya sastra dan

  2. memiliki tingkat orisinalitas yang disyaratkan.

[...] Hak cipta berlaku bukan untuk fakta / informasi itu sendiri, tetapi dengan cara tertentu fakta / informasi disajikan dalam dataset atau database.

Dua contoh itu, satu mengenai AS, satunya lagi - Australia, jelas menunjukkan bahwa data itu sendiri, yaitu simbol unicode dengan angka masing-masing dan atribut seperti "apakah ini angka?" atau "apakah ini huruf kapital dari alfabet Cyrillic?" tidak dilindungi oleh hak cipta.

File data, di sisi lain, mungkin dilindungi oleh hak cipta, tergantung pada keasliannya. Misalnya, PDF yang Anda temukan di http://www.unicode.org/ kemungkinan besar dilindungi oleh hak cipta. Jika, di sisi lain, itu semata-mata pertanyaan dari CSV yang mengaitkan karakter huruf kecil ke huruf besar atau sebaliknya, penulis data tersebut tidak akan dapat menegakkan hak cipta di atasnya.

Jelas, ToUppermetode yang saya letakkan di atas bukanlah pelanggaran terhadap hak cipta http://www.unicode.org/ . Atau kode yang digunakan oleh .NET Framework atau Firefox, kecuali jika sistem tersebut mengandung suatu tempat di dalam file data yang jelas, tidak diragukan lagi disalin dari http://www.unicode.org/ dengan, secara opsional, beberapa perubahan kecil.

Arseni Mourzenko
sumber
1
1. Lisensi mencakup modifikasi File Data, diragukan bahwa Microsoft membuat ulang file tersebut dari awal, terutama karena file-file itu yang membuat standar yang sangat Unicode.
Eric Grange
2. Lihat PAMER 1 detail apa File Tanggal, itu tidak terlihat samar sama sekali.
Eric Grange
1
3. Data dapat dilisensikan, dan tentunya (data pemetaan, atau data penelitian, dcc.ac.uk/resources/how-guides/license-research-data )
Eric Grange
@Eric Grange: (1) ragu-ragu atau tidak, tidak ada bukti formal bahwa Microsoft menggunakan file data tersebut apa adanya. (3) Saya sepenuhnya setuju, data secara umum dapat dilisensikan. Hanya saja dalam dua kasus khusus yang saya cantumkan (yaitu nama negara dan alfabet Inggris), Anda akan kesulitan meyakinkan hakim bahwa ini adalah data Anda dan dilindungi oleh hak cipta Anda.
Arseni Mourzenko
Jawaban yang sangat bagus, dan saya akan lebih memilihnya jika saya hanya bisa memutarbalikkan "Saya bukan pengacara" (lagi).
1

File-file ini secara hukum membentuk basis data, yang berarti banyak yurisdiksi yang diperlakukan bukan sebagai karya yang memiliki hak cipta tetapi tunduk pada jenis perlindungan lainnya. Secara khusus, yurisdiksi tersebut akan mempertimbangkan upaya (kuantitatif dan / atau kualitatif) yang diperlukan untuk penyusunan basis data tersebut. Lihat misalnya Petunjuk Database Eropa .

SEBAGAI contoh, tidak ada keputusan kreatif yang terlibat dalam mendefinisikan hubungan antara huruf besar dan huruf kecil. Tabel khusus itu karenanya tidak tunduk pada hak cipta di UE, dan karena Konsorsium Unicode juga bukan Eropa, maka tidak dicakup dalam undang-undang hak basis data juga. (Tidak ada yang setara dengan perjanjian Berne untuk hak basis data)

MSalters
sumber
Halaman wikipedia yang Anda tautkan mengatakan sebaliknya: mereka dilindungi oleh hak cipta sebagai koleksi ...
Eric Grange
1
Tidak, ada perbedaan eksplisit yang dibuat. Sesuai wiki, "Perlindungan hak cipta tidak tersedia untuk database yang bertujuan untuk menjadi complete". Dan dari unicode.org, "Unicode memberikan nomor unik untuk everykarakter". Koleksi dilindungi oleh hak cipta ketika itu adalah pilihan kreatif. Misalnya ASCII, karena pilihan 127 karakter paling berguna dalam bahasa Inggris, setidaknya menurut penciptanya.
MSalters