Apakah bisa mengunggah konten ofensif ke GitHub? [Tutup]

12

Saya mengembangkan pemeriksa konten ofensif untuk situs web saya dan ingin menerbitkannya di GitHub . Namun, kode sumber berisi banyak konten yang menyinggung, rasis, dan tidak menyenangkan.

Sumber sepenuhnya didokumentasikan, tetapi saya ingin pendapat Anda tentang apakah dapat diterima untuk menerbitkan karya seperti itu di GitHub atau apakah akan membiarkan serangkaian string sesuai dengan imajinasi pembaca ?!

SimonGoldstone.com
sumber
11
Pertanyaan kuncinya adalah "apakah ini benar-benar ofensif? Atau hanya 'kamus'?" yang masuk ke TOS github - §7 menunjukkan bahwa mereka dapat (tetapi tidak berkewajiban untuk) menghapusnya. Anda mungkin ingin agar string diekstraksi ke file lain, yang kemudian dienkripsi rot13 atau semacamnya untuk menghindari menyinggung browser sebab-akibat.
1
Saya kira tidak apa-apa, hanya memperingatkan pembaca yang mungkin di Readme, ada banyak kata-kata ofensif di Repos GitHub lainnya. Plus, kasus Anda adalah niat baik.
jacktrades
5
Mengapa tidak memasukkan semua kata ke dalam file teks atau database dan memuatnya saat runtime. Kemudian letakkan sangkalan kecil yang menyenangkan di bagian atas file bahwa teks di bawah ini bukan untuk orang yang lemah hati. Kode Anda bersih, dan Anda dapat menggunakan file teks yang berbeda untuk situasi yang berbeda?
Sekitar
@ Particus terima kasih atas komentar Anda. Saya setuju dan berpikir itu mungkin pendekatan terbaik bagi saya.
SimonGoldstone.com
5
Sepatah kata saja tidak menyinggung. Niat di baliknya membuatnya ofensif.
kaptan

Jawaban:

45

Saya harus tidak setuju dengan solusi ROT-13. Mengaburkan kata-kata terlarang Anda hanya karena melihatnya mungkin menyinggung seseorang adalah buang-buang waktu.

Kamus kata-kata buruk / buruk-aturan kata Anda harus berasal dari file yang terpisah (yang dapat dimuat saat runtime, atau disematkan sebagai sumber daya) . Mengaburkan file ini hanya membuatnya lebih sulit bagi Anda / pengembang lain / pengguna Anda untuk mengubahnya, atau memperbaiki masalah apa pun. Selain itu, jika saya melihat file bernama "banned_words.txt" di hard-drive saya, saya berharap file itu berisi daftar kata-kata yang tidak sopan.

BlueRaja - Danny Pflughoeft
sumber
Saya setuju. Saya tidak ingin mengaburkan kata-kata.
SimonGoldstone.com
5
+1 @simon Daftar tersebut sudah muncul: github.com/snipe/banbuilder
dcaswell
2
@simon Saya tidak bermaksud bahwa proyek Anda tidak berharga, hanya saja github memungkinkan orang untuk menyimpan daftar seperti yang Anda inginkan. Jawaban yang lain tidak memiliki ya atau tidak, saya hanya ingin mengkonfirmasi kepada Anda bahwa jawabannya sebenarnya Ya.
dcaswell
1
"menciptakan kembali roda" adalah bagian dari pembelajaran ... sebagian besar dari apa yang diajarkan di Perguruan Tinggi.
WernerCD
2
Kadang-kadang Anda bertemu dengan orang-orang dengan ... bagaimana kita mengatakan ... perasaan halus yang mungkin memiliki pengaruh apakah distribusi program tetap atau berjalan. Jika rot13ing file berarti tetap, itu membantu OP mencapai tujuannya agar kodenya aktif dan tetap di GitHub. Itu bukan buang-buang waktu di buku saya.
Blrfl
16

"Semua masalah dalam ilmu komputer dapat diselesaikan dengan tingkat tipuan lainnya." ( oleh David Wheeler ).

Pilihan Anda tidak terbatas pada mengunggahnya atau tidak, jika Anda mempertimbangkan bahwa Anda dapat menyandikan konten sehingga tidak akan mengganggu pembaca.

  • Sebagai contoh, cukup beralih ke huruf berikutnya (A ke B, B ke C, dll., Dengan Z beralih ke A untuk menyelesaikan pengkodean) dapat mengubah empat kata huruf terkenal menjadi Gvdl yang sama sekali tidak berbahaya . Yang Anda perlukan untuk menggunakannya dalam aplikasi adalah menggesernya kembali ke arah yang berlawanan, ke huruf sebelumnya , dengan A bergeser ke Z.

Seperti yang ditunjukkan dalam komentar , pendekatan seperti di atas digunakan dalam sandi substitusi surat ROT13 , yang dikenal karena penggunaannya "sebagai sarana untuk menyembunyikan ... bahan ofensif dari pandangan sepintas ..."

 

http://upload.wikimedia.org/wikipedia/commons/thumb/3/33/ROT13_table_with_example.svg/320px-ROT13_table_with_example.svg.png


Demi kelengkapan, pertimbangkan juga menjalankan pemeriksa Anda terhadap kamus yang disandikan , untuk memastikan bahwa penyandian yang dipilih tidak secara tidak sengaja mengubah satu kata ofensif menjadi yang lain.

Saat menyandikan hal-hal seperti itu, masuk akal untuk memeriksa ulang, karena orang tidak dapat memprediksi hal dengan andal. Dalam salah satu proyek saya di masa lalu, kami mengalami pemadaman surat yang cukup parah ketika pemeriksa yang salah konfigurasi mulai menemukan konten ofensif dalam urutan karakter acak (dalam konten yang di- uuencoded dari arsip ZIP).


Dibandingkan dengan membagikan teks biasa, Gvdl , enkode memiliki manfaat besar untuk sepenuhnya menghindari masalah hukum dan semua risiko serta dependensi yang terlibat .

Pikirkan saja itu. Katakanlah, persyaratan layanan tertentu di repositori tertentu memungkinkan konten saya, baik.

Tapi, bagaimana jika mereka memutuskan untuk mengubah TOS ? Atau, bagaimana jika saya memutuskan untuk berubah ke repositori lain, memiliki ketentuan yang tidak kompatibel. Apa yang akan aku lakukan?

Perhatikan bahwa bahkan di repositori "ramah", di sini dan sekarang, masih belum sepenuhnya aman.

Bagaimana jika seseorang tidak dapat mengunduh konten saya karena filter web yang aneh ? Apakah saya bersedia menanggapi keluhan pengguna dan menjelaskan cara memperbaiki filter? Filter mereka ...

... Anda lihat, saya lebih suka berpikir dua kali sebelum saya memutuskan menentang pengkodean. Dan bahkan jika saya memutuskan, saya akan memastikan bahwa saya memiliki alasan yang sangat, sangat bagus untuk itu.

agas
sumber
6
Rot13 adalah semacam standar de facto untuk itu. Rot13 ganda bahkan lebih baik. :-)
Blrfl
5
@ Bllfl seperti DES tiga lebih baik dari DES, triple rot13 adalah cara untuk pergi.
1
Saya pikir ada plugin untuk banyak editor yang membuat pengeditan file rot13 tidak lebih sulit daripada mengedit file lain yang dalam format khusus
JoelFan
2
@Simon tidak begitu banyak sehingga rot13 adalah kekaburan - melainkan hanya cara standar untuk menyembunyikan teks secara sepele. Sadarilah bahwa beberapa firewall mungkin dikonfigurasikan untuk memblokir pola karakter tertentu sehingga sulit untuk mendapatkan teks Anda untuk fungsionalitas program. Ini bukan kelemahannya yang mungkin menjadi masalah, tetapi rintangan teknologi lainnya yang mungkin tidak menyadari perbedaan antara "sesuatu yang ingin Anda unduh" dan "sesuatu yang ingin Anda blokir". Ya, mereka bisa mendapatkan zip, tetapi mereka tidak akan bisa mengkloning atau fork atau push.
2
@ThomasEding Caesar menggeser sandi dengan satu huruf. Karakter pertama awalnya merupakan 'F'.