Saya mengembangkan pemeriksa konten ofensif untuk situs web saya dan ingin menerbitkannya di GitHub . Namun, kode sumber berisi banyak konten yang menyinggung, rasis, dan tidak menyenangkan.
Sumber sepenuhnya didokumentasikan, tetapi saya ingin pendapat Anda tentang apakah dapat diterima untuk menerbitkan karya seperti itu di GitHub atau apakah akan membiarkan serangkaian string sesuai dengan imajinasi pembaca ?!
Jawaban:
Saya harus tidak setuju dengan solusi ROT-13. Mengaburkan kata-kata terlarang Anda hanya karena melihatnya mungkin menyinggung seseorang adalah buang-buang waktu.
Kamus kata-kata buruk / buruk-aturan kata Anda harus berasal dari file yang terpisah (yang dapat dimuat saat runtime, atau disematkan sebagai sumber daya) . Mengaburkan file ini hanya membuatnya lebih sulit bagi Anda / pengembang lain / pengguna Anda untuk mengubahnya, atau memperbaiki masalah apa pun. Selain itu, jika saya melihat file bernama "banned_words.txt" di hard-drive saya, saya berharap file itu berisi daftar kata-kata yang tidak sopan.
sumber
"Semua masalah dalam ilmu komputer dapat diselesaikan dengan tingkat tipuan lainnya." ( oleh David Wheeler ).
Pilihan Anda tidak terbatas pada mengunggahnya atau tidak, jika Anda mempertimbangkan bahwa Anda dapat menyandikan konten sehingga tidak akan mengganggu pembaca.
Seperti yang ditunjukkan dalam komentar , pendekatan seperti di atas digunakan dalam sandi substitusi surat ROT13 , yang dikenal karena penggunaannya "sebagai sarana untuk menyembunyikan ... bahan ofensif dari pandangan sepintas ..."
Demi kelengkapan, pertimbangkan juga menjalankan pemeriksa Anda terhadap kamus yang disandikan , untuk memastikan bahwa penyandian yang dipilih tidak secara tidak sengaja mengubah satu kata ofensif menjadi yang lain.
Saat menyandikan hal-hal seperti itu, masuk akal untuk memeriksa ulang, karena orang tidak dapat memprediksi hal dengan andal. Dalam salah satu proyek saya di masa lalu, kami mengalami pemadaman surat yang cukup parah ketika pemeriksa yang salah konfigurasi mulai menemukan konten ofensif dalam urutan karakter acak (dalam konten yang di- uuencoded dari arsip ZIP).
Dibandingkan dengan membagikan teks biasa, Gvdl , enkode memiliki manfaat besar untuk sepenuhnya menghindari masalah hukum dan semua risiko serta dependensi yang terlibat .
Pikirkan saja itu. Katakanlah, persyaratan layanan tertentu di repositori tertentu memungkinkan konten saya, baik.
Tapi, bagaimana jika mereka memutuskan untuk mengubah TOS ? Atau, bagaimana jika saya memutuskan untuk berubah ke repositori lain, memiliki ketentuan yang tidak kompatibel. Apa yang akan aku lakukan?
Perhatikan bahwa bahkan di repositori "ramah", di sini dan sekarang, masih belum sepenuhnya aman.
Bagaimana jika seseorang tidak dapat mengunduh konten saya karena filter web yang aneh ? Apakah saya bersedia menanggapi keluhan pengguna dan menjelaskan cara memperbaiki filter? Filter mereka ...
... Anda lihat, saya lebih suka berpikir dua kali sebelum saya memutuskan menentang pengkodean. Dan bahkan jika saya memutuskan, saya akan memastikan bahwa saya memiliki alasan yang sangat, sangat bagus untuk itu.
sumber