Filter kata-kata kotor untuk obrolan MMO

32

Kami sedang mengembangkan MMO menggunakan Smartfox Server. Target audiens adalah anak-anak dari 7 -12 tahun.

Ada opsi obrolan global dalam MMO ini.
Apa pun yang diketik pengguna dalam kotak teks ditampilkan di sebelah avatar pengguna setelah ia masuk.

Kami ingin memfilter bahasa kasar / tidak senonoh dari obrolan ini.
Kami dapat menangkap obrolan dan membaca teks. Masalahnya adalah mendapatkan daftar kata-kata kotor itu sendiri.

Pertanyaan kami adalah

  1. Di mana orang akan mendapatkan daftar lengkap semua senonoh?
  2. Metode apa yang diadopsi dalam skenario serupa untuk menyaring ini?
naveen
sumber
17
Semoga sukses dengan Masalah Scunthorpe .
Cyclops
7
@etanotcoder, maksud saya adalah, penyaringan adalah masalah yang sulit . Misalnya, apakah game Anda akan memiliki acara pada hari Sabtu? Apakah pemain dapat mengetik kata "Sabtu" (perhatikan empat huruf tengah) ke dalam kotak obrolan mereka? (Dan tidak tahu mengapa downvote juga - itu bukan pertanyaan yang buruk , tetapi mungkin tidak ada jawaban sederhana).
Cyclops
6
Dan itu menjadi lebih rumit ketika lebih banyak bahasa ikut bermain. Sebagai contoh: Starcraft 2 menghapus "weniger" dari obrolan, yang merupakan kata Jerman untuk "kurang" ...
bummzack
4
Masalah lain yang sering saya temui ketika saya masih muda dan bermain MMO yang difilter adalah bahwa mereka didasarkan pada bahasa Inggris. Jadi jika saya berbicara bahasa Prancis, beberapa kata bahasa Perancis yang baik akan disensor karena mereka tampak seperti kutukan bahasa Inggris, dan dalam hal apapun, saya masih bisa mengutuk dalam bahasa Prancis semua yang saya inginkan.
Xeon06
2
Dari apa yang saya lihat, hal paling penting untuk membuat filter yang baik adalah memiliki opsi untuk mematikannya. Jika Anda tidak memiliki pilihan, dan pemain tahu mereka tidak punya pilihan selain disensor, mereka AKAN menghindari sensor. Jika Anda membuatnya mudah bagi mereka untuk mematikannya, kemungkinan mereka akan berhenti untuk menghindarinya, dan mereka yang tidak ingin mengalami bahasa yang kasar tidak akan harus berurusan dengan orang-orang yang berusaha menghindari filter.
Michael Zehnich

Jawaban:

46

Jangan.

Filter tidak berfungsi. Setidaknya, hanya saja filter yang tidak berfungsi. Daftar putih, daftar hitam, tidak masalah. Tidak satu pun dari ini akan mencegah anak dari saling melecehkan. Satu-satunya cara untuk membuat pekerjaan ini adalah dengan tidak menyaring obrolan, tetapi untuk memberikan blok bangunan besar untuk kalimat. Misalnya, seorang anak mungkin memilih "Apakah Anda ingin ..." dan opsi untuk "pergi ke ..." dan "berdagang ..." akan ditarik. Memilih "pergi ke ..." akan memunculkan daftar tempat dalam permainan.

Disney menggunakan metode ini untuk MMO "Toontown" mereka, setelah subjek uji daftar putih berusia 14 tahun memutuskan untuk "menempelkan Giraffe berleher panjang [nya] ke atas kelinci putih berbulu [mereka]." Sederhananya, Anda tidak bisa daftar hitam atau daftar putih kata-kata cukup untuk mencegah penyalahgunaan.


Itu semua dikatakan, jika saya merancang MMO anak-anak, saya benar-benar akan menerapkan filter daftar hitam yang ketat, tetapi hanya sebagai garis pertahanan kedua. Garis pertahanan pertama Anda harus selalu menjadi moderator dan kemampuan untuk melaporkan penyalahgunaan. Saya akan mempertimbangkan kata-kata yang masuk daftar hitam, dengan masing-masing pengguna mendapatkan skor rahasia seberapa profan mereka berusaha.

Kemungkinannya adalah, setiap pengguna yang akan mencoba dan menghindari filter Anda akan memicunya terlebih dahulu. Kata-kata kotor yang lebih jelas, (yang bertentangan dengan yang tidak jelas atau ketinggalan zaman,) atau lebih banyak upaya senonoh yang berulang, menempatkan mereka pada daftar pantauan untuk moderator, atau semacam daftar larangan . Dengan cara ini, moderator dapat fokus pada pengguna yang tampaknya mencoba untuk melecehkan orang lain daripada membuang-buang waktu mereka membaca komentar anak-anak yang masih polos.

dlras2
sumber
6
+1 hanya untuk tautan Toontown - Saya terutama menyukai penggunaan saluran rahasia oleh pemain agar orang lain dapat menukar kode rahasia mereka, sehingga mereka dapat mem-bypass filter.
Cyclops
1
Itu adalah bacaan yang sangat menarik. Saya pikir saya akan menggali dan berbagi. Jika Anda tidak membaca sisa jawaban saya, setidaknya baca itu. = P
dlras2
2
Saya percaya Blizzard menggunakan teknik ini (skor rahasia dari jumlah kutukan yang diposting ke obrolan umum) di World of Warcraft, setidaknya saya tahu mereka dulu.
Nate
2
@Bisa pengalaman pribadi saja. Saya dicekal otomatis. (Yang merupakan pengalaman yang berbeda dari yang dilarang oleh GM). Beberapa douche secara verbal menyerang beberapa anak ayam di guild saya, dan saya pergi padanya. Saya tidak dilarang bermain, hanya dari / General untuk beberapa waktu.
Nate
2
+1 untuk kata pertama "Jangan." Pengelakan adalah apa yang terjadi dan itulah mengapa Anda akan merasa seperti Anda telah menyia-nyiakan sumber daya pemrograman yang berharga untuk membuat tumpukan besar meecrob ! ;-D
Randolf Richardson
10

Menanggapi orang-orang yang mengatakan tidak menyediakan filter, saya berpendapat bahwa Anda harus menyediakan filter, karena alasan lain selain untuk menutupi pantat Anda sendiri sehubungan dengan orang tua dari audiens yang Anda tuju. Pastikan itu bisa dinonaktifkan oleh pengguna. Dengan menerapkan filter senonoh (meskipun yang tidak sempurna dan benar-benar opsional), Anda dapat mengatakan bahwa Anda telah melakukan semua yang diharapkan dari Anda untuk melindungi kepekaan audiens muda Anda.

Dengan memungkinkan untuk menonaktifkan, Anda mencegah pengguna mencoba mengelak menggunakan tanda baca atau substitusi yang cerdas, karena orang yang menyukai bahasa semacam itu akan segera menonaktifkan filter di komputer mereka sendiri, dan sudah lama lupa bahwa filter bahkan ada .

Dengan pemahaman itu, jangan terlalu khawatir tentang implementasinya. Itu tidak harus sangat mudah (yang baik, karena itu tidak bisa sangat mudah), tetapi harus relatif lengkap dan tidak mengganggu mungkin. Artinya, Anda tidak ingin memastikan Anda tidak membuat " kesalahan clbuttic ".

Implementasinya bisa sangat sederhana - dapatkan daftar kata, dan ganti kata apa pun yang ditemukan dalam daftar dengan tanda bintang atau yang serupa. Lebih baik mencari seluruh kata saja.

Adapun daftar kata, itu mudah: http://www.google.com/search?q=profanity+word+list

Ingat, itu tidak harus mencakup semua, itu hanya harus mewakili upaya berani di pihak Anda untuk melindungi anak-anak.

tylerl
sumber
1
+1 akan menjadi pendekatan saya juga, setelah meneliti secara rinci apa yang sebenarnya perlu Anda lakukan untuk peringkat usia tertentu.
Oskar Duveborn
5

Saya akan mencoba menerapkan solusi yang memungkinkan daftar hitam dan daftar putih, di mana Anda dapat menambahkan 'cunt' ke daftar hitam, dan 'scunthorpe' ke daftar putih misalnya.

Saya tidak percaya bahwa Anda bisa pernah menerapkan solusi failsafe, jadi saya akan mencoba untuk mendapatkan yang paling "populer" kata-kata dalam kamus Anda, dan membuatnya semudah mungkin untuk menambahkan kata-kata baru ke daftar.

Alasan untuk ini adalah bahwa bahasa, terutama bahasa Inggris, terus berkembang dan sesuatu yang selama bertahun-tahun tidak ofensif bisa menjadi ofensif dalam konteks yang benar.

Cobalah untuk mendapatkan kata-kata sebanyak mungkin dan pergi dari sana, memiliki waktu reaksi cepat ketika orang mengeluh dan menunjukkan bahwa ini adalah masalah umum dan saya ragu Anda akan memiliki masalah.

Akan menjadi ide yang bagus untuk mengetahui dengan pasti apa pedoman untuk penyensoran di AS: MBNL! (Aku bukan pengacara!)

Jonathan Connell
sumber
3
Solusi untuk bahasa yang berkembang adalah dengan memfilter berdasarkan prefanity .
Cyclops
@ Cyclops Menang! xD
Jonathan Connell
4

Seperti yang saya berkomentar, menyaring semua kata-kata ofensif benar-benar sulit - tapi Anda bisa mengubahnya sekitar, dan menggunakan daftar putih dari diperbolehkan kata-kata. Melakukan pencarian google, tampaknya cukup umum untuk permainan anak-anak untuk membatasi apa yang dapat mereka ketik ke dalam daftar. Misalnya, Lego Universe menggunakan daftar putih.

Lihat juga: Daftar putih untuk obrolan game . Dan perhatikan bahwa daftar putih dapat dielakkan . Tidak ada solusi yang dijamin.

Mempertimbangkan bahwa ini untuk anak-anak kecil, dan kesalahan ejaan bisa menjadi masalah - tergantung pada antarmuka klien, Anda mungkin mempertimbangkan penyelesaian kata secara otomatis . Ketika para pemain mulai mengetik huruf, tawarkan daftar kata-kata yang mungkin dan biarkan mereka memilih yang benar.

Cyclops
sumber
Gagasan bagus, meskipun bagi saya tampak aneh di permainan untuk anak kecil yang mungkin salah mengeja. Ini juga dapat menghambat pengembangan pribadi mereka dari ruang lingkup apa yang tersedia pada daftar putih.
Jonathan Connell
@ 3nixios, saya setuju ada masalah, tapi begitu juga setiap solusi yang mungkin. :) Satu perbaikan untuk masalah ejaan adalah - tunggu, saya harus menambahkan itu ke posting saya. :)
Cyclops
+1: ini akan jauh lebih aman tetapi sebagai @ 3nixios: mengatakan itu akan menghambat pengembangan atau akan menjadi daftar yang sangat besar dan sehingga waktu eksekusi semakin meningkat bukan?
naveen
@yetanothercoder, tergantung pada jenis klien (saya mengasumsikan html / javascript), Anda dapat mengunduh lebih dulu daftar kata-kata yang valid dan memeriksanya di klien. Ini tidak akan memperlambat server (secara teoritis bisa dilewati oleh programmer yang pintar, meskipun). Ya, ini lebih banyak pekerjaan - sekali lagi, tidak ada solusi yang mudah, maaf. Itu semua tergantung pada seberapa besar risiko dapat diterima.
Cyclops
1
@ Cyclops Untuk permainan anak-anak, ini bisa menjadi solusi yang dapat diterima jika Anda menganggap hanya anak-anak yang bermain. Sayangnya pengecekan sisi klien berarti 'orang jahat' bisa dengan mudah mengatakan apa yang dia sukai kepada pemain lain.
Jonathan Connell
4

Ada jawaban dari Pemrogram yang menjelaskan satu sistem untuk membangun filter kata-kata kotor. Dia tidak menjelaskan bagaimana dia benar-benar membangunnya dengan sangat rinci, tetapi itu seharusnya cukup untuk mendapatkan ide untuk implementasi.

sang pendahulu
sumber
4

Ini adalah masalah yang sebaiknya diselesaikan oleh manusia dan desain sosial daripada kode.

Sumber terbaik Anda untuk daftar lengkap adalah manusia hidup yang hadir dalam permainan dan memantau aliran obrolan. Tempatkan orang di gim Anda dan biarkan mereka menjadi filter utama Anda.

Luangkan waktu untuk melihat ide-ide dan filosofi Lane Merrifield di belakang Club Penguin dan tentang memberikan layanan. Berikut adalah dua Lelang dari presentasinya di Austin GDC pada tahun 2008. Saya melihatnya dan ingat sangat terkesan dengan gayanya memecahkan masalah manusia dengan manusia dan bukan kode.

http://gamasutra.com/php-bin/news_index.php?story=20234

http://www.raphkoster.com/2008/09/15/agdc08-lane-merrifield-at-their-service/

Khususnya karena gim Anda ditujukan untuk anak-anak, itu lebih dari sekadar sumpah serapah yang perlu Anda pikirkan. Anda harus khawatir tentang orang-orang yang menyamar sebagai anak-anak yang mungkin atau mungkin tidak memiliki motif buruk. Anda harus meyakinkan orang tua bahwa anak-anak mereka aman. Anda harus meyakinkan anak-anak bahwa mereka juga aman.

Kelebihan lainnya bagi manusia adalah mereka akan memahami konteks. Anda tidak ingin seorang anak berkata, "Ibuku menderita kanker payudara" dan ditendang.

Tim Holt
sumber
kami yakin memiliki moderator yang dapat melarang manipulator potensial. saya lebih peduli tentang kata-kata kotor. itu akan menjadi tugas yang membosankan bagi moderator ketika, sebagian besar kata yang digunakan dalam konteks yang buruk akan berulang.
naveen
Saya katakan tentu saja Anda dapat memiliki filter senonoh aktif untuk mendeteksi apa yang Anda sebut hal-hal umum, dan menandainya dengan moderator. Tidak terlalu sulit untuk membuat daftar kata "100 teratas", kemudian melakukan beberapa pencocokan pola cepat pada semua string. Hapus semua spasi dan tanda baca terlebih dahulu sehingga orang tidak C_H_E_A_T atau MANIPULATE algoritma. Pada akhirnya, ini adalah manusia yang akan melakukannya dengan benar.
Tim Holt
3

Solusi sederhana untuk masalah ini:

  1. Hapus semua spasi dan tanda baca dari input Anda.
  2. Blacklist semua yang ada di Urban Dictionary .
  3. Daftar hitam semua homofon, dll
  4. Blacklist semua yang bisa digunakan sebagai euphamisme.
  5. Tulis perangkat lunak Anda untuk memahami konten, maksud, dan nada dari apa yang tersisa.
  6. Buang game dan pergi ke pasar dengan kreasi makhluk hidup dan mahatahu dari langkah 5.
Colin Pickard
sumber
6
telepon homo lolololol
Jonathan Connell
3
Ini adalah hasil akhir dari pemecah spam captcha dan filter spam: AI mahluk yang berjuang untuk menguasai Bumi: satu pihak mencoba untuk menjual Viagra dan yang lainnya berusaha untuk melindungi Kemanusiaan. Sangat Transformers. :-)
Zan Lynx
3

Beberapa MMO untuk anak-anak hanya mengganti obrolan dengan daftar emotes dan frasa yang telah ditentukan dan tidak mengizinkan obrolan dalam bentuk bebas. Mungkin game bisa dirancang untuk mengakomodasi itu.

Oskar Duveborn
sumber