Saat ini saya sedang menulis algoritma untuk privasi diferensial menggunakan mekanisme Laplace.
Sayangnya saya tidak memiliki latar belakang statistik, oleh karena itu banyak istilah yang tidak saya ketahui. Jadi sekarang saya tersandung istilah: kebisingan Laplace . Untuk membuat diferensial dataset privat, semua makalah hanya berbicara tentang menambahkan noise Laplace sesuai dengan distribusi Laplace ke nilai fungsi.
(k adalah nilai pribadi diferensial, f nilai yang dikembalikan oleh fungsi evaluasi dan Y kebisingan Laplace)
Apakah ini berarti saya membuat variabel acak dari distribusi Laplace sesuai fungsi yang saya miliki dari wikipedia https://en.wikipedia.org/wiki/Laplace_distribution ?
UPDATE: Saya merencanakan hingga 100 variabel acak yang diambil dari fungsi di atas, tetapi ini tidak memberi saya distribusi Laplace (bahkan tidak menutup). Tapi saya pikir itu harus memodelkan distribusi Laplace.
UPDATE2:
Itulah definisi yang saya miliki:
(Mekanisme Laplace). Dengan fungsi apa pun , mekanisme Laplace didefinisikan sebagai: mana Y adalah variabel acak iid yang diambil dari
Sebaik:
Untuk menghasilkan Y (X), pilihan umum adalah menggunakan distribusi Laplace dengan rata-rata nol dan parameter skala Δ (f) / ε
Jawaban:
Anda benar, menambahkan noise Laplace berarti bahwa ke variabel Anda menambahkan variabel yang mengikuti distribusi Laplace . Ada beberapa alasan mengapa ini disebut noise . Pertama, pikirkan pemrosesan sinyal, di mana pesan dikirim melalui beberapa saluran dan karena sifat saluran yang tidak sempurna maka sinyal yang diterima berisik, jadi Anda harus mengisolasi sinyal dari kebisingan. Kedua, dalam kriptografi kami juga berbicara tentang kebisingan pseudorandom dan privasi diferensial terkait dengan kriptografi. Ketiga, dalam statistik dan pembelajaran mesin, kami juga dapat berbicara tentang kebisingan statistik, model statistik mencakup persyaratan kebisingan atau kesalahan, dll. (Bahkan ada buku tentang perkiraan namaYX Y Sinyal dan suara oleh Nate Silver). Jadi kami menggunakan noise sebagai sinonim yang lebih tepat untuk keacakan yang ambigu .
Mengenai generasi acak, ada sejumlah cara bagaimana Anda bisa menggambar nilai acak berikut distribusi Laplace, misalnya:
Pada plot di bawah ini Anda dapat melihat distribusi sampel yang diambil menggunakan masing-masing fungsi dengan menyertai kepadatan Laplace (garis merah).105
Untuk menyederhanakan contoh, saya menggunakan distribusi Laplace standar dengan skala = 1, tetapi Anda dapat dengan mudah mengubah hasil dengan mengalikan hasilnya menggunakan faktor penskalaan yang berbeda.
sumber
Distribusi Laplace atau double eksponensial jatuh secara eksponensial ke kiri dan kanan di sekitar beberapa rata-rata. Ini pada dasarnya adalah cermin eksponensial ke sisi lain.
Jika Anda menginginkan kemungkinan tersebut, gunakan kemungkinan eksponensial dan tambahkan abs () ke nilai yang diamati. Kemungkinan log hanyalah abs () dari residu, dikalikan dengan laju eksponensial.
Untuk sampel, yang paling mudah adalah menggambar dari -1,1, dan mengalikannya dengan menggambar dari distribusi eksponensial, yang tersedia di sebagian besar bahasa pemrograman. Atau, seperti yang disebutkan di atas, Anda juga akan menemukan implementasi langsung dari Laplace, tetapi mungkin memerlukan sedikit lebih banyak pencarian.
sumber