distribusi lemak-jari

10

Pertanyaan singkat:
Apakah ada distribusi lemak-jari? Saya yakin jika itu ada, maka ia memiliki nama yang berbeda.

Saya tidak tahu bagaimana merumuskannya sebagai fungsi analitik. Bisakah Anda membantu saya menemukan versi yang sudah ada atau mulai merumuskannya dalam sesuatu yang lebih bersih daripada simulasi raksasa?

Ini adalah distribusi angka yang benar-benar mengenai ketika angka yang diberikan adalah target yang dituju, tetapi tombol-tombolnya jauh lebih kecil dari jari sehingga tombol-tombol terdekat kadang-kadang yang terkena secara tidak sengaja.

Penggunaan distribusi seperti ini adalah entri palsu dalam menekan tombol pada ponsel. Jika saya mengoperasikan sebuah perusahaan di mana seseorang harus "menekan 1 sekarang" atau sesuatu dan "Anda menekan 1, apakah itu benar" maka mereka bisa mendapatkan perkiraan yang layak dari probabilitas jari-gemuk, meskipun 2 berturut-turut jari-jari gemuk dapat mengacaukannya beberapa. (Jarak Hamming di jari-jari? Rantai Markov-jari?)

Saya ingin menggunakannya untuk mencoba dan membangun koreksi kesalahan menjadi menekan tombol. Saya punya beberapa sampel sendiri, tetapi tidak cukup variasi dalam jari "kegemukan" atau topologi keyboard ponsel untuk menjadi kuat.

Latar belakang dan penjabaran:
Berikut ini adalah tata letak keypad ponsel yang normal: masukkan deskripsi gambar di sini

Bayangkan bahwa jari-jari saya jauh lebih besar daripada tombol, sehingga ketika saya menekan angka 5, saya cenderung mendapat angka 5, tetapi kemudian saya juga agak mungkin mendapat angka 2,4,6, atau 8 (kemungkinan sama besar ) dan kemudian saya lebih kecil (tetapi tidak nol) kemungkinan untuk mendapatkan 1,3,7,9 (kemungkinan sama) dan saya sangat tidak mungkin untuk mendapatkan 0.

Saya dapat membayangkan bahwa jika saya mencoba mengetik angka 5 yang tak terbatas untuk "diameter jari" yang tetap maka saya akan mendapatkan distribusi nilai. Jika nilai jari saya lebih kecil maka distribusinya berubah. Jika saya mencoba menekan nomor yang berbeda maka distribusinya berubah.

Dalam praktiknya, ini akan tergantung pada tata letak tombol. Jika mereka berada di cincin raksasa dan bukan kotak 3x3 maka itu akan menjadi pertanyaan yang berbeda. Dalam hal ini, saya berharap kita hanya akan berurusan dengan kotak 3x3 persegi panjang. Saya juga menduga bahwa keypad memiliki kait digital sehingga hanya satu penekanan tombol yang dapat dideteksi. Akan ada paling banyak 7 frekuensi untuk tombol lain seperti ketika "0" ditekan. Saya tidak yakin cara bersih untuk melakukan itu. Mungkin faktor kali jarak dinormalisasi kuadrat antara kunci target dan kunci yang dipicu kandidat?

Berikut adalah bagaimana saya akan mensimulasikan distribusi ketika lima ditekan (bobot agak arbitrer):

#number of presses
npress <- 1000

#hack this (not quadratic)
myprobs <- c(0.85)
myprobs <- c(myprobs, 0.1275/4, 0.1275/4, 0.1275/4, 0.1275/4)
myprobs <- c(myprobs, 0.019125/4, 0.019125/4, 0.019125/4, 0.019125/4)
myprobs <- c(myprobs,1-sum(myprobs) )

#order of number 
my_button <- c(5,2,4,6,8,1,3,7,9,0)

#declare before loop
y <- numeric()

#sample many button presses
for (i in 1:npress){

     #press the button, store the result 
     y[i] <- sample(my_button,size=1,prob=myprobs)

}

#hist, show counts
hist((y),freq = T)
grid()

#hist, show freq
hist((y),freq = F)
grid()

#declare before loop
my_p5 <- numeric()

# compute the probabilties
for (i in 1:length(my_button)){

     my_p5[i] <- length(which(y==my_button[i]))/npress
}

# show probability values
print(data.frame(my_button,my_p5))

catatan tambahan:
Jadi saya membaca artikel ini:
http://www.scientificamerican.com/article/peculiar-pattern-found-in-random-prime-numbers/

Saya kira ada kebalikan dari variasi "distribusi lemak-jari" yang berlaku untuk digit terakhir dari bilangan prima. Ada digit yang dikecualikan berdasarkan digit terakhir dari bilangan prima.

EngrStudent
sumber

Jawaban:

4

Karena kita berhadapan dengan angka-angka diskrit, saya langsung berpikir untuk menggunakan Distribusi Kategorikal sebagai distribusi bersyarat dari setiap kunci target.

Jadi, jika kami mengambil contoh niat pengguna Anda untuk menekan 5, dan membiarkan menjadi kunci yang benar-benar ditekan, maka kami mendapatkan:K

P(K=k|5)=pk,5wherepk,50andk=09pk,5=1

Kita dapat mendefinisikan distribusi semacam itu untuk setiap kunci. Ini adalah bagian empiris.

Sekarang, katakanlah bahwa angka yang ditekan adalah , kita ingin menyimpulkan kunci dimaksudkan . Ini secara alami dinyatakan sebagai masalah Bayesian Inference:kI

P(I=i|k)=P(I=i)P(k|I=i)i=09P(I=i)P(k|I=i)

Persamaan ini memberi tahu Anda probabilitas bahwa pengguna bermaksud menekan mengingat mereka menekan .ki k

Namun, Anda akan melihat bahwa ini tergantung pada , yang merupakan probabilitas sebelumnya bahwa seseorang akan berniat untuk menekan . Saya akan membayangkan bahwa ini akan tergantung pada nomor telepon yang sedang ditekan (tentu saja) tetapi karena Anda tidak akan tahu ini, Anda akan memerlukan beberapa cara untuk menyesuaikan konteks sebelumnya.iP(I=i)i

Intinya adalah bahwa tidak ada distribusi lemak-jari tunggal , kecuali kita berbicara tentang distribusi tergantung pada angka yang dimaksud. Jika metode koreksi kesalahan Anda berguna, ia harus menebak nomor yang dimaksud menggunakan distribusi kondisional ini. Namun, ini akan memerlukan beberapa konteks sebelum berguna, jika tidak saya harapkan kunci yang disimpulkan untuk tetap menjadi kunci yang benar-benar ditekan ... tidak terlalu berguna.


sumber
0

Saya setuju dengan pendekatan Bey, yaitu kemungkinan bersyarat untuk setiap tombol yang ditekan mengingat niat pengguna tertinggi untuk kunci yang dimaksud. Jika tidak, produsen peralatan akan mengganti nama kuncinya. Beberapa tombol lebih rentan untuk salah ditekan daripada yang lain. Mungkin menuju tengah. Bahkan mengetahui hal ini, karena kami memasukkan angka, tidak mungkin untuk mengeksploitasi seperti mengoreksi kata-kata karena satu angka sama validnya dengan yang berikutnya. Jadi koreksi kesalahan pada stroke satu tombol tidak layak.

Apa yang layak adalah mengoreksi, atau mungkin deteksi yang kurang ambisius dari kesalahan utama dalam tipe data input yang diberikan. Ini dilakukan untuk ISBN atau nomor kartu kredit, katakanlah. Namun, nomor telepon tidak memiliki jumlah cek. Mungkin distribusi empiris untuk setiap keyboard dapat digunakan untuk melakukan pemeriksaan nomor yang paling efisien - yang menjadi penggunaan terbaik dari nomor cek yang ditambahkan.

Ben S
sumber
Jika saya memegang kendali, maka saya bisa membuat ukuran tombol dan jarak antar-pusat menjadi driver geometrik koreksi kesalahan. Mungkin dengan area yang sama untuk bekerja dengan seseorang dapat membuat koreksi yang lebih baik. Dengan munculnya telepon pintar (er) seseorang dapat secara dinamis mengubah ukuran kunci, dan sentuhan konstan untuk membantu menginformasikan niat.
EngrStudent