Distribusi pada himpunan bagian dari

Saya ingin tahu apakah ada jenis distribusi standar pada himpunan bilangan bulat . Secara ekuivalen, kita dapat menyatakan ini sebagai distribusi pada vektor panjang dari hasil biner, misalnya jika maka sesuai dengan vektor . $\{1, 2, ..., J\}$ $J$ $J = 5$ $\{1, 3, 5\}$ $(1, 0, 1, 0, 1)$

Idealnya yang saya cari adalah distribusi , berasal dari keluarga yang diindeks oleh parameter dimensi hingga , yang akan mendistribusikan massanya sedemikian rupa sehingga dua biner vektor dan akan memiliki kesamaan probabilitas jika mereka "berdekatan", yaitu dan memiliki probabilitas yang serupa. Sungguh, apa yang ingin saya lakukan mudah-mudahan, adalah meletakkan pada sehingga jika saya tahu cukup besar maka mungkin relatif besar untuk vektor yang jauh dari . $\nu_\theta (\cdot)$ $\theta$ $r_1$ $r_2$ $r_1 = (0, 0, 1, 0, 1)$ $r_2 = (0, 0, 1, 1, 1)$ $\theta$ $\nu_\theta (r_1)$ $\nu_\theta (r_2)$ $r_1$

Salah satu strategi yang muncul dalam pikiran adalah meletakkan metrik atau ukuran dispersi lain pada pada dan kemudian mengambil , atau yang serupa. Contoh eksplisit adalah dalam analogi dengan distribusi normal. Tidak apa-apa, tapi saya berharap ada sesuatu yang standar dan sesuai dengan analisis Bayesian; dengan ini saya tidak dapat menuliskan konstanta normalisasi. $d_\theta$ $\{0, 1\}^J$ $\nu_\theta (r) \propto \exp (-d_\theta (r, \mu))$ $\exp\left\{-\|r - \mu\|^2 / (2 \sigma^2)\right\}$

bayesian discrete-data orang
sumber

Sampling subset adalah masalah dasar dalam metodologi survei.

Stéphane Laurent

@Stephane yakin, tapi saya pikir masalah saya berbeda karena saya memiliki beberapa struktur tambahan yang diinginkan yang ingin saya distribusikan oleh distribusi saya. Mungkin mengutarakan pertanyaan dalam hal himpunan bagian adalah ide yang buruk karena saya memiliki gagasan yang kabur tentang bekerja untuk saya.

pria

Apakah Anda bermaksud menulis "... lalu mungkin kecil ..."? Sejauh konstanta normalisasi berjalan, pertimbangkan untuk menggunakan jarak Hamming untuk metrik: untuk keluarga distribusi skala-lokasi, Anda dapat menghitung konstanta itu sebagai jumlah dari hanya istilah . Selain itu, semua keluarga yang memenuhi kriteria Anda dapat dijelaskan hanya dengan parameter diskrit (untuk lokasi) dan parameter kontinu

v_{θ} (r_{2})

$v_\theta(r_2)$

J + 1

$J+1$

J

$J$

J

$J$

whuber

@whuber tidak, maksudku besar. Saya ingin untuk mendistribusikan massanya di sekitar titik yang berdekatan. Mungkin akan lebih tepat untuk mengutarakan pertanyaannya dengan meletakkan distribusi pada verticies kubus. Saya telah mempertimbangkan jarak Hamming (yang saya kira sama dengan dalam kasus saya); Saya mungkin ingin mengubahnya sebagai, dan saya kira mungkin harus melakukan beberapa MCMC untuk mengambil sampel dari distribusi tersebut.

ν_{θ} (\cdot)

$\nu_\theta (\cdot)$

L_{1}

$L_1$

\sum | \frac{r_{i} - μ_{i}}{σ_{i}} |

$\sum \left|\frac{r_i - \mu_i}{\sigma_i}\right|$

pria

Oh, saya mengerti sekarang. Tapi bukan itu yang awalnya Anda katakan. Misalnya, dalam karakterisasi Anda, jika besar, dan adalah himpunan vektor "jauh" dari , dan adalah vektor yang tidak ada dalam , maka juga harus "mungkin" menjadi besar. Tetapi "tidak jauh" dan "dekat" tidak berarti hal yang persis sama. Akan lebih sederhana - dan lebih konsisten secara internal - untuk mengulangi kondisi seperti yang Anda lakukan dalam komentar Anda. Tapi tidak, Anda tidak perlu MCMC untuk mengambil sampel dari distribusi skala lokasi berdasarkan jarak Hamming: ada cara yang jauh lebih efisien.

ν (r_{1})

$\nu(r_1)$

R

$R$

r_{1}

$r_1$

r_{2}

$r_2$

R

$R$

ν (r_{2})

$\nu(r_2)$

whuber

Jawaban:

Anda mungkin menyukai keluarga lokasi berdasarkan jarak Hamming , karena kekayaan, fleksibilitas, dan kemampuan penelusuran komputasinya.

Notasi dan definisi

Ingatlah bahwa dalam modul berdimensi-bebas bebas dengan basis , jarak Hamming antara dua vektor dan adalah jumlah tempat di mana . $V$ $\left(\mathbf{e}_1, \mathbf{e}_2, \ldots, \mathbf{e}_J\right)$ $\delta_H$ $\mathbf{v}=v_1 \mathbf{e}_1 + \cdots + v_J\mathbf{e}_J$ $\mathbf{w}=w_1 \mathbf{e}_1 + \cdots + w_J\mathbf{e}_J$ $i$ $v_i \ne w_i$

Diberikan asal , partisi jarak Hamming ke dalam bola , , di mana . Ketika cincin dasar memiliki elemen, memiliki elemen dan memiliki elemen. (Ini mengikuti segera dari mengamati bahwa unsur-unsur berbeda dari persis di tempat - yang ada $\mathbf{v}_0\in V$ $V$ $S_i(\mathbf{v}_0)$ $i=0, 1, \ldots, J$ $S_i(\mathbf{v}_0) = \{\mathbf{w}\in V\ |\ \delta_H(\mathbf{w}, \mathbf{v}_0) = i\}$ $n$ $V$ $n^J$ $S_i(\mathbf{v})$ $\binom{J}{i}\left(n-1\right)^i$ $S_i(\mathbf{v})$ $\mathbf{v}$ $i$ $\binom{J}{i}$ kemungkinan - dan bahwa ada, secara mandiri, pilihan nilai untuk setiap tempat.) $n-1$

Terjemahan affine dalam berlaku secara alami pada distribusinya untuk memberi keluarga lokasi. Khususnya, ketika adalah distribusi apa pun pada (yang berarti sedikit lebih dari , untuk semua , dan ) dan adalah elemen , maka juga merupakan distribusi dimana $V$ $f$ $V$ $f:V\to [0,1]$ $f(\mathbf{v})\ge 0$ $\mathbf{v} \in V$ $\sum_{\mathbf{v}\in V}f(\mathbf{v})=1$ $\mathbf{w}$ $V$ $f^{(\mathbf{w})}$

f^{(w)} (v) = f (v - w)

$f^{(\mathbf{w})}(\mathbf{v}) = f(\mathbf{v}-\mathbf{w})$

untuk semua . Sebuah keluarga lokasi distribusi adalah invarian dalam tindakan ini: menyiratkan untuk semua . $\mathbf{v}\in V$ $\Omega$ $f\in \Omega$ $f^{(\mathbf{v})}\in \Omega$ $\mathbf{v}\in V$

Konstruksi

Ini memungkinkan kami untuk menentukan keluarga distribusi yang berpotensi menarik dan bermanfaat dengan menentukan bentuk mereka pada satu vektor tetap , yang untuk kenyamanan saya akan menjadi , dan menerjemahkan "menghasilkan distribusi" ini di bawah tindakan untuk mendapatkan keluarga lengkap . Untuk mencapai properti yang diinginkan yang harus memiliki nilai yang sebanding di titik terdekat, cukup minta properti dari semua distribusi yang dihasilkan. $\mathbf{v}$ $\mathbf{0} = (0,0,\ldots,0)$ $V$ $\Omega$ $f$

Untuk melihat bagaimana ini bekerja, mari kita membangun keluarga lokasi semua distribusi yang menurun dengan meningkatnya jarak. Karena hanya jarak Hamming yang mungkin, pertimbangkan setiap urutan penurunan bilangan real non-negatif = . Set $J+1$ $\mathbf{a}$ $0 \ne a_0 \ge a_1 \ge \cdots \ge a_J \ge 0$

A = \sum_{i = 0}^{J} (n - 1)^{i} (\binom{J}{i}) a_{i}

$A = \sum_{i=0}^J (n-1)^i\binom{J}{i} a_i$

dan tentukan fungsi oleh $f_\mathbf{a}:V\to [0,1]$

f_{a} (v) = \frac{a_{δ_{H} (0, v)}}{A} .

$f_\mathbf{a}(\mathbf{v}) = \frac{a_{\delta_H(\mathbf{0},\mathbf{v})}}{A}.$

Kemudian, seperti mudah untuk memeriksa, adalah distribusi pada . Selanjutnya, jika dan hanya jika adalah kelipatan positif dari (sebagai vektor dalam ). Jadi, jika kita suka, kita dapat membuat standar menjadi . $f_\mathbf{a}$ $V$ $f_\mathbf{a} = f_{\mathbf{a}'}$ $\mathbf{a}'$ $\mathbf{a}$ $\mathbb{R}^{J+1}$ $\mathbf{a}$ $a_0=1$

Dengan demikian, konstruksi ini memberikan parameterisasi eksplisit dari semua distribusi invarian lokasi yang berkurang dengan jarak Hamming: distribusi tersebut dalam bentuk untuk beberapa urutan dan beberapa vektor . $f_\mathbf{a}^{(\mathbf{v})}$ $\mathbf{a} = 1 \ge a_1 \ge a_2 \ge \cdots \ge a_J \ge 0$ $\mathbf{v}\in V$

Parameterisasi ini memungkinkan spesifikasi priors yang sesuai: faktorkan menjadi prior di lokasi dan prior pada shape . (Tentu saja orang dapat mempertimbangkan kumpulan prior yang lebih besar di mana lokasi dan bentuk dan tidak independen, tetapi ini akan menjadi usaha yang lebih rumit.) $\mathbf{v}$ $\mathbf{a}$

Menghasilkan nilai acak

Salah satu cara untuk mengambil sampel dari adalah secara bertahap dengan memfaktorkannya ke dalam distribusi di atas radio bola dan distribusi lain yang tergantung pada setiap bola: $f_\mathbf{a}^{(\mathbf{v})}$

Gambarkan indeks dari distribusi diskrit pada diberikan oleh probabilitas , di mana didefinisikan seperti sebelumnya . $i$ $\{0,1,\ldots,J\}$ $\binom{J}{i}(n-1)^i a_i / A$ $A$
Indeks sesuai dengan himpunan vektor yang berbeda dari tepat di tempat . Oleh karena itu, memilih orang-orang menempatkan keluar dari mungkin himpunan bagian, memberikan masing-masing probabilitas yang sama. (Ini hanya contoh dari subscript dari tanpa pengganti.) Biarkan bagian ini tempat ditulis . $i$ $\mathbf{v}$ $i$ $i$ $\binom{J}{i}$ $i$ $J$ $i$ $I$
Gambarkan elemen dengan secara independen memilih nilai secara seragam dari himpunan skalar yang tidak sama dengan untuk semua dan sebaliknya atur . Secara ekuivalen, buat vektor dengan memilih secara seragam secara acak dari skalar bukan nol ketika dan jika tidak, atur . Set . $\mathbf{w}$ $w_j$ $v_j$ $j\in I$ $w_j=v_j$ $\mathbf{u}$ $u_j$ $j\in I$ $u_j=0$ $\mathbf{w} = \mathbf{v} + \mathbf{u}$

Langkah 3 tidak perlu dalam kasus biner.

Contoh

Berikut ini adalah Rimplementasi untuk menggambarkan.

rHamming <- function(N=1, a=c(1,1,1), n=2, origin) {
  # Draw N random values from the distribution f_a^v where the ground ring
  # is {0,1,...,n-1} mod n and the vector space has dimension j = length(a)-1.
  j <- length(a) - 1
  if(missing(origin)) origin <- rep(0, j)

  # Draw radii `i` from the marginal distribution of the spherical radii.
  f <- sapply(0:j, function(i) (n-1)^i * choose(j,i) * a[i+1])
  i <- sample(0:j, N, replace=TRUE, prob=f)

  # Helper function: select nonzero elements of 1:(n-1) in exactly i places.
  h <- function(i) {
    x <- c(sample(1:(n-1), i, replace=TRUE), rep(0, j-i))
    sample(x, j, replace=FALSE)
  }

  # Draw elements from the conditional distribution over the spheres
  # and translate them by the origin.
  (sapply(i, h) + origin) %% n
}

Sebagai contoh penggunaannya:

test <- rHamming(10^4, 2^(11:1), origin=rep(1,10))
hist(apply(test, 2, function(x) sum(x != 0)))

Ini membutuhkan detik untuk menggambar elemen awal dari distribusi mana , (case biner), , dan menurun secara eksponensial. $0.2$ $10^4$ $f_{\mathbf{a}}^{(\mathbf{v})}$ $J=10$ $n=2$ $\mathbf{v}=(1,1,\ldots,1)$ $\mathbf{a}=(2^{11},2^{10},\ldots,2^1)$

(Algoritma ini tidak mengharuskan berkurang; dengan demikian, ia akan menghasilkan variasi acak dari sembarang keluarga lokasi, bukan hanya yang unimodal.) $\mathbf{a}$

whuber
sumber

Terima kasih untuk ini! Jarak Hamming dalam hal ini hanya di terbatas pada kubus vertikal; dalam konteks itu, jarak Hamming bertindak isotropis. Semakin jauh dari yang saya kira merumitkan hal-hal ini karena saya memiliki lebih dari nilai yang berbeda untuk mengukur jarak saya? Ada komentar umum tentang ini?

L_{1}

$L_1$

R^{J}

$\mathbb R^J$

J

$J$

pria

Ya: pilihan fungsi jarak akan tergantung pada apa yang diwakili oleh nilai dalam . Karena pertanyaan telah dirumuskan secara abstrak, kami benar-benar tidak memiliki apa-apa untuk membentuk pendapat tentang apa yang akan menjadi pilihan yang baik. Jarak Hamming akan sesuai untuk nilai nominal dan mungkin dalam kasus lain juga, tetapi jarak lain mungkin bekerja lebih baik ketika ada rasa jarak yang melekat untuk himpunan . Dalam kasus biner , sulit untuk menyamaratakan jarak Hamming: mereka sudah cukup umum.

{1, 2, \dots, n}

$\{1,2,\ldots,n\}$

{1, 2, \dots, n}

$\{1,2,\ldots,n\}$

n = 2

$n=2$

whuber

Sampel dari titik proses k-determinan memodelkan distribusi lebih dari himpunan bagian yang mendorong keragaman, sehingga item serupa kurang mungkin terjadi bersama-sama dalam sampel. Mengacu pada pengambilan sampel titik proses penentuan-K oleh Alex Kulesza, Ben Taskar.

mobil jenazah
sumber