Jarak statistik antara koin seragam dan bias

9

Misalkan adalah distribusi yang seragam di atas bit, dan misalkan menjadi distribusi di atas bit di mana bit tersebut independen dan setiap bit adalah dengan probabilitas . Benarkah jarak statistik antara dan adalah , ketika ?n D n 1 1 / 2 - ε D U Ω ( ε UnDn11/2ϵDUn1/ϵ2Ω(ϵn)n1/ϵ2

Manu
sumber
2
Iya. Jarak statistik antara dan setidaknya , yaitu ; lihat misalnya jawaban matus di sini: cstheory.stackexchange.com/questions/14471/…V P r U ( x i > n / 2 ) - P r D ( x i > n / 2 ) Ω ( ε UVPrU(xi>n/2)PrD(xi>n/2)Ω(εn)
Yury
2
Terima kasih. Mungkin menjelaskan bagaimana mendapatkan ini dari apa yang ditulis matus dalam jawaban yang bisa saya terima?
Manu
1
Mengenai jawaban Matus, Anda bisa melakukan lebih baik daripada ketidaksetaraan Slud; lihat (2.13.2.14) di arxiv.org/abs/1606.08920
Aryeh

Jawaban:

7

Nyatakan bit acak dengan . Menurut definisi, jarak statistik antara dan setidaknya untuk setiap . Kami memilih .x1,,xnUDPrU(xit)PrD(xit)tt=n/2+n

Perhatikan bahwa untuk beberapa konstanta absolut . Jika , maka jarak statistik setidaknya , dan kita selesai. Jadi kita asumsikan di bawah bahwa .PrU(xit)c1c1>0PrD(xit)c1/2c1/2PrD(xit)c1/2

Biarkan untuk variabel acak iid Bernoulli dengan . Tujuan kami adalah untuk membuktikan bahwa . Dengan teorema nilai rata-rata, untuk beberapa . Sekarang, kita akan membuktikan bahwa ; yang akan menyiratkan bahwa jarak statistik yang diinginkan setidaknya , seperti yang diperlukan.f(s)=Pr(xit)x1,,xnPr(xi=1)=1/2sf(0)f(ε)=Ω(εn)

f(0)f(ε)=εf(ξ),
ξ(0,ε)f(ξ)Ω(n)Ω(nε)

Tulis, dan Perhatikan bahwa Jadi,

f(ξ)=kt(nk)(12ξ)k(12+ξ)nk,
f(ξ)=kt(nk)(k(12ξ)k1(12+ξ)nk+(nk)(12ξ)k(12+ξ)nk1)=kt(nk)(12ξ)k(12+ξ)nkk/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ).
k/2+kξ(nk)/2+(nk)ξ(1/2ξ)(1/2+ξ)=(2kn)/2+nξ(1/2ξ)(1/2+ξ)2(2tn)=4n.
f(ξ)4nkt(nk)(12ξ)k(12+ξ)nk=4nf(ξ)4nf(ε)4n(c1/2).
Di sini, kami menggunakan asumsi bahwa . Kami menunjukkan bahwa .f(ε)=PrD(x1++xnt)c1/2f(ξ)=Ω(n)
Yury
sumber
5

Bukti yang agak lebih mendasar, dan sedikit berantakan (atau setidaknya terasa begitu bagi saya).

Untuk kenyamanan, tulis , dengan dengan asumsi.ε=γnγ[0,1)

Kami secara eksplisit menurunkan ekspresi : dTV(P,U)

2dTV(P,U)=x{0,1}n|(12+γn)|x|(12γn)n|x|12n|=12nk=0n(nk)|(1+2γn)k(12γn)nk1|12nk=n2+nn2+2n(nk)|(1+2γn)k(12γn)nk1|Cnk=n2+nn2+2n|(1+2γn)k(12γn)nk1|
di mana adalah konstanta absolut. Kami menurunkan setiap ringkasan secara terpisah: memperbaiki , dan menulis , sehingga setiap summand lebih rendah dibatasi oleh jumlah yang menyatu (ketika ) keC>0k=kn2[n,2n]
(1+2γn)k(12γn)nk=(14γ2n)n/2(1+2γn12γn)(14γ2n)n/2(1+2γn12γn)nne4γ2γ2
ne4γ2γ21>4γ2γ2>2γ ; menyiratkan bahwa masing-masing adalah . Ringkasnya, ini menghasilkan seperti yang diklaim.Ω(γ)
2dTV(P,U)Cnk=n2+nn2+2nΩ(γ)=Ω(γ)=Ω(εn)
Clement C.
sumber
(Menggunakan Hellinger sebagai proksi karena sifatnya yang bagus distribusi produk yang menggoda, dan akan jauh lebih cepat, tetapi akan ada kerugian oleh faktor kuadrat di batas bawah ujung.)
Clement C.
1
Bagus! Saya suka pendekatan dasar. Kita harus dapat membuatnya non-asimptotik dalam juga .... salah satu caranya adalah dengan menggunakan , lalu gunakan ketidaksetaraan . Agak berantakan. n(1+z1z)n(1+2z)n1+weww2/2
usul