Jarak Earth Mover (EMD) antara dua Gaussians

26

Apakah ada rumus bentuk tertutup untuk (atau semacam ikatan) EMD antara x1N(μ1,Σ1) dan x2N(μ2,Σ2) ?

ifog
sumber
2
Menurut en.wikipedia.org/wiki/Earth_mover%27s_distance , EMD sama dengan jarak Mallows atau Wasserstein, jadi Anda dapat mencoba googlin itu.
kjetil b halvorsen
2
Anda mungkin menemukan makalah ini berguna: vldb.org/pvldb/vol5/p205_brianeruttenberg_vldb2012.pdf
jojer

Jawaban:

27

EMD(P,Q)=infEXYXYXPYQWp=inf(EXYp)1/p

Biarkan XP=N(μx,Σx) , YQ=N(μy,Σy) .

bawah: Oleh ketidaksetaraan Jensen, karena norma adalah cembung, jadi EMD selalu setidaknya jarak antar sarana (untuk distribusi apa pun).

EXYE(XY)=μxμy,

Batas atas berdasarkan pada W2 : Sekali lagi oleh ketidaksetaraan Jensen, (EXY)2EXY2 . Demikian W1W2 . Tetapi Dowson dan Landau (1982) menetapkan itu

W2(P,Q)2=μxμy2+tr(Σx+Σy2(ΣxΣy)1/2),
E M D = W 1 memberikan batas atas pada .EMD=W1

Batas atas yang lebih rapat: Pertimbangkan penggabungan Ini adalah peta yang diturunkan oleh Knott dan Smith (1984) , Pada pemetaan distribusi yang optimal , Journal of Optimization Theory and Applications, 43 (1) hal 39-49 sebagai pemetaan optimal untuk ; lihat juga posting blog ini . Perhatikan bahwa dan

XN(μx,Σx)Y=μy+Σx12(Σx12ΣyΣx12)12Σx12A(Xμx).
W2A=AT
EY=μy+A(EXμx)=μyVarY=AΣxAT=Σx12(Σx12ΣyΣx12)12Σx12ΣxΣx12(Σx12ΣyΣx12)12Σx12=Σx12(Σx12ΣyΣx12)Σx12=Σy,
sehingga kopling valid.

Jarak adalah , di mana sekarang XYD

D=XY=XμyA(Xμx)=(IA)Xμy+Aμx,
yang normal dengan
ED=μxμyVarD=(IA)Σx(IA)T=Σx+AΣxAAΣxΣxA=Σx+ΣyΣx12(Σx12ΣyΣx12)12Σx12Σx12(Σx12ΣyΣx12)12Σx12.

Jadi batas atas untuk adalah . Sayangnya, formulir tertutup untuk harapan ini secara mengejutkan tidak menyenangkan untuk ditulis untuk normals multivariat umum: lihat pertanyaan ini , serta yang ini .W1(P,Q)ED

Jika varian akhirnya berbentuk bulat (mis. Jika , , maka varian menjadi ), yang pertama pertanyaan memberikan jawaban dalam hal polinomial Laguerre umum.DΣx=σx2IΣy=σy2ID(σxσy)2I

Secara umum, kami memiliki batas atas sederhana untuk berdasarkan ketidaksetaraan Jensen, diturunkan misalnya dalam pertanyaan pertama: ED

(ED)2ED2=μxμy2+tr(Σx+ΣyAΣxΣxA)=μxμy2+tr(Σx)+tr(Σy)2tr(Σx12(Σx12ΣyΣx12)12Σx12)=μxμy2+tr(Σx)+tr(Σy)2tr((Σx12ΣyΣx12)12)=W2(P,Q)2.
Kesetaraan pada akhirnya adalah karena matriks danΣxΣyΣx12ΣyΣx12=Σx12(ΣxΣy)Σx12 serupa , sehingga mereka memiliki nilai eigen yang sama, dan dengan demikian akar kuadratnya memiliki jejak yang sama.

Ketidaksetaraan ini sangat ketat selama tidak mengalami kemunduran, yang biasanya terjadi ketika .DΣxΣy

Dugaan : Mungkin batas atas yang lebih dekat ini, , ketat. Kemudian lagi, saya memiliki batas atas yang berbeda di sini untuk waktu yang lama yang saya duga ketat yang sebenarnya lebih longgar daripada , jadi mungkin Anda tidak boleh terlalu mempercayai dugaan ini. :)EDW2

Dougal
sumber