bawah: Oleh ketidaksetaraan Jensen, karena norma adalah cembung,
jadi EMD selalu setidaknya jarak antar sarana (untuk distribusi apa pun).
E∥X−Y∥≥∥E(X−Y)∥=∥μx−μy∥,
Batas atas berdasarkan pada W2 :
Sekali lagi oleh ketidaksetaraan Jensen,
(E∥X−Y∥)2≤E∥X−Y∥2 . Demikian W1≤W2 . Tetapi Dowson dan Landau (1982) menetapkan itu
Jadi batas atas untuk adalah . Sayangnya, formulir tertutup untuk harapan ini secara mengejutkan tidak menyenangkan untuk ditulis untuk normals multivariat umum: lihat pertanyaan ini , serta yang ini .W1(P,Q)E∥D∥
Jika varian akhirnya berbentuk bulat (mis. Jika , , maka varian menjadi ), yang pertama pertanyaan memberikan jawaban dalam hal polinomial Laguerre umum.DΣx=σ2xIΣy=σ2yID(σx−σy)2I
Secara umum, kami memiliki batas atas sederhana untuk berdasarkan ketidaksetaraan Jensen, diturunkan misalnya dalam pertanyaan pertama:
E∥D∥
Kesetaraan pada akhirnya adalah karena matriks danΣxΣyΣ12xΣyΣ12x=Σ−12x(ΣxΣy)Σ12x serupa , sehingga mereka memiliki nilai eigen yang sama, dan dengan demikian akar kuadratnya memiliki jejak yang sama.
Ketidaksetaraan ini sangat ketat selama tidak mengalami kemunduran, yang biasanya terjadi ketika .∥D∥Σx≠Σy
Dugaan : Mungkin batas atas yang lebih dekat ini, , ketat. Kemudian lagi, saya memiliki batas atas yang berbeda di sini untuk waktu yang lama yang saya duga ketat yang sebenarnya lebih longgar daripada , jadi mungkin Anda tidak boleh terlalu mempercayai dugaan ini. :)E∥D∥W2
Jawaban:
BiarkanX∼P=N(μx,Σx) , Y∼Q=N(μy,Σy) .
bawah: Oleh ketidaksetaraan Jensen, karena norma adalah cembung, jadi EMD selalu setidaknya jarak antar sarana (untuk distribusi apa pun).E∥X−Y∥≥∥E(X−Y)∥=∥μx−μy∥,
Batas atas berdasarkan padaW2 :
Sekali lagi oleh ketidaksetaraan Jensen,
(E∥X−Y∥)2≤E∥X−Y∥2 . Demikian W1≤W2 . Tetapi Dowson dan Landau (1982) menetapkan itu
W2(P,Q)2=∥μx−μy∥2+tr(Σx+Σy−2(ΣxΣy)1/2), E M D = W 1
memberikan batas atas pada .EMD=W1
Batas atas yang lebih rapat: Pertimbangkan penggabungan Ini adalah peta yang diturunkan oleh Knott dan Smith (1984) , Pada pemetaan distribusi yang optimal , Journal of Optimization Theory and Applications, 43 (1) hal 39-49 sebagai pemetaan optimal untuk ; lihat juga posting blog ini . Perhatikan bahwa danXY∼N(μx,Σx)=μy+Σ−12x(Σ12xΣyΣ12x)12Σ−12xA(X−μx). W2 A=AT EYVarY=μy+A(EX−μx)=μy=AΣxAT=Σ−12x(Σ12xΣyΣ12x)12Σ−12xΣxΣ−12x(Σ12xΣyΣ12x)12Σ−12x=Σ−12x(Σ12xΣyΣ12x)Σ−12x=Σy,
sehingga kopling valid.
Jarak adalah , di mana sekarang∥X−Y∥ ∥D∥ D=X−Y=X−μy−A(X−μx)=(I−A)X−μy+Aμx,
yang normal dengan
EDVarD=μx−μy=(I−A)Σx(I−A)T=Σx+AΣxA−AΣx−ΣxA=Σx+Σy−Σ−12x(Σ12xΣyΣ12x)12Σ12x−Σ12x(Σ12xΣyΣ12x)12Σ−12x.
Jadi batas atas untuk adalah . Sayangnya, formulir tertutup untuk harapan ini secara mengejutkan tidak menyenangkan untuk ditulis untuk normals multivariat umum: lihat pertanyaan ini , serta yang ini .W1(P,Q) E∥D∥
Jika varian akhirnya berbentuk bulat (mis. Jika , , maka varian menjadi ), yang pertama pertanyaan memberikan jawaban dalam hal polinomial Laguerre umum.D Σx=σ2xI Σy=σ2yI D (σx−σy)2I
Secara umum, kami memiliki batas atas sederhana untuk berdasarkan ketidaksetaraan Jensen, diturunkan misalnya dalam pertanyaan pertama:E∥D∥ (E∥D∥)2≤E∥D∥2=∥μx−μy∥2+tr(Σx+Σy−AΣx−ΣxA)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr(Σ−12x(Σ12xΣyΣ12x)12Σ12x)=∥μx−μy∥2+tr(Σx)+tr(Σy)−2tr((Σ12xΣyΣ12x)12)=W2(P,Q)2.
Kesetaraan pada akhirnya adalah karena matriks danΣxΣy Σ12xΣyΣ12x=Σ−12x(ΣxΣy)Σ12x serupa , sehingga mereka memiliki nilai eigen yang sama, dan dengan demikian akar kuadratnya memiliki jejak yang sama.
Ketidaksetaraan ini sangat ketat selama tidak mengalami kemunduran, yang biasanya terjadi ketika .∥D∥ Σx≠Σy
Dugaan : Mungkin batas atas yang lebih dekat ini, , ketat. Kemudian lagi, saya memiliki batas atas yang berbeda di sini untuk waktu yang lama yang saya duga ketat yang sebenarnya lebih longgar daripada , jadi mungkin Anda tidak boleh terlalu mempercayai dugaan ini. :)E∥D∥ W2
sumber