Jadi, pertanyaan ini agak terlibat, tetapi saya dengan susah payah berusaha membuatnya selurus mungkin.
Tujuan: Singkatnya, ada derivasi negentropi yang tidak melibatkan kumulan tingkat tinggi, dan saya mencoba memahami bagaimana itu diturunkan.
Latar Belakang: (Saya mengerti semua ini)
Saya mempelajari sendiri buku itu 'Analisis Komponen Independen' , ditemukan di sini. (Pertanyaan ini dari bagian 5.6, jika Anda memiliki buku - 'Perkiraan Entropi oleh Fungsi Nonpolinomial').
Kami memiliki , yang merupakan variabel acak, dan negentropi yang ingin kami perkirakan, dari beberapa pengamatan yang kami miliki. PDF diberikan oleh . Negentropi hanyalah perbedaan antara entropi diferensial dari variabel acak Gaussian terstandarisasi, dan entropi diferensial . Entropi diferensial di sini diberikan oleh , sedemikian rupa sehingga:
jadi, negentropi diberikan oleh
di mana adalah Gaussian rv terstandarisasi, dengan PDF yang diberikan oleh .
Sekarang, sebagai bagian dari metode baru ini, buku saya telah menghasilkan perkiraan PDF , yang diberikan oleh:
(Di mana . Omong-omong, is tidak kekuasaan, tetapi indeks sebaliknya).
Untuk saat ini, saya 'menerima' formula PDF baru ini, dan akan menanyakannya lagi di lain hari. Ini bukan masalah utama saya. Apa yang dia lakukan sekarang adalah memasukkan versi PDF kembali ke persamaan negentropi, dan berakhir dengan:
Ingat, sigma (di sini dan untuk sisa posting), hanya loop di sekitar indeks . Misalnya, jika kita hanya memiliki dua fungsi, sinyal akan berulang untuk dan . Tentu saja, saya harus memberi tahu Anda tentang fungsi-fungsi yang ia gunakan. Jadi ternyata, fungsi-fungsi itu didefinisikan sebagai demikian:
Fungsi bukan fungsi polinomial dalam kasus ini. (Kami berasumsi bahwa rv adalah rata-rata nol, dan varians unit). Sekarang, mari kita membuat beberapa batasan dan memberikan properti dari fungsi-fungsi itu:
Untuk menyederhanakan perhitungan, mari kita membuat asumsi lain, murni teknis: Fungsi , membentuk sistem ortonormal, seperti:
dan
Hampir sampai! OK, jadi itu semua latar belakang, dan sekarang untuk pertanyaan. Tugasnya adalah kemudian, cukup tempatkan PDF baru ini ke dalam rumus entropi diferensial, . Jika saya mengerti ini, saya akan mengerti sisanya. Sekarang, buku ini memberikan derivasi, (dan saya setuju dengan itu), tetapi saya macet menjelang akhir, karena saya tidak tahu / melihat bagaimana itu dibatalkan. Juga, saya tidak tahu bagaimana menafsirkan notasi kecil dari ekspansi Taylor.
Ini hasilnya:
Menggunakan ekspansi Taylor , untukH(x)kita dapatkan:
dan sebagainya
Pertanyaan: (Saya tidak mengerti ini)
Jadi, masalah saya: Kecuali untuk , saya tidak mengerti bagaimana dia mendapatkan 4 syarat terakhir dalam persamaan terakhir. (Yaitu, 0, 0, dan 2 istilah terakhir). Saya mengerti segalanya sebelum itu. Dia bilang dia telah mengeksploitasi hubungan ortogonalitas yang diberikan pada properti di atas, tapi saya tidak mengerti caranya. (Saya juga tidak mengerti notasi kecil di sini, dalam arti, bagaimana notasi itu digunakan?)
TERIMA KASIH!!!!
EDIT:
Saya telah maju dan menambahkan gambar-gambar dari buku yang saya baca, cukup banyak yang mengatakan apa yang saya katakan di atas, tetapi kalau-kalau ada yang membutuhkan konteks tambahan.
Dan di sini, ditandai dengan warna merah, adalah bagian yang membingungkan saya. Bagaimana dia menggunakan properti ortogonalitas untuk mendapatkan bagian terakhir, di mana hal-hal dibatalkan, dan penjumlahan akhir yang melibatkan , dan penjumlahan notasi kecil-kecilan?
sumber
Jawaban:
>> Untuk mendapatkan ketentuan nol:
From here, note that in (5.39) it is stated that∫φ(ξ)Fi(ξ)ξk is 0 for k=0,1,2 . The integral on the first term in the right of eq. (1) is of this form (with k=2 ) and the integral in the second term too, (with k=0 ). You just have to exploit this fact on the sums and you are done!
>> To obtain the∑c2i terms:
Note that the integral to be obtained to obtain these terms is:
>> About theo(whatever) notation
I think this is pretty confusing from the authors, but I recall that they use it just to mean that there are terms of orderwhatever every time they put o(whatever) (i.e., just like the big-O notation). However, as @Macro commented on this same answer, there is a difference between the big-O notation and the little-O one. Maybe you should check by yourself and see which one suits the problem in this Wikipedia article.
PS: This is a great book by the way. The papers of the authors on the subject are also very good and are a must read if you are trying to understand and implement ICA.
sumber