Saya telah melihat dan menikmati pertanyaan Memahami analisis komponen utama , dan sekarang saya memiliki pertanyaan yang sama untuk analisis komponen independen. Maksud saya, saya ingin membuat pertanyaan komprehensif tentang cara intuitif untuk memahami ICA?
Saya ingin memahaminya . Saya ingin mendapatkan tujuan itu. Saya ingin merasakannya. Saya sangat mempercayai hal tersebut:
Anda tidak benar-benar memahami sesuatu kecuali Anda bisa menjelaskannya kepada nenek Anda.
-- Albert Einstein
Yah, saya tidak bisa menjelaskan konsep ini kepada orang awam atau nenek
- Mengapa ICA? Apa perlunya konsep ini?
- Bagaimana Anda menjelaskan hal ini kepada orang awam?
Jawaban:
Inilah usaha saya.
Latar Belakang
Pertimbangkan dua kasus berikut.
Pertanyaannya adalah, dalam kedua kasus, bagaimana mengembalikan percakapan (dalam 1.) atau gambar anjing (dalam 2.), mengingat dua gambar yang berisi dua "sumber" yang sama tetapi dengan kontribusi relatif sedikit berbeda dari masing-masing . Tentunya cucu saya yang berpendidikan bisa memahami ini!
Solusi intuitif
Bagaimana kita, setidaknya secara prinsip, bisa mendapatkan kembali gambar anjing dari campuran? Setiap piksel berisi nilai yang merupakan jumlah dua nilai! Nah, jika setiap piksel diberikan tanpa piksel lain, intuisi kita akan benar - kita tidak akan bisa menebak kontribusi relatif yang tepat dari masing-masing piksel.
Namun, kami diberi satu set piksel (atau titik waktu dalam kasus rekaman), yang kami tahu memiliki hubungan yang sama. Misalnya, jika pada gambar pertama, anjing selalu dua kali lebih kuat dari pantulan, dan pada gambar kedua, itu justru sebaliknya, maka kita mungkin bisa mendapatkan kontribusi yang benar. Dan kemudian, kita dapat menemukan cara yang benar untuk mengurangi dua gambar yang ada sehingga refleksi dibatalkan! [Secara matematis, ini berarti menemukan matriks campuran terbalik.]
Menyelam menjadi detail
Tetapi bagaimana Anda bisa menemukannya untuk sinyal umum? mereka mungkin terlihat mirip, memiliki statistik yang sama, dll. Jadi anggaplah mereka independen. Itu masuk akal jika Anda memiliki sinyal yang mengganggu, seperti noise, atau jika dua sinyal adalah gambar, sinyal yang mengganggu mungkin merupakan cerminan dari sesuatu yang lain (dan Anda mengambil dua gambar dari sudut yang berbeda).
Jadi pertama-tama pertimbangkan ini: jika kita menjumlahkan beberapa sinyal independen, non-Gaussian, kami membuat jumlah "lebih banyak Gaussian" daripada komponen. Mengapa? karena teorema batas pusat, dan Anda juga dapat berpikir tentang kepadatan jumlah dua indep. variabel, yang merupakan konvolusi kepadatan. Jika kita menjumlahkan beberapa indep. Variabel Bernoulli, distribusi empiris akan lebih menyerupai bentuk Gaussian. Apakah ini akan menjadi Gaussian sejati? mungkin tidak (tidak bermaksud kata-kata), tetapi kita dapat mengukur Gaussianity dari suatu sinyal dengan jumlah yang menyerupai distribusi Gaussian. Misalnya, kita dapat mengukur kelebihan kurtosisnya. Jika benar-benar tinggi, mungkin Gaussian kurang dari satu dengan varian yang sama tetapi dengan kurtosis berlebih mendekati nol.
Tentu saja, ini menambah asumsi lain - dua sinyal harus non-Gaussian untuk memulai.
sumber
Sangat sederhana. Bayangkan Anda, nenek Anda dan anggota keluarga berkumpul di sekitar meja. Kelompok orang yang lebih besar cenderung memecah mana topik obrolan khusus untuk subkelompok itu. Nenekmu duduk di sana dan mendengar suara semua orang berbicara, yang tampaknya hanya hiruk-pikuk. Jika dia beralih ke satu kelompok, dia dapat dengan jelas mengisolasi diskusi dalam kelompok remaja / pemuda, jika dia beralih ke kelompok lain, dia dapat mengisolasi obrolan orang dewasa.
Untuk meringkas, ICA adalah tentang mengisolasi atau mengekstraksi sinyal tertentu (satu orang atau sekelompok orang berbicara) dari campuran sinyal (kerumunan berbicara).
sumber