Memahami analisis komponen independen

18

Saya telah melihat dan menikmati pertanyaan Memahami analisis komponen utama , dan sekarang saya memiliki pertanyaan yang sama untuk analisis komponen independen. Maksud saya, saya ingin membuat pertanyaan komprehensif tentang cara intuitif untuk memahami ICA?

Saya ingin memahaminya . Saya ingin mendapatkan tujuan itu. Saya ingin merasakannya. Saya sangat mempercayai hal tersebut:

Anda tidak benar-benar memahami sesuatu kecuali Anda bisa menjelaskannya kepada nenek Anda.
-- Albert Einstein

Yah, saya tidak bisa menjelaskan konsep ini kepada orang awam atau nenek

  1. Mengapa ICA? Apa perlunya konsep ini?
  2. Bagaimana Anda menjelaskan hal ini kepada orang awam?
Sepideh Abadpour
sumber
Saya tahu ini adalah jawaban yang terlambat tetapi saya memberikan tautan berikut dan saya sangat merekomendasikannya kepada semua orang yang ingin menjabarkan matematika dan alasan di balik ICA. Itu membantu saya mengklarifikasi intuisi tentang distribusi sumber-sumber non-gaussanian.
mrt

Jawaban:

18

Inilah usaha saya.

Latar Belakang

Pertimbangkan dua kasus berikut.

  1. Anda adalah mata pribadi di sebuah pesta. Tiba-tiba, Anda melihat salah satu klien lama Anda berbicara dengan seseorang, dan Anda dapat mendengar beberapa kata tetapi tidak cukup, karena Anda juga mendengar orang lain di sebelahnya, berpartisipasi dalam diskusi yang tidak terkait tentang olahraga. Anda tidak ingin mendekat - dia akan melihat Anda. Anda memutuskan untuk mengambil ponsel pasangan Anda (yang sibuk meyakinkan bartender bir non-alkohol hebat) dan menanamnya sekitar 10 meter di sebelah Anda. Telepon sedang merekam, dan telepon juga merekam pembicaraan klien lama dan juga olahragawan yang mengganggu. Anda mengambil telepon Anda sendiri dan mulai merekam juga, dari tempat Anda berdiri. Setelah sekitar 15 menit Anda pulang dengan dua rekaman: satu dari posisi Anda, dan yang lainnya dari jarak sekitar 10 meter. Kedua rekaman berisi klien lama Anda dan Tn. Sporty,
  2. Anda mengambil foto seekor anjing Labrador Retriever yang lucu yang Anda lihat di luar jendela. Anda memeriksa gambar, dan sayangnya Anda melihat pantulan dari jendela yang ada di antara Anda dan anjing. Anda tidak dapat membuka jendelanya (itu salah satunya, ya) dan Anda tidak bisa keluar karena takut dia akan lari. Jadi Anda mengambil (karena alasan yang tidak jelas) gambar lain, dari posisi yang sedikit berbeda. Anda masih melihat pantulan dan anjing, tetapi mereka berada di posisi yang berbeda sekarang, karena Anda mengambil gambar dari tempat yang berbeda. Perhatikan juga bahwa posisi berubah secara seragam untuk setiap piksel dalam gambar, karena jendelanya datar dan tidak cekung / cembung.

Pertanyaannya adalah, dalam kedua kasus, bagaimana mengembalikan percakapan (dalam 1.) atau gambar anjing (dalam 2.), mengingat dua gambar yang berisi dua "sumber" yang sama tetapi dengan kontribusi relatif sedikit berbeda dari masing-masing . Tentunya cucu saya yang berpendidikan bisa memahami ini!

Solusi intuitif

Bagaimana kita, setidaknya secara prinsip, bisa mendapatkan kembali gambar anjing dari campuran? Setiap piksel berisi nilai yang merupakan jumlah dua nilai! Nah, jika setiap piksel diberikan tanpa piksel lain, intuisi kita akan benar - kita tidak akan bisa menebak kontribusi relatif yang tepat dari masing-masing piksel.

Namun, kami diberi satu set piksel (atau titik waktu dalam kasus rekaman), yang kami tahu memiliki hubungan yang sama. Misalnya, jika pada gambar pertama, anjing selalu dua kali lebih kuat dari pantulan, dan pada gambar kedua, itu justru sebaliknya, maka kita mungkin bisa mendapatkan kontribusi yang benar. Dan kemudian, kita dapat menemukan cara yang benar untuk mengurangi dua gambar yang ada sehingga refleksi dibatalkan! [Secara matematis, ini berarti menemukan matriks campuran terbalik.]

Menyelam menjadi detail

Y1=a11S1+a12S2Y2=a21S1+a22S2

S1Y1,Y2S1=b11Y1+b12Y2(b11,b12)S2(b21,b22)

Tetapi bagaimana Anda bisa menemukannya untuk sinyal umum? mereka mungkin terlihat mirip, memiliki statistik yang sama, dll. Jadi anggaplah mereka independen. Itu masuk akal jika Anda memiliki sinyal yang mengganggu, seperti noise, atau jika dua sinyal adalah gambar, sinyal yang mengganggu mungkin merupakan cerminan dari sesuatu yang lain (dan Anda mengambil dua gambar dari sudut yang berbeda).

Y1Y2S1,S2X1,X2

X1,X2S1,S2X1,X2bij{aij}{bij}Si

{bij}X1,X2

Jadi pertama-tama pertimbangkan ini: jika kita menjumlahkan beberapa sinyal independen, non-Gaussian, kami membuat jumlah "lebih banyak Gaussian" daripada komponen. Mengapa? karena teorema batas pusat, dan Anda juga dapat berpikir tentang kepadatan jumlah dua indep. variabel, yang merupakan konvolusi kepadatan. Jika kita menjumlahkan beberapa indep. Variabel Bernoulli, distribusi empiris akan lebih menyerupai bentuk Gaussian. Apakah ini akan menjadi Gaussian sejati? mungkin tidak (tidak bermaksud kata-kata), tetapi kita dapat mengukur Gaussianity dari suatu sinyal dengan jumlah yang menyerupai distribusi Gaussian. Misalnya, kita dapat mengukur kelebihan kurtosisnya. Jika benar-benar tinggi, mungkin Gaussian kurang dari satu dengan varian yang sama tetapi dengan kurtosis berlebih mendekati nol.

{bij}X1,X2{bij}

Tentu saja, ini menambah asumsi lain - dua sinyal harus non-Gaussian untuk memulai.

yoki
sumber
3
+1. Jawaban yang bagus, tetapi jelas bukan pada level nenek (setidaknya itu bukan nenek biasa Anda). Mungkin Anda bisa mengawali dengan beberapa orang awam / pengantar intuitif (misalnya, sepanjang garis tradisional "masalah pesta koktail")?
Amuba kata Reinstate Monica
Terima kasih. Saya menambahkan beberapa latar belakang tentang masalah dan solusi.
yoki
3

Sangat sederhana. Bayangkan Anda, nenek Anda dan anggota keluarga berkumpul di sekitar meja. Kelompok orang yang lebih besar cenderung memecah mana topik obrolan khusus untuk subkelompok itu. Nenekmu duduk di sana dan mendengar suara semua orang berbicara, yang tampaknya hanya hiruk-pikuk. Jika dia beralih ke satu kelompok, dia dapat dengan jelas mengisolasi diskusi dalam kelompok remaja / pemuda, jika dia beralih ke kelompok lain, dia dapat mengisolasi obrolan orang dewasa.

Untuk meringkas, ICA adalah tentang mengisolasi atau mengekstraksi sinyal tertentu (satu orang atau sekelompok orang berbicara) dari campuran sinyal (kerumunan berbicara).

Vladislavs Dovgalecs
sumber