Contoh PCA yang baik untuk pengajaran

10

Saya mengajar aljabar linier ke kelas insinyur, ilmuwan sosial, dan pemrogram komputer. Kami baru saja melakukan dekomposisi nilai singular, dan kami memiliki hari ekstra, jadi saya pikir saya akan berbicara tentang hubungan antara dekomposisi nilai singular dan analisis komponen utama. Saya memiliki bagian teori dari kuliah yang ditulis dengan baik, tetapi saya kesulitan menemukan contoh yang baik untuk digunakan. Berikut adalah kendalanya:

  • Saya ingin menunjukkan gambar. Idealnya, grafik harus bekerja dengan baik sendiri: Sumbu dan titik data di sebar plot harus diberi label. Kata bahasa Inggris lebih baik daripada nama spesies Latin.

  • Pertanyaan yang dipelajari harus menarik. Morfologi ikan Nigeria, meski penting, bukanlah cara yang baik untuk menarik perhatian kelas.

  • Berbeda dengan poin sebelumnya: Tidak ada perbedaan ras manusia; tidak ada pada pengujian intelijen. Itu akan mengarah pada diskusi yang hidup yang tidak ada hubungannya dengan teknik matematika.

  • Metode analisis matematika pada dasarnya harus PCA murni. Proyek DW-NOMINATE, walaupun mengagumkan, menggunakan PCA sebagai titik awal yang diikuti oleh algoritma mendaki bukit yang jauh lebih rumit.

Saya pikir ini akan mudah. Saya dapat dengan mudah memikirkan selusin proyek analisis menyenangkan yang bisa saya lakukan jika saya punya waktu untuk mengumpulkan data: Ambil jajak pendapat Pew Research dan lihat apakah PCA memulihkan sumbu kebijakan sosial / kebijakan fiskal yang disukai para libertarian. Ambil selusin pengukuran karakteristik fisik khas jenis anjing dan lihat apakah PCA dapat menemukan kluster "anjing domba". Dll, dan sebagainya ... Saya mencari orang lain yang sudah melakukan pekerjaan sehingga saya bisa memamerkannya.

Saya khawatir timeline di sini agak ketat: saya kuliah besok sore (Senin). Saya telah menghabiskan sebagian besar studi PCA akhir pekan di Google di berbagai bidang menarik dan menemukan bahwa itu tidak cocok.

David E Speyer
sumber
1
Morfologi ikan Nigeria akan cukup untuk menarik perhatian saya (saya bukan ahli biologi jarak jauh). Saya tidak tahu apakah saya tidak biasa atau Anda meremehkan kapasitas orang untuk tertarik pada sesuatu. Mungkin itu sedikit dari masing-masing.
Glen_b -Reinstate Monica
1
@Glen_b Di sini Anda pergi scielo.cl/pdf/ijmorphol/v29n4/art60.pdf !
David E Speyer

Jawaban:

4

Ada beberapa panduan langkah demi langkah dalam catatan Shalizi di sini: http://www.stat.cmu.edu/~cshalizi/uADA/12/lectures/ch18.pdf , salah satunya adalah kumpulan data mobil dari R dan yang lainnya artikel seni dan musik dari New York Times. (Menyimpulkan topik artikel dari kata-kata yang terkandung di dalamnya adalah bidang penelitian yang sangat aktif.) Jika Anda tidak tahu / tidak ingin belajar R maka Anda masih bisa menggunakan catatan dan grafiknya.

Sunting: lupa mengatakan bahwa ada juga beberapa contoh bagus dalam sebuah buku karya Everitt dan Hothorn, yang tersedia di SpringerLink. Seingat saya, satu set data adalah jet tempur dan ada juga tembikar Romawi.

Flounderer
sumber
2

Saya tahu sudah terlambat untuk kuliah Anda, tetapi ini adalah contoh menggunakan data dasalomba Olimpiade yang saya temukan sangat membantu ketika mempelajari PCA. Beberapa tulisan berbasis R: http://factominer.free.fr/classical-methods/principal-components-analysis.html http://www.math.vu.nl/sto/onderwijs/multivar/ College2.pdf

Jac
sumber
Karena tidak ada tautan di atas yang berfungsi lebih lama, berikut ini adalah pengganti: statweb.stanford.edu/~jtaylo/courses/stats202/olympic.html
MERose