Transisi dari menggunakan perangkat lunak statistik untuk memahami persamaan matematika?

12

Konteks:

Saya seorang mahasiswa PhD Psikologi. Seperti banyak mahasiswa PhD psikologi, saya tahu bagaimana melakukan berbagai analisis statistik menggunakan perangkat lunak statistik, hingga teknik seperti PCA, pohon klasifikasi, dan analisis kluster. Tapi itu tidak terlalu memuaskan karena walaupun saya bisa menjelaskan mengapa saya melakukan analisis dan apa artinya indikator, saya tidak bisa menjelaskan bagaimana teknik ini bekerja.

Masalah sebenarnya adalah penguasaan perangkat lunak statistik itu mudah, tetapi terbatas. Untuk mempelajari teknik-teknik baru dalam artikel mengharuskan saya memahami cara membaca persamaan matematika. Saat ini saya tidak bisa menghitung nilai eigen atau K-means. Persamaan seperti bahasa asing bagi saya.

Pertanyaan:

  • Apakah ada panduan komprehensif yang membantu memahami persamaan dalam artikel jurnal?

Edit:

Saya pikir pertanyaannya akan lebih jelas: di atas kompleksitas tertentu, notasi statistik menjadi omong kosong bagi saya; katakanlah saya ingin kode fungsi saya sendiri di R atau C ++ untuk memahami teknik tetapi ada penghalang. Saya tidak bisa mengubah persamaan menjadi program. Dan sungguh: Saya tidak tahu situasinya di sekolah doktoral AS, tetapi di sekolah doktoral saya (Prancis), satu-satunya mata kuliah yang dapat saya ikuti adalah tentang gerakan sastra di abad ke-16 ...

Koroner
sumber
@Coronier Maaf, saya ragu ada panduan komprehensif untuk memahami artikel psikologi yang menggunakan pemodelan statistik. Namun latar belakang yang disyaratkan semua harus pada tingkat gelar master dalam statistik. Jika program Anda akan membayar untuk itu, pertimbangkan untuk mendapatkan MA dalam statistik. Opsi terbaik berikutnya untuk keperluan Anda mungkin adalah untuk mengambil kembali versi statistik dari statistik multivariat - biasanya mereka memberikan catatan dengan latar belakang matematika untuk PCA, pengelompokan, pohon, dll. Anda akan memerlukan latar belakang dalam aljabar linier dan matematika dasar statistik apa pun.
terkunci
Silakan ajukan pertanyaan yang lebih spesifik.
4
Saya juga seorang mahasiswa PhD Psikologi, dan saya membuat pilihan untuk mengambil banyak matematika di tahun-tahun sarjana saya karena ada begitu banyak PhD Psikologi yang tidak tahu bagaimana PCA (misalnya) dihitung. Hal pertama yang perlu Anda lakukan adalah bekerja dengan cara Anda melalui buku teks aljabar linear yang layak. Apa itu buku teks aljabar linier yang layak? Gilbert Strang adalah bomnya, dan ia memiliki video ceramah tentang kursus aljabar liniernya di situs web MIT untuk melakukan booting. Anda bahkan bisa mendapatkannya di iTunes.
Phillip Cloud
1
Pertanyaannya sangat luas sehingga tidak akan mendapatkan jawaban yang memuaskan dalam beberapa paragraf. Statistik seperti pertanyaan: semakin mudah jika Anda memecahnya ke beberapa komponen yang dapat dikelola.
Fr.
Saya hanya bisa setuju dengan komentar di atas. Entah Anda harus fokus pada masalah tertentu, atau Anda hanya perlu mengerjakan beberapa buku pelajaran atau handout online terlebih dahulu. Buku teks yang layak yang mencakup konsep dasar untuk statistik multivariat dengan ilustrasi adalah Alat Matematika untuk Analisis Multivariat Terapan , oleh Carroll dan Green (AP, 1997, Rev. Ed.). Satu lagi adalah Statistik Multivariat Terapan dan Pemodelan Matematika , oleh Tinsley dan Brown (AP, 2000).
chl

Jawaban:

9

Gambaran:

  • Kesan saya adalah bahwa pengalaman Anda biasa bagi banyak siswa dalam ilmu sosial.
  • Titik awalnya adalah motivasi untuk belajar.
  • Anda dapat menempuh rute pengajaran otodidak atau formal .

Instruksi formal:

Ada banyak opsi dalam hal ini. Anda dapat mempertimbangkan master dalam statistik atau hanya mengambil beberapa mata pelajaran di departemen statistik. Namun, Anda mungkin ingin memeriksa apakah Anda memiliki latar belakang matematika yang diperlukan. Bergantung pada kursus, Anda mungkin menemukan bahwa Anda perlu meninjau kembali matematika pra-kalkulus, dan mungkin beberapa materi seperti kalkulus dan aljabar linier sebelum menangani mata pelajaran statistik tingkat universitas yang ketat secara matematis.

Otodidak

Atau, Anda bisa menempuh jalur otodidak. Ada banyak sumber daya yang bagus di internet. Secara khusus, membaca dan melakukan latihan dalam buku teks matematika itu penting, tetapi mungkin tidak cukup. Penting untuk mendengarkan instruktur berbicara tentang matematika dan menonton mereka memecahkan masalah.

Penting juga untuk memikirkan tujuan matematika Anda dan prasyarat matematika yang diperlukan untuk mencapai tujuan tersebut. Jika persamaan seperti bahasa asing bagi Anda, maka Anda mungkin perlu mempelajari matematika dasar terlebih dahulu.

Saya telah menyiapkan beberapa sumber daya yang bertujuan membantu orang yang melakukan transisi dari menggunakan perangkat lunak statistik ke memahami matematika yang mendasarinya.

  • Video : Daftar Video Matematika Online Gratis - Posting ini juga menyediakan beberapa panduan mengenai apa yang akan menjadi urutan matematika yang tepat mulai dari pra-kalkulus dan bekerja melalui kalkulus, aljabar linier, probabilitas, dan statistik matematika. Lihat juga pertanyaan ini pada video statistik matematika .
  • Membaca dan pengucapan - Salah satu tantangan pertama adalah belajar cara mengucapkan dan membaca persamaan matematika. Saya menulis dua posting, satu pada pelafalan dan satu lagi pada tips untuk membaca matematika untuk non-matematikawan .
  • Menulis - Belajar menulis matematika dapat membantu membaca matematika. Coba pelajari LaTeX dan lihat beberapa panduan matematika di LaTeX
  • Buku : Ketika datang untuk belajar matematika, saya pikir layak berinvestasi dalam beberapa buku teks yang bagus. Namun, ada banyak opsi online gratis hari ini
Jeromy Anglim
sumber
Terima kasih, sumber daya yang Anda berikan luar biasa. Btw, blog Anda benar-benar menyerap (saya seorang siswa I / OP dan useR, itu seperti wahyu bagi saya).
Coronier
@Coronier Sangat menyenangkan bertemu orang lain yang menggabungkan R dengan I / O Psych.
Jeromy Anglim
3

Saya mendapat kesan bahwa Anda berpikir bahwa Anda bisa mendapatkan wawasan tentang persamaan statistik dengan memprogramnya menjadi R atau C ++; kamu tidak bisa. Untuk memahami persamaan statistik, cari buku teks "sarjana" dengan banyak masalah pekerjaan rumah di akhir setiap bab yang berisi persamaan, dan kemudian lakukan pekerjaan rumah di akhir bab yang berisi persamaan.

Sebagai contoh, untuk memahami PCA Anda perlu pemahaman yang baik tentang aljabar linier dan khususnya dekomposisi nilai singular. Saat belajar komputasi kuantum melalui buku Michael Nielsen, menjadi jelas bagi saya bahwa saya perlu meninjau aljabar linier. Saya menemukan video Gilbert Strang, mereka sangat membantu dalam membangun pemahaman dasar konsep. Namun, nuansa materi tidak sampai sampai saya menemukan buku aljabar linier yang mengandung banyak masalah pekerjaan rumah, dan kemudian saya perlu melakukannya.

schenectady
sumber
4
@ schenectady sementara saya bersimpati dengan sudut pandang Anda, bagi saya setidaknya, kode R menyediakan jembatan yang dapat saya gunakan untuk lebih memahami pemahaman saya tentang persamaan dan matematika yang bersangkutan. Yang sedang berkata, saya sepenuh hati setuju dengan kebutuhan untuk masalah, statistik dan matematika secara umum adalah sesuatu yang hanya bisa dipelajari dengan melakukan.
richiemorrisroe
2

Saya memahami kesulitan Anda karena saya memiliki masalah yang sama ketika saya mencoba melakukan sesuatu yang baru dalam statistik (saya juga seorang mahasiswa pascasarjana, tetapi dalam bidang yang berbeda). Saya menemukan memeriksa kode R cukup berguna untuk mendapatkan ide bagaimana sesuatu dihitung. Sebagai contoh, saya baru-baru ini belajar bagaimana menggunakan kmeanspengelompokan dan memiliki banyak pertanyaan dasar, baik konseptual dan bagaimana penerapannya. Menggunakan Rinstalasi (saya sarankan R Studio, http://www.rstudio.org/ , tetapi instalasi apa pun berhasil), cukup ketikkan kmeanske baris perintah. Berikut adalah contoh bagian dari output:

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers)) 
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1, 
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1) 
            nmeth <- 3
        k <- centers
        if (nstart == 1) 
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k) 
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    } 

Saya tidak yakin seberapa praktis untuk memeriksa sumber setiap waktu, tetapi itu benar-benar membantu saya mendapatkan ide apa yang sedang terjadi, dengan asumsi Anda memiliki keakraban dengan sintaksis.

Pertanyaan sebelumnya yang saya ajukan di stackoverflow menunjuk saya ke arah ini, tetapi juga membantu memberi tahu saya bahwa komentar tentang kode terkadang disertakan di sini .


Secara lebih umum, Journal of Statistical Software menggambarkan hubungan antara teori dan implementasi ini, tetapi sering mengenai topik-topik lanjutan (yang secara pribadi saya mengalami kesulitan memahami), tetapi berguna sebagai contoh.

celenius
sumber