Saya sangat tertarik tentang potensi analisis statistik untuk simulasi / perkiraan / estimasi fungsi, dll.
Namun, saya tidak tahu banyak tentang itu dan pengetahuan matematika saya masih sangat terbatas - saya seorang mahasiswa sarjana junior di bidang rekayasa perangkat lunak.
Saya mencari buku yang akan membantu saya memulai hal-hal tertentu yang terus saya baca: regresi linier dan jenis regresi lainnya, metode bayesian, metode monte carlo, pembelajaran mesin, dll. Saya juga ingin memulai dengan R jadi jika ada buku yang menggabungkan keduanya, itu akan luar biasa.
Lebih disukai, saya ingin buku menjelaskan hal-hal secara konseptual dan tidak terlalu banyak detail teknis - saya ingin statistik menjadi sangat intuitif bagi saya, karena saya mengerti ada banyak jebakan berisiko dalam statistik.
Tentu saja saya bersedia membaca lebih banyak buku untuk meningkatkan pemahaman saya tentang topik yang saya anggap berharga.
sumber
Untuk kombinasi R dengan banyak metode yang Anda gambarkan, selain teks Maindonald dan Braun yang disebutkan oleh @Jeromy Anglim, saya sarankan Anda melihat dua buku ini oleh Julian Faraway:
Keduanya memiliki pengantar yang cukup sederhana untuk berbagai topik, yang terakhir mencakup sejumlah besar pendekatan yang lebih modern untuk regresi, termasuk banyak teknik pembelajaran mesin, tetapi melakukannya dengan kecepatan yang lebih cepat dengan deskripsi yang lebih sedikit, dan keduanya mencontohkan teknik melalui kode R.
Anda bisa mendapatkan kode dari Bagian Buku di Situs Web R untuk memberi Anda 20% diskon RRP jika Anda membeli langsung dari Chapman & Hall / CRC Press, tetapi lakukan pengecekan harga Amazon atau serupa untuk wilayah Anda karena sering kali pengurangan di Amazon kompetitif dengan harga penerbit setelah diskon.
Salah satu hal baik tentang sepasang buku ini adalah mereka memberi Anda rasa yang baik dari metode modern dengan cukup detail untuk kemudian menjelajahi area yang Anda ingin detail lebih lanjut dengan teks yang lebih khusus.
Beberapa konten yang masuk ke buku-buku tersebut tersedia dalam PDF online oleh Julian, melalui bagian Dokumen yang Dikontribusi di Situs Web R. Saya mendorong Anda untuk menelusuri bagian itu untuk melihat apakah ada dokumen lain yang dapat membantu Anda memulai tanpa Anda harus mengeluarkan uang tunai. Versi awal teks yang berubah menjadi edisi pertama teks Maindonald dan Braun juga dapat ditemukan di bagian ini.
sumber
Nah, jika Anda ingin gambaran metode statistik yang paling, dan kode R untuk mereka, Anda tidak bisa pergi jauh salah dengan Venables dan modern Statistik Terapan Ripley di S .
Its succint, jelas dan memiliki cukup kode R untuk membantu Anda memulai pada hampir semua topik statistik yang ingin Anda sebutkan.
Saya membeli buku ini dan khawatir tentang harga versus jumlah halaman, tetapi itu layak investasi. Mereka memang mengasumsikan kalkulus dan aljabar linier, tetapi mengingat Anda adalah seorang insinyur, itu seharusnya tidak terlalu menjadi masalah.
Pemrograman S mereka juga luar biasa, tapi mungkin bukan yang Anda cari saat ini.
sumber
Elemen pembelajaran statistik bisa sedikit mengintimidasi bagi pemula. Saya akan merekomendasikan membaca " Pengantar Pembelajaran Statistik dengan Aplikasi dalam R ", yang dapat diunduh secara gratis dari sini -> http://www-bcf.usc.edu/~gareth/ISL/ Ini juga telah mengerjakan contoh dalam R di akhir setiap bab.
" Machine Learning: An Perspektif algoritmik " oleh Stephen Marsland juga mencakup berbagai topik yang lebih luas tanpa terlalu banyak ke matematika.
sumber
Jawaban sebelumnya memiliki banyak hal di sisi aplikasi. Sejauh materi konseptual berjalan dan pemikiran statistik yang baik, saya akan merekomendasikan Teori Probabilitas: Logika sains oleh Edwin Jaynes. Tiga bab pertama tersedia secara gratis di sini
Itu tidak memiliki banyak cara program komputer, jadi sisi aplikasi hal-hal pada masalah yang lebih bergaya. Memiliki bab yang brilian tentang paradoks teori probabilitas, dengan satu pengecualian, "paradoks marginalisasi", yang diselesaikan dengan benar di sini (meskipun Jaynes pada dasarnya "mendapat pelajaran" dalam hal bahwa prior yang tidak tepat harus menjadi batas urutan urutan prioritas) .
sumber
Saran yang dibuat sejauh ini semuanya sangat baik tetapi berfokus pada teknik yang paling canggih dan canggih menggunakan perangkat lunak R. Untuk gambaran yang sangat baik dan intuitif dari teknik multivariat klasik, kerangka kerja yang mendasari untuk pendekatan terbaru, termasuk regresi, ANOVA, analisis faktor, analisis kluster, analisis diskriminan, analisis tabel kontingensi dan analisis persamaan struktural, Multivariat Dillon dan Goldstein Statistik yang diterbitkan oleh Wiley di tahun 80-an tetap klasik. Ini jelas dan diterapkan dalam contoh-contohnya tanpa terlalu teoritis atau melekat pada perangkat lunak.
Dillon dan Goldstein adalah buku yang saya rekomendasikan kepada siapa saja yang menginginkan pemahaman tentang di mana metode pembelajaran mesin modern berasal.
sumber
Saya akan merekomendasikan "Analisis Rangkaian Waktu dan penerapannya dengan contoh R" oleh Shumway dan Stoffer
Edisi ketiga: http://www.stat.pitt.edu/stoffer/tsa3/
Klik dan beli http://www.amazon.com/Time-Analysis-Its-Applications-Statistics/dp/144197864X/ref=dp_ob_title_bk
sumber
R Cookbook adalah cara yang bagus untuk melompat ke R dan mulai belajar bagaimana menggunakannya. Ini sangat praktis, jadi bagus untuk belajar menggunakan bahasa itu, tetapi Anda harus mencari buku teori yang bagus juga.
sumber