Dalam matematika, ada cabang-cabang seperti aljabar, analisis, topologi, dll. Dalam pembelajaran mesin ada yang diawasi, tidak diawasi, dan pembelajaran penguatan. Di dalam masing-masing cabang ini, ada cabang yang lebih baik yang membagi metode lebih lanjut.
Saya mengalami masalah menggambar paralel dengan statistik. Apa yang akan menjadi cabang utama statistik (dan cabang pembantu)? Partisi yang sempurna kemungkinan tidak mungkin, tetapi segalanya lebih baik daripada peta kosong besar.
self-study
classification
Silly.deer
sumber
sumber
Jawaban:
Saya menemukan sistem klasifikasi ini sangat tidak membantu dan bertentangan. Sebagai contoh:
dan seterusnya. Tidak ada "cabang" matematika yang jelas, dan statistik seharusnya tidak ada.
sumber
Ini adalah tandingan minor untuk jawaban Rob Hyndman. Ini dimulai sebagai komentar dan kemudian tumbuh terlalu kompleks untuk satu. Jika ini terlalu jauh untuk menjawab pertanyaan utama, saya minta maaf dan akan menghapusnya.
Biologi telah menggambarkan hubungan hierarkis sejak jauh sebelum orat-oret pertama Darwin (lihat komentar Nick Cox untuk tautannya). Sebagian besar hubungan evolusi masih ditunjukkan dengan jenis 'pohon filogenetik' yang bagus, bersih, bercabang:
Namun, kami akhirnya menyadari bahwa biologi lebih berantakan dari ini. Kadang-kadang ada pertukaran genetik (melalui kawin silang dan proses lainnya) antara spesies berbeda dan gen yang ada di satu bagian pohon 'lompat' ke bagian pohon yang berbeda. Transfer gen horizontal memindahkan gen dengan cara yang membuat penggambaran pohon sederhana di atas tidak akurat. Namun, kami tidak meninggalkan pohon, tetapi hanya membuat modifikasi pada jenis visualisasi ini:
Ini lebih sulit untuk diikuti, tetapi menyampaikan gambaran realitas yang lebih akurat.
Contoh lain:
Namun, kami tidak pernah memperkenalkan angka yang lebih kompleks ini untuk memulainya, karena mereka sulit untuk dipahami tanpa memahami konsep dasar. Sebagai gantinya, kami mengajarkan ide dasar dengan figur sederhana, dan kemudian menyajikannya dengan figur yang lebih kompleks dan komplikasi yang lebih baru dalam cerita.
'Peta' statistik apa pun akan menjadi tidak akurat dan juga merupakan alat pengajaran yang berharga. Visualisasi bentuk OP menyarankan sangat berguna bagi siswa dan tidak boleh diabaikan hanya karena mereka gagal menangkap realitas secara total. Kita dapat menambahkan lebih banyak kerumitan pada gambar begitu mereka memiliki kerangka dasar di tempatnya.
sumber
Anda dapat melihat kata kunci / tag dari situs web Cross Validated.
Cabang sebagai jaringan
Salah satu cara untuk melakukan ini adalah dengan memplotnya sebagai jaringan berdasarkan hubungan antara kata kunci (seberapa sering mereka bertepatan dalam posting yang sama).
Saat Anda menggunakan skrip sql ini untuk mendapatkan data situs dari (data.stackexchange.com/stats/query/edit/1122036)
Kemudian Anda mendapatkan daftar kata kunci untuk semua pertanyaan dengan skor 2 atau lebih tinggi.
Anda dapat menjelajahi daftar itu dengan merencanakan sesuatu seperti berikut ini:
Pembaruan: sama dengan warna (berdasarkan vektor eigen dari matriks relasi) dan tanpa tag belajar sendiri
Anda dapat membersihkan grafik ini sedikit lebih jauh (mis. Mengambil tag yang tidak berhubungan dengan konsep statistik seperti tag perangkat lunak, dalam grafik di atas ini sudah dilakukan untuk tag 'r') dan meningkatkan representasi visual, tapi saya kira bahwa gambar di atas sudah menunjukkan titik awal yang bagus.
Kode-R:
Cabang hierarkis
Saya percaya bahwa jenis grafik jaringan di atas berhubungan dengan beberapa kritik mengenai struktur hierarki yang murni bercabang. Jika Anda suka, saya kira Anda bisa melakukan pengelompokan hierarkis untuk memaksanya ke dalam struktur hierarkis.
Di bawah ini adalah contoh model hierarkis tersebut. Kita masih perlu menemukan nama grup yang tepat untuk berbagai kluster (tapi, saya tidak berpikir bahwa pengelompokan hierarkis ini adalah arah yang baik, jadi saya membiarkannya terbuka).
Ukuran jarak untuk pengelompokan telah ditemukan oleh coba-coba (membuat penyesuaian sampai kelompok tampak bagus.
Ditulis oleh StackExchangeStrike
sumber
Cara mudah untuk menjawab pertanyaan Anda adalah dengan melihat tabel klasifikasi umum. Misalnya, Klasifikasi Subjek Matematika 2010 digunakan oleh beberapa publikasi untuk mengklasifikasikan makalah. Ini relevan karena begitulah banyak penulis mengklasifikasikan makalah mereka sendiri.
Ada banyak contoh klasifikasi serupa, misalnya klasifikasi arxiv atau UDK kementerian pendidikan Rusia (klasifikasi universal desimal universal) yang digunakan secara luas untuk semua publikasi dan penelitian.
Contoh lain adalah Sistem Klasifikasi JEL dari American Economic Association. Makalah Rob Hyndman " Peramalan seri waktu otomatis: paket prakiraan untuk R " Ini diklasifikasikan sebagai C53, C22, C52 menurut JEL. Hyndman ada benarnya dalam mengkritik klasifikasi pohon. Pendekatan yang lebih baik bisa berupa penandaan, misalnya kata kunci dalam makalahnya adalah: "model ARIMA, peramalan otomatis, perataan eksponensial, interval prediksi, model ruang angkasa, seri waktu, R." Orang bisa berpendapat bahwa ini adalah cara yang lebih baik untuk mengklasifikasikan makalah, karena mereka tidak hierarkis dan beberapa hierarki dapat dibangun.
@whuber menunjukkan bahwa beberapa kemajuan terbaru seperti pembelajaran mesin tidak akan berada di bawah statistik dalam klasifikasi saat ini. Sebagai contoh, lihatlah makalah " Pembelajaran Dalam: Pengantar untuk Ahli Matematika Terapan " oleh Catherine F. Higham, Desmond J. Higham. Mereka mengklasifikasikan makalah mereka di bawah MSC tersebut sebagai 97R40, 68T01, 65K10, 62M45. ini berada di bawah ilmu komputer, pendidikan matematika dan analisis numerik di samping statistik
sumber
Salah satu cara untuk mendekati masalah tersebut adalah dengan melihat jaringan kutipan dan rekan penulis dalam jurnal statistik, seperti Annals of Statistics, Biometrika, JASA, dan JRSS-B. Ini dilakukan oleh:
Mereka mengidentifikasi komunitas ahli statistik dan menggunakan pemahaman domain mereka untuk memberi label komunitas sebagai:
Makalah ini mencakup diskusi terperinci tentang komunitas bersama dengan dekomposisi yang lebih besar menjadi subkomunitas lebih lanjut.
Ini mungkin tidak sepenuhnya menjawab pertanyaan, karena ini menyangkut bidang penelitian ahli statistik daripada semua bidang, termasuk yang tidak lagi aktif. Semoga ini bermanfaat. Tentu saja, ada peringatan lain (seperti hanya mempertimbangkan empat jurnal ini) yang dibahas lebih lanjut di koran.
sumber
Saya melihat banyak jawaban yang luar biasa, dan saya tidak tahu bagaimana klasifikasi sederhana yang dibuat sendiri dapat diterima, tetapi saya tidak tahu buku yang lengkap dari semua statistik untuk menunjukkan ringkasan, dan saya pikir itu, seperti @ mkt berkomentar dengan cemerlang, klasifikasi bidang studi dapat berguna. Jadi, inilah bidikan saya:
Tentu saja ini terlalu sederhana, itu hanya dimaksudkan untuk memberikan beberapa ide langsung kepada seseorang yang nyaris tidak mengenal bidangnya, kita masing-masing di sini pasti tahu bahwa ada banyak metode di antara kategori di sini, banyak yang lain yang tidak saya ketahui. t daftar karena mereka kurang terkenal atau karena saya hanya lupa. Harap Anda menyukainya.
sumber
Salah satu cara untuk mengatur informasi ini adalah dengan mencari buku yang bagus dan melihat daftar isi. Ini adalah paradoks karena Anda secara khusus bertanya tentang statistik , sedangkan sebagian besar teks tingkat pascasarjana pengantar tentang topik ini adalah statistik dan teori probabilitas secara bersamaan. Buku yang saya baca tentang regresi sekarang memiliki TOC berikut:
Model Data Biner
Model Regresi Umum
(Bagian yang tersisa mendukung matematika dan teori probabilitas)
sumber