hanya untuk rasa ingin tahu ... Bahasa apa yang paling banyak digunakan di sini? R? MATLAB? Python? Jawa?
Apa untuk prototipe atau untuk produksi? Sebagai contoh saya pikir MATLAB sebagian besar digunakan untuk prototyping, python untuk kedua prot. dan produksi ...
Jawaban:
Saya sangat setuju dengan suara untuk R. R adalah "Lingua Franca" dari dunia statistik. Ini adalah definisi terkini, sementara sebagian besar paket untuk MATLAB dan SAS memakan waktu beberapa bulan. Bahasa ini sangat sederhana untuk dipahami sebagai lawan SAS. Ini juga memberi Anda kekuatan untuk terhubung dengan C / C ++ / Python dan database.
Pertimbangkan versi Revolution Analytics dari R untuk kinerja yang sedikit lebih.
http://www.revolutionanalytics.com/products/revolution-r.php
sumber
Nah, Anda dapat MEMBAYAR untuk MATLAB, dan kemudian (1) memprogram hal-hal yang benar-benar Anda butuhkan dari bawah ke atas atau (2) MEMBAYAR LEBIH BANYAK untuk kotak alat MATLAB. Dan temukan bahwa melakukan statistik yang bermanfaat di MATLAB adalah suatu renungan yang ditangani dalam Kotak Alat Statistik yang semakin tidak berguna. Atau ... Anda dapat mengunduh R secara GRATIS dan mencari (dan menemukan!) Paket yang Anda butuhkan, yang juga dapat Anda unduh secara GRATIS.
Banyak hal produksi skala kecil dapat dilakukan di R. Jika Anda melakukan sesuatu yang sangat besar (pikirkan sensus AS), Anda mungkin perlu belajar SAS - dan membuat majikan Anda membayar untuk itu.
sumber
"Popularitas" tergantung pada komunitas dan definisi "statistik". Di seluruh dunia, mengambil pandangan luas tentang "inferensi statistik" sebagai termasuk metode menggambar kesimpulan atau mengambil tindakan berdasarkan data kuantitatif, ada sedikit pertanyaan bahwa Excel mengalahkan semua aplikasi lain, termasuk R, SAS, Stata, SPSS, dan S -Plus . (Tautan mengarah ke berbagai jenis statistik, tetapi mereka sangat sugestif, untuk sedikitnya.) Python dan MATLAB bahkan tidak gagal dalam statistik. Saya tidak mengatakan bahwa ini adalah hal yang baik atau bahwa kita harus menyukainya: begitulah adanya dan itulah yang akan bertahan untuk waktu yang sangat lama.
Kami tidak boleh menarik kesimpulan apa pun dari apa yang tampaknya populer di sini di forum ini. Vendor perangkat lunak komersial mendukung forum mereka sendiri, sehingga secara alami tempat seperti SE akan lebih menyukai orang yang menggunakan perangkat lunak yang tidak didukung secara aktif, terutama gratis, sumber terbuka, dan solusi akademik.
sumber
Seharusnya jelas dengan melihat tag paling populer bahwa R adalah bahasa yang paling populer di situs ini. Apakah itu menjadikannya bahasa yang paling populer untuk analisis statistik tidak dapat disimpulkan secara langsung, tetapi orang mungkin mengira begitu.
sumber
R dan SAS masing-masing memiliki pro dan kontra. Saya pikir lebih banyak ahli statistik perlu merangkul fakta bahwa banyak perangkat lunak statistik hebat tersedia, daripada pertengkaran tanpa henti tentang mana yang lebih unggul.
R gratis. SAS sangat mahal. R memberi Anda kemampuan untuk melakukan apa saja. SAS mungkin atau mungkin tidak. R memiliki kemampuan grafis yang luar biasa. Melihat grafik SAS membuatnya terasa seperti tahun 1985 lagi. SAS memiliki dukungan pelanggan yang hebat. Dukungan R = jam mencari arsip milis. Juga dengan nama seperti "R", hasil mesin pencari seringkali buruk. R sangat lambat dan tidak berurusan dengan set data yang besar. SAS tidak masalah dengan kumpulan data besar. SAS cenderung lebih kuat. Dalam pengalaman saya, ketika datang ke pemodelan efek campuran atau apa pun yang melibatkan desain eksperimen (seperti menganalisis desain crossover), SAS lebih unggul.
Untuk skala besar, simulasi brute force, saya menggunakan Fortran. Saya dulu menggunakan C, tetapi menemukan Fortran jauh lebih mudah digunakan. Saya tidak pernah menggunakan MATLAB. Jika saya membutuhkan kekuatan statistik R tetapi kecepatan Fortran, saya akan menulis operasi intensif waktu (yaitu loop) di Fortran dan memanggil subrutin dari R.
sumber
lme4
paket itu dengan mudah menangani banyak efek acak (seperti yang dijumpai misalnya, dalam penilaian pendidikan). Pengalaman saya sendiri (tetapi terbatas) (SASNLMIXED
vs Rlme4
) mengonfirmasi hal itu: R sama sekali tidak lebih lambat dari SAS dalam hal menerapkan model IRT yang kompleks , dan ia menangani set data genetik yang besar juga (berkat implementasi C yang pintar) .Preferensi saya masuk ke Python, dan mungkin, Jawa. Pertama, mereka adalah bahasa pemrograman nyata. Kedua, mereka adalah bahasa yang paling populer (Indeks TIOBE). Anda juga dapat mengkonversi antara bahasa-bahasa ini menggunakan beberapa bahasa scripting. Di masa lalu saya menggunakan platform DMelt http://jwork.org/dmelt/ untuk melakukan perhitungan statistik, dan saya sangat terkesan dengan grafik dalam 2D dan 3D, yang dapat dengan mudah dicapai untuk makalah profesional. Paket R tidak membuat saya terkesan dengan gambarnya.
sumber