R vs SAS, mengapa SAS lebih disukai oleh perusahaan swasta?

143

Saya belajar R tetapi tampaknya perusahaan jauh lebih tertarik pada pengalaman SAS. Apa kelebihan SAS dibanding R?

Benoit_Plante
sumber
17
Ini tragis, tapi aku takut ...
gung
19
Seorang ahli statistik medis pernah mengatakan kepada saya, bahwa mereka menggunakan SAS karena jika mereka membuat kesalahan karena bug perangkat lunak dan itu menjadi tuntutan hukum, SAS akan mengkompensasi mereka. R datang tanpa jaminan.
Momo
42
@Momo R datang tanpa garansi, benar, tapi saya ingin melihat referensi bahwa SAS memiliki yang kuat. Saya tidak dapat menemukan teks lisensi SAS di situs web mereka, tetapi dapat menemukan sesuatu untuk satu komponen: support.sas.com/documentation/onlinedoc/sasc/doc650/common/…. Itu memiliki garansi 90 hari di media bahwa perangkat lunak dikirimkan pada dan penafian semua topi dari garansi lainnya. Tolong beri referensi selain "seseorang yang pernah memberi tahu saya".
Brian Diggs
13
Dimaksudkan sebagai anekdot, saya suka sinisme pragmatis dari komentar tersebut. Tapi senang Anda memeriksa, saya tidak pernah peduli.
Momo
36
SAS hadir dengan garansi yang sama dengan R: tidak ada.
Frank Harrell

Jawaban:

139

Saya pikir ada beberapa masalah (dalam urutan validitas yang memungkinkan):

  1. Tradisi / kebiasaan : orang terbiasa dengan SAS, dan tidak mau harus belajar sesuatu yang baru. (Semakin sulit, cara Anda berpikir dalam SAS dan R berbeda.) Ini dapat berlaku untuk siapa saja yang mungkin harus mengirimi Anda kode, atau membaca / menggunakan kode Anda, termasuk manajer dan kolega.
  2. Ketidakpercayaan terhadap freeware : Saya punya beberapa orang mengatakan mereka tidak mau menerima hasil dari R karena Anda tidak memiliki perusahaan nirlaba yang memeriksa kode untuk memastikan itu memberikan hasil yang benar sebelum keluar ke pelanggan, kalau-kalau mereka akhirnya kehilangan bisnis.
  3. Data besar : R melakukan operasi dengan semua yang ada dalam memori, sedangkan SAS tidak selalu. Dengan demikian, jika data Anda mendekati batas memori Anda, akan ada masalah.

Secara pribadi, saya hanya berpikir # 3 memiliki kelebihan yang sah, meskipun ada pendekatan untuk data besar yang telah dikembangkan dengan R. Masalah dengan # 1 berbicara sendiri. Saya pikir # 2 mengabaikan beberapa fakta: ada beberapa pemeriksaan yang berlangsung dengan R, banyak paket utama ditulis oleh beberapa nama terbesar dalam statistik, dan ada penelitian yang membandingkan keakuratan berbagai perangkat lunak statistik & R memiliki tentu saja kompetitif.

gung
sumber
41
Poin 1 memperoleh lebih banyak legitimasi jika Anda juga memasukkan "infrastruktur yang ada" di bawah spanduk inersia itu. Jika ada proses bisnis yang sudah ada yang menggunakan SAS, maka ada biaya transisi dengan perubahan. Jika ini masalahnya, ini bukan memilih antara SAS dan R, tetapi memilih antara tetap dengan SAS dan berubah menjadi R, yang dapat memiliki kesimpulan yang berbeda.
Brian Diggs
25
Poin Point 2 adalah bahwa, sementara BEBERAPA paket ditulis oleh para ahli, yang lainnya tidak. Siapa yang menjamin mereka? Siapa yang mengujinya? (Saya tahu mereka diuji bahwa mereka MENJALANKAN, tetapi siapa yang menguji apakah mereka bekerja dengan benar?) Saya tahu, Anda dapat melihat kode, tetapi itu mengandaikan waktu dan kemampuan untuk melihat kode orang lain dan memverifikasinya, seringkali untuk metode yang sangat kompleks.
Peter Flom
18
@ PeterFlom, Anda menaikkan poin yang masuk akal. Karena paket-paket menjadi lebih esoteris, ada lebih sedikit jaminan daripada ada hal-hal dasar. Tapi seberapa jauh Anda harus pergi? Bahkan SEM, yang cukup canggih, ditulis dalam R oleh John Fox. Selain itu, StasK membuat poin yang bagus tentang realitas pemeriksaan perangkat lunak statistik dalam praktiknya. Akhirnya, R jauh lebih komprehensif daripada yang lainnya, jadi ketika Anda ingin melakukan hal-hal esoteris dengan perangkat lunak lain, Anda sebagian besar harus membuat kode sendiri. Siapa yang menjamin keakuratan kode itu?
gung
33
Siapa yang sebenarnya memeriksa kode SAS, Stata, SPSS,? Apakah ada cara sama sekali untuk mengetahui apakah hasil yang mereka berikan, dengan metode yang mereka katakan mereka gunakan, sebenarnya dilaksanakan dengan benar? Saya tahu dari mengikuti, misalnya, lme4milis yang membandingkan SAS dengan cukup teratur. Tetapi tidak mungkin untuk mengetahui apakah kita harus membuat perbandingan seperti itu. Tanpa akses ke sumbernya, kita harus menganggap perusahaan-perusahaan itu bahwa hasil yang dihasilkan oleh perangkat lunak mereka benar-benar valid. Terus terang, saya lebih suka memiliki kemampuan untuk meninjau kode perangkat lunak yang saya gunakan.
Jason Morgan
28
Benar, tetapi sulit untuk menghukum sistem komputasi statistik karena kelengkapannya. Atau mengatakannya dengan cara lain, cara R melakukan sesuatu lebih baik daripada cara sistem lain untuk tidak melakukannya.
Frank Harrell
105

Selain jawaban yang bagus sejauh ini, saya akan menambahkan faktor rasa malu. Jika Anda menghabiskan ratusan ribu dolar tahun lalu untuk dukungan SAS dan SAS, dan Anda mengusulkan untuk tidak mengeluarkan apa pun untuk R, dengan harga dukungan yang sangat rendah (Revolusi, dll), seseorang di rantai itu akan bertanya mengapa. Apakah salah menghabiskan begitu banyak uang tahun lalu ketika R ada tahun lalu? Atau apakah kesalahan menjatuhkan perangkat lunak profesional untuk sesuatu yang dibuat oleh sekelompok relawan?

Setelah masalah dibingkai dengan cara itu, itu adalah tawaran kalah-kalah, jadi mungkin lebih baik untuk tidak mengungkitnya.

Wayne
sumber
47
Ini mungkin jawaban yang paling sinis pada cross divalidasi. +1
probabilityislogic
11
@probabilityislogic: Terima kasih! Untuk lebih jelasnya, ini lebih merupakan komentar tentang manajemen tingkat tinggi yang buruk daripada pada orang yang menggunakan perangkat lunak. Saya telah bekerja di tempat-tempat di mana benar-benar ada sikap (pada tingkat yang lebih tinggi), "Hmmm ... Anda tidak menghabiskan semua uang yang kami anggarkan untuk Anda tahun ini. Jelas Anda bisa mendapatkan lebih sedikit uang, jadi kami Sedang memotong anggaran Anda untuk tahun depan dan memberikan ekstra kepada departemen yang kelebihan biaya. " Aturan Dilbert.
Wayne
11
"Kau tidak menghabiskan uangnya ..." - begitulah sistem perencanaan Soviet dulu bekerja, dari pengetahuan pertamaku.
Tugas
5
Seseorang di rantai perlu dijelaskan bahwa untuk sebagian kecil dari biaya lisensi SAS, Anda dapat menginstal R Studio Server pada Mesin Virtual AWS dengan 16 core dan RAM 256 GB - di tangan 2 programmer R yang baik, itu lebih kuat dari apa pun yang bisa dilakukan SAS. Pikirkan seberapa cepat satu miliar rekaman dapat dikaburkan satu sama lain! Atau dalam hal ini bahkan Open source PostgreSQL dengan Python + PERL akan mencapai sebagian kecil dari biaya.
vagabond
1
"Atau apakah itu kesalahan untuk menjatuhkan perangkat lunak profesional untuk sesuatu yang dibuat oleh sekelompok relawan?" Ini adalah dikotomi yang salah!
kjetil b halvorsen
54

Di atas apa gung telah diidentifikasi dengan benar di sini, masalah terbesar di dunia korporasi adalah warisan. Dan ketika Anda memiliki kode produksi berkualitas baik yang diketahui melakukan pekerjaan itu, Anda tidak mengubahnya. SAS ada di sana sejak tahun 1970-an, dan pada saat itu merupakan satu-satunya bahasa statistik skrip yang efektif. Jumlah kode produksi yang terakumulasi sejak saat itu di SAS dalam pharma dan pemerintahan tidak dapat dibayangkan, puluhan ribu tahun manusia. Menulis ulang ini dalam R atau Stata akan memakan waktu beberapa tahun, kode yang dihasilkan akan menjadi lebih fleksibel, lebih efisien, lebih transparan, lebih mudah dan lebih murah untuk dipelihara, tetapi tidak ada yang akan membayar untuk refactoring tersebut. (Pengalaman saya melakukan ini adalah bahwa kode Stata saya umumnya sekitar tiga kali lebih pendek; Saya pernah punya proyek yang mengubah kode SPSS menjadi Stata di mana saya membuatnya sekitar 20 kali lebih pendek.

Dalam arti tertentu, ini adalah cerita yang mirip dengan penerbit akademis: mereka mengendarai gelombang pengguna akhir yang mempertahankan langganan mereka karena kebutuhan; sebuah universitas tanpa berlangganan Nature bukanlah sebuah universitas. Penerbitan gratis melalui perkumpulan profesional akan membuatnya lebih murah, orang-orang menyiapkan kiriman mereka di LaTeX hari ini, sehingga mereka siap menggunakan kamera, dan orang yang sama akan memberikan tinjauan sejawat, sehingga tidak akan ada kemunduran kualitas pada salah satu dimensi. Tapi ... tidak ada nama merek dan faktor dampak di balik jurnal online.

Ini merangkum semuanya: http://scatter.wordpress.com/2011/06/28/stata-12/ . Stata lebih disukai di bidang ekonomi dan yang berhubungan dengan kebijakan, dan semakin saya belajar SAS, semakin saya menyukai Stata.

Tugas
sumber
38
SAS memiliki sintaksis mengerikan yang dimulai dengan sesuatu yang mirip dengan JCL (Bahasa Kontrol Pekerjaan IBM) untuk mengirimkan pekerjaan batch kartu berlubang pada masa itu. Sungguh luar biasa bahwa orang masih menggunakannya, sungguh.
Wayne
6
+1 Saya sangat menikmati BlackBerry: iOS: Android: Nokia as SAS: Stata: R: SPSS analogi dalam postingan sebar.
jthetzel
6
Wayne, jika Anda pernah memikirkan pernyataan CARD, Anda menyadari bahwa SAS adalah paket perangkat lunak statistik untuk bekerja dengan kartu punch. Stata bekerja dengan set data persegi panjang. R bekerja dengan objek. Jadi tergantung pada format data apa yang harus Anda tangani, yang satu mungkin lebih baik daripada yang lain.
Tugas
3
Satu poin besar dalam warisan adalah hal-hal seperti persetujuan FDA atau peraturan serupa. Industri yang saya ajak bicara tidak akan menyentuh anyhing (TM) setelah mereka melewati itu untuk memastikan mereka tidak harus melalui seluruh proses lagi. Dan itu adalah argumen besar dalam hal uang.
cbeleites
48

Saya telah bekerja secara efektif sebagai programmer SAS selama tujuh tahun terakhir, di sebelah saya seorang rekan kerja telah memprogram SAS lebih lama daripada saya hidup. Seperti dicatat di sini, ada sejumlah besar inersia / warisan di belakang SAS; tetapi SAS seperti halnya R adalah cara untuk suatu cara, bukan cara itu sendiri.

SAS sangat efisien pada akses data sekuensial, dan akses database melalui SQL terintegrasi dengan sangat baik. PROC's didokumentasikan dengan sangat baik, tetapi sayangnya tidak sepenuhnya standar dengan notasi (PROC OPTMODEL dan IML adalah dua contoh). Agak canggung ketika harus menulis kode yang rumit, dan tidak seanggun kode paralel. Saya juga menemukan mengimpor file csv menjadi sumber kesengsaraan besar di waktu dan lebih suka hanya membuangnya ke R pertama kemudian ke database.

Meskipun SAS memang memiliki antarmuka untuk objek bersama dan lain-lain, Anda tidak mendapatkan akses bagus ke file header apa pun atau semacamnya, dan distribusi kode juga tidak tersedia melalui paket bahagia.

Namun ada sedikit kekhawatiran tentang seseorang termasuk beberapa paket esoteris yang sekarang tidak berfungsi atau rusak dalam kode Anda yang sekarang perlu Anda pertahankan, dan kualitas kode dalam SAS cenderung sangat baik (kode inti R juga sangat baik, dan juga bebas tersedia untuk siapa saja).

Seperti yang disebutkan sebelumnya SAS juga sangat mahal, tetapi ini adalah alat yang baik yang saya gunakan ketika saya tahu ada prosedur kalengan yang bekerja dengan baik untuk kebutuhan saya.

R + SAS + mysql dengan sedikit perl untuk merekatkan mereka bekerja dengan sangat baik :)

Jonathan Lisic
sumber
11
Komentar tentang memelihara paket lama berjalan baik untuk makro yang ditulis pengguna atau proc lama yang belum diperbarui.
probabilityislogic
4
R juga memiliki dukungan SQL yang sangat baik yang diperoleh baru-baru ini melalui dplyrperpustakaan - R secara harfiah menerjemahkan sintaks R / dplyr ke dalam SQL dan memanggil basis data, Anda dapat memutuskan operasi apa yang harus dilakukan pada server db dan apa yang secara lokal menggunakan sintaksis yang sama: cran.r-project. org / web / paket / dplyr / vignettes / databases.html
Tim
41

Jadi saya menggunakan R dan SAS - memang diakui di dunia akademis - tetapi ada beberapa alasan mengapa saya cenderung menuju SAS kadang-kadang:

  1. Dokumentasi yang lebih baik. R menjadi lebih baik dalam hal ini, tetapi dokumentasi, terutama dokumentasi resmi, seringkali agak buruk dan tidak jelas. Selain itu, SAS didukung oleh infrastruktur buku yang sangat besar - penggunaan R! seri ini membantu dalam R, tapi belum ada di sana. Saya dapat beralih ke Analisis Kelangsungan Hidup Paul Allison Menggunakan SAS , atau Analisis Data Kategorikal Menggunakan SAS atau buku yang saya miliki tentang metode Monte Carlo menggunakan SAS dan saya memiliki buku yang ditulis dengan jelas dalam gaya yang cukup konsisten untuk bahasa yang saya gunakan.
  2. Kelembaman. Ini bukan hanya "perusahaan malas" - kelembaman juga memiliki nilai. Ada pengetahuan institusional. Begitu-dan-begitu memiliki kode yang melakukan itu - dan melakukannya dengan baik.
  3. Paket. Beberapa paket di R luar biasa. Beberapa paket tidak. Anda harus pergi mencari mereka, mengevaluasi mereka, dan bahkan kemudian ada beberapa masalah lompatan-keyakinan dalam paket itu hanya sebaik orang yang menulisnya. Sulit untuk percaya itu. SAS pada dasarnya memiliki "kepercayaan penuh dan kredit dari SAS Institute" yang memiliki rekam jejak yang cukup solid.
  4. Dukungan sumber tunggal. Jika SAS rusak, Anda memanggil SAS. Jika R rusak Anda menelepon ....?
Fomite
sumber
21
"Jika R rusak kamu menelepon ....?" Brian Ripley :-) (+1 untuk respons yang diperdebatkan dengan baik ini)
chl
6
Mengenai 4), saya pikir ada konsep yang membingungkan. Jika Anda menggunakan program dan rusak, Anda biasanya memiliki dua opsi. Anda dapat membayar untuk dukungan, atau Anda dapat mencari dukungan yang tersedia secara bebas (komunitas online, literatur, sendiri). R dan SAS dapat dibandingkan sebagai bahasa pemrograman statistik. Keduanya memiliki dukungan yang tersedia secara bebas, yang juga dapat dibandingkan. R dan SAS tidak dapat dibandingkan dengan solusi dukungan berbayar ...
jthetzel
7
... SAS Institute menyediakan dukungan berbayar untuk SAS. Perusahaan seperti Revolution Analytics dan TIBCO (S +) memberikan dukungan berbayar untuk R. Jika Anda ingin membandingkan solusi dukungan berbayar untuk R dan SAS, Anda harus membandingkan SAS Institute dengan Revolution Analytics dan TIBCO, bukan R. Kekacauan, saya percaya, timbul dari integrasi ketat bahasa SAS dengan SAS Institute dan non-integrasi bahasa R dengan dukungan dan pendidikan perusahaan terkait-R.
jthetzel
3
@ jthetzel Saya tidak berpikir itu "kebingungan". Bahasa SAS sangat erat dengan layanan SAS. Platform apa pun yang dikerjakan SAS mendapat dukungan dari SAS. Ini tidak benar untuk dukungan R - dan bahasa dipisahkan, mungkin tidak ada bantuan untuk Anda tergantung pada platform (coba bicara dengan Revolution kapan saja ketika tidak menggunakan Windows atau RHEL ...), dan mereka tidak perlu bertanggung jawab untuk Kesalahan RandomPackage, di mana SAS akan mendukung PROC Sewenang-wenang.
Fomite
2
@probabilityislogic Saya pikir di luar harus mengevaluasinya untuk melihat apakah itu sesuai untuk analisis Anda. Ya, keduanya bisa salah, dan keduanya perlu dievaluasi. Tapi saya percaya tim kontrol kualitas SAS lebih dari saya percaya pada saya sendiri.
Fomite
39

Tidak ada yang mengatakan alasan mengapa itu lebih disukai adalah kebodohan. Inilah dua kutipan yang baru-baru ini saya temui:

"Menggunakan perangkat lunak sumber terbuka seperti R tidak mungkin - kami tidak dapat menjamin hasil yang dapat diulang dengan sempurna"

dan

"Kami tidak akan dapat memberikan dukungan apa pun karena ini adalah perangkat lunak open source"

Dua menit dengan orang-orang ini akan menunjukkan kepada mereka betapa salahnya mereka.

Spacedman
sumber
3
Dua menit dengan orang yang mana? Tanpa referensi hampir seolah-olah Anda baru saja membuat kutipan itu.
David Heffernan
4
kutipan kedua tampaknya baik-baik saja dari departemen TI dewan, mereka tidak dapat diharapkan untuk mendukung semua perangkat lunak open source yang mungkin digunakan pelanggan, oleh karena itu peringatan menyeluruh. Saya pikir kutipan anti open source terburuk yang pernah saya dengar adalah dari SAS yang mengatakan sesuatu seperti 'maukah Anda mempercayai jet jumbo yang dirancang dalam open source, mesin mungkin akan jatuh'
PaulHurleyuk
5
@PaulHurleyuk: +1 Kutipannya adalah “Kami memiliki pelanggan yang membuat mesin untuk pesawat terbang. Saya senang mereka tidak menggunakan freeware ketika saya mendapatkan pada jet.”Oleh direktur pemasaran SAS di artikel ini New York Times pada R . Perwakilan SAS mengklarifikasi pernyataannya dalam posting blog berikutnya .
jthetzel
4
@PaulHurleyuk: Sama halnya dewan tidak dapat diharapkan untuk mendukung perangkat lunak berpemilik yang mungkin ingin digunakan pelanggan. Keterbukaan bukan alasannya. Jika mereka mengatakan mereka tidak dapat mendukung apa pun di luar perangkat lunak yang didukung, maka baiklah.
Spacedman
5
Dalam dua kasus yang saya kutip, mungkin ada keputusan yang rasional, tetapi alasan yang diberikan jelas bukan alasan itu. Alasan rasional mungkin "kami sudah mendukung SAS, dan kami tidak mampu mendukung dua paket statistik". Tetapi "Kami tidak dapat mendukung ini karena ini adalah open source" adalah non-sequitur. Dua bagian itu mungkin benar, tetapi kesimpulannya tidak mengikuti. Seperti mengatakan "Elizabeth adalah Ratu karena langit berwarna biru".
Spacedman
23

Satu masalah tampaknya tidak diatasi secara eksplisit: ass-covering. Jika Anda menggunakan SAS dan banyak hal meledak, pembuat keputusan selalu dapat mengatakan bahwa ia membeli perangkat lunak canggih, dan bagaimana ia tahu itu akan hancur? Jika dia memutuskan untuk pergi dengan R, argumen ini akan lebih sulit untuk dibuat. Ya, ini terkait dengan argumen inersia yang telah disebutkan di sini.

Beberapa dasawarsa yang lalu, mereka biasa mengatakan bahwa "noboby pernah dipecat karena membeli IBM" , yang telah disebut sebagai frase pemasaran terbesar yang pernah ada.

Stephan Kolassa
sumber
2
Meskipun, saya tidak yakin bagaimana R kurang canggih daripada SAS (dan berkaitan dengan banyak prosedur, saya mendapat kesan bahwa R lebih canggih daripada SAS). Dugaan saya adalah bahwa banyak pengguna SAS tidak tahu tentang itu ...
Patrick Coulombe
21

Sebagai pengguna SAS dan R, saya akan mengatakan alasan terbesar kami menggunakan SAS lebih dari R (ketika kami melakukannya) adalah kemampuannya untuk pemrosesan sekuensial. Kami hanya membutuhkan mesin dengan RAM tidak lebih dari 4GB untuk memproses data selama 15 tahun. Saya akan membutuhkan mesin yang jauh lebih besar menggunakan stok R dan saya belum mencoba memigrasi kode SAS untuk dijalankan dengan Revolution R.

merenung
sumber
8
+1, walaupun perlu dicatat bahwa ada beberapa cara untuk bekerja dengan dataset yang lebih besar dari memori di R ( bigmemory , ff , chunking data dari database, berbagai opsi komputasi terdistribusi). Tetapi semua itu membutuhkan pengaturan; SAS memang hanya akan menenggelamkan apa pun yang Anda lemparkan padanya, yang merupakan keuntungan nyata.
Matt Parker
21

Waktu mereka adalah sebuah perubahan

Pada 2015, aktuaris di bawah usia sekitar 35 lebih suka menggunakan R - buku teks menggunakan kode R dan SAS. Aktuaris yang lebih tua tidak pernah belajar menggunakan R dan lebih suka SAS dan tidak menggunakan R. Proporsi aktuaris yang benar-benar mengkode dalam SAS akan menurun.

Jika Anda mencari makalah Google yang merujuk pada SAS - maka Anda akan menemukan publikasi yang stabil selama 550 tahun per tahun selama beberapa tahun terakhir. Jika Anda mencari makalah menggunakan R ("R Foundation for Computing Statistik"), ada 25.100 pada 2014 dan pada pertengahan Juli 2015 ada 16.700. Merencanakan angka - ini berkembang sangat cepat!

SAS tidak membantu diri mereka sendiri selama beberapa tahun dengan menuntut biaya lisensi yang besar dari universitas - yang telah mereka batalkan - tetapi sekarang sudah terlambat banyak universitas telah beralih ke mengajar menggunakan R dan bukan SAS.

Teknik statistik baru diterbitkan dalam makalah bersama dengan paket R. Beberapa teknik yang telah di basis R selama bertahun-tahun masih belum muncul di SAS. Anda sekarang dapat menggunakan R dari dalam SAS.

Singkatnya, banyak hal berubah dan berubah dengan cepat.

Sean
sumber
19

Dalam industri farmasi SAS digunakan karena itulah yang digunakan dan disukai oleh FDA. Ada beberapa alasan serius. Hasil dapat dilacak dan output memiliki cap waktu. Ahli statistik FDA dapat memeriksa apa yang Anda dapatkan. Ini sangat baik untuk manajemen basis data dan ini adalah perangkat lunak yang dapat diandalkan. Tentu saja banyak atribut SAS yang dapat diperdebatkan hadir dalam paket perangkat lunak lain termasuk R dan SAS yang mahal. Masih saya pikir siapa pun yang ingin menjadi ahli statistik terapan yang bekerja di industri akan lebih baik untuk setidaknya belajar bagaimana memprogram dalam SAS. Gunakan R atau STATA jika Anda lebih suka tetapi kenal SAS. Ketika Anda bekerja untuk perusahaan yang ingin Anda menggunakan SAS, mereka akan membayar lisensi.

Michael Chernick
sumber
4
Berikut adalah beberapa informasi tambahan tentang pemikiran FDA sehubungan dengan R: blog.revolutionanalytics.com/2012/06/fda-r-ok.html
Matt Parker
4
Yayasan R menerbitkan sebuah makalah pada tahun 2008 membahas penggunaan R dalam uji klinis yang diatur . Ini harus menjadi referensi yang baik untuk kolaborator yang skeptis menggunakan R.
jthetzel
2
Saya setuju bahwa ada langkah untuk menggunakan R lebih banyak dalam penelitian klinis dan banyak yang percaya bahwa R dapat dibuat setiap bit dapat dilacak seperti SAS.
Michael Chernick
6
FDA cukup vokal tentang TIDAK mendukung atau memerlukan satu perangkat lunak apa pun untuk digunakan. Secara historis memang benar bahwa sebagian besar pengiriman telah menggunakan SAS, sehingga FDA memiliki banyak pengetahuan SAS, tetapi mereka sangat cepat untuk merangkul sistem lain, menggunakan R untuk banyak pekerjaan terbaru, terutama seputar meta analysis.
PaulHurleyuk
1
@PaulHurleyuk Apa yang akan dikatakan FDA di depan umum dan bagaimana mereka bertindak dalam praktik belum tentu sama. Sebagian besar perusahaan farmasi terutama berkaitan dengan uji klinis fase II dan III dan mereka umumnya berharap bahwa mereka harus dan akan terus perlu menggunakan SAS untuk analisis uji coba tersebut.
Michael Chernick
18

Saya pikir kutipan dari Anne H. Milley ini meringkas perasaan banyak orang tentang R:

Kami memiliki pelanggan yang membuat mesin untuk pesawat terbang. Saya senang mereka tidak menggunakan freeware ketika saya naik jet.

Sayangnya, saya pikir kesalahpahaman ini (gratis == lebih rendah) adalah umum di masyarakat umum.

Zach
sumber
16

(topik yang agak tidak umum): melihatnya sebagai ronde lain: beberapa keunggulan yang dimiliki R dalam dunia akademis tidak berlaku untuk industri.

Misalnya dalam dunia akademis, itu adalah keuntungan yang jelas jika Anda dapat memberitahu siswa untuk pergi dan mendapatkan perangkat lunak dan bekerja di rumah. Dalam industri, Anda biasanya tidak seharusnya membawa pulang data apa pun ...

Anda juga tidak boleh mencoba beberapa hal (TM), mengunduh banyak paket (bahkan jika memiliki reputasi & teruji), gunakan metode mutakhir. Alih-alih, Anda biasanya diharapkan untuk tetap berpegang pada metode & kode yang telah digunakan selama bertahun-tahun dan di mana perilaku tersebut diketahui sejak lama. Anda tidak akan memenangkan banyak manfaat akademis dengan itu.

Dan tentu saja, seperti yang telah disebutkan: tidak seorang pun akan mengambil risiko mengulangi semua jenis persetujuan pengaturan demi beralih ke R. Dari apa yang saya lihat itu kurang tentang R dan lebih banyak tentang biaya besar + pekerjaan untuk mendapatkan persetujuan regulatori .

cbeleites
sumber
3
Tidak ada yang perlu dilakukan untuk mengulangi persetujuan peraturan demi beralih ke R.
Frank Harrell
2
@ Frank: mungkin kita berpikir dalam skenario yang berbeda: Saya kira Anda mungkin berpikir tentang percobaan baru (dan itu benar) - Saya lebih berpikir dalam hal analitik proses (analisis kimia + statistik) yang sedang berlangsung produksi. AFAIK, Anda tidak bisa hanya beralih analisis data di sana (tapi kemudian, itu bukan negara SAS). Tapi saya mungkin salah.
cbeleites
2
Saya tidak akrab dengan dunia itu tetapi saya curiga bahwa para ilmuwan memiliki lebih banyak kebebasan daripada yang mereka pikirkan.
Frank Harrell
13

Sementara itu cukup pesimis, jawaban saya adalah bahwa jenis orang yang membuat keputusan besar di perusahaan seperti 'kami hanya menggunakan SAS' juga jenis orang yang tidak mempercayai apa yang tidak mereka pahami, dan secara otomatis memikirkan nilainya. sesuatu berbanding lurus dengan jumlah uang yang Anda habiskan untuk itu. Ini membuat mereka lebih suka membayar untuk SAS daripada menghabiskan waktu menyelidiki alternatif.

PaulHurleyuk
sumber
12

Mengapa perusahaan obat besar bahkan ingin mengkonversi ke R dari SAS? SAS menelan biaya jutaan tetapi itu bukan apa-apa bagi perusahaan obat. Namun, mengubah semua sistem pelaporan stabil dari SAS ke R akan menelan biaya 50-100 kali lebih tinggi.

SAS memiliki sistem pendukung yang fenomenal: setiap kali saya membutuhkan bantuan, mereka dapat menyediakannya dalam beberapa jam.

Dan apa sebenarnya yang dimiliki R yang tidak dimiliki SAS: 1) grafis yang lebih baik ... ok, ini yang besar tetapi grafis bukanlah segalanya. selain itu R selalu dapat digunakan alat tambahan untuk membuat beberapa grafik keren dan SAS tidak terlalu buruk dalam hal grafik 2) bahasa pemrograman modern dan lebih efisien. Banyak pengguna SAS bukan pemrogram dan tidak peduli menggunakan bahasa keren. Mereka hanya ingin dapat menganalisis data.

Saya suka R tetapi akan menjadi gila bagi perusahaan besar untuk pindah ke SAS. Ini bisa masuk akal untuk perusahaan kecil

Max C
sumber
3
Setuju dengan Anda, @ Max. Akhirnya jawaban datang dari seseorang di industri. Ini MAHAL untuk beralih ke R.
Dan
3
Itu salah. Biaya dukungan pemrograman untuk SAS jauh lebih tinggi dari itu untuk R. Perusahaan menyewa simpanan programmer SAS untuk menebus bahasa SAS yang digunakan kuno.
Frank Harrell
Saya di industri dan menggunakan keduanya. R dapat melakukan manipulasi data dan, yang lebih penting, menganalisis dengan garis yang jauh lebih sedikit, dan karenanya dapat dikembangkan lebih cepat. Saya akan mengatakan bahwa beberapa perusahaan obat telah membangun sistem SAS untuk pemrograman pengaturan yang telah berhasil. Poinnya menjadi pertimbangan: mengapa berubah (pada titik ini)? Jika mereka melakukannya dari awal, mungkin R sebagai gantinya.
AdamO
11

Ada beberapa keunggulan utama, tanpa urutan tertentu

  • SAS memiliki basis terpasang yang besar dan rekam jejak yang panjang

Saya sengaja menghindari penggunaan istilah yang merendahkan seperti "warisan" atau "kebiasaan" Banyak perusahaan telah menggunakan SAS selama 30 atau 40 tahun, dan mereka memiliki jutaan baris kode kerja. Selain itu, ada semua manfaat dari basis kode yang stabil dengan jutaan hari pengguna di area di mana kesalahan kecil bisa menjadi kritis. Ini adalah alasan yang sama bahwa rasa Unix masih populer meskipun Unix berusia lebih dari 40 tahun dan usang dalam beberapa hal. Akhirnya, ada komunitas besar profesional SAS berpengalaman yang digunakan untuk memecahkan masalah bisnis

  • SAS sangat cocok untuk data yang heterogen, kompleks dan lingkungan operasi

Perusahaan memiliki banyak sumber data yang berbeda, yang berbasis pada berbagai jenis sistem, serta dalam banyak kasus, beberapa lingkungan operasi. R baru-baru ini mendapatkan beberapa kemampuan yang sangat mendasar untuk menangani lebih dari yang dapat disimpan dalam memori. Bandingkan ini dengan kemampuan SAS untuk mendukung pemrosesan dalam-database asli, yang dioptimalkan, untuk terradata, untuk mengutip hanya satu contoh. Dalam sebagian besar situasi dunia nyata, bagian tersulit dari analitik adalah berurusan dengan data dan lingkungan operasi. (perlu menjalankan kode penilaian model yang dikembangkan Windows pada mainframe? Dengan SAS, tidak ada masalah. Dengan R, Anda kurang beruntung.) R tidak menyelesaikan masalah tersebut.

  • Pengguna tidak perlu khawatir menjadi "sendiri"

Seorang pengguna SAS dapat yakin bahwa setiap modul kode telah diuji oleh orang-orang yang memenuhi syarat. Tidak perlu mencurahkan waktu dan upaya untuk mempelajari asal-usul kode, atau memvalidasi secara independen. Lebih jauh, jika masalah dalam bentuk apa pun ditemukan, bantuan yang kuat (dari sesuatu yang mendasar seperti dokumentasi hingga yang komprehensif seperti penjelajahan hasil tak terduga atau perilaku metode canggih) pengguna dapat mengangkat telepon dan mendapatkan bantuan.

  • "Cukup bagus"

Bahasa mematikan sebagian orang karena berbeda dari bahasa modern untuk pemrograman umum. Karena itu, bahasanya tinggi, kuat, ekspresif, dan komprehensif. Singkatnya, setelah Anda mempelajarinya, itu menyelesaikan pekerjaan. Bagi perusahaan, keanggunan solusi tidak banyak nilai jual.

JBK
sumber
2
Keanggunan mungkin - tetapi biaya? Saya pikir perusahaan peduli akan hal itu!
probabilityislogic
2
R dapat berjalan pada apa pun dari ponsel ke komputer super tanpa biaya, dan mainframe juga, tanpa biaya.
Sean
9

Dukungan pelanggan.

Saya pernah bercakap-cakap dengan seorang teman yang bekerja di sebuah perusahaan yang berspesialisasi dalam menginstal server, dan dia kemudian menjelaskan kepada saya mengapa perusahaan-perusahaan besar selalu memilih produk-produk Microsoft daripada menjadi open source. Keuntungan Microsoft memiliki lebih dari pesaing open source adalah dukungan pelanggan. Jika ada yang salah dengan produk, perusahaan dapat memanggil Microsoft, perusahaan besar bahkan memiliki dukungan pribadi untuk mereka. Tidak demikian halnya dengan perangkat lunak sumber terbuka.

Saya pikir itu adalah alasan yang sama persis SAS mendapatkan prioritas di atas R.

Raskolnikov
sumber
2
Revolution R (atau perusahaan lain)?
Ben Bolker
4
Saya pikir komentar ini tidak benar. Di dunia server, aturan sumber terbuka, dan server web Apache adalah server web paling populer.
Frank Harrell
Saya tidak pernah mengatakan dia berbicara tentang server. Melainkan tentang produk seperti Microsoft Office. Saya hanya menyebutkan bahwa dia bekerja di dunia server.
Raskolnikov
2
Mengingatkan saya pada perusahaan yang menggunakan Sharepoint dan wiki open source. Hampir selalu sharepoint mandul dan hanya wiki yang diperbarui.
TLJ
9

Bagaimana dengan Frontends? Apa yang setara dengan R untuk SAS Enterprise Guide, Web Report Studio atau Enterprise Miner? Sunting: Alat-alat ini memungkinkan bagi Pengguna non-pemrograman untuk menggunakan GUDANG DATA, tanpa pengetahuan tentang teknologi yang mendasarinya. Mereka bukan alat utama untuk penggunaan SAS seperti itu. R GUI hanya IDE untuk bahasa R / sistem, AFAIK. Mereka tidak dapat memberikan bantuan untuk pengguna non-teknis yang ingin mendapatkan informasi & wawasan dari DWH.

Kurt
sumber
2
Itu jawaban. Apa yang membuat SAS sangat berharga bagi pelanggan (seperti kami) adalah kemudahan penggunaan bagi orang-orang yang tidak perlu menulis satu baris kode pun.
Kurt
2
@ Kurt, gung tidak ingin mengatakan bahwa ini bukan jawaban, melainkan bahwa jawaban Anda tidak cocok dengan situs ini (dan terutama untuk pertanyaan yang ada saat ini, sebenarnya)
Stéphane Laurent
Ada banyak GUI untuk R, lihat stats.stackexchange.com/questions/5292/...
naught101
2
Yah, saya telah bekerja dengan RStudio. Dibandingkan dengan SAS Enterprise Guide, masih memiliki jalan yang sangat panjang sampai mencapai kemudahan penggunaan bagi pengguna pemula. Tambahkan fakta bahwa R tidak ada yang setara dengan Server Metadata. Dan saya benar-benar kehilangan setara dengan out-of-the-box untuk WRS (mungkin saya buta :)). Keindahan bahasa dan produktivitas yang dapat Anda raih berarti apa-apa bagi perusahaan di mana 90% dari "pelanggan" gudang data tidak dapat menulis "Hello World" di lingkungan pemrograman apa pun. Itulah yang ingin saya tunjukkan, dan di situlah banyak pekerjaan yang harus dilakukan.
Kurt
2
Terima kasih telah memperbarui jawaban Anda, @Kurt. Saya pikir ini akan lebih bermanfaat bagi pembaca masa depan sekarang. Memang benar bahwa ada penawaran point & click, & data warehouse untuk SAS yang lebih komprehensif, & siap-untuk-keluar dari kotak daripada R. Itu adalah poin yang masuk akal untuk dinaikkan. +1
gung
8

Saya pernah bekerja untuk sebuah perusahaan konsultan yang memberikan bantuan SAS kepada produsen chip besar di Silicon Valley. Penghubung kami di perusahaan memberi tahu kami bahwa ia mendapat tawaran dari perusahaan lain untuk memberi mereka konsultasi yang sama persis, dengan menggunakan perangkat lunak berbeda yang mencakup semua area yang dicakup oleh SAS dan yang akan membebani sebagian kecil dari apa yang ditagih SAS kepada mereka. ( $ 30.000 dibandingkan dengan $ 1.000.000). Orang yang dapat dihubungi mempertimbangkan apa yang harus dilakukan dan memutuskan untuk tidak memberi tahu atasannya tentang tawaran itu karena dia khawatir dipecat karena menggunakan SAS sejak awal dan tidak mempertimbangkan alternatif yang lebih murah. Sebagai gantinya, dia bersikeras bahwa perusahaan konsultan kami memberikan perusahaan mereka terobosan besar dalam biaya konsultasi kami. Perusahaan kami setuju.

sAV
sumber
1
Jadi penghubung Anda tidak dapat membuat argumen bahwa R masih relatif baru dibandingkan dengan SAS, dan ia ingin menunggu untuk memastikan R telah dibuat sebelum menggunakannya?
probabilityislogic
6

Saya tidak berpikir keamanan aplikasi telah disebutkan. Pertanyaan ini dimunculkan dalam Stack Overflow tetapi jatuh karena itu di luar topik.

Saya bekerja sama dengan Dewan Kesehatan dan Kesejahteraan Nasional Swedia yang menggunakan SAS. Ketika saya berbicara dengan ahli statistik mereka (yang seperti R) mereka mengklaim bahwa orang-orang IT mereka lebih suka SAS karena mereka tidak mempercayai paket yang diunduh dalam R. Istri saya juga bekerja di SAS dan lembaganya sering mengklaim masalah yang sama ...

Saya ingin melihat beberapa komentar tentang masalah ini. Saya telah melakukan pencarian cepat tetapi belum menemukan referensi yang bagus ...

Max Gordon
sumber
3
Apa alternatif untuk mengunduh paket yang menyediakan kemampuan baru (seperti yang dilakukan sebagian besar paket R)? Apakah untuk rumah tumbuhkan kemampuan itu? Apakah itu lebih dapat diandalkan?
Frank Harrell
2
@ FrankHarrell Saya setuju, tapi saya pikir ini mungkin area yang mudah bagi pengembang R untuk menargetkan dan meningkatkan. Sebuah solusi sederhana bisa berupa tingkat keamanan yang berbeda untuk paket - jika suatu paket memiliki panggilan sistem atau menghubungkan sendiri ke Internet paket harus memiliki izin yang lebih tinggi. Ini dapat memungkinkan instalasi dengan hanya izin tingkat rendah di lembaga / perusahaan di mana kebocoran data menjadi perhatian utama. Saya sebagai pengguna kemudian dapat juga melakukan pemeriksaan tambahan ketika saya memilih untuk menginstal paket izin tinggi. (Btw, kapan buku Anda (RMS ver 2) dijadwalkan?)
Max Gordon
Saya berharap RMS edisi ke-2 akan tersedia hanya dalam waktu satu tahun.
Frank Harrell
5

Alasan yang saya pahami sebagai yang paling meyakinkan adalah bahwa SAS memiliki perpustakaan yang luas untuk modul-modul spesifik bisnis vertikal yang digunakan semua orang dalam vertikal ini, jadi ini agak terkunci.
Tetapi juga bahwa SAS telah menjawab kebutuhan segmen vertikal ini dalam bisnis dan dioptimalkan sesuai kebutuhan mereka - dioptimalkan dalam arti "pengguna tidak harus melakukan banyak pekerjaan ekstra untuk mendapatkan hasil". Saya bukan pengguna SAS, jadi ini tidak dimaksudkan sebagai pertahanan bias terhadap strategi bisnis SAS.

Nitin
sumber
4

Menjadi produk komersial besar seperti SAS, ada upaya kuat dan terkoordinasi oleh tenaga penjualan yang dibayar untuk mempromosikannya. Saya tidak berpikir bahwa upaya untuk mempromosikan penggunaan R dapat menyamai ini.

Itamar
sumber
8
Ya, orang sampai batas tertentu menemukan R di on mereka. Tetapi sebagian besar masalah timbul karena inersia mempelajari bahasa baru. Bahasa baru selalu keluar yang memiliki keunggulan dibandingkan bahasa yang lebih lama namun pengguna tetap menggunakan bahasa yang lama (saksi COBOL). Pemrograman dalam SAS sangat tidak efisien, membutuhkan mungkin dua kali lipat jumlah programmer untuk melakukan pekerjaan yang sama dengan R, tetapi para ahli SAS senang bersenandung dalam cara meriah mereka dan perusahaan takut akan jenis gangguan yang akan menyelamatkan mereka jutaan dolar dalam gaji.
Frank Harrell
3

Saya melihat Open Source atau perangkat lunak berlisensi seperti ini, baik SAS atau apa pun. Departemen TI saya ada di sana untuk memberikan layanan kepada bisnis kami. Perusahaan tidak mendapat uang dari IT, hanya dari bisnis yang didukung IT. Bisnis ini memiliki pendapatan tahunan $ 16 Miliar. Biaya TI sekitar $ 200 juta per tahun. Jika uang adalah masalah saya akan memotong biaya, tetapi jika saya menghemat 10% ( $ 20 juta) dari anggaran saya, akankah bisnis memerhatikan? Apakah mereka akan mengurangi anggaran saya tahun depan? Jika IT gagal, bisnis kehilangan pendapatan, berapa banyak akan bervariasi pada sifat kegagalan. Bagian dari bisnis mungkin tidak lagi menghasilkan pendapatan. Jika produk seperti SAS gagal, saya dapat menuntut berdasarkan kontrak. Jika produk OSS gagal, saya tidak bisa. Saya tidak akan memulihkan $ saya16 Miliar, tapi saya mungkin mendapatkan kembali, dan secara realistis dengan SAS, Anda tidak akan kehilangan banyak. Perbedaan harga versus biaya harus membenarkan setiap risiko yang dirasakan tambahan untuk bisnis. Terkadang lebih murah untuk tetap menggunakan SAS daripada berlatih kembali. Terkadang ada masalah prioritas yang lebih tinggi, sehingga perusahaan tetap menggunakan SAS. Beberapa perusahaan tidak memerlukan fungsionalitas penuh dalam hal alternatif yang layak. Beberapa tidak membutuhkan dukungan dan lagi alternatif yang layak. Jika Anda memenuhi persyaratan bisnis maka kedua opsi tersebut valid, jika Anda ingin memberikan dukungan untuk bisnis Anda perlu melihat total biaya kepemilikan selama 5-10 tahun, kemampuan merekrut para ahli dalam alat, stabilitas dalam produk. jadi Anda tidak perlu menulis ulang semuanya dengan setiap rilis baru, kursus pelatihan yang tersedia untuk meningkatkan keterampilan,

Bruce Rei
sumber
4
Saya tidak mengikuti alasan Anda. Jumlah uang yang terbuang untuk membayar programmer untuk memprogram dalam bahasa kuno (SAS) vs bahasa gratis modern sangat menakjubkan.
Frank Harrell
4
@ Terus terang - Saya harus tidak setuju dengan karakterisasi Anda. Seorang programmer SAS yang kompeten dapat sangat produktif dalam SAS, dan programmer SAS yang kompeten tersedia secara luas. Saya beri tahu Anda bahwa R terstruktur lebih seperti bahasa modern, dan mungkin lebih mudah dipelajari untuk programmer yang tahu, katakanlah, Java. Dalam pengalaman saya di banyak perusahaan, produktivitas pengembang menggunakan SAS jarang merupakan masalah material.
JBK
9
Setelah menggunakan SAS selama 23 tahun dan S-Plus / R selama 22 tahun saya dapat mengatakan bahwa seorang programmer SAS yang sangat berpengalaman dapat menjadi sangat produktif, tetapi seorang programmer R yang berpengalaman dapat dengan mudah tiga kali lebih produktif.
Frank Harrell
2
"Saya dapat menuntut di bawah kontrak" haha ​​- kode yang salah yang ditulis oleh karyawan jauh lebih mungkin menyebabkan masalah daripada yang dilakukan SAS atau R "dengan sendirinya"
probabilityislogic
1

Beberapa alasan yang belum saya lihat disebutkan:

  1. Dokumentasi yang lebih baik. Dokumentasi SAS adalah verbose, dokumentasi R singkat. Banyak perusahaan mungkin lebih suka dokumentasi verbose.

  2. Pesan kesalahan yang lebih baik. Pesan kesalahan R sering tampaknya dirancang untuk membuktikan bahwa orang yang menulis pesan itu lebih pintar daripada orang yang membacanya.

  3. Dukungan teknologi. SAS memiliki beberapa dukungan teknis terbaik yang pernah saya temui di mana saja, yang disediakan oleh SAS. Anda bisa mendapatkan bantuan dengan R, tetapi bantuan itu tersebar di berbagai tempat dan tidak selalu tersedia. Orang-orang di berbagai situs yang menyediakan bantuan dengan R adalah sukarelawan - dan sukarelawan tidak wajib membantu. Orang-orang di dukungan teknis SAS dibayar untuk melakukan apa yang mereka lakukan - dan mereka melakukannya dengan baik. Tidak hanya mereka melakukannya dengan baik, mereka melakukannya dengan sopan suatu sifat yang sering tidak hadir di semua komunitas R (favorit saya? "Saya mendapat bantuan dengan mengetikkan 'bantuan', mengapa Anda tidak mencoba mengetik 'bantuan'?")

  4. L.SEBUAHTEX

Peter Flom
sumber
1
Saya yakin ada perusahaan yang menjual dukungan teknis untuk R. Tapi betapa baiknya itu saya tidak punya pengalaman!
kjetil b halvorsen
1

Saya pikir sudut warisan bisa menjadi besar karena alasan berikut. Suatu organisasi merekrut seseorang, memanggil mereka orang X. Mereka adalah seorang guru komputer / penyihir / dll. Mereka membangun program / alat SAS yang mengagumkan / dll. Mereka sangat baik sehingga orang lain dalam organisasi tidak merasa perlu memahami cara kerja program. Mereka membuatnya sangat mudah untuk hanya menekan tombol, dan semuanya hanya berfungsi (kotak hitam ajaib).

Orang X meninggalkan organisasi. Sayangnya, pengetahuan bahwa orang X telah meninggalkan organisasi (dokumentasi dan manajemen pengetahuan tidak diprioritaskan, program kerja malah). Mereka digantikan oleh orang Y. Orang Y hebat dengan R tetapi tidak tahu tentang SAS, dan karenanya tidak tahu tentang bagaimana sebenarnya program SAS bekerja. Ada kurva belajar yang sangat besar untuk menentukan apaCT. Kita kemudian memerlukan (efisiensi?) Perolehan kecil dari pindah ke R (saya katakan kecil berdasarkan pengalaman saya dengan mengoptimalkan kode SAS dan mengoptimalkan kode R untuk prediksi regresi logistik). Ini juga perlu dibandingkan dengan biaya lisensi untuk SAS. Kemungkinan ituCTsecara signifikan lebih tinggi dari lisensi satu tahun untuk SAS. Saya berharap SAS akan melakukan beberapa analisis dari trade off ini, dan membiarkan ini mempengaruhi bagaimana ia menetapkan biaya lisensi (well, saya akan lakukan jika saya bekerja di SAS). Juga perhatikan bagaimana prosedur merencanakan SAS jauh lebih baik daripada satu dekade yang lalu (mis. Proc sgplot vs proc plot). kebetulan bahwa R melakukan plot yang baik dulu? Saya pikir tidak! Ini secara efektif mengurangi efisiensi dari beralih karena merencanakan tidak begitu berbeda lagi - R masih lebih baik, tetapi tidak cukup untuk ...

probabilityislogic
sumber
0

Untuk statistik industri, ada orang-orang jaminan kualitas yang (biasanya) tidak memiliki pemrograman, statistik, atau latar belakang sains dan yang mengaudit ahli statistik, programer, dan ilmuwan. Mereka ingin tahu, "Bagaimana Anda tahu bahwa apa yang Anda lakukan itu benar?" dan "Jika itu salah, bagaimana kita dapat menyalahkan seseorang dan bagaimana mereka akan membayarnya?".

Lisensi GNU / GPL Copyleft hadir dengan teks kalengan yang mengatakan, "R adalah perangkat lunak gratis dan DATANG DENGAN TIDAK ADA JAMINAN" dalam teks all-caps persis seperti yang telah saya tulis. Ini membantah. Ketika orang yang berkualitas membaca teks ini, mereka pada dasarnya mendiskreditkan R secara langsung. Maksud saya, jika suatu produk bagus, ada baiknya menambah garansi bukan? Seperti memiliki produk komersial membuat kami percaya. Bahkan, pada akhirnya FDA yang mengatakan mereka akan menerima pengiriman peraturan dalam R yang mencerminkan seachange dalam industri perangkat lunak. (Perhatikan pernyataan ini muncul setelah tanggal posting asli pertanyaan.)

Bagi seseorang yang tidak tahu apa-apa tentang komputer, skenario keamanan yang dibayangkan, tidak dapat direproduksi, dan kesalahan ilmiah yang serius tidak terikat sebagai hasil dari KURANGNYA GARANSI YANG BENAR-BENAR TIDAK ADA. Kita semua sepakat bahwa kesalahan dapat memiliki biaya yang sangat besar. Untuk lisensi SAS Anda, SAS memiliki ahli yang dapat menjelaskan perangkat lunak mereka kepada auditor, dan dalam skenario yang tidak mungkin bahwa SAS benar-benar menyebabkan masalah seperti itu, mereka dapat bertanggung jawab atas denda dan hukuman (mereka juga memiliki cukup uang untuk pengacara untuk memastikan mereka dibebaskan sepenuhnya dalam kasus seperti itu). Beban dan biaya untuk memiliki analis / programmer yang mempresentasikan kasus ini untuk R pada dasarnya merupakan lisensi SAS. Bukan berarti pemrograman di SAS benar-benar membebaskan Anda dari beban berat kepatuhan kualitas!

Jadi pada dasarnya, saya akan mengatakan litigasi telah memainkan peran penting dalam memerlukan perangkat lunak lisensi yang mahal.

AdamO
sumber