Seberapa jauh seseorang bisa unggul? [Tutup]

8

dalam bisnis saya, kami menangani semua analitik melalui Excel. Ini termasuk sebagian besar penjadwalan, perencanaan produksi dan operasi akuntansi. Kami saat ini sedang mencari untuk menambahkan sedikit pemodelan prediktif dan Excel cukup untuk suatu titik, tetapi tidak memiliki dukungan untuk model yang kompleks.

Seperti yang saya lihat, manfaat utama dari Excel adalah kemudahan penggunaan dan kemudahan yang Anda dapat temukan dan melatih orang untuk terbiasa dengannya. Di sisi lain lingkungan yang lebih canggih (misalnya R, python) dapat menangani berbagai tugas analitik yang lebih luas, tetapi membutuhkan individu yang lebih terlatih.

Saya juga telah membaca pertanyaan ini tentang apakah Excel cukup untuk Ilmu Data dan sementara itu sedikit di luar ruang lingkup untuk tujuan saya, kesimpulannya adalah alat seperti R dan Python jauh lebih baik daripada Excel.

Pertanyaan saya adalah (dalam konteks analitik data): "Seberapa jauh kita bisa dapatkan dengan Excel, tanpa perlu mengubah ke alat yang lebih canggih?" atau "Pada titik apa kita perlu bermigrasi dari Excel ke -let's say- R?"

Terima kasih banyak!

Jcart
sumber
Komentar saya, untuk apa nilainya: Excel OK untuk set data yang relatif kecil dari ukuran yang diketahui. Ini mengerikan untuk dataset besar, dan untuk dataset dengan panjang yang berbeda-beda.
Adrian Keister
1
Kemungkinan duplikat dari Apakah para ilmuwan data menggunakan Excel?
tuomastik

Jawaban:

2

TL; DR

Jika Anda memiliki waktu yang tidak terbatas dan menggunakan versi 64-bit Excel, Anda dapat menggunakan Excel sebagai alat analisis data lainnya.

Waktu

Saya menyebutkan waktu sebagai faktor pertama saya, karena Excel hanya memiliki fungsi dasar bawaan, seperti penjumlahan, pembuatan angka acak, pencarian dll. Ini berhubungan dengan semacam perpustakaan standar , yang juga dimiliki oleh Python dan R. Dengan menggunakan fungsi-fungsi dasar ini, dengan waktu yang cukup, Anda dapat membangun hampir semua alat analisis di luar sana. Jangan berharap kinerja runtime yang baik. Namun, dalam Python dan R, ada banyak paket yang telah dibuat orang, yang berkinerja baik dan telah diuji oleh banyak orang sehingga dipercaya.

Penyimpanan

Poin kedua saya tentang 64-bit Excel adalah karena itu memungkinkan lebih banyak memori untuk digunakan oleh satu instance Excel. Ini memungkinkan lebih banyak sel untuk diisi. Menggunakan 32-bit excel akan membatasi Anda untuk proyek sekitar 2Gb. Itu adalah jumlah data yang wajar, tetapi itu adalah batas yang sulit.

Kemudian langkah-langkah dalam 64-bit Excel, yang pada dasarnya berarti tidak ada lagi batas memori - hanya yang berasal dari perangkat keras Anda, dan itu berarti Python dan R juga akan dihentikan di jalurnya.

Untuk memberikan beberapa angka, kita cukup menghitung jumlah bit yang dapat disimpan di setiap versi. Di sini, di prompt interaktif Python:

In [1]: (2**32) / 10**9          # 10^9 means the result is 4.3 Gb
Out[1]: 4.294967296

In [9]: (2**64) / 10**18         # 10^15 means the result is 18.4 Eb
Out[9]: 18.446744073709553

Ebberarti exa-byte . Ini berarti 18,4 juta juta juta gigabytes.

Saya perhatikan perhitungan menunjukkan 4Gb untuk 32-bit, sementara saya katakan 2 Gb di atas. Saya membaca ada semacam batasan keras pada versi 32-bit. Saya tidak tahu atau tidak peduli mengapa itu ... Saya menggunakan Python dan R ;-)

Bagaimanapun, saya harap itu cukup untuk meyakinkan Anda bahwa ingatan tidak menjadi masalah, jika Anda adalah orang yang berani mau menginvestasikan seluruh waktu Anda untuk membangun alat dari bawah ke atas!

Ringkasan

Jika Anda memiliki logika bisnis yang rumit, di mana analisis sebenarnya secara matematis sederhana, tetap berpegang pada Excel. Orang-orang bisnis akan mencintaimu karenanya.

Jika Anda ingin melakukan lebih dari regresi linier, gunakan Python atau R.

Peringatan

Sejauh yang saya tahu Anda tidak dapat menjalankan tugas jarak jauh atau didistribusikan menggunakan Excel, sedangkan yang relatif mudah menggunakan Python dan (sedikit kurang menurut saya) R. Jadi pada saat itu, saya akan menyerah pada Excel. Anda mungkin harus mengimplementasikan alat Anda sendiri di C # atau C ++ menggunakan framework .Net.

n1k31t4
sumber