Aljabar komputer simbolik untuk statistik

8

Fungsi apa yang harus ada dalam CAS yang secara khusus diarahkan pada Statistik?

Sistem aljabar simbolis seperti Mathematica dan Maple sering digunakan untuk masalah kalkulus, logika, dan fisika tetapi jarang digunakan untuk statistik. Kenapa ini?

Konstruksi statistik apa yang dapat ditambahkan ke sistem aljabar simbolis untuk meningkatkan penggunaannya dalam bidang ini? Apa beberapa contoh kode spesifik yang ingin dilakukan banyak orang.

Silakan pikirkan tentang tiga pengguna berikut: ahli statistik penelitian, peneliti non-statistik menggunakan statistik di bidang lain (seperti biologi), mahasiswa statistik.

Saya akan bekerja pada kode statistik SymPy selama beberapa bulan ke depan dan ingin meminta masukan untuk fungsi yang diinginkan. Hal-hal yang saya gunakan belum tentu apa yang digunakan masyarakat luas.

MRocklin
sumber
Ada paket yang didedikasikan untuk statistik, lihat proyek R untuk komputasi statistik ( r-project.org ).
Roman Luštrik
1
Ya, R bagus untuk statistik. Namun ia cenderung berspesialisasi dalam kebanyakan perhitungan numerik. Saya tertarik pada apa yang bisa kita lakukan untuk membantu peneliti dalam manipulasi simbolik.
MRocklin
2
Tidak jelas bahwa salah satu dari sistem simbolik ini membutuhkan "konstruksi statistik" yang ditambahkan padanya. Mathematica telah melakukan banyak hal dalam rilis 8, tetapi masih tidak akan menjadi platform yang populer untuk statistik atau siswa terapan. Salah satu alasannya adalah bahwa perangkat lunak statistik yang baik mendukung tenaga kerja non-matematika jauh lebih baik daripada perangkat lunak matematika: input data, manajemen, transformasi, permintaan, dan dokumentasi. Perangkat lunak statistik biasanya juga mendukung galeri besar metode visualisasi data.
whuber
2
Saya tidak yakin mengapa Anda berpikir CAS jarang digunakan dalam statistik; secara pribadi saya menggunakan Mathematica sepanjang waktu. Casella & Berger bahkan memiliki lampiran yang dikhususkan untuk Mathematica. Tetapi sebagai ahli statistik saya biasanya menghabiskan lebih banyak waktu dengan data daripada melakukan matematika, seperti yang ditunjukkan @whuber.
JMS
2
Juga sadari bahwa banyak (sebagian?) Peneliti dan siswa akademis memiliki akses gratis ke paket dewasa seperti Maple dan Mathematica melalui mesin dan / atau lisensi situs.
JMS

Jawaban:

9

Dukungan untuk aljabar matriks. Sebagian besar statistik yang dipraktikkan adalah multivariat dan melibatkan matriks, dan sering kali menyederhanakan bentuk matriks memerlukan aturan khusus yang tidak mudah diterjemahkan dari kasus univariat, sehingga dukungan matriks yang baik akan sangat membantu.

pengguna2839
sumber
2
Ini adalah sesuatu yang sudah bagus di Mathematica .
Whuber
Poin luar biasa. Apa yang bisa ditambahkan ke sistem yang sudah mengekspresikan aljabar linier dengan baik? Atau apakah ekspresi matriks yang solid cukup?
MRocklin
1
@ MR Daripada bertanya apa yang bisa ditambahkan ke sistem ini, pikirkan mengapa Anda melakukan ini. Untuk siapa? Apa gunanya yang ingin Anda dukung? Apa alasan kuat (jika ada) untuk menambahkan prosedur statistik ke sistem simbolik? Dengan kata lain, mulailah dengan spesifikasi fungsional yang baik.
whuber