Saya mengambil kursus pascasarjana dalam Statistik Terapan yang menggunakan buku teks berikut (untuk memberi Anda rasa untuk tingkat materi yang dibahas): Konsep dan Metode Statistik , oleh GK Bhattacharyya dan RA Johnson.
Profesor mengharuskan kita menggunakan SAS untuk pekerjaan rumah.
Pertanyaan saya adalah: apakah ada Java library (ies), yang dapat digunakan sebagai pengganti SAS untuk masalah yang biasanya terlihat di kelas tersebut.
Saat ini saya mencoba bergaul dengan Apache Math Commons dan meskipun saya terkesan dengan perpustakaan (itu mudah digunakan dan dimengerti) tampaknya bahkan tidak memiliki hal-hal sederhana seperti kemampuan untuk menggambar histogram (berpikir menggabungkannya dengan perpustakaan grafik) ).
Saya telah melihat Colt, tetapi minat awal saya mereda dengan cepat.
Akan menghargai masukan apa pun - dan saya telah melihat pertanyaan serupa di Stackoverflow tetapi belum menemukan sesuatu yang menarik.
CATATAN: Saya mengetahui perpustakaan R, SciPy dan Octave dan java yang melakukan panggilan ke mereka - Saya mencari perpustakaan asli Java atau kumpulan perpustakaan yang dapat bersama-sama menyediakan fitur yang saya cari.
CATATAN: Topik yang dibahas dalam kelas seperti itu biasanya meliputi: tes satu-samle dan dua-sampel dan interval kepercayaan untuk rata-rata dan median, statistik deskriptif, tes good-of-fit, ANOVA satu dan dua arah, inferensi simultan, pengujian varians, analisis regresi, dan analisis data kategorikal.
Jawaban:
Ketika saya terpaksa menggunakan java untuk statistik dasar, apache commons matematika adalah cara untuk pergi. Untuk plot, saya menggunakan dan merekomendasikan JFreeChart . Yang terakhir tersebar luas, sehingga stackoverflow bahkan memiliki tag yang dihuni untuk itu .
Edit
Jika seseorang mencari suite, maka mungkin Deducer adalah opsi. GUI didasarkan pada JGR sementara bagian statistik disebut dalam R. Tampaknya dapat diperpanjang baik melalui R dan java . Orang bisa misal melewatkan panggilan ke Rengine tetapi memanggil perpustakaan java yang direferensikan sebagai gantinya. Tapi saya akui, saya belum mencobanya.
Sejauh yang saya pahami OP, yang optimal akan menjadi seperti Rapidminer for Statistics , karena Rapidminer adalah kerangka java murni yang mendukung akses GUI (termasuk visualisasi), penggunaan sebagai perpustakaan dan pengembangan plugin kustom. Sejauh pengetahuan saya, sesuatu seperti itu untuk statistik tidak ada. Saya tidak merekomendasikan Rapidminer untuk tugas khusus itu , karena setahu saya ini hanya mencakup tes statistik paling dasar. Visualisasi telah diperluas akhir-akhir ini, tetapi saya tidak dapat memperkirakan seberapa disesuaikan mereka sekarang.
sumber
Lihat Suan Shu: NumericalMethod.com . Ini tidak gratis secara umum, tetapi gratis untuk penggunaan akademis.
sumber
Mirip dengan saran Steffen tentang RapidMiner , Anda mungkin ingin mempertimbangkan Weka . Ini mungkin diarahkan lebih khusus untuk pembelajaran mesin daripada yang Anda harapkan. Ini memiliki banyak algoritma untuk tugas-tugas seperti pengelompokan, klasifikasi, dan regresi. Weka memiliki GUI, tetapi juga dapat digunakan sebagai pustaka perangkat lunak. Saya telah melihat histogram di GUI tapi saya tidak yakin apakah mudah untuk menggunakannya kembali melalui perpustakaan atau tidak.
sumber
Coba http://www.roguewave.com/Portals/0/products/imsl-numerical-libraries/java-library/docs/5.0.1/api/overview-summary.html
Ini didokumentasikan dengan baik dan menyediakan banyak fungsi statistik dan matematika yang berguna. Namun sayangnya itu bukan open source. Jadi jika itu tidak mengganggu Anda, maka perpustakaan harusnya ok.
Namun saya tidak tahu, apakah itu memberikan output grafis.
sumber
Lingkungan komputasi DataMelt memiliki banyak perpustakaan statistik Java hampir untuk semua topik. Anda dapat menggunakannya menggunakan Jython seperti yang disarankan di situs web, tetapi saya menggunakannya dengan Java dan Groovy.
Saya dapat mengatakan lebih banyak: proyek DataMelt mencakup topik statistik berikut:
Berikut ini adalah contoh regresi non-linear yang menggunakan pendekatan log-likelihood untuk menyesuaikan data dengan kesalahan:
Paket ini gratis.
sumber