Pustaka Java sumber terbuka untuk statistik di tingkat yang ditawarkan oleh kursus statistik lulusan

15

Saya mengambil kursus pascasarjana dalam Statistik Terapan yang menggunakan buku teks berikut (untuk memberi Anda rasa untuk tingkat materi yang dibahas): Konsep dan Metode Statistik , oleh GK Bhattacharyya dan RA Johnson.

Profesor mengharuskan kita menggunakan SAS untuk pekerjaan rumah.

Pertanyaan saya adalah: apakah ada Java library (ies), yang dapat digunakan sebagai pengganti SAS untuk masalah yang biasanya terlihat di kelas tersebut.

Saat ini saya mencoba bergaul dengan Apache Math Commons dan meskipun saya terkesan dengan perpustakaan (itu mudah digunakan dan dimengerti) tampaknya bahkan tidak memiliki hal-hal sederhana seperti kemampuan untuk menggambar histogram (berpikir menggabungkannya dengan perpustakaan grafik) ).

Saya telah melihat Colt, tetapi minat awal saya mereda dengan cepat.

Akan menghargai masukan apa pun - dan saya telah melihat pertanyaan serupa di Stackoverflow tetapi belum menemukan sesuatu yang menarik.

CATATAN: Saya mengetahui perpustakaan R, SciPy dan Octave dan java yang melakukan panggilan ke mereka - Saya mencari perpustakaan asli Java atau kumpulan perpustakaan yang dapat bersama-sama menyediakan fitur yang saya cari.

CATATAN: Topik yang dibahas dalam kelas seperti itu biasanya meliputi: tes satu-samle dan dua-sampel dan interval kepercayaan untuk rata-rata dan median, statistik deskriptif, tes good-of-fit, ANOVA satu dan dua arah, inferensi simultan, pengujian varians, analisis regresi, dan analisis data kategorikal.

pengguna1172468
sumber
2
Sudahkah Anda mempertimbangkan R ?
RioRaider
Hai, terima kasih atas catatannya, saya mencari perpustakaan yang hampir seluruhnya di Jawa. Jadi saya mengetahui perpustakaan R, SciPy dan Octave dan java yang membuat panggilan ke mereka - saya akan mengedit pertanyaan untuk mencerminkan hal ini. Terima kasih.
user1172468
Anda mengatakan bahwa "Saya mengetahui perpustakaan R, SciPy dan Octave dan java yang membuat panggilan ke mereka". Bisakah Anda memberi tahu saya bahwa bagaimana Anda akan memanggil kode yang ditulis dalam "perangkat lunak statistik R" menggunakan Java?
Aman Chawla
5
Mengapa Anda ingin menggunakan perpustakaan Java untuk tes statistik dasar?
Underminer
3
@Underminer mengajukan pertanyaan yang benar di sini. Melakukan statistik di Jawa seperti menggunakan palu untuk sekrup. Dengan tekad yang cukup dan kekuatan kasar Anda pasti bisa mendapatkan sekrup di tempatnya, tetapi tidak dengan cara yang sangat elegan atau efisien. Anda mungkin akan berakhir dengan sekrup yang rusak dan jari-jari yang menyakitkan.
Marc Claesen

Jawaban:

10

Ketika saya terpaksa menggunakan java untuk statistik dasar, apache commons matematika adalah cara untuk pergi. Untuk plot, saya menggunakan dan merekomendasikan JFreeChart . Yang terakhir tersebar luas, sehingga stackoverflow bahkan memiliki tag yang dihuni untuk itu .

Edit

Jika seseorang mencari suite, maka mungkin Deducer adalah opsi. GUI didasarkan pada JGR sementara bagian statistik disebut dalam R. Tampaknya dapat diperpanjang baik melalui R dan java . Orang bisa misal melewatkan panggilan ke Rengine tetapi memanggil perpustakaan java yang direferensikan sebagai gantinya. Tapi saya akui, saya belum mencobanya.

Sejauh yang saya pahami OP, yang optimal akan menjadi seperti Rapidminer for Statistics , karena Rapidminer adalah kerangka java murni yang mendukung akses GUI (termasuk visualisasi), penggunaan sebagai perpustakaan dan pengembangan plugin kustom. Sejauh pengetahuan saya, sesuatu seperti itu untuk statistik tidak ada. Saya tidak merekomendasikan Rapidminer untuk tugas khusus itu , karena setahu saya ini hanya mencakup tes statistik paling dasar. Visualisasi telah diperluas akhir-akhir ini, tetapi saya tidak dapat memperkirakan seberapa disesuaikan mereka sekarang.

steffen
sumber
Hai, itulah yang saya coba lakukan, berharap ada suite yang lebih komprehensif.
user1172468
@ user1172468 Saya telah memperbarui jawaban saya
steffen
4

Lihat Suan Shu: NumericalMethod.com . Ini tidak gratis secara umum, tetapi gratis untuk penggunaan akademis.

pengguna765195
sumber
Ini sebenarnya bukan jawaban untuk pertanyaan OP. Itu lebih dari sebuah komentar. Maukah Anda memperluasnya untuk membuatnya lebih dari sebuah jawaban? Atau, kami dapat mengonversinya menjadi komentar untuk Anda.
gung - Pulihkan Monica
Mungkin Anda bisa memperluas mengapa itu bukan jawaban. Dia mencari perpustakaan java dan saya menunjuknya ke salah satu yang memiliki sebagian besar fitur yang dia cari.
user765195
Anda benar, situasi ini sedikit lebih ambigu daripada situasi standar. Meskipun demikian, ini pada dasarnya hanya jawaban tautan. SE menganggap itu sebagai komentar daripada jawaban. Anda memiliki reputasi yang cukup untuk memberikan ini sebagai komentar. Karena hanya sebuah tautan adalah semacam jawaban di sini & karena ada upvote, saya tidak menandainya untuk konversi ke komentar, tetapi mungkin lebih baik jika Anda dapat menambahkan sedikit ke dalamnya. Jika Anda tidak bisa, & memilih untuk tidak memberikan komentar, saya menghargai keputusan Anda, itu sebabnya saya hanya meninggalkan Anda catatan.
gung - Pulihkan Monica
Tampaknya tidak gratis untuk penggunaan akademis.
kosmos
Sayangnya, tidak lagi tampaknya, tetapi versi siswa tampaknya masih tersedia seharga $ 100.
user765195
3

Mirip dengan saran Steffen tentang RapidMiner , Anda mungkin ingin mempertimbangkan Weka . Ini mungkin diarahkan lebih khusus untuk pembelajaran mesin daripada yang Anda harapkan. Ini memiliki banyak algoritma untuk tugas-tugas seperti pengelompokan, klasifikasi, dan regresi. Weka memiliki GUI, tetapi juga dapat digunakan sebagai pustaka perangkat lunak. Saya telah melihat histogram di GUI tapi saya tidak yakin apakah mudah untuk menggunakannya kembali melalui perpustakaan atau tidak.

Michael McGowan
sumber
Hai terima kasih atas tanggapannya, saya benar-benar memikirkan materi yang tercakup dalam kursus Statistik Lulusan: Topik meliputi tes satu dan dua sampel dan interval kepercayaan untuk rata-rata dan median, statistik deskriptif, tes good-of-fit, satu dan dua ANOVA-jalan, inferensi simultan, varians pengujian, analisis regresi, dan analisis data kategorikal.
user1172468
1

Coba http://www.roguewave.com/Portals/0/products/imsl-numerical-libraries/java-library/docs/5.0.1/api/overview-summary.html

Ini didokumentasikan dengan baik dan menyediakan banyak fungsi statistik dan matematika yang berguna. Namun sayangnya itu bukan open source. Jadi jika itu tidak mengganggu Anda, maka perpustakaan harusnya ok.

Namun saya tidak tahu, apakah itu memberikan output grafis.

Orges Leka
sumber
1
Hai, terima kasih atas tautannya, tahukah Anda perbandingannya dengan Apache Commons Math.
user1172468
1

Lingkungan komputasi DataMelt memiliki banyak perpustakaan statistik Java hampir untuk semua topik. Anda dapat menggunakannya menggunakan Jython seperti yang disarankan di situs web, tetapi saya menggunakannya dengan Java dan Groovy.

Saya dapat mengatakan lebih banyak: proyek DataMelt mencakup topik statistik berikut:

  • Angka acak
  • Diskrit dan distribusi yang paling populer
  • Analisis statistik deskriptif
  • Kesesuaian data (linear dan non-linear)
  • Berbagai tes statistik
  • Histogram dalam 2D ​​dan 3D

Berikut ini adalah contoh regresi non-linear yang menggunakan pendekatan log-likelihood untuk menyesuaikan data dengan kesalahan:

masukkan deskripsi gambar di sini

Paket ini gratis.

Remi
sumber
3
Selamat datang di situs ini, @Remi. Ini sebenarnya bukan jawaban untuk pertanyaan OP. Itu lebih dari sebuah komentar. Harap hanya menggunakan bidang "Jawaban Anda" untuk memberikan jawaban. Saya tahu ini membuat frustrasi, tetapi Anda dapat berkomentar di mana saja saat reputasi Anda> 50. Sebagai alternatif, Anda dapat mencoba mengembangkannya untuk membuatnya lebih sebagai jawaban. Karena Anda baru di sini, Anda mungkin ingin membaca halaman tur kami , yang berisi informasi untuk pengguna baru.
gung - Reinstate Monica