Dalam mengevaluasi kualitas perangkat lunak yang akan Anda gunakan (apakah itu sesuatu yang Anda tulis atau paket kalengan) dalam pekerjaan komputasi, seringkali merupakan ide yang baik untuk melihat seberapa baik kerjanya pada set data standar atau masalah. Di mana orang bisa mendapatkan tes ini untuk memverifikasi rutinitas komputasi?
(Tolong, satu situs web / buku per jawaban.)
Jawaban:
Jika Anda tertarik untuk melakukan analisis tentang matriks jarang, saya juga akan mempertimbangkan Pengumpulan Matriks Koleksi Universitas Florida dan Pasar Matriks .
sumber
Metode solusi yang diproduksi adalah standar untuk menguji PDE dan pemecah lainnya. Sebagian besar sistem aljabar simbolis memiliki fasilitas untuk menghasilkan kode, ini berguna untuk membuat solusi buatan. SymPy dan Maple memiliki kode fungsi, antara lain untuk tujuan ini.
sumber
Satu set tes untuk IVP (Masalah Nilai Awal untuk pemecah ODE) saat ini dikelola oleh orang-orang dari University of Bari, Italia, yang mengambil alih dari CWI Amsterdam.
sumber
Untuk menguji algoritma partisi grafik, ada Walshaw's Graph Partitioning Archive .
sumber
Dalam komputasi elektromagnetisme, ada yang terkenal (atau terkenal karena kesulitan dalam beberapa) masalah tes: Pengujian Metode Analisis Elektromagnetik (TIM) .
Beberapa dari mereka benar-benar membutuhkan teknik numerik canggih untuk mendapatkan hasil simulasi yang benar selaras dengan data eksperimen. Misalnya, masalah konduktor-koil .
Seperangkat masalah pengujian untuk persamaan Maxwell dikompilasi oleh Dauge: Komputasi benchmark untuk persamaan Maxwell untuk perkiraan solusi yang sangat tunggal . Yang ada di kubus Fichera yang terkenal (atau terkenal):
sumber
Jika Anda tertarik pada algoritma pembandingan yang terkait dengan struktur molekul, basis data pubchem memiliki banyak koleksi sebagian besar molekul organik. Ini mungkin berguna untuk membandingkan prediksi sifat molekuler yang diperoleh dengan model / program yang berbeda. Situs ini memiliki beberapa opsi untuk mengunduh sejumlah besar molekul yang memenuhi beberapa kriteria yang telah ditentukan (misalnya komposisi kimia).
sumber
Arnold Neumaier mempertahankan masalah pengujian yang stabil untuk optimasi yang tidak dibatasi dan dibatasi (pemrograman nonlinear). Termasuk dalam koleksi ini adalah masalah tes standar sekarang untuk optimasi yang tidak dibatasi karena Moré, Garbow, dan Hillstrom.
sumber
Situs web CUTEr memperbarui set uji CUTE yang disebutkan di situs web Arnold Neumaier dengan beberapa masalah tambahan untuk pengoptimalan dan pemecah linear. Selain itu, ia menyediakan alat perangkat lunak untuk pengujian dan pembaruan aljabar linier dan pemecah optimasi.
sumber
Tes Athena jika Anda menyelesaikan hukum konservasi hiperbolik.
sumber
Kami menggunakan set data cuaca di perangkat lunak simulasi energi bangunan kami. Untuk AS, set data terdiri dari pengamatan cuaca yang diambil (biasanya di bandara) setiap jam selama 20 tahun sebelumnya.
Kumpulan data tersedia untuk diunduh .
Manual untuk menggambarkan format file .
sumber
Untuk menguji algoritma statistik, ada A Handbook of Small Data Set oleh DJ Hand, F. Daly, K. McConway, D. Lunn, dan E. Ostrowski. Beberapa set data tersebut dapat diunduh dari sini .
sumber
Untuk menguji analisis statistik multivariat dan algoritma pembelajaran mesin, ada repositori dataset UCI di http://www.ics.uci.edu/~mlearn/
sumber
Situs web Hans Mittelman adalah sumber yang bagus untuk menavigasi opsi perangkat lunak saat ini dalam optimasi numerik. Ia menyertakan tolok ukurnya sendiri, serta tautan ke tolok ukur lain untuk masalah pengujian dalam pengoptimalan .
sumber
Alan Genz mengusulkan serangkaian fungsi dalam makalah Pengujian rutinitas integrasi multidimensi . Saya tidak dapat menemukan versi online makalah ini, tetapi referensi untuknya dapat ditemukan di makalah tentang perpustakaan CUBA .
sumber
Ada koleksi referensi masalah optimisasi terbatas-PDE yang dikelola oleh Roland Herzog di TU-Chemnitz di sini .
sumber
Perangkat lunak yang baik harus telah diuji, dan harus mengatakan bagaimana penulis telah menguji dan menyediakan set data uji sendiri (misalnya dalam bentuk tes regresi) atau setidaknya memberikan tautan ke data yang diuji dengan itu.
sumber
Jika Anda mencari grafik besar atau data jaringan untuk diuji. The Analisis Stanford Jaringan Project (SNAP) memiliki banyak dataset grafik besar biasanya dalam bentuk daftar adjacency anonim. Beberapa opsi mereka termasuk:
Data
Properti Data
Statistik kebenaran dasar tersedia di dataset:
Alat
sumber
Data mudah; API untuk mendapatkannya bisa jadi sulit. Saya merekomendasikan Quandl . Situs ini memiliki lebih dari 10 juta set data yang tersedia untuk umum yang dapat diakses melalui satu API yang mudah, REST-ful. Semua data dikembalikan dalam CSV atau JSON. Atau, jika pemrograman tidak sesuai dengan keinginan Anda, ada cara mudah untuk memasukkan data ke Excel. Pemrogram R, Python, dan Ruby akan langsung di rumah dengan pustaka asli.
sumber