Matematika memiliki Masalah Milenium yang terkenal (dan, secara historis, Hilbert's 23 ), pertanyaan yang membantu membentuk arah bidang.
Tapi saya tidak tahu apa itu Hipotesis Riemann dan P vs NP.
Jadi, apa pertanyaan terbuka menyeluruh dalam statistik?
Diedit untuk menambahkan: Sebagai contoh semangat umum (jika tidak cukup spesifik) dari jawaban yang saya cari, saya menemukan kuliah "Hilbert's 23" yang diinspirasikan oleh David Donoho pada konferensi "Tantangan Matematika Abad 21": Analisis Data Dimensi Tinggi: Kutukan dan Berkat Dimensi
Jadi jawaban potensial dapat berbicara tentang data besar dan mengapa itu penting, jenis-jenis tantangan statistik yang ditimbulkan data dimensi tinggi, dan metode yang perlu dikembangkan atau pertanyaan yang perlu dijawab untuk membantu memecahkan masalah.
Jawaban:
Sebuah pertanyaan besar harus melibatkan isu-isu kunci dari metodologi statistik atau, karena statistik sepenuhnya tentang aplikasi, itu harus menyangkut bagaimana statistik digunakan dengan masalah-masalah penting bagi masyarakat.
Karakterisasi ini menunjukkan bahwa hal-hal berikut harus dimasukkan dalam pertimbangan masalah besar:
Cara terbaik untuk melakukan uji coba narkoba . Saat ini, pengujian hipotesis klasik membutuhkan banyak tahapan studi formal. Dalam fase selanjutnya (konfirmasi), masalah ekonomi dan etika tampak besar. Bisakah kita berbuat lebih baik? Apakah kita harus memasukkan ratusan atau ribuan orang sakit ke dalam kelompok kontrol dan menyimpannya di sana sampai akhir studi, misalnya, atau dapatkah kita menemukan cara yang lebih baik untuk mengidentifikasi perawatan yang benar-benar bekerja dan mengirimkannya kepada anggota uji coba (dan lainnya) lebih cepat?
Mengatasi bias publikasi ilmiah . Hasil negatif diterbitkan jauh lebih sedikit hanya karena mereka tidak mencapai nilai p ajaib. Semua cabang ilmu pengetahuan perlu menemukan cara yang lebih baik untuk membawa hasil yang penting secara ilmiah , tidak hanya signifikan secara statistik , ke cahaya. (Masalah perbandingan ganda dan mengatasi data dimensi tinggi adalah subkategori dari masalah ini.)
Menguji batas metode statistik dan antarmuka mereka dengan pembelajaran mesin dan kognisi mesin . Kemajuan yang tak terhindarkan dalam teknologi komputasi akan membuat AI benar-benar dapat diakses di masa hidup kita. Bagaimana kita akan memprogram otak buatan? Apa peran pemikiran statistik dan pembelajaran statistik dalam menciptakan kemajuan ini? Bagaimana para ahli statistik dapat membantu dalam berpikir tentang kognisi buatan, pembelajaran buatan, dalam mengeksplorasi keterbatasan mereka, dan membuat kemajuan?
Mengembangkan cara yang lebih baik untuk menganalisis data geospasial . Sering diklaim bahwa mayoritas, atau sebagian besar, basis data mengandung referensi lokasi. Segera banyak orang dan perangkat akan ditemukan secara real time dengan teknologi GPS dan ponsel. Metode statistik untuk menganalisis dan mengeksploitasi data spasial benar-benar baru dalam masa pertumbuhannya (dan tampaknya diturunkan ke SIG dan perangkat lunak spasial yang biasanya digunakan oleh non-statistik).
sumber
Michael Jordan memiliki artikel pendek berjudul Apa Masalah Terbuka dalam Statistik Bayesian? , di mana ia mengumpulkan pendapat banyak ahli statistik untuk pandangan mereka tentang masalah terbuka dalam statistik. Saya akan meringkas (alias, salin dan tempel) sedikit di sini, tapi mungkin yang terbaik hanya dengan membaca aslinya.
Nonparametrik dan semiparametrik
Priors
Hubungan Bayesian / frequentist
Komputasi dan statistik
Seleksi Model dan Pengujian Hipotesis
sumber
Saya tidak yakin seberapa besar mereka, tetapi ada halaman Wikipedia untuk masalah yang belum terselesaikan dalam statistik. Daftar mereka termasuk:
sumber
Sebagai contoh semangat umum (jika tidak cukup spesifik) dari jawaban yang saya cari, saya menemukan kuliah "Hilbert's 23" yang diinspirasikan oleh David Donoho di konferensi "Tantangan Matematika Abad 21":
Analisis Data Dimensi Tinggi: Kutukan dan Berkat Dimensi
sumber
Mathoverflow memiliki pertanyaan serupa tentang masalah besar dalam teori probabilitas .
Akan muncul dari halaman itu bahwa pertanyaan terbesar berkaitan dengan menghindari jalan acak dan perkolasi.
sumber
Anda dapat memeriksa "Masalah Sulit dalam temu wicara Ilmu Sosial Harvard yang diadakan awal tahun ini. Beberapa pembicaraan ini menawarkan masalah dalam penggunaan statistik dan pemodelan dalam ilmu sosial.
sumber
Jawaban saya adalah perjuangan antara statistik frequentist dan Bayesian. Ketika orang bertanya kepada Anda yang Anda "percaya", ini tidak baik! Terutama untuk disiplin ilmu.
sumber