Gagasan Proyek Sains Data [ditutup]

23

Saya tidak tahu apakah ini tempat yang tepat untuk mengajukan pertanyaan ini, tetapi komunitas yang didedikasikan untuk Ilmu Data harus menjadi tempat yang paling tepat menurut saya.

Saya baru saja mulai dengan Ilmu Data dan pembelajaran Mesin. Saya mencari ide proyek jangka panjang yang bisa saya kerjakan selama 8 bulan.

Gabungan Ilmu Data dan pembelajaran Mesin akan menjadi hal yang luar biasa.

Sebuah proyek yang cukup besar untuk membantu saya memahami konsep inti dan juga mengimplementasikannya pada saat yang sama akan sangat bermanfaat.

Kevin Desai
sumber

Jawaban:

27

Saya akan mencoba untuk menganalisis dan memecahkan satu atau lebih masalah yang dipublikasikan pada Kompetisi Kaggle ( https://www.kaggle.com/competitions ). Perhatikan bahwa kompetisi dikelompokkan berdasarkan kompleksitas yang diharapkan , dari 101(bawah daftar) ke Researchdan Featured(atas daftar). Pita vertikal kode warna adalah pedoman visual untuk pengelompokan. Anda dapat menilai waktu Anda bisa menghabiskan waktu di sebuah proyek dengan menyesuaikan diharapkan panjang kompetisi yang sesuai, berdasarkan Anda keterampilan dan pengalaman .

Sejumlah ide proyek sains data dapat ditemukan dengan menjelajahi Coursolvehalaman web berikut : https://www.coursolve.org/browse-needs?query=Data%20Science .

Jika Anda memiliki keterampilan dan keinginan untuk mengerjakan proyek sains data nyata , fokus pada dampak sosial , kunjungi DataKindhalaman proyek: http://www.datakind.org/projects . Lebih banyak proyek dengan fokus dampak sosial dapat ditemukan di Data Science for Social Goodhalaman web fellowship: http://dssg.io/projects .

Halaman Science Project Ideas di My NASA Datasitus terlihat seperti tempat lain untuk dikunjungi untuk inspirasi: http://mynasadata.larc.nasa.gov/804-2 .

Jika Anda ingin menggunakan data terbuka , daftar panjang aplikasi ini Data.govdapat memberikan Anda beberapa ide proyek sains data yang menarik : http://www.data.gov/applications .

Aleksandr Blekh
sumber
5

Ambil sesuatu dari kehidupan sehari-hari Anda. Buat prediktor kemacetan di wilayah Anda, buat rekomendasi musik yang dipersonalisasi, analisis pasar mobil, dll. Pilih masalah nyata yang ingin Anda selesaikan - ini tidak hanya akan membuat Anda termotivasi, tetapi juga membuat Anda melalui seluruh lingkaran pengembangan dari pengumpulan data untuk pengujian hipotesis.

teman
sumber
2
Mendapatkan data seringkali merupakan salah satu tantangan terbesar :)
Patlaf
2

Pengantar kursus Ilmu Data yang sedang dijalankan di Coursera sekarang termasuk tugas proyek dunia nyata di mana perusahaan memposting masalah mereka dan siswa didorong untuk menyelesaikannya. Ini dilakukan melalui coursolve.com (sudah disebutkan di sini).

Informasi lebih lanjut di sini (Anda harus terdaftar dalam kursus untuk melihat tautan itu)

Alexey Grigorev
sumber