Matematika PhD (Nonlinear Programming) beralih ke Ilmu Data?

9

Saya seorang Ph.D. siswa yang tertarik untuk pergi ke industri sebagai Ilmuwan Data setelah lulus. Saya akan memberikan sedikit latar belakang tentang pendidikan saya sebelum mengajukan pertanyaan saya, sehingga lebih dipahami:

Kursus Matematika:

Ini sebagian besar dalam matematika murni: topologi, analisis fungsional, dll, tetapi juga termasuk yang lebih diterapkan (di mana saya telah mengkhususkan diri untuk disertasi): optimasi cembung, pemrograman nonlinier, analisis numerik, pemrograman linier, optimasi multi-tujuan. Selain itu, sekarang saya memiliki 0 pengetahuan tentang stat inferensial, tetapi saya yakin dengan teori probabilitas.

Pemrograman:

Saya baru saja mengambil kursus selama setahun di Sarjana, tetapi sebagian besar adalah Mathematica dan beberapa Jawa, yang saya ingat tidak ada yang jujur. Dalam kursus ini, konten tidak termasuk struktur data atau desain dan analisis algoritma, atau sistem manajemen basis data. Saya juga belajar Matlab sendiri untuk menerapkan algoritma dalam tesis sarjana.

Latar belakang di atas adalah selama program Sarjana dan Master. Sekarang, selama Ph.D. Program, saya menemukan bahwa Machine Learning adalah campuran sempurna (bagi saya) antara Nonlinier Optimasi, Pemrograman dan aplikasi di dunia nyata, yaitu, keduanya menarik secara teoritis dan berorientasi aplikasi. Inilah alasan mengapa saya menjadi sangat bersemangat untuk pergi ke industri. Oleh karena itu, saya mulai belajar sendiri (dalam waktu luang saya) selama 3 tahun terakhir.

Ringkasan singkat dari hal-hal yang dipelajari:

  • Python: Saya nyaman menerapkan algoritma optimisasi, bekerja dengan notebook jupyter dan perpustakaan numpy (pada kenyataannya, saya harus melakukan ini untuk disertasi), dan melakukan manipulasi data dasar dan tugas pembersihan di panda. Ini saya pelajari secara online, dalam platform yang disebut dataquest ( https://app.dataquest.io ). Namun, saya tidak berpikir saya memiliki cukup pengetahuan untuk lulus wawancara dalam struktur data dan algoritma (lihat di atas).

  • Pembelajaran Mesin: Saya mengambil kursus tingkat master dalam topik di uni (karena saya di Jerman, kami tidak memiliki kursus di Ph.D., jadi ini semua ada dalam waktu pribadi saya), yang sangat saya nikmati. Topik termasuk: k-NN, PCA, SVM, NN, dll.

  • Mengambil kursus di Database semester ini, yang berfokus pada SQL.

  • Mengambil spesialisasi Deep Learning pada Coursera semester ini.

Akhirnya, saya ingin mengatakan bahwa saya merasa benar-benar mampu mempelajari topik-topik tersebut. Bahkan, seiring waktu saya berniat untuk mengambil lebih banyak kursus tingkat pascasarjana yang tersedia online (misalnya, Stanford CS231N, CS234, dll) karena, menurut pendapat saya, kursus online mungkin tidak cukup ketat. Semoga setelah pertahanan, saya akan bisa fokus penuh waktu pada ini.

Karena itu pertanyaan:

  • Apakah saya masih bisa diterima pada saat ini (maksud saya, setelah menyelesaikan semester ini dengan pengetahuan yang dijelaskan di atas)? Jujur saya pikir saya belum siap, tetapi saya merasa yakin bahwa saya bisa mendapatkan yang layak dalam satu tahun.

  • Apakah saya terlalu naif dalam berpikir bahwa sebuah perusahaan akan memberi saya kesempatan?

  • Apa yang harus saya lakukan untuk menjadi lebih bisa diubah dalam hal apa pun?

John D
sumber
1
Ketika saya melamar pekerjaan saya (di Jerman) setidaknya ada dua perusahaan yang hanya mempertimbangkan pengetahuan matematika. Mereka tidak peduli tentang hal lain. Pemrograman akan menjadi bantuan tetapi mereka telah mendedikasikan pemrogram untuk mengubah hal-hal yang sebagian besar ahli matematika dan fisikawan bekerja menjadi perangkat lunak.
Ben

Jawaban:

4

Saya tidak setuju dengan jawaban yang lain, tetapi inilah perspektif berbeda yang harus Anda ingat. Juga, saya dapat menawarkan jawaban untuk pertanyaan spesifik Anda sebagai seseorang yang meninggalkan akademia (matematika terapan / CS) untuk ilmu data.

Singkatnya, memahami kebutuhan yang mendasarinya dan kasus penggunaan untuk masalah bisnis sangat penting untuk proyek apa pun, sehingga mengembangkan rasa bisnis yang kuat dan keterampilan komunikasi lintas fungsional sangat penting jika Anda ingin jangkauan terluas dalam karir ilmu data.

  • Apakah saya masih bisa diterima pada saat ini (maksud saya, setelah menyelesaikan semester ini dengan pengetahuan yang dijelaskan di atas)? Jujur saya pikir saya belum siap, tetapi saya merasa yakin bahwa saya bisa mendapatkan yang layak dalam satu tahun.
  • Apakah saya terlalu naif dalam berpikir bahwa sebuah perusahaan akan memberi saya kesempatan?

Saya akan menjawab ini bersama. Ini sangat tergantung pada perusahaan dan kebutuhan saat ini. Bagi Anda, ini mungkin bervariasi di sepanjang dimensi "startup" hingga "perusahaan" dan "toko ML" hingga "bisnis berbasis data umum". Yang terakhir, maksud saya ada perusahaan yang tujuan utamanya adalah untuk menjual produk atau layanan ML kepada klien, vs perusahaan teknologi umum yang ingin mengeksploitasi pemodelan dalam bisnis mereka. Kemungkinannya adalah Anda akan menemukan kecocokan yang lebih cepat / lebih mudah dengan perusahaan yang sudah memiliki casing penggunaan ML-nya dibangun atau didikte oleh orang lain, karena Anda tidak mungkin diperlengkapi untuk menyusun strategi pendirian proyek baru.

Jadi, itu mungkin benar dari bisnis yang lebih besar yang memiliki departemen yang didedikasikan untuk memoles teknik model ML sementara bagian lain dari perusahaan menentukan strategi dan desain bisnis, atau dalam bisnis dengan ukuran apa pun yang berfokus pada ML sebagai produknya / layanan.

Dalam jangka pendek, ya Anda mungkin bisa meyakinkan seseorang untuk menjadikan Anda sebagai magang atau asisten dalam beberapa proyek, tetapi PhD Anda kemungkinan akan dipandang sebagai kelemahan potensial jika Anda berbicara dengan perusahaan kecil hingga menengah yang ingin mempekerjakan generalis / jacks dari semua perdagangan ...

  • Apa yang harus saya lakukan untuk menjadi lebih bisa diubah dalam hal apa pun?

Yang membawa saya ke sini. Anda dapat memilih petualangan Anda sendiri karena ada begitu banyak jenis peran, tetapi Anda harus menyadari peran dan situasi seperti apa yang dicari oleh masing-masing pemberi kerja, dan bersikap realistis tentang bagaimana Anda bisa cocok dengannya. Ada banyak majikan yang tidak secara jelas mengungkapkan apa yang mereka inginkan atau butuhkan, atau bahkan tidak tahu apa itu . Anda sebaiknya mencari tahu dengan mereka untuk menghindari kekecewaan berat.

Jika Anda ingin memperluas wawasan Anda dalam ilmu data dan memastikan Anda memiliki dampak bisnis tertinggi dan peluang pengembangan profesional, Anda ingin belajar lebih banyak tentang aplikasi bisnis ilmu data. Mereka sangat beragam dan keduanya lebih informal dalam praktiknya dan lebih berdampak pada bisnis secara keseluruhan daripada mengkhawatirkan optimisasi untuk matriks pseudo-pembalik.

Terlepas dari pendapat wajar di jawaban lain yang diposting tentang pasar, ada defisit pasar yang sangat besar menurut pendapat saya bagi para ilmuwan data yang:

  • Benar-benar memahami kebutuhan bisnis dan dapat berkomunikasi secara efektif dengan orang-orang non-teknis
  • Kembangkan dan laksanakan rencana yang melibatkan pemecahan masalah berbasis data umum, yang mungkin melibatkan atau tidak membangun model "keren" (dan sejujurnya mereka mungkin tidak akan, setidaknya tidak sampai masalahnya dipahami dengan baik oleh metode eksplorasi yang lebih tradisional).
RHC
sumber
jawaban yang sangat bagus
pcko1
Saya (lulusan MSc Matematika baru) percaya bahwa saya berada di kapal yang berlawanan sebagai OP. Sedikit pemrograman di sana, sedikit matematika di sini, tapi tidak ada yang terlalu dalam di mana pun. Pendidikan saya terlalu umum, jadi sulit untuk menonjol. Saya memiliki banyak soft skill seperti yang Anda sebutkan di poin kedua hingga terakhir. Setelah saya memahami konsep teknis sepenuhnya, saya cukup pandai menjelaskannya kepada orang awam. Saya juga seorang perwira di angkatan laut, jadi saya memiliki banyak pengalaman bekerja dengan orang-orang dan memproyeksikan "gambar", yang saya pikir melintasi ke dalam pola pikir bisnis.
rocksNwaves
10

Pekerjaan ilmu data mencakup berbagai kegiatan yang berbeda sehingga jawaban apa pun cenderung subjektif. Saya di dunia akademis sehingga pengetahuan saya tentang pasar kerja terbatas, tetapi dari apa yang saya lihat:

  • Konteks saat ini sangat menguntungkan bagi para ilmuwan data yang mencari pekerjaan, sehingga siapa pun yang memiliki pengetahuan dasar tentang ML memiliki peluang. Anda sudah berada di atas level ini sehingga tidak perlu khawatir tentang imho depan ini. Tren ini cenderung terus berlanjut seperti ini, tetapi tidak ada yang tahu masa depan.
  • Idealnya untuk meningkatkan peluang Anda, Anda harus dapat menunjukkan bahwa Anda memiliki pengalaman langsung: misalnya proyek github, partisipasi dalam kompetisi ML, hal semacam ini.
  • Jangan abaikan matematika Anda PhD: Anda tampaknya memiliki banyak waktu luang untuk mempelajari ilmu data, bagus untuk Anda ... Tetapi pastikan PhD adalah prioritas utama Anda, itu akan menjadi aset besar pada resume Anda, bahkan jika itu tidak terkait dengan ilmu data.
Erwan
sumber
3

Erwan memakukannya (+1). Tapi saya pikir penambahan saya agak terlalu lama untuk komentar.

Anda tampaknya jauh di depan di mana saya berada ketika saya mendapatkan pekerjaan DS saya. Saya dalam matematika murni, beberapa postdocs, dan hanya memiliki waktu belajar sendiri yang singkat ketika saya melamar ilmu data industri.

Di sisi lain, saya memiliki ujian aktuaria di undergrad saya, yang mungkin membantu saya masuk ke ruang fintech. Saat menerapkan, tekankan apa yang sudah Anda ketahui, dan akui apa yang perlu Anda pelajari dalam beberapa bulan pertama (pemrograman yang lebih kuat? Gunakan git? ...).

(Juga, Anda tidak menyebutkan model berbasis pohon dalam kursus ML Anda: Saya kira itu hanya kelalaian, tetapi itu tampaknya menjadi model yang paling penting untuk dipahami kecuali Anda mencoba masuk ke industri di mana jaring saraf adalah norma.)

Ben Reiniger
sumber
Terima kasih atas jawabannya! Bagus untuk tahu itu bukan pertama kalinya seorang ahli matematika murni pergi ke ilmu data.
John D
Bolehkah saya bertanya apa pendapat Anda tentang kursus online seperti spesialisasi Deep Learning on Coursera? Apakah jenis kursus ini benar-benar mempersiapkan Anda untuk bekerja di industri ini?
John D
Alih-alih pergi ke Coresera, cobalah cepat. Jika kursus lebih disesuaikan dengan aplikasi kehidupan nyata, coursera lebih baik untuk melihat kursus apa pun MOOC yang akan mereka ajarkan kepada Anda topik dan materi pelajaran dan konsep setelah itu terserah Anda, gunakan alat-alat yang dipelajari ke dalam aplikasi yang dibutuhkan Anda. Hanya saja, jangan terlalu berpikir itu hanya masuk dan saya jamin Anda akan menemukan gairah Anda.
khwaja wisal
3

Hanya saja, Jangan mengambil saran ini secara membabi buta: Mata pelajaran yang Anda sebutkan dalam matematika adalah inti untuk memecahkan masalah menggunakan pembelajaran mesin / Pembelajaran mendalam, pemrograman adalah alat untuk menerapkan semua teori ini yang Anda pelajari dan atas dasar itu Anda membuat hipotesis Anda dan kemudian menguji dengan mengimplementasikannya dalam kode untuk itu Anda tidak perlu keterampilan pengkodean seorang programmer Anda harus tahu struktur data yang Anda gunakan terutama frame data dan manipulasi tensor dan sisanya Anda akan belajar sambil menerapkan. Bagian terbaik dengan Anda adalah Anda memiliki pengetahuan dasar matematika (saya berasumsi Anda tahu statistik probabilitas kalkulus multivariat, analisis fungsional dan seluruh mata pelajaran yang Anda sebutkan saya tidak akan menjelaskan secara terperinci karena Anda sudah melakukan Ph.D. .

Saya akan menyarankan Anda pergi melalui semua program dari Fast.ai diajarkan oleh Jeremy Howard (dia benar-benar dewa pembelajaran mendalam) kursus tentang pembelajaran mendalam praktis untuk coders dikemas dengan pengetahuan selain dari itu untuk pemahaman inti dari matematika di balik jaringan saraf Anda dapat pergi dan membaca blog oleh Michael Nielsen yang disebut neuralnetworksanddeeplearning.com sebenarnya buku dan yang hebat dan Anda akan menyukai penjelasan matematis dan untuk pemahaman yang lebih Anda selalu dapat pergi dan membaca di blog Chris olah itu bagus.

Jadi sekarang masalahnya adalah Anda masih bisa mendapatkan banyak magang penelitian dan pergi dan belajar di sana dalam lingkungan industri tetapi saya lebih suka menyarankan Anda, beri diri Anda beberapa waktu melalui kursus-kursus ini untuk menguasai masalah ini dan dengan matematika di belakang Anda, Anda siap melakukan apa saja. Lihat, ilmu data saat ini adalah seperti semua orang ingin menjadi satu dan hanya mendapatkan 6 digit gaji dan dilakukan tetapi tidak seperti ilmu data bukanlah sesuatu yang dapat Anda pelajari sekaligus sekaligus membutuhkan waktu,

Jadi, beri diri Anda sedikit waktu untuk bersabar dan teruslah menyelesaikan terus membaca makalah literatur tentang topik-topik terbaru yang sekarang tersedia secara bebas sekarang, jadi teruskan.

khwaja wisal
sumber
Terima kasih atas jawabannya! akan melakukan.
John D