Saya mewawancarai orang-orang untuk posisi pengembang algoritma / peneliti dalam konteks statistik / pembelajaran mesin / data mining.
Saya mencari pertanyaan untuk ditanyakan untuk menentukan, secara khusus, keakraban, pemahaman dan kelenturan kandidat dengan teori yang mendasarinya, misalnya sifat dasar dari harapan dan perbedaan, beberapa distribusi umum, dll.
Saya saat masuk ke pertanyaan adalah: "Ada kuantitas yang tidak diketahui yang kami ingin perkiraan Untuk tujuan ini kita memiliki estimator. Y 1 , Y 2 , ... , Y n yang, mengingat X , semua berisi dan independen, dan masing-masing memiliki varians diketahui σ 2 i , yang berbeda untuk masing-masing. Cari optimal estimator Y = f ( Y 1 , ... , Y n ) yang tidak bias dan memiliki varian minimal. "
Saya berharap ada kandidat yang serius untuk menanganinya dengan mudah (diberikan waktu untuk menyelesaikan perhitungan), namun saya terkejut melihat berapa banyak kandidat yang seharusnya dari bidang yang relevan gagal membuat kemajuan sekecil apa pun. Karena itu saya menganggapnya sebagai pertanyaan yang baik dan diskriminatif. Satu-satunya masalah dengan pertanyaan ini adalah hanya satu.
Apa pertanyaan lain yang bisa digunakan untuk ini? Atau, di mana saya dapat menemukan koleksi pertanyaan seperti itu?
sumber
Jawaban:
Apa yang ingin dilakukan oleh pengembang statistik Anda?
Angkatan Darat AS mengatakan "latih kamu akan bertarung, karena kamu akan bertarung seperti kamu dilatih" Uji mereka pada apa yang Anda ingin mereka lakukan sepanjang hari. Sungguh, Anda ingin mereka "menciptakan nilai" atau "menghasilkan uang" untuk perusahaan.
Bos 101
Pikirkan "tunjukkan saya uang."
Catatan: Jika pertanyaan manipulasi simbolis Anda tidak terhubung dengan bersih ke "uang" maka Anda mungkin mengajukan pertanyaan yang salah.
Ada 3 hal yang harus dilakukan setiap karyawan untuk menjadi karyawan:
Jika Anda tidak mendapatkan dasar yang kuat ini, tidak ada jawaban lain yang akan membantu Anda.
Jika Anda dapat menggantinya dengan perangkat lunak yang bagus atau remaja yang terlatih, maka pada akhirnya Anda harus melakukannya, dan itu akan dikenakan biaya.
Data 101
Apa yang harus mereka lakukan:
(regresi / pemasangan termasuk model linier, glm, basis radial,
persamaan perbedaan), apakah benar bahwa "x "(pengujian hipotesis), berapa banyak sampel yang saya butuhkan (sampel penerimaan), bagaimana cara mendapatkan
data terbanyak dari sedikit / eksperimen murah / efisien (Desain statistik
eksperimen) - penafian, saya insinyur bukan ahli statistik Anda mungkin bertanya kepada mereka pertanyaan "apa saja tugas mendasar yang berbeda, dan bagaimana Anda menguji bahwa ahli statistik dapat melakukannya secara efisien dan benar?
Mereka harus dapat membaca dari csv, xlsx (excel), SQL, dan
gambar. (HDF5, Rdata) Jika Anda memiliki format khusus, mereka harus
dapat membacanya dan bekerja dengan alat dengan cepat dan
efisien. Mereka harus tahu kekuatan / kelemahan format. CSV cepat digunakan, telah ada selamanya, prototipe cepat, tetapi kembung, tidak efisien dan lambat dijalankan.
orang mengatakan "ada kebohongan, kebohongan, dan statistik" tetapi tidak di
perusahaan saya . Input bagus yang sama memberikan output baik yang sama. Outputnya bukan angka, itu selalu merupakan keputusan bisnis yang menginformasikan
tindakan teknis dan menghasilkan hasil bisnis. Tes yang berbeda dapat mengatur putaran di 5,5, atau 6,5, tetapi kemampuan selalu di atas 1,33.
dapat
dipahami oleh para pembuat keputusan , dan / atau antek, dan / atau diri mereka sendiri dalam setahun, dengan kesalahan paling sedikit. Suatu hal yang indah adalah mampu menjelaskannya sehingga nenek Anda mendapatkannya. ( Tautan ) ini adalah jawaban saya, tetapi saya menyukainya.
Zinger analitik:
Saya pikir pertanyaan-pertanyaan mustahil itu hebat. Mereka tidak mungkin karena suatu alasan. Mampu mengetahui apakah ada sesuatu yang mustahil di luar gerbang adalah hal yang baik. Mengetahui mengapa, memiliki beberapa cara untuk melibatkannya, atau dapat mengajukan pertanyaan yang berbeda bisa lebih baik.
Pertanyaan CV lainnya. ( tautan ) Di reddit. ( tautan ) lainnya ( tautan )
BTW: ini pertanyaan yang bagus. Saya mungkin harus memperbarui jawaban ini dari waktu ke waktu.
sumber