Apa nama operator yang mengambil vektor kategorikal dan mengubahnya menjadi representasi biner menggunakan pengkodean satu-panas? Saya bertanya-tanya karena saya sedang menulis makalah ilmiah dan perlu nama yang tepat untuk itu.
terminology
categorical-encoding
fraktur
sumber
sumber
Jawaban:
Ahli statistik menyebut pengkodean satu-panas sebagai pengkodean dummy . Seperti yang disarankan orang lain (termasuk Scortchi dalam komentar), ini bukan sinonim yang tepat, tetapi ini adalah istilah yang biasanya digunakan untuk variabel kategori 0-1 yang dikodekan.
Lihat juga: "Variabel dummy" versus "variabel indikator" untuk data nominal / kategorikal
sumber
Itu tergantung pada audiens target Anda.
Seperti kata Tim , ahli statistik menyebutnya dummy coding, dan itulah yang saya harapkan untuk dilihat ketika menggambarkan sesuatu seperti model regresi. "Variabel kode Dummy dimasukkan untuk menyesuaikan lokasi toko." Saya pikir menyebutnya pengkodean satu panas akan terasa sedikit aneh di sini.
Namun, seperti yang dikatakan Tim lain , pengkodean satu-panas cukup umum dalam literatur pembelajaran mesin. Samar-samar menyiratkan keberadaan node (seperti dalam jaringan saraf), kabel fisik (dalam perangkat), atau sesuatu seperti itu, setidaknya bagi saya.
sumber
Istilah ini berasal dari teknik elektronik. Pikirkan siapa yang akan menyebut 1 "panas"? Hanya mereka yang bekerja dengan listrik, di mana "panas" atau "hidup" berarti ada potensi listrik pada kabel . "One hot" mengacu pada desain sirkuit di mana level sinyal listrik diskrit pada satu kawat akan diterjemahkan menjadi panas / dingin pada satu set kabel. Saya kira beberapa orang belajar mesin dengan latar belakang EE menemukan analogi yang menarik.
Dalam ekonometrika dan statistik Anda mungkin menemukan
dummy
atauindicator
variabel, yang sangat mirip karena ini digunakan untuk mewakili kategori yang berbeda dengan indikator yang berbeda. Ada perbedaan yang halus. Misalnya, Anda membuat boneka K-1 untuk kategori K, karena kategori dasar sesuai dengan semua boneka yang ditetapkan ke 0. Sebaliknya, saya pikir dalam satu pengkodean panas Anda memiliki kabel K, di mana kategori dasar akan memiliki kawat sendiri ( variabel).sumber
Saya terlatih secara statistik, dan baru-baru ini mendengar tentang "one-hot encoding" dalam pembelajaran mesin / komputer sci lit. Saya biasanya hanya merujuk ke matriks satu-hotted sebagai matriks desain / data matriks / bingkai desain.
sumber
Dalam ilmu fisika dan teknik, disebut delta Kronecker (umum) .
Delta Kronecker sangat berguna dalam Sigma / Pi / Einstein / etc. notasi karena memungkinkan untuk istilah yang ditentukan secara kondisional.
Hanya untuk menghubungkan ini dengan struktur pemrograman umum, yang Kronecker delta ini
condition?1:0
, di mana?:
adalah operator kondisional .sumber
Ini kutipan dari buku,
sumber