Saya tersesat dalam normalisasi, dapatkah seseorang membimbing saya?
Saya memiliki nilai minimum dan maksimum, masing-masing -23,89 dan 7,54990767.
Jika saya mendapatkan nilai 5,6878 bagaimana saya bisa skala nilai ini pada skala 0 hingga 1.
normalization
Angelo
sumber
sumber
Jawaban:
Jika Anda ingin menormalkan data Anda, Anda dapat melakukannya seperti yang Anda sarankan dan hanya menghitung yang berikut ini:
di mana dan sekarang adalah data normalisasi . Sebagai bukti konsep (walaupun Anda tidak memintanya) berikut adalah beberapa kode dan grafik yang menyertai untuk menggambarkan hal ini:x=(x1,...,xn) zi ith
R
sumber
illustrate the point
jawaban Anda (benar)?Rumus satu baris umum untuk secara linier menskala ulang nilai data setelah mengamati min dan maks ke dalam kisaran arbitrer baru min ' to max' adalah
sumber
a
danb
konstanta, dan kemudian hanya berlakunewvalue = a * value + b
.a = (max'-min')/(max-min)
danb = max - a * max
b = max' - a * max
Ataub = min' - (a * min)
u = -1 + 2.*(u - min(u))./(max(u) - min(u));
.Berikut ini adalah implementasi PHP saya untuk normalisasi:
Tetapi ketika saya sedang membangun jaringan syaraf tiruan saya sendiri, saya perlu mengubah output yang dinormalisasi kembali ke data asli untuk mendapatkan output yang baik untuk grafik.
Denormalisasi menggunakan rumus berikut:
sumber
Pembagian dengan nol
Satu hal yang perlu diingat adalah bahwa
max - min
bisa sama dengan nol. Dalam hal ini, Anda tidak ingin melakukan divisi itu.Kasus di mana ini akan terjadi adalah ketika semua nilai dalam daftar yang Anda coba normalkan adalah sama. Untuk menormalkan daftar tersebut, setiap item akan menjadi
1 / length
.Contoh:
sumber
normalize([12, 20, 10])
output[0.2, 1.0, 0.0]
, yang sama dengan yang Anda dapatkan(val - min) / (max - min)
.jawabannya benar tetapi saya punya saran, bagaimana jika data pelatihan Anda menghadapi beberapa angka di luar jangkauan? Anda bisa menggunakan teknik squashing. dijamin tidak akan keluar dari jangkauan. daripada ini
Saya sarankan gunakan ini
dengan squashing seperti ini di min dan max range
dan ukuran kesenjangan out-of-range yang diharapkan berbanding lurus dengan tingkat kepercayaan bahwa akan ada nilai out-of-range.
untuk informasi lebih lanjut Anda dapat google: menekan angka out-of-range dan merujuk ke buku persiapan data "dorian pyle"
sumber
Coba ini. Ini konsisten dengan skala fungsi
sumber