Saat ini saya menggunakan SVM dan meningkatkan fitur pelatihan saya ke kisaran [0,1]. Saya pertama kali cocok / mengubah set pelatihan saya dan kemudian menerapkan transformasi yang sama untuk set pengujian saya. Sebagai contoh:
### Configure transformation and apply to training set
min_max_scaler = MinMaxScaler(feature_range=(0, 1))
X_train = min_max_scaler.fit_transform(X_train)
### Perform transformation on testing set
X_test = min_max_scaler.transform(X_test)
Mari kita asumsikan bahwa fitur yang diberikan dalam set pelatihan memiliki kisaran [0,100], dan fitur yang sama dalam set pengujian memiliki kisaran [-10.120]. Di set latihan fitur itu akan diskalakan dengan tepat ke [0,1], sementara di set pengujian fitur itu akan diskalakan ke rentang di luar yang ditentukan pertama, sesuatu seperti [-0.1,1.2].
Saya bertanya-tanya apa konsekuensi dari fitur set pengujian yang berada di luar jangkauan yang digunakan untuk melatih model? Apakah ini masalah?
sumber
MinMaxScaler
.