Apakah tunggul keputusan merupakan model linier?

19

Decision stump adalah pohon keputusan dengan hanya satu split. Ini juga dapat ditulis sebagai fungsi piecewise.

Misalnya, anggap adalah vektor, dan adalah komponen pertama , dalam pengaturan regresi, beberapa tunggul keputusan dapatxx1x

f(x)={3x125x1>2

Tetapi apakah ini model linier? di mana dapat dituliskan sebagai ? Pertanyaan ini mungkin terdengar aneh, karena seperti yang disebutkan dalam jawaban dan komentar, jika kita memplot fungsi piecewise itu bukan garis. Silakan lihat bagian selanjutnya untuk alasan saya mengajukan pertanyaan ini.f(x)=βTx


EDIT:

  • Alasan saya mengajukan pertanyaan ini adalah regresi logistik adalah model linier (umum) dan batas keputusan adalah garis, juga untuk tunggul keputusan. Catatan, kami juga memiliki pertanyaan ini: Mengapa regresi logistik model linier? . Di sisi lain, tampaknya tidak benar bahwa tunggul keputusan adalah model linier.

masukkan deskripsi gambar di sini

Berikut ini adalah salah satu contoh pengambilan keputusan untuk meningkatkan regresi dengan 2 fitur dan 1 tanggapan berkelanjutan.

masukkan deskripsi gambar di sini

Haitao Du
sumber
Mengapa Anda menganggapnya linier ..?
Tim
5
@ hxd1011 penting untuk membedakan antara batas keputusan dan fungsi keputusan di sini
shadowtalker
Saya bisa menyebutnya polinomial urutan ke-1000 dengan semua pesanan dari 1 hingga 1000 sama dengan nol. Saya bisa menyebutnya model zero-order (alias konstan) dan akan lebih ringkas mengkomunikasikan fitur-fitur utama. Sebuah pohon klasik selalu konstan. Pohon trivial, tunggul, adalah pemisahan tunggal dalam ruang di mana model di satu sisi konstan dan yang lain adalah konstanta yang berbeda. Ini tidak konstan secara global, tetapi juga bukan poly1. Pustaka "cubist" dalam R cocok dengan model linear (poly1) aktual dan bukan model konstan. Anda mungkin mencobanya.
EngrStudent
1
Jika Anda menggambar garis dalam bidang (katakanlah y = 0), dan ambil fungsi apa pun , maka akan memiliki garis kontur yang merupakan garis aktual (sejajar dengan sumbu ), tetapi itu tidak akan menjadi fungsi linear. f(x)g(x,y)=f(x)y
Matthew Drury
1
Ini pertanyaan aneh. Bisakah Anda memplot fungsi dari contoh Anda (yang sama dengan 3 untuk x <2 dan 5 untuk x> 2)? Lihat itu - apakah ini garis lurus? Jika itu bukan garis lurus, maka itu bukan fungsi linier.
Amoeba berkata Reinstate Monica

Jawaban:

21

Tidak, kecuali Anda mengubah data.

Ini adalah model linier jika Anda mentransformasikan menggunakan fungsi indikator: x = I ( { x > 2 } ) = { 0x

x=I({x>2})={0x21x>2

Kemudian f(x)=2x+3=(32)T(1x)

Sunting: ini disebutkan dalam komentar tetapi saya ingin menekankannya di sini juga. Setiap fungsi yang mempartisi data menjadi dua bagian dapat ditransformasikan menjadi model linier dari formulir ini, dengan intersep dan input tunggal (indikator "sisi" partisi tempat titik data aktif). Penting untuk mencatat perbedaan antara fungsi keputusan dan batas keputusan .

shadowtalker
sumber
"Transformasi" itu rumit, saya pikir neural network (MLP) adalah non-linear, tetapi setelah transformasi, itu linear ..
Haitao Du
2
Ini adalah model linier dalam parameter. Dan itu adalah linear linear dalam dummy . x
Michael M
1
@MichaelM bagaimana linear dalam parameter? Saya berasumsi dengan "parameter" yang Anda maksud adalah pilihan x2
shadowtalker
1
@ hxd1011 jawabannya adalah "tidak, kecuali Anda mengubah data"
shadowtalker
2
Saya sarankan Anda mengedit jawaban Anda untuk memasukkan "tidak, kecuali Anda mengubah data" (dari komentar terakhir Anda) ke dalamnya. Saat ini kata-kata pembuka Anda adalah "Ini adalah model linier", dan orang-orang dapat menjadi bingung.
Amuba mengatakan Reinstate Monica
7

Jawaban untuk pertanyaan Anda:

  1. Tunggul keputusan bukan model linier.
  2. Batas keputusan dapat berupa garis, meskipun modelnya tidak linier. Regresi logistik adalah contohnya.
  3. Model yang dikuatkan tidak harus menjadi model yang sama dengan pelajar dasar. Jika Anda memikirkannya, contoh peningkatan Anda, ditambah pertanyaan yang Anda tautkan, membuktikan bahwa putusan keputusan bukanlah model linier.
Flounderer
sumber
3

Jawaban ini lebih verbal daripada yang dibutuhkan untuk hanya menjawab pertanyaan. Saya berharap dapat memancing beberapa komentar dari para ahli nyata.

Saya pernah berada di ruang sidang dan hakim bertanya (untuk alasan yang baik dalam konteks), jika kita menyebut ekor anjing sebagai kaki, apakah itu berarti seekor anjing memiliki 5 kaki? Jadi apa itu model linier?

f1,f2,,fny=aifidengan batasan penting bahwa istilah kesalahan independen dan didistribusikan secara normal. Dengan definisi itu, orang tidak dapat mengatakan apakah model Anda linier karena Anda tidak memberikan informasi tentang istilah kesalahan. Jika salah satu menjatuhkan batasan istilah kesalahan, maka tautologis linear dalam fungsi yang Anda berikan atau dalam fungsi yang diberikan oleh ssdecontrol. Bagaimanapun naifnya, dalam konteks pertanyaan ini, itu mungkin tidak memuaskan. Fungsi apa pun dapat dianggap sebagai dasar linear dalam arti itu. Itu karena setiap ruang fungsi dapat diubah menjadi ruang vektor fungsi.

βf(x)=βTx

f(x+y)=f(x)+f(y)xyf(1.5)=3f(3)=5f(3)f(1.5)+f(1.5)f(x)=βTx

meh
sumber
4
Linearitas tidak ada hubungannya dengan istilah kesalahan. Ini berkaitan dengan fakta bahwa itu terdiri dari kombinasi linear dari parameter . Ini mewakili garis lurus dalam ruang 2D (tetapi lebih umum mewakili bidang).
shadowtalker
f(x)=0f(x)=a0+i=1i=Naixi. Namun fungsinya akan lineara0=0f(x+y)=f(x)+f(y)
jika itu yang dia tegaskan, maka itu pendapatnya dan bukan semacam fakta sulit. Sejauh yang saya ketahui, tidak ada definisi yang diterima secara ketat untuk "model linear", juga tidak ada kebutuhan untuk satu dalam pikiran saya. Bagi saya, fakta bahwa ada istilah kesalahan yang terlibat hanya mengubah model dari "model linier" menjadi "model linier statistik". Saya tidak melihat sesuatu yang inheren linier tentang persyaratannya, saya juga tidak melihat statistik inheren tentang model linier.
shadowtalker
IMO bersikeras pada adanya istilah kesalahan hanya mengabaikan apa, katakanlah, dan teknik atau fisikawan mungkin menganggap "model linier" dari proses fisik deterministik.
shadowtalker