Apa yang salah dengan ekstrapolasi?

68

Saya ingat duduk di kursus statistik sebagai mahasiswa yang mendengar tentang mengapa ekstrapolasi adalah ide yang buruk. Selain itu, ada berbagai sumber online yang berkomentar tentang ini. Ada juga yang menyebutkannya di sini .

Adakah yang bisa membantu saya memahami mengapa ekstrapolasi adalah ide yang buruk? Jika ya, bagaimana teknik peramalan tidak secara statistik tidak valid?

SEORANG PRIA
sumber
3
@ Firebug Mark Twain mengatakan sesuatu tentang itu. Kutipan yang relevan dikutip di dekat akhir jawaban saya di stats.stackexchange.com/a/24649/919 .
Whuber
1
@whuber kurasa itu bukan ekstrapolasi memikirkannya sekarang. Katakanlah, kami melatih dan memvalidasi algoritma dengan benar untuk memprediksi data satu minggu ke dalam fitur. Melakukan resampling yang benar (dan menyetel, jika ada hiperparameter yang harus disetel), maka saya tidak dapat melihat apa yang salah jika itu, Anda memiliki respons dan Anda juga harus mengetahui kepercayaan diri dari respons itu. Sekarang, jika Anda melatih algoritme Anda dalam basis minggu ke minggu, Anda tidak dapat berharap untuk memprediksi satu tahun ke depan secara akurat. Maaf atas kemungkinan kebingungan.
Firebug
7
@ Firebug Tidak perlu meminta maaf - komentar Anda mengandung informasi klarifikasi yang berguna. Ketika saya membacanya, mereka menyarankan "ekstrapolasi" dapat memiliki banyak interpretasi dalam pengaturan perkiraan. Salah satunya adalah bahwa itu melibatkan "ekstrapolasi" waktu. Tetapi ketika Anda melihat model deret waktu standar, terutama yang waktu bukan kovariat eksplisit, mereka memprediksi nilai masa depan dalam hal nilai sebelumnya . Ketika nilai-nilai sebelumnya tetap dalam kisaran nilai sebelumnya, model tidak melakukan ekstrapolasi sama sekali! Di sinilah letak resolusi paradoks yang tampak.
Whuber
7
xkcd.com/605
user253751
2
Saya kecewa dengan berapa lama waktu yang diperlukan untuk xkcd wajib muncul
Duncan X Simpson

Jawaban:

89

Model regresi sering digunakan untuk ekstrapolasi, yaitu memprediksi respons terhadap input yang berada di luar kisaran nilai-nilai variabel prediktor yang digunakan agar sesuai dengan model. Bahaya yang terkait dengan ekstrapolasi diilustrasikan pada gambar berikut. grafik yang menunjukkan garis ekstrapolasi yang melanjutkan ke atas di mana nilai "benar" menurun

Model regresi adalah "dengan konstruksi" model interpolasi, dan tidak boleh digunakan untuk ekstrapolasi, kecuali ini dibenarkan dengan benar.

Kostia
sumber
1
Ini adalah contoh buruk terhadap ekstrapolasi. Garis regresi lurus sesuai dengan poin data yang jauh lebih baik daripada fungsi sebenarnya Anda yang berlekuk.
horaceT
9
"Garis regresi lurus sesuai dengan poin data yang jauh lebih baik daripada fungsi sebenarnya Anda yang berlekuk" Pernyataan ini salah. RSS untuk fungsi regresi yang sebenarnya lebih kecil dari RSS untuk garis regresi sederhana,
Kostia
Poin yang diambil dan Anda mungkin (harus) benar. Namun jika dilihat dari kumpulan poin, tidak mungkin seseorang dapat menyimpulkan fungsi sebenarnya.
horaceT
27
Persis. Dan ini mengapa ekstrapolasi mungkin ide yang buruk.
Kostia
"Model regresi adalah" dengan konstruksi "model interpolasi" -> Saya kira kita dapat memiliki masalah yang sama persis dengan interpolasi (bahkan jika itu cenderung terjadi)
Metariat
88

Komik xkcd ini menjelaskan semuanya.

komik xkcd

Menggunakan data poin yang dimiliki Cueball (pria dengan tongkat), ia memperkirakan bahwa wanita itu akan memiliki suami "empat lusin" pada akhir bulan depan, dan menggunakan ekstrapolasi ini untuk mengarah pada kesimpulan membeli kue pengantin dalam jumlah besar.

Sunting 3: Bagi Anda yang mengatakan "dia tidak memiliki cukup data poin", inilah komik xkcd lain :

komik xkcd

Di sini, penggunaan kata "berkelanjutan" dari waktu ke waktu ditampilkan pada plot semi-log, dan mengekstrapolasi poin data kami menerima perkiraan yang tidak masuk akal tentang seberapa sering kata "berkelanjutan" akan muncul di masa mendatang.

Sunting 2: Bagi Anda yang mengatakan "Anda perlu semua titik data masa lalu juga", komik xkcd lain: komik xkcd

Di sini, kami memiliki semua titik data masa lalu tetapi kami gagal memprediksi resolusi Google Earth secara akurat. Perhatikan bahwa ini juga grafik semi-log.

Sunting: Terkadang, bahkan korelasi terkuat (r = .9979 dalam kasus ini) benar-benar salah.


Jika Anda memperkirakan tanpa bukti pendukung lain, Anda juga melanggar korelasi tidak menyiratkan sebab - akibat ; dosa besar lain di dunia statistik.

Namun, jika Anda melakukan ekstrapolasi X dengan Y, Anda harus memastikan bahwa Anda dapat secara akurat (cukup untuk memenuhi persyaratan Anda) memprediksi X dengan hanya Y. Hampir selalu, ada beberapa faktor daripada dampak X.

Saya ingin membagikan tautan ke jawaban lain yang menjelaskannya dengan kata-kata Nassim Nicholas Taleb.

noɥʇʎԀʎzɐɹƆ
sumber
14
xkcd memiliki lelucon tentang setiap masalah matematika / statistik yang mungkin ditemui seseorang, bukan?
Ander Biguri
24
Gagasan ini mungkin juga digunakan sebagai argumen menentang interpolasi: "tadi malam Anda memiliki 0,5 suami".
JiK
3
@JiK Jika yang Anda tahu adalah bahwa ia memiliki satu sekarang, dan dua hari yang lalu ia tidak memilikinya, itu bukan perkiraan yang buruk ;-)
Dennis Jaheruddin
9
Berkelanjutan berkelanjutan, Berkelanjutan, berkelanjutan, berkelanjutan, Berkelanjutan berkelanjutan. en.wikipedia.org/wiki/…
Meni Rosenfeld
1
lebih banyak xkcd, orang-orang!
noɥʇʎԀʎzɐɹƆ
24

"Prediksi sangat sulit, terutama jika ini tentang masa depan". Kutipan ini dikaitkan dengan banyak orang dalam beberapa bentuk . Saya membatasi dalam "ekstrapolasi" berikut untuk "prediksi di luar kisaran yang diketahui", dan dalam pengaturan satu dimensi, ekstrapolasi dari masa lalu yang diketahui ke masa depan yang tidak diketahui.

Jadi apa yang salah dengan ekstrapolasi. Pertama, tidak mudah untuk memodelkan masa lalu . Kedua, sulit untuk mengetahui apakah model dari masa lalu dapat digunakan untuk masa depan . Di belakang kedua pernyataan itu terdapat pertanyaan mendalam tentang kausalitas atau ergodisitas, kecukupan variabel penjelas, dll. Yang sangat tergantung pada kasus. Yang salah adalah bahwa sulit untuk memilih skema ekstrapolasi tunggal yang berfungsi dengan baik dalam konteks yang berbeda, tanpa banyak informasi tambahan.

Ketidakcocokan generik ini dengan jelas diilustrasikan dalam dataset kuartet Anscombe yang ditunjukkan di bawah ini. Regresi linier juga (di luar rentang koordinat) adalah contoh ekstrapolasi. Baris yang sama mundur empat set poin, dengan statistik standar yang sama. Namun, model yang mendasarinya sangat berbeda.x

Kuartet Anscombe

Namun, perkiraan dapat diperbaiki hingga batas tertentu. Menambah jawaban lain, beberapa bahan dapat membantu ekstrapolasi praktis:

  1. Anda dapat menimbang sampel sesuai dengan jaraknya (indeks ) ke lokasi tempat Anda ingin mengekstrapolasi. Misalnya, gunakan fungsi yang meningkat (dengan ), seperti pembobotan atau penghalusan eksponensial , atau jendela geser sampel, untuk memberikan nilai yang kurang penting pada nilai yang lebih lama.p f p ( n ) p nnpfp(n)pn
  2. Anda dapat menggunakan beberapa model ekstrapolasi, dan menggabungkannya atau memilih yang terbaik ( Combining forecasts , J. Scott Armstrong, 2001). Baru-baru ini, ada sejumlah karya pada kombinasi optimal mereka (saya dapat memberikan referensi jika diperlukan).

Baru-baru ini, saya telah terlibat dalam sebuah proyek untuk mengekstrapolasi nilai-nilai untuk komunikasi subsistem simulasi dalam lingkungan waktu nyata. Dogma dalam domain ini adalah ekstrapolasi dapat menyebabkan ketidakstabilan. Kami benar-benar menyadari bahwa menggabungkan kedua bahan di atas sangat efisien, tanpa ketidakstabilan yang nyata (tanpa bukti formal, dan saat ini sedang ditinjau ). Dan ekstrapolasi bekerja dengan polinomial sederhana, dengan beban komputasi yang sangat rendah, sebagian besar operasi dihitung sebelumnya dan disimpan dalam tabel pencarian.

Akhirnya, sebagai ekstrapolasi menyarankan gambar lucu, berikut ini adalah efek mundur dari regresi linier:

Bersenang-senang dengan cinta dan regresi linier

Laurent Duval
sumber
+1 Jawaban yang bagus. Menurut situs web ini, sepertinya Bohr tidak mengatakannya. Tampaknya lebih mungkin menjadi pepatah Denmark yang tidak umum tetapi generik.
usεr11852 mengatakan Reinstate Monic
@ usεr11852 Tidak mungkin dia "pernah mengatakan itu"? Itu sebabnya saya berkata "dikaitkan", haruskah saya lebih berhati-hati?
Laurent Duval
2
Saya tidak pernah mengatakan bagian yang pernah ada . Saya membuat komentar ini karena mengingat bahwa pepatah itu tampaknya jauh lebih mungkin menjadi pepatah Denmark, menghubungkannya dengan tertentu (sangat lambang) Dane tampaknya sedikit penagihan - terutama mengingat bahwa tidak ada catatan Bohr mengatakannya. Penulis asli mungkin adalah seorang nelayan yang tidak disebutkan namanya mengomentari tangkapan besok! Saya rooting untuk si kecil di sini! : D
usεr11852 mengatakan Reinstate Monic
2
Sangat sulit untuk memodelkan legenda kutipan masa lalu juga.
Laurent Duval
3
Tentu saja pertanyaannya menggunakan kedua kata tersebut: intinya adalah apakah "peramalan" harus dianggap sebagai bentuk "ekstrapolasi." Menurut komentar pengantar Anda, Anda tampaknya mendefinisikan ekstrapolasi sebagai menggunakan masa lalu untuk "model masa depan." Sampai Anda menawarkan definisi yang jelas dan berbeda untuk masing-masing, jawaban Anda bisa disalahpahami.
Whuber
17

Meskipun kecocokan model mungkin " baik ", ekstrapolasi di luar rentang data harus diperlakukan secara skeptis. Alasannya adalah bahwa dalam banyak kasus ekstrapolasi (sayangnya dan tidak dapat dihindari) bergantung pada asumsi yang tidak dapat diuji tentang perilaku data di luar dukungan yang mereka amati.

Ketika mengekstrapolasi seseorang harus melakukan dua penilaian panggilan: Pertama, dari perspektif kuantitatif, seberapa valid model di luar kisaran data? Kedua, dari perspektif kualitatif, seberapa masuk akal suatu titik terletak di luar rentang sampel yang diamati menjadi anggota populasi yang kita asumsikan untuk sampel? Karena kedua pertanyaan tersebut memerlukan tingkat ambiguitas tertentu, ekstrapolasi juga dianggap sebagai teknik yang ambigu. Jika Anda memiliki alasan untuk menerima bahwa asumsi ini berlaku, maka ekstrapolasi biasanya merupakan prosedur inferensial yang valid.xout

Peringatan tambahan adalah bahwa banyak teknik estimasi non-parametrik tidak mengizinkan ekstrapolasi secara asli. Masalah ini terutama terlihat dalam kasus penghalusan spline di mana tidak ada lagi simpul untuk menahan spline yang dipasang.

Izinkan saya menekankan bahwa ekstrapolasi jauh dari kejahatan. Misalnya, metode numerik yang banyak digunakan dalam Statistik (misalnya proses delta-kuadrat Aitken dan Ekstrapolasi Richardson ) pada dasarnya adalah skema ekstrapolasi berdasarkan gagasan bahwa perilaku yang mendasari fungsi yang dianalisis untuk data yang diamati tetap stabil di seluruh dukungan fungsi.

usεr11852 kata Reinstate Monic
sumber
Meskipun dimungkinkan untuk menulis perlindungan untuk Wynn (generalisasi Aitken bermanfaat secara komputasi ) dan ekstrapolasi Richardson, dapat dan memang terjadi bahwa asumsi yang mendasari algoritme ini tidak sepenuhnya dipenuhi oleh urutan yang diberikan kepadanya. Ketika menggunakan metode ekstrapolasi ini dengan urutan asal tidak pasti, paranoid yang cukup biasanya akan memiliki dua atau lebih metode percepatan konvergensi ini untuk pengujian, dan hanya akan mempercayai hasil jika setidaknya dua dari metode yang sangat berbeda secara konseptual ini setuju dengan hasil mereka. . Δ 2εΔ2
JM bukan ahli statistik
15

Bertentangan dengan jawaban lain, saya akan mengatakan bahwa tidak ada yang salah dengan ekstrapolasi sejauh tidak digunakan secara sembrono. Pertama, perhatikan bahwa ekstrapolasi adalah :

proses memperkirakan, di luar rentang pengamatan asli, nilai suatu variabel atas dasar hubungannya dengan variabel lain.

... jadi ini istilah yang sangat luas dan banyak metode berbeda mulai dari ekstrapolasi linier sederhana , hingga regresi linier, regresi polinomial, atau bahkan beberapa metode peramalan time-series yang canggih sesuai dengan definisi tersebut. Faktanya, ekstrapolasi, prediksi, dan ramalan berkaitan erat. Dalam statistik, kita sering membuat prediksi dan ramalan . Ini juga yang dikatakan oleh tautan yang Anda rujuk:

Kami diajari sejak hari pertama statistik bahwa ekstrapolasi adalah hal yang tidak boleh, tetapi itulah yang diramalkan.

Banyak metode ekstrapolasi yang digunakan untuk membuat prediksi, apalagi, seringkali beberapa metode sederhana bekerja dengan baik dengan sampel kecil, sehingga dapat lebih disukai daripada yang rumit. Masalahnya adalah, seperti diperhatikan dalam jawaban lain, ketika Anda menggunakan metode ekstrapolasi secara tidak benar.

Sebagai contoh, banyak penelitian menunjukkan bahwa usia inisiasi seksual menurun dari waktu ke waktu di negara-negara barat. Lihatlah plot di bawah ini tentang usia hubungan seksual pertama di AS. Jika kita secara buta menggunakan regresi linier untuk memprediksi usia hubungan seksual pertama kita akan memprediksi itu akan di bawah nol pada beberapa tahun (sesuai dengan pernikahan pertama dan kelahiran pertama terjadi pada beberapa waktu setelah kematian) ... Namun, jika Anda perlu membuat perkiraan satu tahun ke depan, maka saya kira regresi linier akan menghasilkan prediksi jangka pendek yang cukup akurat untuk tren tersebut.

masukkan deskripsi gambar di sini

(sumber guttmacher.org )

Semua model salah , ekstrapolasi juga salah, karena tidak memungkinkan Anda membuat prediksi yang tepat. Sebagai alat matematika / statistik lainnya, ini akan memungkinkan Anda untuk membuat perkiraan perkiraan. Tingkat seberapa akuratnya data tersebut tergantung pada kualitas data yang Anda miliki, menggunakan metode yang memadai untuk masalah Anda, asumsi yang Anda buat saat menentukan model Anda dan banyak faktor lainnya. Tetapi ini tidak berarti bahwa kita tidak dapat menggunakan metode seperti itu. Kita bisa, tetapi kita perlu mengingat tentang keterbatasan mereka dan harus menilai kualitas mereka untuk masalah yang diberikan.

Tim
sumber
4
Ketika data yang Anda gunakan untuk regresi berakhir pada awal 1980-an, Anda mungkin dapat dengan mudah menguji berapa lama di luar tanggal ekstrapolasi akan bekerja.
gerrit
@ kritik saya setuju, tetapi sayangnya saya tidak dapat menemukan data yang sesuai. Tetapi jika seseorang bisa mengarahkannya kepada saya maka saya akan dengan senang hati memperbarui jawaban saya untuk perbandingan seperti itu.
Tim
Dalam hal ini, ekstrapolasi gagal, mengingat bahwa usia seks pertama telah melonjak dalam beberapa tahun terakhir. (Tetapi data untuk ini selalu tertinggal tahun kelahiran oleh beberapa dekade, karena alasan yang harus jelas.)
David Manheim
13

Saya sangat menyukai contoh karya Nassim Taleb (yang merupakan adaptasi dari contoh sebelumnya oleh Bertrand Russell):

Pertimbangkan kalkun yang diberi makan setiap hari. Setiap pemberian makan akan menguatkan keyakinan burung bahwa adalah aturan umum kehidupan yang harus diberi makan setiap hari oleh anggota ramah umat manusia "mencari kepentingan terbaiknya," seperti yang dikatakan oleh politisi. Pada sore hari Rabu sebelum Thanksgiving, sesuatu yang tidak terduga akan terjadi pada kalkun. Ini akan menimbulkan revisi keyakinan.

Beberapa analog matematika adalah sebagai berikut:

  • pengetahuan tentang beberapa koefisien Taylor pertama dari suatu fungsi tidak selalu menjamin bahwa koefisien yang berhasil akan mengikuti pola yang Anda duga.

  • pengetahuan tentang kondisi awal persamaan diferensial tidak selalu menjamin pengetahuan tentang perilaku asimptotiknya (misalnya persamaan Lorenz, terkadang terdistorsi menjadi apa yang disebut "efek kupu-kupu")

Berikut adalah utas MO bagus tentang masalah ini.

J. M. bukan ahli statistik
sumber
3
... dan tentu saja, Taleb harus menunjukkan pelajaran moral: "jangan menjadi kalkun"! Dalam konteks ini: jangan menjadi ekstrapolator yang ceroboh, dan jangan menyerah pada dosa keangkuhan.
JM bukan ahli statistik
@ uoɥʇʎPʎzɐɹC, saya tidak memintanya, tapi terima kasih!
JM bukan ahli statistik
tidak benar-benar menggunakan reputasi lintas yang divalidasi - dan tidak ada yang melihat jawaban Anda dan itu benar-benar bagus. Nikmati!
noɥʇʎԀʎzɐɹƆ
12

Renungkan cerita berikut, jika Anda mau.

Saya juga ingat duduk di kursus Statistik, dan profesor mengatakan kepada kami bahwa ekstrapolasi adalah ide yang buruk. Kemudian selama kelas berikutnya dia memberi tahu kami bahwa itu adalah ide yang buruk lagi; sebenarnya, dia mengatakannya dua kali.

Aku sakit selama sisa semester, tapi aku yakin aku tidak mungkin melewatkan banyak materi, karena pada minggu terakhir pria itu pasti tidak melakukan apa-apa selain mengatakan kepada orang-orang lagi dan lagi bagaimana ekstrapolasi adalah ide yang buruk .

Anehnya, nilai ujian saya tidak terlalu tinggi.

einpoklum - mengembalikan Monica
sumber
6
Pertanyaannya bertanya "apa yang salah dengan ekstrapolasi?". Kami mencari jawaban yang memberikan alasan mengapa ekstrapolasi bisa menjadi ide yang buruk.
Robert Long
8
@RobertLong: Ini sebenarnya semacam jawaban meta / lelucon, dan sangat mirip dengan xkcd.com/605 - masih mungkin lebih baik sebagai komentar daripada jawaban.
Neil Slater
@NeilSlater: Anda seharusnya memposting komentar Anda sebagai jawaban ... :)
usεr11852 mengatakan Reinstate Monic
@RobertLong: Ini adalah jawaban semacam itu. Itu hanya memiliki bentuk perumpamaan.
einpoklum - mengembalikan Monica
2
Tidak jelas bahwa model Anda eksponensial.
gerrit
6

Pertanyaannya bukan hanya statistik, tetapi juga epistemologis. Ekstrapolasi adalah salah satu cara kita belajar tentang alam, itu adalah bentuk induksi . Katakanlah kita memiliki data untuk konduktivitas listrik suatu bahan dalam kisaran suhu dari 0 hingga 20 Celcius, apa yang dapat kita katakan tentang konduktivitas pada 40 derajat Celcius?

Ini terkait erat dengan inferensi sampel kecil: apa yang bisa kita katakan tentang seluruh populasi dari pengukuran yang dilakukan pada sampel kecil? Ini dimulai oleh Gosset sebagai Guiness , yang datang dengan distribusi t Student. Sebelum dia, ahli statistik tidak mau repot-repot memikirkan sampel kecil dengan asumsi ukuran sampel selalu bisa besar. Dia berada di Guinnes dan harus berurusan dengan sampel bir untuk memutuskan apa yang harus dilakukan dengan seluruh batch bir yang akan dikirim.

Jadi, dalam praktik (bisnis), teknik, dan sains kita selalu harus memperkirakan dalam beberapa hal. Itu bisa berupa ekstrapolasi sampel kecil hingga besar, atau dari kisaran kondisi input terbatas hingga serangkaian kondisi yang lebih luas, dari apa yang terjadi dalam akselerator hingga apa yang terjadi pada lubang hitam miliaran mil jauhnya dll. Terutama penting dalam sains , karena kami benar-benar belajar dengan mempelajari perbedaan antara perkiraan ekstrapolasi kami dan pengukuran aktual. Seringkali kita menemukan fenomena baru ketika perbedaan besar atau konsisten.

karenanya, saya katakan tidak ada masalah dengan ekstrapolasi. Itu adalah sesuatu yang harus kita lakukan setiap hari. Itu hanya sulit.

Aksakal
sumber
4

Ekstrapolasi itu sendiri tidak selalu jahat, tetapi itu adalah proses yang cocok dengan kesimpulan yang lebih tidak masuk akal daripada Anda sampai pada interpolasi.

  • Ekstrapolasi sering dilakukan untuk mengeksplorasi nilai-nilai yang cukup jauh dari wilayah sampel. Jika saya mengambil sampel 100 nilai dari 0-10, dan kemudian memperkirakan sedikit, hanya menjadi 11, poin baru saya kemungkinan 10 kali lebih jauh dari titik data apa pun daripada interpolasi yang bisa didapat. Ini berarti ada lebih banyak ruang bagi variabel untuk keluar dari kendali (secara kualitatif). Perhatikan bahwa saya sengaja memilih hanya ekstrapolasi kecil. Ini bisa menjadi jauh lebih buruk
  • Ekstrapolasi harus dilakukan dengan kurva fit yang dimaksudkan untuk melakukan ekstrapolasi. Misalnya, banyak polinomial yang cocok untuk ekstrapolasi sangat buruk karena istilah yang berperilaku baik pada rentang sampel dapat meledak setelah Anda meninggalkannya. Ekstrapolasi yang baik tergantung pada "tebakan yang baik" tentang apa yang terjadi di luar wilayah sampel. Yang membawaku ke ...
  • Seringkali sangat sulit untuk menggunakan ekstrapolasi karena adanya transisi fase. Banyak proses yang ingin diekstrapolasikan secara jelas memiliki sifat nonlinier yang tidak cukup terekspos di wilayah sampel. Aeronautika dengan kecepatan suara adalah contoh yang sangat baik. Banyak ekstrapolasi dari kecepatan rendah berantakan saat Anda mencapai dan melampaui kecepatan transfer informasi di udara. Ini juga sering terjadi pada ilmu-ilmu lunak, di mana kebijakan itu sendiri dapat berdampak pada keberhasilan kebijakan tersebut. Ekonomi Keynesian memperkirakan bagaimana ekonomi akan berperilaku dengan tingkat inflasi yang berbeda, dan memperkirakan hasil terbaik. Sayangnya, ada efek urutan kedua dan hasilnya bukan kemakmuran ekonomi, melainkan beberapa tingkat inflasi tertinggi yang pernah dilihat AS.
  • Orang menyukai ekstrapolasi. Secara umum, orang benar-benar ingin seseorang mengintip ke dalam bola kristal dan memberi tahu mereka masa depan. Mereka akan menerima ekstrapolasi yang sangat buruk hanya karena itu semua informasi yang mereka miliki. Ini mungkin tidak membuat ekstrapolasi itu sendiri buruk, tapi itu pasti sesuatu yang harus diperhitungkan ketika menggunakannya.

Untuk ekstrapolasi terbaik, pertimbangkan Proyek Manhattan. Para fisikawan di sana dipaksa bekerja dengan tes skala sangat kecil sebelum membangun benda yang sebenarnya. Mereka benar-benar tidak memiliki cukup Uranium untuk dihabiskan pada tes. Mereka melakukan yang terbaik yang mereka bisa, dan mereka pintar. Namun, ketika tes terakhir terjadi, diputuskan bahwa masing-masing ilmuwan akan memutuskan seberapa jauh dari ledakan yang mereka inginkan ketika meledak. Ada perbedaan pendapat substansial tentang seberapa jauh itu "aman" karena setiap ilmuwan tahu mereka memperkirakan cukup jauh dari tes mereka. Bahkan ada pertimbangan non-sepele bahwa mereka mungkin membakar atmosfir dengan bom nuklir, suatu masalah juga diselesaikan dengan ekstrapolasi substansial!

Cort Ammon
sumber
3

Banyak jawaban bagus di sini, saya hanya ingin mencoba dan mensintesis apa yang saya lihat sebagai inti dari masalah: berbahaya untuk melakukan ekstrapolasi di luar proses pembuatan data yang memunculkan sampel estimasi. Ini kadang-kadang disebut 'perubahan struktural'.

Peramalan dilengkapi dengan asumsi, yang utama adalah bahwa proses menghasilkan data (sedekat tidak membuat perbedaan signifikan) sama dengan yang menghasilkan sampel (kecuali untuk variabel rhs, yang perubahannya Anda pertanggungjawabkan secara eksplisit dalam model) . Jika perubahan struktural terjadi (yaitu, Thanksgiving dalam contoh Taleb), semua taruhan dibatalkan.

Jason
sumber