Jadi apa yang saya baca tentang nabi Facebook adalah bahwa ia pada dasarnya memecah seri waktu menjadi tren dan musiman. Misalnya, model aditif akan ditulis sebagai:
dengan
- waktu
- tren (mungkin linier atau logistik)
- musiman (harian, mingguan, tahunan ...)
- liburan
- kesalahannya
Pertanyaan saya adalah: Tidak bisakah dilakukan dengan regresi linier sederhana? Apa perbedaan dalam hal hasil jika kita membandingkannya, dan mengapa?
Jawaban:
Masalahnya di sini adalah untuk mendapatkan persamaan yang mem-parsing data yang diamati menjadi sinyal dan noise. Jika data Anda sederhana maka pendekatan regresi Anda mungkin berhasil. Harus diperhatikan untuk memahami beberapa asumsi yang mereka buat dengan Nabi. Anda harus lebih memahami apa yang dilakukan oleh Nabi, karena itu tidak hanya sesuai dengan model sederhana tetapi upaya untuk menambahkan beberapa struktur.
Misalnya, beberapa refleksi yang saya buat setelah membaca pengantar yang ditulis dengan baik mungkin membantu Anda dalam evaluasi Anda. Saya minta maaf sebelumnya jika saya salah memahami pendekatan mereka, dan ingin diperbaiki jika demikian.
1) Contoh utama mereka memiliki dua break-point dalam tren tetapi mereka hanya menangkap satu yang paling jelas.
2) Mereka mengabaikan setiap dan semua struktur ARIMA yang mencerminkan seri stokastik yang dihilangkan atau nilai menggunakan nilai historis Y untuk memandu perkiraan.
3) Mereka mengabaikan dinamika yang mungkin (efek lead dan lag) dari seri stokastik dan deterministik yang disarankan pengguna. Efek regresi kausal Nabi hanyalah sebaya.
4) Tidak ada upaya yang dilakukan untuk mengidentifikasi pergeseran langkah / level dalam seri atau pulsa musiman misalnya perubahan dalam EFEK SENIN setengah hari melalui waktu karena beberapa peristiwa eksternal yang tidak diketahui. Nabi mengasumsikan "pertumbuhan linier sederhana 'daripada memvalidasinya dengan memeriksa kemungkinan alternatif. Untuk contoh yang mungkin dari ini, lihat Peramalan pesanan berulang untuk bisnis berlangganan online menggunakan Facebook Prophet dan R
5) Sines dan Cosines adalah cara buram dalam berurusan dengan musiman, sementara efek musiman seperti hari-of-the-minggu, hari-of-the-bulan, minggu-of-the-bulan, bulan-of-the-tahun adalah jauh lebih efektif / informatif ketika berhadapan dengan efek antropogenik (berurusan dengan manusia!).
Menyarankan frekuensi 365,25 untuk pola tahunan tidak masuk akal karena kami tidak melakukan tindakan yang sama pada hari yang sama seperti yang kami lakukan tahun lalu, sementara aktivitas bulanan jauh lebih gigih, tetapi Nabi tampaknya tidak menawarkan 11 indikator bulanan pilihan. Frekuensi mingguan 52 tidak masuk akal karena kita tidak memiliki 52 minggu setiap tahun.
6) Tidak ada upaya yang dilakukan untuk memvalidasi proses kesalahan menjadi Gaussian sehingga tes signifikansi dapat dilakukan.
7) Tidak ada perhatian untuk varians kesalahan model menjadi homogen, yaitu, tidak berubah secara deterministik pada titik-titik waktu tertentu yang menyarankan Weighted Least Squares. Tidak ada kekhawatiran untuk menemukan transformasi daya yang optimal untuk menangani varians kesalahan yang proporsional dengan Nilai yang Diharapkan Kapan (dan mengapa) Anda harus mengambil log distribusi (angka)? .
8) Pengguna harus menentukan sebelumnya semua kemungkinan efek timbal dan kelambatan di sekitar acara / liburan. Misalnya, penjualan harian sering mulai meningkat pada akhir November, yang mencerminkan efek jangka panjang Natal.
9) Tidak ada kekhawatiran bahwa kesalahan yang dihasilkan bebas dari struktur yang menyarankan cara untuk meningkatkan model melalui pemeriksaan diagnostik untuk kecukupan.
10) Tampaknya tidak ada masalah dengan memperbaiki model dengan menghapus struktur yang tidak signifikan.
11) Tidak ada fasilitas untuk mendapatkan keluarga perkiraan simulasi di mana batas kepercayaan mungkin tidak harus simetris melalui bootstrap kesalahan model dengan kelonggaran kemungkinan anomali.
12) Membiarkan pengguna membuat asumsi tentang tren (# breakpoint tren dan breakpoint aktual) memungkinkan fleksibilitas yang tidak diinginkan / tidak dapat digunakan dalam menghadapi analisis skala besar yang namanya dirancang untuk aplikasi skala besar hands-free.
sumber
Saya belum menggunakannya, tetapi ini adalah abstrak pracetak mereka (penekanan milik saya):
Dalam pendahuluan:
Jadi bagi saya tampaknya mereka tidak mengklaim telah membuat kemajuan statistik yang substansial di sini (walaupun itu mampu jauh lebih dari model sederhana yang Anda uraikan). Sebagai gantinya, mereka mengklaim bahwa sistem mereka membuatnya layak untuk sejumlah besar orang tanpa keahlian dalam analisis deret waktu untuk menghasilkan perkiraan sambil menerapkan keahlian domain mereka sendiri dan kendala spesifik sistem.
Jika Anda sudah memiliki keahlian dalam analisis deret waktu dan pengkodean model yang rumit, ini mungkin tidak terlalu membantu Anda. Tetapi jika klaim mereka benar, ini bisa sangat berguna! Sains (dan perdagangan) berkembang tidak hanya karena ide-ide baru, tetapi juga karena alat baru dan penyebarannya (lihat artikel pendek Freeman Dyson tentang topik ini dan respons ini ).
Untuk mengambil contoh dari statistik itu sendiri:
R
tidak mewakili kemajuan statistik, tetapi telah berpengaruh besar-besaran karena memudahkan banyak orang untuk melakukan analisis statistik. Sudah menjadi perancah di mana banyak pemahaman statistik telah dibangun. Jika kita beruntung, Nabi dapat memainkan peran yang sama.Dyson, Freeman J. "Apakah sains sebagian besar didorong oleh ide atau oleh alat ?." Sains 338, tidak. 6113 (2012): 1426-1427.
sumber
Anda kehilangan poin perubahan, splines linier piecewise, yang dapat diimplementasikan dalam model linier.
Anda benar bahwa setidaknya dalam kasus pembatas itu adalah regresi linier yang diregulasi (L1 dan L2 regularisasi).
Perhatikan bahwa ada model nabi yang terpisah, pertumbuhan logistik.
Anda juga mengasumsikan bahwa faktor musiman bersifat aditif, tetapi mereka juga mendukung efek musiman multiplikasi, yang tampaknya lebih alami setidaknya untuk pemodelan pertumbuhan.
sumber
Banyak yang bisa dilakukan dengan regresi linier sederhana tetapi tidak semua yang dilakukan Nabi. Hanya satu contoh, Anda dapat menentukan kandidat titik perubahan Anda sendiri untuk tren, dan Nabi akan menggunakannya sebagai sebelumnya.
sumber