Bukti untuk pemanasan global buatan manusia mencapai 'standar emas': bagaimana mereka melakukan ini?

Pesan ini dalam artikel Reuter dari 25.02.2019 saat ini ada di seluruh berita:

Bukti untuk pemanasan global buatan manusia mencapai 'standar emas'

[Ilmuwan] mengatakan keyakinan bahwa aktivitas manusia yang meningkatkan panas di permukaan bumi telah mencapai level "lima-sigma", ukuran statistik yang berarti hanya ada peluang satu-dalam-sejuta bahwa sinyal akan muncul jika ada tidak ada pemanasan.

Saya percaya bahwa ini merujuk pada artikel ini "Merayakan ulang tahun tiga peristiwa utama dalam ilmu perubahan iklim" yang berisi plot, yang ditunjukkan secara skematis di bawah ini (Ini adalah sketsa karena saya tidak dapat menemukan gambar open source untuk yang asli, serupa gambar gratis dapat ditemukan di sini ). Artikel lain dari kelompok penelitian yang sama, yang tampaknya merupakan sumber yang lebih asli, ada di sini (tetapi menggunakan signifikansi 1%, bukannya $5\sigma$ ).

Plot ini menyajikan pengukuran dari tiga kelompok penelitian yang berbeda: Sistem Penginderaan Jauh, Pusat Aplikasi dan Penelitian Satelit, dan Universitas Alabama di Huntsville.

Plot menampilkan tiga kurva peningkatan rasio sinyal ke kebisingan sebagai fungsi dari panjang tren.

Jadi, entah bagaimana para ilmuwan telah mengukur sinyal antropogenik pemanasan global (atau perubahan iklim?) Pada tingkat , yang tampaknya merupakan bukti ilmiah standar . $5\sigma$

Bagi saya grafik seperti itu, yang memiliki abstraksi tingkat tinggi, menimbulkan banyak pertanyaan , dan secara umum saya bertanya-tanya tentang pertanyaan 'Bagaimana mereka melakukan ini?' . Bagaimana kita menjelaskan eksperimen ini menjadi kata-kata sederhana (tapi tidak terlalu abstrak) dan juga menjelaskan arti level ? $^{\dagger}$ $5\sigma$

Saya mengajukan pertanyaan ini di sini karena saya tidak ingin diskusi tentang iklim. Sebaliknya saya ingin jawaban mengenai konten statistik dan terutama untuk mengklarifikasi makna pernyataan seperti itu yang menggunakan / mengklaim . $5 \sigma$

$^\dagger$ Apa hipotesis nolnya? Bagaimana mereka mengatur percobaan untuk mendapatkansinyalantropogenik? Berapaukuranefeksinyal? Apakah ini hanya sinyal kecil dan kami hanya mengukur ini sekarang karena kebisingan berkurang, atau apakah sinyal meningkat? Asumsi macam apa yang dibuat untuk membuat model statistik yang dengannya mereka menentukan persimpangan ambang 5 sigma (independensi, efek acak, dll ...)? Mengapa ketiga kurva untuk kelompok penelitian berbeda, apakah mereka memiliki kebisingan yang berbeda atau mereka memiliki sinyal yang berbeda, dan dalam kasus yang terakhir, apa artinya mengenai interpretasi probabilitas dan validitas eksternal?

p-value intuition application communication climate Sextus Empiricus
sumber

@ MatF. Harapan saya adalah bahwa akan dimungkinkan untuk membuat eksposisi sederhana yang menjelaskan konsep statistik dari ambang

yang telah digunakan di sini (setidaknya fisikawan partikel energi tinggi, yang juga menggunakan

perbedaan / efek untuk menggambarkan sinyal ke rasio noise dalam hitungan acara, tidak punya masalah dengan ini). Dengan sederhana saya maksudkan sesuatu dilucuti dari jargon klimatologi, tetapi cukup canggih untuk mengandung esensi. Katakanlah, itu akan menjadi sesuatu yang ditulis untuk ahli statistik profesional dan ahli matematika sehingga mereka dapat memahami

sini.

5 σ

$5\sigma$

σ

$\sigma$

5 σ

$5\sigma$

Sextus Empiricus

Untuk menekankan kontras dengan fisika energi tinggi: untuk bidang ini ahli statistik dapat memahami bahwa level

pada dasarnya tidak berarti dan bilah ditetapkan tinggi karena perhitungannya secara teknis salah (1. tampilan efek di tempat lain 2. asumsi salah tentang distribusi kesalahan mengabaikan efek sistematis 3. secara implisit melakukan analisis Bayesian, 'klaim luar biasa membutuhkan bukti luar biasa').

5 σ

$5\sigma$

Sextus Empiricus

Pertanyaannya adalah seberapa banyak ketiga efek ini hadir dalam kasus artikel pemanasan global buatan manusia ini. Saya pikir penting untuk memperjelas hal ini, untuk mengaburkan klaim-klaim scency. Sangat umum untuk hanya melemparkan beberapa angka ke dalam argumen untuk membuatnya terdengar keras, dan kebanyakan orang berhenti mempertanyakannya.

Sextus Empiricus

Pernahkah Anda melihat kritik ini: judithcurry.com/2019/03/01/… ?

Robert Long

Secara kebetulan saya membaca makalah ini hanya beberapa hari yang lalu, dan sekarang perhatikan karunia baru Anda. Saya mungkin menulis sesuatu sekarang.

Amuba kata Reinstate Monica

Jawaban:

Ini tidak selalu tentang pengujian statistik. Bisa juga tentang teori informasi.

Istilah 5σ adalah apa yang dikatakannya: rasio "sinyal" ke "noise." Dalam pengujian hipotesis kami memiliki estimasi parameter distribusi, dan standar kesalahan estimasi. Yang pertama adalah "sinyal," yang kedua adalah "noise," dan rasio statistik dan kesalahan standarnya adalah z-statistik, t-statistik, F-statistik, apa saja.

Namun demikian rasio signal-to-noise berguna di mana-mana di mana kita menerima / memahami beberapa informasi melalui beberapa noise. Seperti yang dijelaskan dalam tautan yang dikutip

Rasio signal-to-noise (sering disingkat SNR atau S / N) adalah ukuran yang digunakan dalam sains dan teknik untuk mengukur seberapa besar sinyal terkorupsi oleh noise.

Dalam kasus kami, "sinyal" adalah perubahan aktual yang diukur dalam suhu beberapa strata atmosfer dan "noise" adalah prediksi perubahan dari simulasi tanpa diketahui pengaruh antropogenik. Kebetulan simulasi ini memperkirakan suhu stasioner lebih atau kurang dengan standar deviasi tertentu σ.

Sekarang kembali ke statistik. Semua statistik uji (z, t, F) adalah rasio estimasi untuk kesalahan standarnya. Jadi ketika kita para ahli statistik mendengar sesuatu seperti S / N, kita memikirkan z-statistik dan melengkapinya dengan probabilitas. Para ahli iklim jelas tidak melakukan ini (tidak ada penyebutan probabilitas di mana pun dalam artikel ). Mereka hanya menemukan bahwa perubahan itu "kira-kira tiga sampai delapan" kali lebih besar seperti yang diharapkan, S / N adalah 3σ ke 8σ.

Apa yang dilaporkan dalam artikel tersebut adalah, bahwa mereka membuat dua jenis simulasi: simulasi dengan pengaruh antropogenik yang diketahui termasuk dalam model dan yang lainnya dengan pengaruh antropogenik yang diketahui dikecualikan. Simulasi pertama mirip dengan data satelit aktual yang diukur, sedangkan yang kedua jauh. Jika ini mungkin atau tidak, mereka tidak mengatakan dan jelas tidak peduli.

Untuk menjawab pertanyaan lain. Mereka tidak membuat percobaan, mereka membuat simulasi sesuai dengan model mereka. Jadi tidak ada hipotesis nol eksplisit kecuali yang jelas, bahwa perubahannya mirip dengan yang diharapkan (S / N adalah 1).

Ukuran efek sinyal adalah perbedaan antara data aktual dan simulasi. Ini adalah sinyal 5 kali lebih besar dari yang diperkirakan (lima kali variabilitas suhu yang biasa). Tampaknya kebisingan berkurang karena jumlah dan keakuratan pengukuran.

Bertolak belakang dengan harapan kami dari "ilmuwan sungguhan," tidak ada model statistik yang dapat kami bicarakan, sehingga pertanyaan tentang asumsi yang dibuat kosong. Satu-satunya asumsi adalah bahwa model mereka memungkinkan mereka untuk memprediksi iklim. Ini sama validnya dengan mengatakan bahwa model yang digunakan untuk prakiraan cuaca solid.

Ada lebih dari tiga kurva. Mereka adalah hasil simulasi dari model yang berbeda. Mereka harus berbeda. Dan ya, ada suara yang berbeda. Sinyal, sejauh berbeda, adalah set pengukuran yang berbeda, yang memiliki kesalahan pengukuran, dan juga harus berbeda. Apa artinya ini mengenai interpretasi? Interpretasi probabilitas S / N tidak bagus. Namun, validitas eksternal dari temuan-temuan itu bagus. Mereka hanya menyatakan bahwa perubahan iklim pada periode 1979 hingga 2011 sebanding dengan simulasi ketika pengaruh antropogenik yang diketahui dicatat dan kira-kira lima kali lebih besar dari yang dihitung dengan simulasi ketika faktor antropogenik yang diketahui dikecualikan dari model.

Jadi ada satu pertanyaan lagi. Jika ahli iklim akan meminta ahli statistik untuk membuat model, apa yang seharusnya? Menurut saya ada sesuatu di garis gerak Brown.

Nino Rode
sumber

Jadi apa yang merupakan "sinyal," apa sifat dari "kebisingan", dan untuk proses yang tidak terlihat (es) apa yang bisa kita kaitkan?

Josh

Sory @Josh, saya menekan tombol kirim sebelum waktunya. Sekarang Anda dapat membaca jawaban lengkap saya. Lebih sedikit bijih, "sinyal" adalah pengukuran aktual, dan "noise" adalah hasil simulasi ketika faktor antropogenik yang diketahui dikeluarkan dari model. Dan menurut saya ini sangat tidak statistik ...

Nino Rode

Kedua, apa yang saya dapatkan dari posting Anda adalah bahwa statistik S / N ditentukan oleh sinyal: perbedaan antara dua model teoretis (efek manusia versus baseline), dan noise: penyimpangan dalam model teoretis tersebut. Tetapi ini bisa sangat dipengaruhi oleh efek sistematis. Distribusi efek acak tidak ditentukan dengan baik hanya dengan rata-rata atas varians dalam simulasi monte carlo (lihat partikel Vivianonium). Jika ada kesalahan sistematis, maka Anda bisa membuatnya

n σ

$n\sigma$

@NinoRode Mungkin saya melewatkan sesuatu, tetapi karena model "noise" tanpa pengaruh antropogenik adalah ternyata salah karena fakta bahwa suhu rata-rata telah naik berdasarkan pengukuran empiris , bagaimana model itu memberikan baseline yang relevan? Karena dipahami bahwa suhu berfluktuasi karena proses alami ( en.wikipedia.org/wiki/Little_Ice_Age ) selain yang antropogenik, apa dasar untuk asumsi bahwa model "noise" harus memiliki peningkatan suhu rata-rata nol periode analisis?

Josh

@Scott, masalah dengan kartun pintar itu ada di sana ada suara yang ditampilkan melalui seri waktu karena pengukuran kemungkinan tidak cukup halus untuk menentukan suhu pada abad tertentu, apalagi tahun tertentu. Sehingga terlihat mulus dan bertahap hingga munculnya perangkat pengukuran modern. Dalam mekanika fluida ini akan seperti membandingkan pengamatan sesaat dari bidang kecepatan dengan yang rata-rata Reynolds; ini bukan perbandingan yang tepat. Kecuali Anda benar-benar berpikir pada dasarnya tidak ada volatilitas pada suhu global sampai Greta Thunberg lahir. :)

Josh

Peringatan: Saya BUKAN pakar klimatologi, ini bukan bidang saya. Tolong ingat ini. Selamat datang koreksi.

Sosok yang Anda maksud berasal dari makalah terbaru Santer et al. 2019, Merayakan ulang tahun tiga peristiwa utama dalam ilmu perubahan iklim dari Nature Climate Change . Ini bukan makalah penelitian, tetapi komentar singkat. Angka ini adalah pembaruan yang disederhanakan dari tokoh yang sama dari makalah Science sebelumnya dari penulis yang sama, Santer et al. 2018, Pengaruh manusia pada siklus musiman suhu troposfer . Berikut adalah angka 2019:

Dan di sini adalah angka 2018; panel A sesuai dengan angka 2019:

Di sini saya akan mencoba menjelaskan analisis statistik di balik angka terakhir ini (keempat panel). The Ilmu kertas akses terbuka dan cukup mudah dibaca; perincian statistik, seperti biasa, disembunyikan dalam Materi Tambahan. Sebelum membahas statistik seperti itu, kita harus mengatakan beberapa kata tentang data pengamatan dan simulasi (model iklim) yang digunakan di sini.

1. Data

Singkatan RSS, UAH, dan STAR, merujuk pada rekonstruksi suhu troposfer dari pengukuran satelit. Temperatur troposfer telah dipantau sejak 1979 menggunakan satelit cuaca: lihat Wikipedia tentang pengukuran suhu MSU . Sayangnya, satelit tidak mengukur suhu secara langsung; mereka mengukur sesuatu yang lain, dari mana suhu dapat disimpulkan. Selain itu, mereka diketahui menderita berbagai bias tergantung waktu dan masalah kalibrasi. Ini membuat merekonstruksi suhu aktual menjadi masalah yang sulit. Beberapa kelompok penelitian melakukan rekonstruksi ini, mengikuti metodologi yang agak berbeda, dan memperoleh hasil akhir yang agak berbeda. RSS, UAH, dan STAR adalah rekonstruksi ini. Mengutip Wikipedia,

Satelit tidak mengukur suhu. Mereka mengukur pancaran dalam berbagai pita panjang gelombang, yang kemudian harus secara matematis terbalik untuk mendapatkan inferensi tidak langsung suhu. Profil suhu yang dihasilkan tergantung pada detail metode yang digunakan untuk mendapatkan suhu dari pancaran cahaya. Akibatnya, berbagai kelompok yang telah menganalisis data satelit telah memperoleh tren suhu yang berbeda. Di antara kelompok-kelompok ini adalah Sistem Penginderaan Jauh (RSS) dan Universitas Alabama di Huntsville (UAH). Seri satelit tidak sepenuhnya homogen - catatan ini dibangun dari serangkaian satelit dengan instrumentasi yang serupa tetapi tidak identik. Sensor memburuk dari waktu ke waktu, dan koreksi diperlukan untuk pergeseran satelit di orbit.

Ada banyak perdebatan tentang rekonstruksi mana yang lebih andal. Setiap kelompok memperbarui algoritme mereka sesekali, mengubah seluruh rangkaian waktu yang direkonstruksi. Inilah sebabnya, misalnya, RSS v3.3 berbeda dari RSS v4.0 pada gambar di atas. Secara keseluruhan, AFAIK diterima dengan baik di lapangan bahwa perkiraan suhu permukaan global lebih tepat daripada pengukuran satelit. Bagaimanapun, yang penting untuk pertanyaan ini, adalah bahwa ada beberapa perkiraan yang tersedia tentang suhu troposfer yang diselesaikan secara spasial, dari tahun 1979 sampai sekarang - yaitu sebagai fungsi dari garis lintang, bujur, dan waktu.

$T(\mathbf x, t)$ .

2. Model

Ada berbagai model iklim yang dapat dijalankan untuk mensimulasikan suhu troposfer (juga sebagai fungsi lintang, bujur, dan waktu). Model-model ini mengambil konsentrasi CO2, aktivitas vulkanik, radiasi matahari, konsentrasi aerosol, dan berbagai pengaruh eksternal lainnya sebagai input, dan menghasilkan suhu sebagai output. Model-model ini dapat dijalankan untuk periode waktu yang sama (1979 - sekarang), menggunakan pengaruh eksternal terukur yang sebenarnya. Keluaran kemudian dapat dirata-ratakan, untuk mendapatkan keluaran model rata-rata.

Kita juga dapat menjalankan model ini tanpa memasukkan faktor antropogenik (gas rumah kaca, aerosol, dll.), Untuk mendapatkan gagasan prediksi model non-antropogenik. Perhatikan bahwa semua faktor lain (surya / vulkanik / dll.) Berfluktuasi di sekitar nilai rata-rata, sehingga output model non-antropogenik tidak bergerak oleh konstruksi. Dengan kata lain, model tidak memungkinkan iklim berubah secara alami, tanpa sebab eksternal tertentu.

$M(\mathbf x,t)$ $N(\mathbf x, t)$

$z$

$T(\mathbf x, t)$ $M(\mathbf x, t)$ $N(\mathbf x, t)$

$T(\mathbf x, i)$ $M(\mathbf x, i)$ $N(\mathbf x, i)$ $i$

Rata-rata tahunan: cukup suhu rata-rata sepanjang tahun.
Siklus musiman tahunan: suhu musim panas minus suhu musim dingin.
$\mathbf x$ $i$ .
Siklus musiman tahunan dengan rata-rata global dikurangi: sama dengan (2) tetapi kembali mengurangi rata-rata global.

$M(\mathbf x, i)$ $F(\mathbf x)$ . Ini pada dasarnya adalah pola 2D dari perubahan maksimal kuantitas bunga sesuai dengan model antropogenik.

$T(\mathbf x, i)$ $F(\mathbf x)$

Z (i) = \sum_{x} T (x, i) F (x),

$Z(i) = \sum_\mathbf x T(\mathbf x, i) F(\mathbf x),$

β

$\beta$

z

$z$ -statistic ("rasio signal-to-noise" dalam gambar).

W (i) = \sum_{x} N (x, i) F (x),

$W(i) = \sum_\mathbf x N(\mathbf x, i) F(\mathbf x),$

β_{n o i s e}

$\beta_\mathrm{noise}$

β_{n o i s e}

$\beta_\mathrm{noise}$

z

$z$ -statistik:

z = \frac{β}{{Var}^{1 / 2} [β_{n o i s e}]} .

$z = \frac{\beta}{\operatorname{Var}^{1/2}[\beta_\mathrm{noise}]}.$

Apa yang Anda lihat di panel A - D pada gambar di atas adalah ini $z$ nilai untuk tahun akhir analisis yang berbeda.

$z$

4. Beberapa komentar

Sidik jari pertama (panel A) adalah, IMHO, yang paling sepele. Ini hanya berarti bahwa suhu yang diamati tumbuh secara monoton sedangkan suhu di bawah hipotesis nol tidak. Saya tidak berpikir orang perlu seluruh mesin yang rumit ini untuk membuat kesimpulan ini. Rangkaian waktu suhu rata-rata global yang lebih rendah (varian RSS) terlihat seperti ini :

dan jelas ada tren yang sangat signifikan di sini. Saya tidak berpikir kita perlu model untuk melihatnya.

$z$

amuba kata Reinstate Monica
sumber

(+1) Ini adalah jawaban yang bagus! Jika Anda tidak keberatan: dapatkah Anda memperluas langkah "PCA lintas waktu"? Saya tidak mengerti pemikiran di balik melakukan PCA di sana daripada menganalisis setiap dimensi secara terpisah.

mkt - Pasang kembali Monica

β_{noise}

$\beta_{\text {noise}}$

N (x, i)

$N(x,i)$

F (x)

$F(x)$

T (x, i)

$T(x,i)$

F (x)

$F(x)$

N (x, 2019)

$N(x, 2019)$

Ya, hal ini dapat didiskusikan dari semua jenis sudut. Saya pribadi sering tanpa penilaian tentang pihak mana pun, tetapi saya suka bahwa argumennya tajam dan jelas. Pelaporan tentang iklim saat ini sangat kabur.

Sextus Empiricus

F (x)

$F(x)$