Menggunakan regresi linier tersegmentasi sebagai bukti untuk batas umur manusia

8

Nature menerbitkan makalah berikut tahun ini: Bukti untuk batas umur manusia 1 , di mana penulis berpendapat "hasil mereka sangat menunjukkan bahwa umur manusia maksimum adalah tetap dan tunduk pada kendala alam."

Salah satu analisis statistik makalah ini telah digeser di beberapa situs, termasuk artikel Nature salah tentang batas umur manusia 115 tahun dan Bukti untuk batas ulasan sejawat yang efektif , karena muncul di beberapa media populer.

Studi ini didasarkan, di antara beberapa hal, pada data dari database yang merinci usia kematian maksimum tahunan. Di antara analisis mereka, gambar berikut termasuk :

http://www.nature.com/nature/journal/v538/n7624/images/nature19793-sf6.jpg

Pada dasarnya penulis berpendapat ada breakpoint, dan mereka melakukan regresi tersegmentasi sebelum sekitar tahun 1995 dan setelah itu dan seterusnya. Regresi digunakan sebagai bukti untuk batas umur manusia.

Apakah itu masuk akal? Jika tidak, metode apa yang bisa digunakan untuk mempelajari data ini?

[1] Dong, Xiao, Brandon Milholland, dan Jan Vijg. "Bukti untuk batas umur manusia." Alam 538.7624 (2016): 257-259.

Pembakar
sumber
4
Regresi linier untuk ekstrema tampak aneh ... dan, mereka jelas menggunakan regresi tersegmentasi yang terputus-putus, yang tidak biasa ...
kjetil b halvorsen
3
@kjetilbhalvorsen setuju. Ekstrem adalah contoh data yang diketahui melanggar asumsi normal dengan sangat liar. Saya bertanya-tanya bagaimana kemungkinan rutin maksimum untuk data Gumbel akan dilakukan ... menggunakan teknik analisis survival yang tepat .
AdamO

Jawaban:

2

Pertama-tama, mari kita secara manual mengekstraksi nilai dari Gambar 2 asli mereka dan memplot data tanpa warna atau garis regresi yang bias inspeksi visual pertama kami dari data mentah.

year <- c(1968, 1970, 1973, 1975, 1978, 1979, 1980, 1981, 1982, 
          1983, 1984, 1985, 1986, 1987, 1988, 1989, 1990, 1991, 
          1992, 1994, 1993, 1995, 1996, 1998, 1997, 1999, 2000, 
          2001, 2002, 2003, 2004, 2005, 2006)
age <- c(111, 111, 112, 111, 111, 110, 111, 113, 113, 113, 111, 
         114, 113, 114, 114, 112, 112, 112, 114, 115, 117, 112, 
         114, 115, 121, 119, 114, 115, 115, 114, 113, 114, 112)

plot(year,age,xlab="Year",
     ylab="Yearly maximum reported age at death (years)", 
     pch=20,cex=2,ylim=c(108,124),xlim=c(1960,2010))

Kami memperoleh:

usia sebar vs tahun

Dan, mari kita lakukan hal yang sama untuk data pada Gambar 6 (seperti yang disajikan dalam pertanyaan di atas):

age <- c(113, 109, 109, 110, 113, 109, 110, 111, 111, 111, 
         112, 112, 113, 111, 111, 113, 113, 113, 114, 115, 
         113, 114, 122, 119, 117, 114, 115, 115, 114, 114, 
         115, 116, 115, 115, 114, 114, 116, 116, 117)
year <- c(1954, 1957, 1958, 1958, 1963, 1964, 1965, 1967,
          1968, 1970, 1975, 1972, 1976, 1976, 1977, 1980, 
          1981, 1982, 1984, 1985, 1986, 1987, 1997, 1998, 
          1998, 1999, 2001, 2001, 2002, 2003, 2006, 2006,
          2008, 2007, 2010, 2011, 2011, 2012, 2015)

plot(year,age,xlab="Year",
     ylab="MRAD from GRG", 
     pch=20,cex=2,ylim=c(108,124),xlim=c(1950,2020))

masukkan deskripsi gambar di sini

Tampaknya model regresi linier sederhana akan menjadi kandidat alami yang menantang model titik perubahan yang kurang pelit seperti yang diusulkan penulis. Memang, Philipp Berens dan Tom Wallis telah melakukannya dan menerbitkan analisis ulang mereka di github: https://github.com/philippberens/lifespan

Brandmaier
sumber
1
Anda tampaknya telah melakukan kesalahan dalam mengambil nilai dari gambar - data hilang selama beberapa tahun.
Scortchi
Hmm ... Menurut Berens & Wallis , penulis menjelaskan bahwa "yang" hilang "adalah karena fakta bahwa orang-orang MRAD lebih muda dari Jeanne Calment yang memegang rekor untuk orang tertua di dunia pada saat itu". Jadi data tentang orang lain, yang masing-masing adalah yang tertua untuk meninggal pada tahun kematiannya, dihilangkan karena kelangsungan hidup sesepuh seseorang. Kedengarannya seperti resep untuk breakpoint!
Scortchi
2
Dalam versi pertama posting, saya hanya memasukkan Gambar 2. mereka. Saya menambahkan data dari Gambar 6, di mana kita bisa melihat kesenjangan yang dibahas.
Brandmaier
Maaf! Saya berasumsi itu adalah angka yang sama seperti dalam pertanyaan.
Scortchi
4

Saya pikir sifat kesimpulannya adalah benar-benar tempat tidur. Kami melihat antara tahun 1950 dan 2015 tren peningkatan diikuti oleh tren menurun. Ini adalah kekeliruan klasik dalam menerapkan data yang menunjukkan hipotesis berbeda dari yang diuji dan menyajikannya. Dengan data ini, regresi tersegmentasi dapat interpolasi dan memprediksi bahwa pada tahun 1995 sebuah maxima lokal dari umur sekitar 115 tahun apapun kesalahan mereka memperkirakan dari regresi tersegmentasi. Ini tidak menghalangi tren tahun 2020 atau 2030 menggantikan nilai itu.±

  1. Konsep rentang hidup alami bertentangan dengan dominannya penelitian dalam hal penuaan, genetika, dan telomer.
  2. Desain eksperimental untuk mengatasi umur manusia alami diperlukan menggunakan teknologi "tubuh pada chip".
  3. 50 tahun benar-benar sepele dalam perjalanan sejarah manusia. Ada banyak poin di masa lalu di mana tren naik dalam umur diikuti oleh yang ke bawah.
  4. Data seperti yang disajikan dapat disimulasikan dari model non-linear yang memiliki diskontinuitas dan / atau asimtot yang tidak dapat diukur.
  5. Karena tujuan model adalah prediksi, asumsi distribusi, dan kebenaran model rata-rata diperlukan, dan tidak ada (tampaknya) yang diperiksa atau dipenuhi.
AdamO
sumber