Apa yang diikat data dalam konteks koefisien korelasi peringkat?

16

Saya tidak di bidang statistik.

Saya telah melihat kata "data terikat" ketika membaca tentang Koefisien Korelasi Peringkat.

  • Apa itu data terikat?
  • Apa contoh data terikat?
BB01
sumber

Jawaban:

5

Ini berarti data yang memiliki nilai yang sama; misalnya jika Anda memiliki 1,2,3,3,4 sebagai dataset maka keduanya bertiga terikat data. Jika Anda memiliki 1,2,3,4,5,5,5,6,7,7 sebagai dataset maka angka 5 dan 7 adalah data terikat.

quarkdown27
sumber
14

"Data Terikat" muncul dalam konteks uji statistik non-parametrik berbasis peringkat.

Tes non-parametrik : pengujian yang tidak mengasumsikan distribusi probabilitas tertentu, misalnya itu tidak mengasumsikan kurva berbentuk lonceng.

berbasis peringkat : kelas besar tes non-parametrik mulai dengan mengubah angka (mis. "3 hari", "5 hari", dan "4 hari") ke dalam peringkat (mis. "durasi terpendek (3)", "durasi terpanjang (1) "," durasi terpanjang kedua (2) "). Metode pengujian parametrik tradisional kemudian diterapkan ke peringkat ini.

Data yang diikat merupakan masalah karena angka-angka yang identik sekarang perlu dikonversi ke peringkat. Terkadang peringkat diberikan secara acak, terkadang peringkat rata-rata digunakan. Yang paling penting, protokol untuk memecah peringkat terikat perlu dijelaskan untuk reproduktifitas hasilnya.

Ming K
sumber
5

Ini hanya dua nilai data yang identik, seperti mengamati 7 dua kali dalam kumpulan data yang sama.

Ini muncul dalam konteks metode statistik yang menganggap data memiliki pengukuran kontinu dan identik tidak mungkin (atau secara teknis, probabilitas nilai identik adalah nol). Komplikasi praktis muncul ketika metode ini diterapkan pada data yang bulat atau terpotong sehingga pengukuran yang identik tidak hanya mungkin tetapi cukup umum.

John D. Cook
sumber
1
Saya tidak setuju dengan alasan ini karena Anda tidak dapat mengatakan itu karena probabilitas nolnya bahwa peristiwa ini mungkin tidak akan pernah terjadi. Ini bukan alasan yang bagus.
Henry.L
2

Pertanyaannya sangat penting:

Apa itu observasi / data / pasangan terikat?

T+

(Jadi saya tidak berpikir @ Ming-Chih Kao jawaban yang tepat dengan memperkenalkan tes nonparametrik terlebih dahulu. Tetapi karena judulnya adalah 'Apa data yang diikat dalam konteks koefisien korelasi peringkat?', Saya akan membelinya.)

Zi=XiYi

(Xi,Yi)

Zi

Zi

|Zi|

{(1,1)(1,1)},{(1,2)(1,2)(2,1)(2,1)(2,3)(2,3)(3,2)},{(3,0)}

Mari kita coba cara yang sangat mudah untuk melakukan ini, kita peringkat dari kiri ke kanan dan memberi:

Ri

|Zi|

Ri

|Zi|

Ri

|Zi|=1|Zi|=2

1++77=48+92=8.5

Ri

Ini memodifikasi peringkat dan membuat masing-masing pengamatan terikat memiliki pengaruh yang sama dalam menghitung statistik peringkat, sehingga dalam tes peringkat.

Apa solusi untuk observasi / data / pasangan terikat?

(1) Tetapkan peringkat rata-rata. Inilah yang kami lakukan di atas. Dengan menetapkan peringkat yang sama untuk data yang diikat dalam kelompok yang sama, kami membuat pengaruhnya dalam tes peringkat sama dan karenanya menghilangkan kemungkinan ketidakakuratan yang disebabkan oleh pengamatan terikat.

MaxRankfirstgroup<MinRanksecondgroupMaxRankfirstgroup>MinRanksecondgroupMaxRankfirstgroup=MinRanksecondgroup, maka kita harus menggabungkan dua kelompok terikat menjadi satu.

ϵ

PX=x=0

Henry
sumber