Saya memiliki dua variabel: Nama Obat (DN) dan Kejadian Buruk yang sesuai (AE), yang berdiri dalam hubungan banyak-ke-banyak. Ada 33.556 nama obat dan 9.516 efek samping. Ukuran sampel adalah sekitar 5,8 juta pengamatan.
Saya ingin belajar dan memahami hubungan / hubungan antara DN dan AE. Saya sedang memikirkan cara memvisualisasikan set ini dalam R karena lebih baik untuk melihat gambar. Saya tidak yakin bagaimana cara melakukannya ...
r
categorical-data
data-visualization
large-data
association-measure
pengguna9292
sumber
sumber
Jawaban:
Apa yang dapat Anda lakukan adalah menggunakan ide bayangan sisa dari vcd di sini dikombinasikan dengan visualisasi matriks jarang seperti misalnya pada halaman 49 bab buku ini . Bayangkan plot terakhir dengan bayangan sisa dan Anda mendapatkan ide.
Tabel matriks jarang / kontigensi biasanya akan berisi jumlah kejadian setiap obat dengan masing-masing efek samping. Namun dengan ide naungan residual Anda dapat mengatur model linier log baseline (misalnya model independensi atau apa pun yang Anda suka) dan menggunakan skema warna untuk mengetahui kombinasi obat / efek yang lebih sering terjadi / lebih jarang daripada yang diprediksi oleh model . Karena Anda memiliki banyak pengamatan, Anda dapat menggunakan ambang warna yang sangat halus dan mendapatkan peta yang mirip dengan bagaimana microarray dalam analisis kluster sering divisualisasikan misalnya di sini(tapi mungkin dengan warna "gradien" yang lebih kuat). Atau Anda bisa membuat ambang sedemikian rupa sehingga hanya jika perbedaan pengamatan dengan prediksi melebihi ambang batas daripada yang diwarnai dan sisanya akan tetap putih. Bagaimana tepatnya Anda melakukan ini (misalnya model mana yang digunakan atau ambang mana) tergantung pada pertanyaan Anda.
Sunting Jadi, inilah cara saya melakukannya (mengingat saya memiliki cukup RAM yang tersedia ...)
Anda kemudian berakhir dengan sesuatu seperti ini (tentu saja gambar Anda akan jauh lebih besar dan akan ada ukuran piksel yang jauh lebih rendah tetapi Anda harus mendapatkan ide. Dengan penggunaan warna yang pintar Anda dapat memvisualisasikan asosiasi / keberangkatan dari kemerdekaan yang paling Anda sukai. berminat).
Contoh cepat dan kotor dengan matriks 100x100. Ini hanyalah contoh mainan dengan residu mulai dari -10 hingga 10 seperti yang Anda lihat dalam legenda. Putih adalah nol, biru lebih jarang dari yang diharapkan, merah lebih sering dari yang diharapkan. Anda harus bisa mendapatkan ide dan mengambilnya dari sana. Sunting: Saya memperbaiki pengaturan plot dan menggunakan warna non-kekerasan.
Ini dilakukan menggunakan
image
fungsi dancm.colors()
dalam fungsi berikut:menggunakan ide dari sini http://www.phaget4.org/R/image_matrix.html . Jika matriks Anda begitu besar sehingga
image
fungsinya menjadi lambat, gunakanuseRaster=TRUE
argumen (Anda mungkin juga ingin menggunakan objek Matrix jarang; perhatikan bahwa harus adaimage
metode jika Anda ingin menggunakan kode dari atas, lihat paket sparsem.)Jika Anda melakukan ini, beberapa pemesanan baris / kolom yang cerdik mungkin menjadi berguna, yang dapat Anda hitung dengan paket arules (periksa halaman 17 dan 18 atau lebih). Saya biasanya merekomendasikan utilitas arules untuk tipe data dan masalah ini (tidak hanya visualisasi tetapi juga untuk menemukan pola). Di sana Anda juga akan menemukan ukuran-ukuran hubungan antara level-level yang bisa Anda gunakan alih-alih shading residual.
Anda mungkin juga ingin melihat tableplots yang ingin Anda selidiki hanya beberapa efek samping nanti.
sumber