Saya menghabiskan tiga hari mencoba-coba tm
setelah membaca kertas konsep oleh seorang teman di mana ia menjelajahi corpus teks dengan UCINET, menunjukkan awan teks, grafik jaringan dua mode dan Dekomposisi Nilai Tunggal (dengan grafik, menggunakan Stata). Saya berlari di bawah sejumlah besar masalah: pada Mac OS X, ada masalah dengan Java di belakang perpustakaan seperti Snowball (stemming) atau Rgraphviz (grafik).
Bisakah seseorang menunjukkan bukan paket - saya telah melihat tm
, wordfish
dan wordscores
, dan tahu tentang NLTK - tetapi penelitian, jika mungkin dengan kode, pada data tekstual, yang berhasil menggunakan tm
atau sesuatu yang lain untuk menganalisis data seperti debat parlemen atau dokumen legislatif? Sepertinya saya tidak dapat menemukan banyak tentang masalah ini, dan bahkan lebih sedikit kode untuk dipelajari.
Proyek saya sendiri adalah debat parlemen dua bulan, dengan variabel-variabel ini diinformasikan dalam file CSV: sesi parlemen, pembicara, kelompok parlemen, teks intervensi lisan. Saya mencari perbedaan antara penutur dan terutama antara kelompok-kelompok parlemen dalam penggunaan istilah yang jarang dan tidak terlalu jarang, misalnya "pembicaraan keamanan" melawan pembicaraan "kebebasan sipil".
sumber
Jawaban:
Disertasi PhD dari Penulis tm, Ingo Feinerer dari Austria, ditulis dalam bahasa Inggris. Bab 7-10 dokumen ini berisi aplikasi paket tm, dengan kompleksitas yang semakin meningkat.
http://epub.wu.ac.at/1923/
Baca seluruh dokumen sampul depan. Perhatikan, bagaimanapun, bahwa dokumen tersebut ditulis pada tahun 2008, dan sejak itu telah ada beberapa perubahan API, misalnya, tesis PhD menyebutkan fungsi
tmMap()
yang telah diubah namanya menjaditm_map()
. Jadi contoh kode tidak akan berfungsi apa adanya, Anda tidak dapat menggunakan cut-and-paste untuk mencobanya.Anda juga bisa pergi ke
http://tm.r-forge.r-project.org/users.html
dan cari pada halaman itu untuk frasa "tulis makalah" dan Anda akan menemukan banyak tautan. Saya hanya membaca salah satu makalah, "deteksi topik otomatis dalam lirik lagu". Cukup menarik, dan lucu.
sumber
Tempat yang baik untuk memulai mungkin adalah daftar publikasi di situs web untuk
tm
, seperti yang ini:Daftar referensi di akhir setiap publikasi ini termasuk aplikasi yang berhasil
tm
, yang sepertinya Anda cari. Ada banyak - terutama jika Anda kemudian mengikuti referensi dari referensi tersebut.Misalnya, Berikut ini yang mungkin relevan:
Semoga berhasil.
sumber
tm
di pihak saya. Tetap saja, terima kasih banyak :)