Salah satu kelemahan utama curl
adalah bahwa semakin banyak situs memiliki konten utama yang dilukis oleh respons JavaScript AJAX yang terjadi setelah respons HTTP awal. curl
tidak pernah mengambil konten pasca-dicat ini.
Jadi untuk mengambil jenis-jenis halaman web dari baris perintah, saya telah dikurangi untuk menulis skrip di Ruby yang mendorong SeleniumRC untuk menjalankan contoh Firefox dan kemudian mengembalikan sumber HTML setelah panggilan AJAX ini selesai.
Akan jauh lebih baik untuk memiliki solusi baris perintah yang lebih ramping untuk jenis masalah ini. Apakah ada yang mengetahui?
Jawaban:
Saya baru saja mulai menggunakan WebDriver dari Selenium 2 di Jawa. Ada driver bernama HtmlUnitDriver yang sepenuhnya mendukung JavaScript tetapi tidak menjalankan browser yang sebenarnya.
Ini bukan solusi ringan tapi itu menyelesaikan pekerjaan.
Saya telah merancang kode untuk dijalankan dari baris perintah dan menyimpan data web ke file.
sumber
Sudahkah Anda mempertimbangkan Watir?
http://watir.com/
Setelah menambahkan paket, Anda dapat menjalankannya sebagai file mandiri atau dari
irb
, baris demi baris setelahnyainclude 'watir-webdriver'
. Saya menemukan ini lebih responsif daripadaselenium-webdriver
, tetapi tanpa GUI rekaman untuk membantu menyelesaikan kondisi pengujian yang rumit.sumber