Bagaimana cara menggunakan Paket Agility HTML ?
Dokumen XHTML saya tidak sepenuhnya valid. Itu sebabnya saya ingin menggunakannya. Bagaimana saya menggunakannya dalam proyek saya? Proyek saya ada di C #.
c#
html
html-agility-pack
carla
sumber
sumber
var body = CQ.CreateFromFile(filePath)["body"]
.Jawaban:
Pertama, instal paket nuget HTMLAgilityPack ke proyek Anda.
Kemudian, sebagai contoh:
(NB: Kode ini adalah contoh saja dan belum tentu pendekatan yang terbaik / satu-satunya. Jangan menggunakannya secara membabi buta dalam aplikasi Anda sendiri.)
The
HtmlDocument.Load()
Metode juga menerima aliran yang sangat berguna dalam mengintegrasikan dengan kelas berorientasi aliran lain dalam rangka NET. SedangkanHtmlEntity.DeEntitize()
metode lain yang berguna untuk memproses entitas html dengan benar. (terima kasih Matthew)HtmlDocument
danHtmlNode
kelas yang paling sering Anda gunakan. Mirip dengan parser XML, ia menyediakan metode selectSingleNode dan selectNodes yang menerima ekspresi XPath.Perhatikan
HtmlDocument.Option??????
properti boolean. Ini mengontrol bagaimanaLoad
danLoadXML
metode akan memproses HTML / XHTML Anda.Ada juga file bantuan yang dikompilasi yang disebut HtmlAgilityPack.chm yang memiliki referensi lengkap untuk masing-masing objek. Ini biasanya di folder dasar dari solusi.
sumber
SelectSingleNode()
tampaknya telah dihapus beberapa waktu laluSaya tidak tahu apakah ini akan membantu Anda, tetapi saya telah menulis beberapa artikel yang memperkenalkan dasar-dasarnya.
Artikel selanjutnya selesai 95%, saya hanya perlu menuliskan penjelasan beberapa bagian terakhir dari kode yang saya tulis. Jika Anda tertarik maka saya akan mencoba mengingat untuk memposting di sini ketika saya menerbitkannya.
sumber
HtmlAgilityPack menggunakan sintaks XPath, dan meskipun banyak yang berpendapat bahwa dokumentasinya buruk, saya tidak kesulitan menggunakannya dengan bantuan dari dokumentasi XPath ini: https://www.w3schools.com/xml/xpath_syntax.asp
Mengurai
Saya melakukan ini:
sumber
XPath
standar. Pertama-tama orang harus belajar standar itu dan semuanya akan mudah setelah itu.Kode utama HTMLAgilityPack terkait adalah sebagai berikut
sumber
sumber
Memulai - Paket HTML Agility
sumber
coba ini
sumber