Bagaimana seseorang dapat mem-parsing HTML / XML dan mengekstrak informasi
Bagaimana seseorang dapat mem-parsing HTML / XML dan mengekstrak informasi
Ditutup . Pertanyaan ini perlu lebih fokus . Saat ini tidak menerima jawaban. Ingin meningkatkan pertanyaan ini? Perbarui pertanyaan sehingga hanya berfokus pada satu masalah saja mengedit posting ini . Ditutup 6 tahun yang lalu . Saya sedang berpikir...
Saya mencari solusi tetapi tidak ada yang relevan, jadi inilah masalah saya: Saya ingin mengurai string yang berisi teks HTML. Saya ingin melakukannya dalam JavaScript. Saya mencoba perpustakaan ini tetapi tampaknya mem-parsing HTML halaman saya saat ini, bukan dari string. Karena ketika saya...
Sepertinya setiap pertanyaan pada stackoverflow di mana penanya menggunakan regex untuk mengambil beberapa informasi dari HTML pasti akan memiliki "jawaban" yang mengatakan tidak menggunakan regex untuk mem-parsing HTML. Kenapa tidak? Saya sadar bahwa ada parser HTML "nyata" kutipan-tanda kutip di...
Seperti yang ada saat ini, pertanyaan ini tidak cocok untuk format Tanya Jawab kami. Kami berharap jawaban didukung oleh fakta, referensi, atau keahlian, tetapi pertanyaan ini kemungkinan akan mengundang debat, argumen, polling, atau diskusi panjang. Jika Anda merasa bahwa
Saya mencari modul HTML Parser untuk Python yang dapat membantu saya mendapatkan tag dalam bentuk daftar Python / kamus / objek. Jika saya memiliki dokumen formulir: <html> <head>Heading</head> <body attr1='val1'> <div class='container'> <div
Apa cara terbaik untuk memilih semua teks antara 2 tag - mis: teks antara semua tag 'pra' pada
Saya melihat pertanyaan setiap hari yang menanyakan bagaimana mengurai atau mengekstrak sesuatu dari beberapa string HTML dan jawaban / komentar pertama selalu "Jangan gunakan RegEx untuk mem-parsing HTML, jangan sampai Anda merasa marah!" (bagian terakhir itu terkadang dihilangkan). Ini agak...
Saya perlu mengurai (sisi server) halaman HTML dalam jumlah besar. Kami semua setuju bahwa regexp bukanlah cara untuk menuju ke sini. Menurut saya, javascript adalah cara asli untuk mengurai halaman HTML, tetapi asumsi tersebut bergantung pada kode sisi server yang memiliki semua kemampuan DOM...
Saya memiliki file yang terlihat seperti ini: <table name="content_analyzer" primary-key="id"> <type="global" /> </table> <table name="content_analyzer2" primary-key="id"> <type="global" /> </table> <table name="content_analyzer_items"...