Apa perbedaan antara menggunakan RDFS / OWL versus XML?

10

Saya bertanya-tanya apa kelebihan bahasa ontologi RDFS / OWL dibandingkan menggunakan sistem penandaan / markup (seperti http://www.schema.org/ ) untuk mengelola dan membuat metadata?

Tesaurus Webster
sumber
3
Mesin inferensi, itulah yang terjadi. Yang mengejutkan tidak ada jawaban di bawah ini yang dibicarakan. Mesin seperti Jena dapat menyimpulkan data baru dan memanfaatkan properti transitif.
Andrew T Finnell
2
@AndrewFinnell memposting penjelasan yang lebih rinci sebagai jawaban, tolong
Andrew, saya setuju dan akan memberikan suara untuk jawaban Anda. Jawaban yang ada saat ini di bawah ini kurang informasi dan berkualitas rendah.
Dibbeke
@AndrewFinnell, saya juga ingin Anda memposting jawaban Anda sendiri, juga saya bertanya-tanya apakah inferensi berada di luar cakupan OP atau tidak. (Awalnya saya pikir begitu, tapi mungkin juga tidak)
ZJR

Jawaban:

5

Pertanyaan Anda tidak masuk akal apa adanya. RDFS adalah bahasa skema yang sangat mendasar untuk mengekspresikan kendala RDF. OWL adalah skema yang lebih maju untuk mengekspresikan ontologi yang rumit. Mereka sama sekali tidak memiliki kesamaan dengan XML kecuali bahwa mereka dapat diekspresikan dalam XML.

Stefano Borini
sumber
4

Tidak bisa setuju dengan jawaban ZJR. Ini benar-benar tidak diinformasikan.

  1. Bagaimana Anda mengurai Microdata? Apa itu parse juga? RDFa mem-parsing ke RDF, model data umum yang merupakan hal yang Semantic Web telah menyerukan. Microdata pada dasarnya muncul karena Hickie tidak mau repot-repot membaca spesifikasi RDF dan RDFa. Mungkin lebih mudah bagi pengembang, tetapi itu tidak lebih baik untuk web (yaitu malas )
  2. Untuk daftar kosa kata OWL umum lihat di bawah:

  3. Rilis RDF berikutnya sudah dekat, termasuk format serialisasi baru seperti Turtle dan RDFj

  4. SPARQL 1.1 juga merupakan iuran dalam waktu dekat. Federasi kueri, ekspresi jalur properti, Pembaruan SPARQL, dan banyak lagi.

  5. BBC dibangun di atas RDF. API grafik Facebook menyediakan RDF (itu benar, Anda dapat menghormati URI grafik menggunakan header teks / penyu Menerima dan mendapatkan kembali RDF) dan banyak perusahaan besar lainnya.

Jadi dalam ringkasan Web Semantik, RDF, RDFS, OWL, SPARQL dan semua standar Web Semantik sangat hidup dan menendang. Jika Anda tidak percaya kepada saya, lihatlah semua aktivitas di http://www.semanticoverflow.com

William Greenly
sumber
BBC dibangun di atas RDF, meskipun peta ke mikrodata, jadi? Mereka membangun kembali situs pada dekade 2000-2010 pada saat W3C menjanjikan alat ajaib yang bagus untuk RDF, alat-alat itu tidak benar-benar terwujud, RDF adalah warisan, di sana. Struktur organisasi yang solid, tetapi mengerikan untuk dibagikan, microdata mencakup mil terakhir. (dan selamatkan hari ini)
ZJR
dan kemudian beberapa: SPARQL yang berguna sudah dekat sejak lama, kata-kata dari spesifikasi RDF yang digunakan untuk menyedot waktu besar dan membuat takut sebagian besar pelaksana potensial pergi selama bertahun-tahun. (tidak tahu jika mereka memperbaikinya, apakah mereka memperbaikinya? imho, sudah terlambat, lagi pula ) dan kemudian, RDF<some-letter>nomenklatur ini menimbulkan kebingungan dan pertengkaran sepanjang waktu.
ZJR
1
BBC dibangun di atas RDF menggunakan BigOWLIM, bukan mikrodata. Mircodata bukan format data kanonik. Ini adalah tambahan untuk HTML. Platform Olimpiade yang baru dibangun sepenuhnya di atas RDF, sebagaimana disebutkan dalam siaran pers dan presentasi di Akademi mereka.
William Greenly
4

RDF / OWL vs XML adalah alternatif yang salah. Sebenarnya salah satu serialisasi populer adalah menggunakan XML.

RDF / OWL vs Microformats adalah alternatif yang salah. Bahkan ada standar yang memungkinkan penggunaan RDF sebagai mikroformat , RDFa resmi eRDF dan W3C dengan cara terstandarisasi dalam HTML5 .

Jadi sebenarnya pertanyaannya adalah apa keuntungan menggunakan format standar yang disetujui W3C. Alasannya adalah:

  • ada beberapa ontologi yang sudah ada di luar sana termasuk yang paling banyak digunakan sebagai Dublin Core dan FOAF .
  • beberapa triple-store yang kompatibel dengan RDF / OWL untuk sebagian besar bahasa pemrograman apa pun.
  • berbagai mesin inferensi fitur triple-store yang disebutkan di atas dengan antarmuka SPARQL .

Secara keseluruhan, saya tidak melihat alasan mengapa Anda memilih mikroformat non-standar, non-W3C.

vartec
sumber
1

RDF dan OWL adalah standar yang ditetapkan untuk pengkodean data semantik dan skema mereka, pada tingkat yang jauh lebih dalam dan generik daripada markup ad-hoc.

Misalnya, dengan OWL, Anda dapat menentukan Skema baru, yang setidaknya akan dipahami sebagian oleh alat lain (karena Anda dapat menggabungkan skema OWL / RDF yang berbeda bersama-sama). Dengan cara ini, Anda dapat mengekspor dari satu dataset "tampilan" yang berbeda dan meminta semua orang bekerja sama. Anda juga bisa "menjelajahi" tautan antara objek dan propertinya.

Dengan microdata, ini pada dasarnya adalah serangkaian hal-hal yang dapat Anda terapkan, bukan platform semantik umum.

p_l
sumber
Saya masih bingung tentang bagaimana RDF berbeda dari RDFS berbeda dari OWL .... Dapatkah istilah-istilah itu digunakan secara bergantian ...?
Webster Thesaurus
@WebsterThesaurus RDF adalah bahasa yang agak sederhana untuk menggambarkan konsep berdasarkan tiga kali lipat dari Subject-Verb-Object. RDFS adalah RDF Schema, pada dasarnya seperangkat istilah yang telah ditentukan untuk membuatnya lebih mudah mendefinisikan apa arti hubungan. OWL adalah sistem deskripsi ontologi, jauh lebih kuat daripada RDFS, tetapi lebih sulit untuk diterapkan
p_l
1

Saya ingin memulai dengan mencatat bahwa jawaban ini tidak ditulis oleh seorang ahli di bidangnya. Walaupun saya seorang pendukung sistem semantik terdistribusi, saya pikir aplikasi OWL saat ini terbatas. Meskipun menggambarkan dengan tepat ceruk tempat OWL dapat diterapkan akan berada di luar cakupan jawaban ini, saya mungkin dapat menjelaskan beberapa pro dan kontra.

OWL pada dasarnya adalah bahasa yang memungkinkan ekspresi konstruk semantik menggunakan klasifikasi, tidak berbeda dengan kelas yang Anda kenal dari OOP dan batasan antara kelas dan instance mereka. Orang bisa melihatnya sebagai cara yang lebih formal dan tingkat tinggi untuk menggambarkan hubungan yang Anda tahu dari database relasional.

Untuk menggambarkan dan mengkomunikasikan bahasa ini, perlu diserialisasi ke format tertentu. Ada beberapa format, yang RDF hanya satu.

Ada tiga tingkat OWL yang berbeda, memungkinkan untuk meningkatkan ekspresif, tetapi membatasi kemampuan komputasi (mis. Apakah Anda dapat menemukan solusi yang mungkin untuk pertanyaan yang Anda tanyakan pada basis pengetahuan yang dijelaskan oleh definisi OWL). Ini adalah OWL Lite, DL dan Full.

Keuntungan paling penting dari menggunakan OWL / RDF adalah pertukaran pengetahuan antara basis pengetahuan yang berbeda (atau hierarki klasifikasi) dan membuat kesimpulan yang berguna tanpa harus merekayasa semua basis ini sebelumnya untuk memungkinkan mereka berkomunikasi. Ini dilakukan sebagian dengan mendefinisikan kelas kesetaraan. Menggunakan ruang nama memungkinkan insinyur untuk memastikan keunikan; paradigma yang bermanfaat.

Keuntungan lain adalah semakin banyaknya mesin inferensi dan bahasa query. Di dunia jaringan kami, ada permintaan untuk pertukaran pengetahuan yang didistribusikan.

Mungkin kerugian penting adalah kompleksitas yang relatif tinggi untuk memastikan komputabilitas kesimpulan dan batasan ruang dan waktu mereka. Misalnya. dalam OWL penuh Anda mungkin dapat meminta kesimpulan yang tidak dapat dibuktikan untuk diakhiri. Jadi, tentu saja ada batas kekuatan OWL.

Pengetahuan OWL bersifat diskrit ... tidak ada sistem setengah-kebenaran atau kepercayaan. Memiliki ini kemungkinan besar akan membuat solusi terlalu rumit.

Tetapi kerugian yang paling penting bagi selera saya adalah bahwa orang tidak dapat menemukan banyak insinyur yang baik di lapangan. Anda akan membutuhkan insinyur pengetahuan, satu atau dua ilmuwan komputer dan tim pengembangan kecil untuk membangun bahkan basis pengetahuan kecil. Oleh karena itu, seringkali jauh lebih murah dan efektif untuk hanya menggunakan bahasa deskriptif seperti skema XML dan menggambarkan semantik yang diperlukan dalam dokumen yang dapat dibaca manusia.

Dibbeke
sumber
0

RDFS adalah tentang menggambarkan data terstruktur. Akan jauh lebih berguna jika itu akan memasukkan metode atau fungsi, sehingga kita bisa menggambarkan antarmuka dengannya. Saat ini Anda memerlukan vocab tambahan untuk melakukannya, misalnya WSDL atau Hydra oleh layanan web. Saya kira ada vocab untuk OOP juga, saya hanya tidak tahu banyak vocab.

OWL adalah sesuatu seperti XSD, ini tentang memvalidasi data Anda, misalnya jika Anda mengharapkan string dengan paling banyak 20 karakter, Anda menggunakan OWL untuk menggambarkan aturan itu dan menghasilkan validator. Secara teori Anda bisa melakukan hal yang sama dengan RDFS dan XSD, saya tidak tahu mengapa orang harus menemukan OWL daripada hanya menggunakan XSD. Mungkin itu karena XSD tidak berdasarkan RDFS, jadi misalnya string XSD bukan keturunan RDFS Literal.

Schema.org menggambarkan kelas umum seperti Person misalnya. Mereka membuat RDFS mereka sendiri seperti vocab, yang mencakup Hal alih-alih rdfs: Class, domainIncludes bukan rdfs: domain, rangeInclude bukan rdfs: range, dan sebagainya alih-alih menggunakan RDFS. Jenis terbatas mereka ad-hoc juga, mereka menggunakan Teks dan Nomor tanpa mendefinisikan mereka atau menghubungkan mereka setidaknya ke rdf: Literal atau XSD primitif. Mereka tidak menggunakan XSD atau OWL untuk mendefinisikan tipe terbatas sejauh yang saya tahu. Saya tidak yakin apakah ada batasan dalam vocab mereka, tetapi jika demikian saya kira mereka menyebutkannya dalam deskripsi yang dapat dibaca manusia, sehingga Anda tidak akan dapat menghasilkan validator yang tepat terhadap schema.org, yang dapat Anda lakukan jika mereka akan menggunakan XSD / OWL dan RDFS.

Jadi saya pikir keuntungan menggunakan standar seperti RDFS, XSD, OWL bahwa Anda dapat menulis perpustakaan yang dapat Anda gunakan kembali oleh setiap dokumen.

inf3rno
sumber
-2

Untuk tujuan mengembangkan produk masa depan, file XML RDFS / OWL dianggap sudah hampir mati dan hilang.

Mereka membutuhkan terlalu banyak pekerjaan untuk mengekspresikan konsep bahwa solusi yang dibuat khusus berdasarkan format teks kustom akan mengekspresikan lebih baik , sambil menjaga data lebih mudah dibaca dan diedit oleh manusia dan mesin. Mereka tidak menambahkan nilai nyata dan hanya membuat hidup sedikit lebih menyedihkan bagi semua orang yang tersandung pada mereka. (dan harus berurusan dengan nomenklatur namespace mereka)

Ada solusi penanganan dokumen raksasa yang didasarkan pada mereka, dan mereka baru-baru ini dikembangkan, digunakan, dan berada dalam layanan saat ini. Mereka mengancam untuk berlama-lama untuk waktu yang sangat lama. Banyak programmer di masa depan pasti akan menderita banyak WTF yang dilantik RDF dan OWL.

Microdata sistem, (versi ramah-validator dari Microformats ) seperti yang dijelaskan dalam schema.org , sekarang bukan banyak keuntungan untuk pengembang, editor, dan pembaca, sama; baik manusia dan mekanik.

Konsep RDF (yang layak disimpan) dapat dipetakan (dan sebenarnya dipetakan secara eksplisit) di atas representasi mikrodata tanpa rasa sakit.

Item Microdata memungkinkan penulis dan sistem penanganan dokumen untuk memperkaya komunikasi dengan cara yang cukup mudah (semudah CSS atau DOM) untuk menangani dan menyesuaikan untuk pembaca.

ZJR
sumber
Tunggu, saya tidak mengerti ... jadi bagaimana Microdata berbeda dari XML / HTML? Rencana yang dijelaskan dalam schema.org secara khusus mengatakan mereka menggunakan tag di dalam halaman web mereka ... bukankah itu juga yang dilakukan oleh XML dan HTML?
Webster Thesaurus
Dan jika Microdata jauh lebih baik, mengapa W3C mendorong untuk RDFS / OWL dan bukan Microdata itu sendiri?
Webster Thesaurus
Saya pikir jawaban itu agak menyesatkan, karena RDF! = XML. Pengkodean RDF XML hanya satu dari banyak, dan dirancang dengan tujuan untuk dicampur ke dalam Aplikasi XML yang ada. Selain itu, kembali ke sistem kustom (ya, termasuk mikrodata) berarti kembali ke "tulis parser khusus untuk f * cking semuanya" daripada bisa menggunakan kosa kata umum. Dengan RDF / OWL saya dapat mencampur aplikasi yang berbeda masing-masing bekerja pada subset data yang terlibat, serta menulis kode fleksibel yang memiliki refleksi otomatis - contoh yang baik adalah Xanasys LinkExplorer.
p_l
1
Jawaban yang dikemukakan tidak informatif. Harap tunjukkan referensi untuk mencadangkan klaim ini.
Dibbeke
@ Dibbeke Dugaan asli saya adalah bahwa OP sedang mencari metadatas pragmatis. RDF dalam kasus itu adalah pembunuhan yang berlebihan. Bagian yang disarankan relatif terhadap keyakinan saya pada RDF yang selalu berlebihan .
ZJR