将 HTML/XML 中的网站转换为 RDF [英] Converting Websites in HTML/XML into RDF

查看:72
本文介绍了将 HTML/XML 中的网站转换为 RDF的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想将任何 html 网站上的数据转换为 rdf.你知道任何html到rdf转换器吗?或者,您是否建议为此目的使用 XQuery 或 GRDDL?

I want to convert the data on any html website to rdf. do you know any html to rdf converter? or, do you recommend for this purpose the use of XQuery or GRDDL?

推荐答案

一般来说,自动转换是不可能的,因为 HTML 说明的是事物的样子,而不是它的含义.如果 HTML 包含现有标记,您可以使用 nothing2Triples (http://developers.any23.org/) 来获取 RDF.

In general, an automatic conversion is not possible, since HTML says what something looks like, and not what it means. If the HTML contains existing markup, you could use Anything2Triples (http://developers.any23.org/) to get RDF out.

如果它只是 HTML,您必须以某种方式编写自己的提取规则.GRDDL 会起作用,但我可能会简单地使用 python + BeautifulSoup.这取决于你已经知道什么技术/语言!

If it's just HTML you have to write your own extraction rules somehow. GRDDL would work, but I would probably simply use python + BeautifulSoup. It depends what technology/language you know already!

这篇关于将 HTML/XML 中的网站转换为 RDF的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆