ODP数据的解析程序

作者: 阮一峰

日期: 2008年3月 2日

腾讯课堂 NEXT 学院

mzcolor.gif

放目录计划ODP(Open Directory Project)是一个对网站进行人工分类的开放式项目。它的所有数据都可以自由下载。我以前介绍过的。

但是,下载的数据是RDF格式,需要自己编写程序将数据提取出来。

网上有不少已经编写好的解析器。我觉得这事不难,加之我还有一些特殊要求,今天下午就自己写了一个。考虑到这个程序可能会有其他人需要,我把它放出来,有兴趣的朋友可以点击下载(10K)。

长期以来,我一直想有一套好的分类法,以便将所有信息高效简明地分类。ODP数据算是提供了一个很好的基础,下一步是要将它翻译成中文,我还没想好怎么做。

(完)

留言(2条)

ODP与目前的搜索引擎有什么区别?它是标准吗?而且它的分类是建立在什么标准之上,又是如何来避免信息冗余呢?

ODP是人工维护的,这就是它同搜索引擎的最大区别。

至于ODP的标准,可以看下面的网址:

http://www.dmoz.org/guidelines/

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接