« 一个普通美国人看2008年大选 | 首页 | 中国的互联网审查 »

ODP数据的解析程序


mzcolor.gif

放目录计划ODP(Open Directory Project)是一个对网站进行人工分类的开放式项目。它的所有数据都可以自由下载。我以前介绍过的。

但是,下载的数据是RDF格式,需要自己编写程序将数据提取出来。

网上有不少已经编写好的解析器。我觉得这事不难,加之我还有一些特殊要求,今天下午就自己写了一个。考虑到这个程序可能会有其他人需要,我把它放出来,有兴趣的朋友可以点击下载(10K)。

长期以来,我一直想有一套好的分类法,以便将所有信息高效简明地分类。ODP数据算是提供了一个很好的基础,下一步是要将它翻译成中文,我还没想好怎么做。

(完)

相关内容

随机文章

  • 2006.07.22: 《哈姆莱特》(Hamlet):摘录(第二部分)
    (英语史系列笔记之八) 56. 一个躁急的性格不免会有时发作,一个血气方刚的少年的一时胡闹。 [原文] The flash and outbreak of a fiery mind, A savageness in unreclaimed blood.(II.1)
  • 2006.08.07: 虚无主义,庸人主义和肉欲主义
    我看见有一篇评论,这样概括James joyce《Ulysses》中的三个主要人物:艺术家Stephen Dedalus是虚无主义代表,报馆的广告业务员Leopold Bloom是庸人主义的代表,他的老婆Molly Bloom是肉欲主义的代表。 我觉得概括得很准确:虚无主义、庸人主义,肉欲主义正是当代人精神世界的写照。

功能链接

广告



评论

killvin 说:

ODP与目前的搜索引擎有什么区别?它是标准吗?而且它的分类是建立在什么标准之上,又是如何来避免信息冗余呢?

Ruan YiFeng 说:

ODP是人工维护的,这就是它同搜索引擎的最大区别。

至于ODP的标准,可以看下面的网址:

http://www.dmoz.org/guidelines/

我要发表看法