« 一个普通美国人看2008年大选 | 首页 | 中国的互联网审查 »

ODP数据的解析程序


mzcolor.gif

放目录计划ODP(Open Directory Project)是一个对网站进行人工分类的开放式项目。它的所有数据都可以自由下载。我以前介绍过的。

但是,下载的数据是RDF格式,需要自己编写程序将数据提取出来。

网上有不少已经编写好的解析器。我觉得这事不难,加之我还有一些特殊要求,今天下午就自己写了一个。考虑到这个程序可能会有其他人需要,我把它放出来,有兴趣的朋友可以点击下载(10K)。

长期以来,我一直想有一套好的分类法,以便将所有信息高效简明地分类。ODP数据算是提供了一个很好的基础,下一步是要将它翻译成中文,我还没想好怎么做。

(完)

相关内容

  • 2008.02.25: 资源描述框架RDF
    在图书馆里,每一本书都要被编目,这样才能方便查找和利用。于是,很早就有人想到,网上所有的资源也需要“编目”。
  • 2008.02.24: 语种名称代码
    我们经常需要用缩写的代码来表示一种语言,比如用en表示英语,用de表示德语。ISO 639就是规定语种代码的国际标准。

随机文章

  • 2007.10.14: 21世纪最差的10个行业
    年轻人就业的时候,最怕的就是选错行业。一个发展迅速的行业,可以给你带来无数机会;而一个走向衰落的行业,则很可能让你终生都处在苦苦奋斗之中,一事无成。
  • 2006.10.19: 咽喉炎复发
    (文后附有讲座消息) 我的咽喉炎复发了。早上一起床就感到喉咙疼,一整天都是这样,不管是走路、吃饭、看书,都很不舒服,完全打不起精神。

功能链接

广告(点击支持我)



评论

killvin 说:

ODP与目前的搜索引擎有什么区别?它是标准吗?而且它的分类是建立在什么标准之上,又是如何来避免信息冗余呢?

Ruan YiFeng 说:

ODP是人工维护的,这就是它同搜索引擎的最大区别。

至于ODP的标准,可以看下面的网址:

http://www.dmoz.org/guidelines/

我要发表看法