信息的分类

作者: 阮一峰

日期: 2007年1月24日

腾讯课堂 NEXT 学院

何将世界上所有的信息分类?这看似一个很普通的问题,其实非常的难。

一个好的分类法应该做到如下几点:

1)能够涵盖集合中的所有元素。
2)类与类之间不重叠。
3)能够比较容易地为每一个元素找到其分类。

下面分别是Google、Yahoo!和Wikipedia的分类法。

一、Google

网址:http://www.google.com/dirhp

一级分类共16项。

1. Arts: Movies, Music, Television,...
2. Business: Industries, Finance, Jobs,...
3. Computers: Hardware, Internet, Software,...
4. Games: Board, Roleplaying, Video,...
5. Health: Alternative, Fitness, Medicine,...
6. Home: Consumers, Homeowners, Family,...
7. Kids and Teens: Computers, Entertainment, School,...
8. News: Media, Newspapers, Current Events,...
9. Recreation: Food, Outdoors, Travel,...
10. Reference: Education, Libraries, Maps,...
11. Regional: Asia, Europe, North America,...
12. Science: Biology, Psychology, Physics,...
13. Shopping:Autos, Clothing, Gifts,...
14. Society: Issues, People, Religion,...
15. Sports: Basketball, Football, Soccer,...
16. World: Deutsch, Español, Français, Italiano, Japanese, Korean, Nederlands, Polska, Svenska, ...

二、Yahoo!

网址:http://dir.yahoo.com/

一级分类共14项。

1. Arts & Humanities: Photography, History, Literature...
2. Business & Economy: B2B, Finance, Shopping, Jobs...
3. Computers & Internet: Software, Web, Blogs, Games...
4. Education: Colleges, K-12, Distance Learning...
5. Entertainment: Movies, TV Shows, Music, Humor...
6. Government: Elections, Military, Law, Taxes...
7. Health: Diseases, Drugs, Fitness, Nutrition...
8. News & Media: Newspapers, Radio, Weather...
9. Recreation & Sports: Sports, Travel, Autos, Outdoors...
10. Reference: Phone Numbers, Dictionaries, Quotes...
11. Regional: Countries, Regions, U.S. States...
12. Science: Animals, Astronomy, Earth Science...
13. Social Science: Languages, Archaeology, Psychology...
14. Society & Culture: Sexuality, Religion, Food & Drink...

三、Wikipedia

网址:http://en.wikipedia.org/wiki/Wikipedia:Categorical_index

一级分类共12项。

1. Art and culture
2. Geography and places
3. Health and fitness
4. History and events
5. Mathematics and abstractions
6. Natural sciences and nature
7. People and self
8. Philosophy and thinking
9. Reference
10. Religion and belief systems
11. Social sciences and society
12. Technology and applied sciences

四、总结

以上面三种分类为参考,我尝试总结出一套适用于中文环境的分类法。这个分类肯定问题很多,以后再逐步完善。

第一组:普通类

1. 商业和经济
2. 教育
3. 政府
4. 健康和医疗
5. 体育和休闲
6. 新闻和媒体
7. 社会
8. 家庭生活和青少年

第二组:文化类

9. 艺术和文化
10. 地区
11. 历史
12. 文学
13. 人物

第三组:学术类

14. 计算机和互联网
15. 参考资料
16. 自然科学
17. 社会科学
18. 技术和应用科学

第四组:其他语言类
19. 外语资料

(完)

[参考链接]

* 公众分类法

留言(9条)

偶也一直在考虑如何简明全面的分类,但总是不让人满意。
很不错的参考,thanks~

现在软件流行面向对象,我觉得不错。
如果在分细,就陷入无穷无止的细节中了。
很多都有交叉的。

你的名字和我小时候的一个好友一样,而且也住在人民路这一带。想问一下你是否在淮海东路小学上的学?

引用qiu的发言:
你的名字和我小时候的一个好友一样……

哪一位啊……这种事情还是发邮件吧,不用留言了。

引用阿三的发言:
现在软件流行面向对象,我觉得不错。如果在分细,就陷入无穷无止的细节中了。很多都有交叉的。

分类的主要目的是提供一种主题浏览的方式,将相关的信息归类在一起。

我觉得,对于海量信息,搜索显然比分类合适。但是,分类还是必须存在。

理想的信息检索方式:搜索、分类、标签都提供。

发了两封邮件给你263的邮箱都没有收到回复,你加我的msn吧,如果你是我那个小学的同学就加我的msn吧。

jimqiu2004@hotmail.com

引用qiu的发言:
发了两封邮件给你263的邮箱都没有收到回复,你加我的msn吧,如果你是我那个小学的同学就加我的msn吧。 jimqiu2004@hotmail.com

换了个邮箱,已经回信了。

分类问题困扰我许久,是否有成熟的专业?

树型分类,来解决这种问题,我感觉是无解的。
人脑的结构也是网状的,用网状来整理的话,交叉就无所谓了。

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接