1.
前几天,我才知道有一种简化的数据交换格式,叫做yaml。
我翻了一遍它的文档,看懂的地方不多,但是有一句话令我茅塞顿开。
它说,从结构上看,所有的数据(data)最终都可以分解成三种类型:
第一种类型是标量(scalar),也就是一个单独的字符串(string)或数字(numbers),比如"北京"这个单独的词。
第二种类型是序列(sequence),也就是若干个相关的数据按照一定顺序并列在一起,又叫做数组(array)或列表(List),比如"北京,上海"。
第三种类型是映射(mapping),也就是一个名/值对(Name/value),即数据有一个名称,还有一个与之相对应的值,这又称作散列(hash)或字典(dictionary),比如"首都:北京"。
我恍然大悟,数据构成的最小单位原来如此简单!难怪在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。
2.
我马上想到了json。
21世纪初,Douglas Crockford寻找一种简便的数据交换格式,能够在服务器之间交换数据。当时通用的数据交换语言是XML,但是Douglas Crockford觉得XML的生成和解析都太麻烦,所以他提出了一种简化格式,也就是Json。
Json的规格非常简单,只用一个页面几百个字就能说清楚,而且Douglas Crockford声称这个规格永远不必升级,因为该规定的都规定了。
1) 并列的数据之间用逗号(", ")分隔。
2) 映射用冒号(": ")表示。
3) 并列数据的集合(数组)用方括号("[]")表示。
4) 映射的集合(对象)用大括号("{}")表示。
上面四条规则,就是Json格式的所有内容。
比如,下面这句话:
"北京市的面积为16800平方公里,常住人口1600万人。上海市的面积为6400平方公里,常住人口1800万。"
写成json格式就是这样:
[
{"城市":"北京","面积":16800,"人口":1600},
{"城市":"上海","面积":6400,"人口":1800}
]
如果事先知道数据的结构,上面的写法还可以进一步简化:
[
["北京",16800,1600],
["上海",6400,1800]
]
由此可以看到,json非常易学易用。所以,在短短几年中,它就取代xml,成为了互联网上最受欢迎的数据交换格式。
我猜想,Douglas Crockford一定事先就知道,数据结构可以简化成三种形式,否则怎么可能将json定义得如此精炼呢!
3.
学习javascript的时候,我曾经一度搞不清楚"数组"(array)和"对象"(object)的根本区别在哪里,两者都可以用来表示数据的集合。
比如有一个数组a=[1,2,3,4],还有一个对象a={0:1,1:2,2:3,3:4},然后你运行alert(a[1]),两种情况下的运行结果是相同的!这就是说,数据集合既可以用数组表示,也可以用对象表示,那么我到底该用哪一种呢?
我后来才知道,数组表示有序数据的集合,而对象表示无序数据的集合。如果数据的顺序很重要,就用数组,否则就用对象。
4.
当然,数组和对象的另一个区别是,数组的数据没有"名称"(name),对象的数据有"名称"(name)。
但是问题是,很多编程语言中,都有一种叫做"关联数组"(associative array)的东西。这种数组中的数据是有名称的。
比如在javascript中,可以这样定义一个对象:
var a={"城市":"北京","面积":16800,"人口":1600};
但是,也可以定义成一个关联数组:
a["城市"]="北京";
a["面积"]=16800;
a["人口"]=1600;
这起初也加剧了我对数组和对象的混淆,后来才明白,在Javascript语言中,关联数组就是对象,对象就是关联数组。这一点与php语言完全不同,在php中,关联数组也是数组。
比如运行下面这段javascript:
var a=[1,2,3,4];
a['foo']='Hello World';
alert(a.length);
最后的结果是4,也就是说,数组a的元素个数是4个。
但是,运行同样内容的php代码就不一样了:
<?php
$a=array(1,2,3,4);
$a["foo"]="Hello world";
echo count($a);
?>
最后的结果是5,也就是说,数组a的元素个数是5个。
(完)
晨 说:
我是个Google的Blogger用户,这个应用里就有很多json应用,您的这篇文章作为入门非常合适。
谢谢阮老师。
2009年5月30日 22:58 | # | 引用
四野 说:
还是喜欢看你的非技术blog 虽然你有一点点悲观 一点点感性 但是很真实 很诚恳
2009年5月31日 01:51 | # | 引用
廖 说:
javascript中对象是一个非常宽泛的东西,并不仅仅局限为关联数组
楼主所说的对象叫哈希表可能更合适
2009年5月31日 07:29 | # | 引用
dylanklc 说:
挺可爱的文章~
2009年5月31日 13:29 | # | 引用
dylanklc 说:
把php的 数组理解为 python的 list.
php的关联数组看成是 python的 dictionary就对了.
php就是perl+C, perl里面的关联数组就是hash.
但是python 还多个tuple.
php数组没有负索引,序列相关操作python更方便.
当然php更成熟……
所有语言终归到底就是操作字符串&操作文件哪个更适合实现就用哪个呗.
2009年5月31日 13:40 | # | 引用
张昭 说:
“
在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。
”
我不这么认为,不知道你使用的是什么语言? 数组也是对象 C#
http://msdn.microsoft.com/zh-cn/library/aa288453(VS.71).aspx
2009年5月31日 13:46 | # | 引用
蔡炜 说:
对我有帮助, 有价值!
多谢:)
2009年5月31日 15:06 | # | 引用
ManofPhysics 说:
看一下SICP :)
2009年5月31日 16:40 | # | 引用
Ruan YiFeng 说:
这篇文章算是我的学习心得,不适合作为javascript入门的。
你可以参考这篇:Mastering JSON http://www.hunlock.com/blogs/Mastering_JSON_(_JavaScript_Object_Notation_)
2009年6月 1日 01:08 | # | 引用
闲耘 说:
才注意到yaml,那几条总结不错。
2009年6月 1日 23:56 | # | 引用
张昭 说:
yaml, how to pronounce it?
2009年6月 2日 10:33 | # | 引用
Ruan YiFeng 说:
yaml的发音是“雅梅尔”。
2009年6月 3日 16:46 | # | 引用
zhang 说:
数据类型和perl基本一样啊。
2009年6月10日 17:36 | # | 引用
merlin 说:
拜读
2009年12月 4日 11:28 | # | 引用
智者 说:
拜读了,有几个问题恍然大悟,多谢阮老师~
2009年12月 7日 10:05 | # | 引用
ayymbirst 说:
学习了,mark。
2009年12月21日 09:16 | # | 引用
张晨 说:
拜读,对于一些模糊的概念一下子清晰了
2011年3月17日 11:56 | # | 引用
ErrorGo 说:
明白了一些json,正想使用呢
2011年4月 3日 17:32 | # | 引用
魏蕤 说:
阮老师,你的讲解非常棒。受教了。
2011年6月 3日 11:35 | # | 引用
zjx 说:
写得好啊!真正的经验总结。不是普通教程所能给予的。
2011年6月13日 15:19 | # | 引用
LN 说:
写得好啊 精辟啊
2011年6月22日 11:24 | # | 引用
寇强 说:
一些概念性的东西一下就明白了。
2011年11月17日 12:57 | # | 引用
zk546113096 说:
终于了解了json、数组、对象,谢谢
2012年1月14日 11:50 | # | 引用
bookpakr 说:
最近在思考哈希表和关联数组有什么区别,看到这篇文章又有一些进一步的理解。如果根据数据结构的最小构成,哈希表和关联数组应该都属于映射吧?
2012年2月16日 14:42 | # | 引用
lintide 说:
阮先生的文章真是太棒了!
2012年2月22日 11:01 | # | 引用
韵锦 说:
您说的好复杂啊
2012年3月 6日 14:26 | # | 引用
RoyBit 说:
太棒了,我都看了好几次了,阮老师引用的那个数据分三类的太精辟了
2012年3月12日 10:22 | # | 引用
千鹤 说:
说得通俗易懂,好。
2012年3月13日 01:32 | # | 引用
ghuyt 说:
这种格式肯定很轻量级,如果达到一定规模,可能就会出现瓶颈
2012年4月28日 01:58 | # | 引用
祁连雪狼 说:
拜读了,刚接触JSON,受教了,多谢阮老师~
2012年5月10日 13:40 | # | 引用
笃行天下 说:
var a=[1,2,3,4];
a['8']='Hello World';
alert(a.length); //9
alert(a[7]); //undefined
这个能否解释一下?
2012年6月10日 21:41 | # | 引用
7869120 说:
alert(a.toString()); //这样弹下就知道了
2012年6月20日 16:32 | # | 引用
dk01 说:
偶以为YAML格式同样简洁,但是它还可以加注释,这样就省去了很多不必要的约定,看注释就知道每个字段是干什么的了
2012年7月24日 14:38 | # | 引用
Rambo 说:
你的博客 非常喜欢 短小精干 无废话 对我们刚入门的人很是有大用 相比您是编程年龄不下8年吧!
2012年9月10日 17:45 | # | 引用
yingying 说:
谢谢你的文章,最新在重温编程的知识,很有用!
2012年9月12日 04:44 | # | 引用
李冬 说:
呵呵,在Google里面查询Json的时候,看到了博主的这篇文章,言简意赅啊,让我对数据类型的理解有了更好的认识。
2012年10月19日 09:24 | # | 引用
einverne 说:
看过一遍这篇文章我就忘不了这么深刻的理解了,这是我第二次再拜读这篇文章,那句”数据构成的最小单位原来如此简单!难怪在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。“让我记忆深刻。
2013年3月 8日 20:49 | # | 引用
zerbobo 说:
谢谢,瞬间懂了
2013年3月11日 18:52 | # | 引用
小蘑菇 说:
为什么js里面,a.length仍然是4?
2013年3月25日 11:51 | # | 引用
zhxxmu 说:
对数组和对象的关系一直不清楚,看了本文多少有些明白了。
2013年4月12日 10:19 | # | 引用
leo569 说:
楼主讲解的太精彩了。从最简单的数据类型讲起,一目了然!
2013年4月16日 13:55 | # | 引用
DrWeb 说:
阮一峰老师的文章还是这么通俗易懂、鞭辟入里
2013年5月17日 10:40 | # | 引用
lts 说:
数据构成的最小单位原来如此简单!难怪在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~`
这句话根本就是错的。这里的「最小单位」,相当有歧义。事实上,用关联数组就可以表示对象,用数组就可以表示一切了,Lisp就是这么做的啊。比如我们这样这样用数组定义一套数据结构,完全就跟JSON是同构的。
[t a b c ... ] ======> [a, b, c, ...]
[p k1 v1 k2 v2 ...] ======> {k1 : v1, k2: v2, ... }
[s s] ======> s
然后
[
{"城市":"北京","面积":16800,"人口":1600},
{"城市":"上海","面积":6400,"人口":1800}
]
就可以表示为:
[t [p [s 城市] [s 北京] [s 面积] [s 16800] [s 人口] [s 1600]]
[p [s 城市] [s 上海] [s 面积] [s 6400] [s 人口] [s 1800]]
完全等价,而且我们没用字典吧。
JSON的胜利,是其刚好抓住了「最常用的数据关系」,巧妙的简写。我们如果用上面的格式,估计就有得蛋疼了。当然标量、数组、字典的复合其实不是偶然:
标量 ==》 C里面的int、float等 ==》 原子分子,维持基本的功能
数字 ==》 C里面的数组 ==》 外部的聚合,比如混合物、人群
字典 ==》 C里面的Struct ==》 内部的聚合,比如一个水分子由两个氢原子和一个氧原子组成
出现了上面的数组表示字典之所以会成功,原因其实是「内部的聚合」也表示「约定为外部的聚合」。再直接点,将「聚合」看做是标量,那么一切都可以是标量。
所以只需要有两个量就可以了(0和1),这才是最小单位。
2013年7月27日 20:55 | # | 引用
帅 说:
本人是一个初学者,对数组,对象很是头痛,自从读完阮一峰老师的这篇文章,我很是感动,突然之间让我茅塞顿开、恍然大悟。这篇文章很适合新手!!!
还有就是,一些发留言的人也让我学到了不少东西,如“笃行天下”与“7869120”对话,对我很是受用,但同样也有一些人让我这位新手很是头痛,如“lts ”,
2013年8月 1日 21:56 | # | 引用
鱼无言 说:
每篇跟帖都能看到两种聪明人:
一种有本事把简单搞复杂,以只有他懂为傲,
一种有本事把复杂搞简单,以让大家都懂为傲...
2013年8月 5日 21:15 | # | 引用
小错丶曾经 说:
刚刚接触json,能不能推荐一些读物?
2013年8月16日 10:11 | # | 引用
keyair 说:
@lts:
你不能用语言的实现反过来推数据的组成
是现有数据的组成才有语言的实现
语言怎么实现都是具体细节
但不能改变数据的本质
2013年12月17日 11:13 | # | 引用
成成雨飞 说:
我也是刚开始接触json的,一般都是在www.sojson.com 这个里面格式化,不错
2013年12月19日 14:32 | # | 引用
开心一百 说:
简单易懂,赞!对象是可以表示成数组,但大同 小不同的地方太多,分离出新的 对象 表达形式更加清晰明了吧?
2014年2月20日 13:07 | # | 引用
pythonwood 说:
不是老就成熟,知道不。php,JS,其实像怪胎。四不像,像整容失败的女人。
2014年2月22日 15:25 | # | 引用
苗子 说:
喜欢这样概括性介绍性的文章,把复杂的事情将简单。
2014年2月26日 12:03 | # | 引用
路人甲 说:
"如果数据的顺序很重要,就用数组,否则就用对象。"
我怎么觉得应该是:如果无序性很重要,就用对象,否则用数组.
2014年3月10日 10:14 | # | 引用
书生 说:
json是一种简单的数据交换格式,如果难学的,尼大师就没必要费那个劲了
2014年7月 1日 10:32 | # | 引用
labmach 说:
谢谢老师的分享,确实写的很好,很多人自己认为很专业但是解释了大半天,初学者还是不明白,而高手就是将复杂的结构,采用通俗易懂的词汇,一下子将问题给说透了!你果然是高手,领悟的通透,初学者就是需要你这样的老师,哈哈
来自 www.labmach.com 的支持
2014年8月17日 12:11 | # | 引用
丁峰 说:
阮老师您好,问个问题:为什么json 键值中会设计numbers(int float) 格式 ?
因为int 和 float在数据格式位数多重多样,网传状态处于是那种状态。
2014年11月14日 11:57 | # | 引用
MikeTan 说:
"难怪在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。"
这个我觉得不是should be的问题而是一个has to be的问题,因为,当前的计算机硬件只支持数组
2014年11月22日 08:23 | # | 引用
tree 说:
浅显易懂,不过最后的那个例子没懂,
2015年5月13日 17:24 | # | 引用
--清汤-- 说:
2015年5月18日 16:47 | # | 引用
Winclpt 说:
一些比较混淆的概念也理清了,好文
2015年7月 1日 11:15 | # | 引用
hemingway 说:
谢谢分享,加深了我对json的理解。
2015年7月 8日 11:56 | # | 引用
rocket 说:
谢谢,最近接触到关联数组的问题,正好理解了。
2015年7月14日 10:18 | # | 引用
heavenhelllin 说:
很棒的文章
2018年1月 4日 23:36 | # | 引用
李雨辰 说:
一点浅见
本质上数组a的形式就是带有自然数名称的对象,只不过当名称顺序和自然数顺序相同时,默认省略。“顺序”一词的内涵就是符合自然数序列。自然数序列和链表有点像,5自带的信息就是下一个地址是6,6同理,这个顺序是所有人共同习得的。
试想一个没有学过自然数符号的人,想提取数组a中的第三个元素,那他就不知道应该打a[2],但是如果把a数组补全成{0:1,1:2,2:3,3:4}这种形式,无需学习自然数符号也能够按规则打出a[2],这种省略的前提是用户已经接受了数学教育,这是共同知识,每个人都在小学学过了这个这种自然数密码表。对于没有共同知识的名称顺序,就必须补全。
2022年11月 5日 13:20 | # | 引用