数据类型和Json格式

作者: 阮一峰

日期: 2009年5月30日

1.

前几天,我才知道有一种简化的数据交换格式,叫做yaml

我翻了一遍它的文档,看懂的地方不多,但是有一句话令我茅塞顿开。

它说,从结构上看,所有的数据(data)最终都可以分解成三种类型

第一种类型是标量(scalar),也就是一个单独的字符串(string)或数字(numbers),比如"北京"这个单独的词。

第二种类型是序列(sequence),也就是若干个相关的数据按照一定顺序并列在一起,又叫做数组(array)或列表(List),比如"北京,上海"。

第三种类型是映射(mapping),也就是一个名/值对(Name/value),即数据有一个名称,还有一个与之相对应的值,这又称作散列(hash)或字典(dictionary),比如"首都:北京"。

我恍然大悟,数据构成的最小单位原来如此简单!难怪在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。

2.

我马上想到了json

21世纪初,Douglas Crockford寻找一种简便的数据交换格式,能够在服务器之间交换数据。当时通用的数据交换语言是XML,但是Douglas Crockford觉得XML的生成和解析都太麻烦,所以他提出了一种简化格式,也就是Json。

Json的规格非常简单,只用一个页面几百个字就能说清楚,而且Douglas Crockford声称这个规格永远不必升级,因为该规定的都规定了。

1) 并列的数据之间用逗号(", ")分隔。

2) 映射用冒号(": ")表示。

3) 并列数据的集合(数组)用方括号("[]")表示。

4) 映射的集合(对象)用大括号("{}")表示。

上面四条规则,就是Json格式的所有内容。

比如,下面这句话:

"北京市的面积为16800平方公里,常住人口1600万人。上海市的面积为6400平方公里,常住人口1800万。"

写成json格式就是这样:

[
  {"城市":"北京","面积":16800,"人口":1600},
  {"城市":"上海","面积":6400,"人口":1800}
]

如果事先知道数据的结构,上面的写法还可以进一步简化:

[
  ["北京",16800,1600],
  ["上海",6400,1800]
]

由此可以看到,json非常易学易用。所以,在短短几年中,它就取代xml,成为了互联网上最受欢迎的数据交换格式。

我猜想,Douglas Crockford一定事先就知道,数据结构可以简化成三种形式,否则怎么可能将json定义得如此精炼呢!

3.

学习javascript的时候,我曾经一度搞不清楚"数组"(array)和"对象"(object)的根本区别在哪里,两者都可以用来表示数据的集合。

比如有一个数组a=[1,2,3,4],还有一个对象a={0:1,1:2,2:3,3:4},然后你运行alert(a[1]),两种情况下的运行结果是相同的!这就是说,数据集合既可以用数组表示,也可以用对象表示,那么我到底该用哪一种呢?

我后来才知道,数组表示有序数据的集合,而对象表示无序数据的集合。如果数据的顺序很重要,就用数组,否则就用对象。

4.

当然,数组和对象的另一个区别是,数组的数据没有"名称"(name),对象的数据有"名称"(name)。

但是问题是,很多编程语言中,都有一种叫做"关联数组"(associative array)的东西。这种数组中的数据是有名称的。

比如在javascript中,可以这样定义一个对象:

var a={"城市":"北京","面积":16800,"人口":1600};

但是,也可以定义成一个关联数组:

a["城市"]="北京";
a["面积"]=16800;
a["人口"]=1600;

这起初也加剧了我对数组和对象的混淆,后来才明白,在Javascript语言中,关联数组就是对象,对象就是关联数组。这一点与php语言完全不同,在php中,关联数组也是数组。

比如运行下面这段javascript:

var a=[1,2,3,4];

a['foo']='Hello World';

alert(a.length);

最后的结果是4,也就是说,数组a的元素个数是4个。

但是,运行同样内容的php代码就不一样了:

<?php

$a=array(1,2,3,4);

$a["foo"]="Hello world";

echo count($a);

?>

最后的结果是5,也就是说,数组a的元素个数是5个。

(完)

留言(63条)

我是个Google的Blogger用户,这个应用里就有很多json应用,您的这篇文章作为入门非常合适。
谢谢阮老师。

还是喜欢看你的非技术blog 虽然你有一点点悲观 一点点感性 但是很真实 很诚恳

javascript中对象是一个非常宽泛的东西,并不仅仅局限为关联数组

楼主所说的对象叫哈希表可能更合适

挺可爱的文章~

把php的 数组理解为 python的 list.
php的关联数组看成是 python的 dictionary就对了.
php就是perl+C, perl里面的关联数组就是hash.
但是python 还多个tuple.
php数组没有负索引,序列相关操作python更方便.
当然php更成熟……
所有语言终归到底就是操作字符串&操作文件哪个更适合实现就用哪个呗.


在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。

我不这么认为,不知道你使用的是什么语言? 数组也是对象 C#

http://msdn.microsoft.com/zh-cn/library/aa288453(VS.71).aspx

对我有帮助, 有价值!
多谢:)

引用张昭的发言:

我不这么认为,不知道你使用的是什么语言? 数组也是对象 C#

看一下SICP :)

引用晨的发言:
您的这篇文章作为入门非常合适。

这篇文章算是我的学习心得,不适合作为javascript入门的。

你可以参考这篇:Mastering JSON http://www.hunlock.com/blogs/Mastering_JSON_(_JavaScript_Object_Notation_)

才注意到yaml,那几条总结不错。

yaml, how to pronounce it?

yaml的发音是“雅梅尔”。

数据类型和perl基本一样啊。

拜读

拜读了,有几个问题恍然大悟,多谢阮老师~

学习了,mark。

拜读,对于一些模糊的概念一下子清晰了

明白了一些json,正想使用呢

阮老师,你的讲解非常棒。受教了。

写得好啊!真正的经验总结。不是普通教程所能给予的。

写得好啊 精辟啊

一些概念性的东西一下就明白了。

终于了解了json、数组、对象,谢谢

最近在思考哈希表和关联数组有什么区别,看到这篇文章又有一些进一步的理解。如果根据数据结构的最小构成,哈希表和关联数组应该都属于映射吧?

阮先生的文章真是太棒了!

您说的好复杂啊

太棒了,我都看了好几次了,阮老师引用的那个数据分三类的太精辟了

说得通俗易懂,好。

这种格式肯定很轻量级,如果达到一定规模,可能就会出现瓶颈

拜读了,刚接触JSON,受教了,多谢阮老师~

var a=[1,2,3,4];
a['8']='Hello World';
alert(a.length); //9
alert(a[7]); //undefined

这个能否解释一下?

引用笃行天下的发言:
var a=[1,2,3,4];a['8']='Hello World';alert(a.length); //9alert(a[7]); //undefined 这个能否解释一下?

alert(a.toString()); //这样弹下就知道了

偶以为YAML格式同样简洁,但是它还可以加注释,这样就省去了很多不必要的约定,看注释就知道每个字段是干什么的了

你的博客 非常喜欢 短小精干 无废话 对我们刚入门的人很是有大用 相比您是编程年龄不下8年吧!

谢谢你的文章,最新在重温编程的知识,很有用!

呵呵,在Google里面查询Json的时候,看到了博主的这篇文章,言简意赅啊,让我对数据类型的理解有了更好的认识。

看过一遍这篇文章我就忘不了这么深刻的理解了,这是我第二次再拜读这篇文章,那句”数据构成的最小单位原来如此简单!难怪在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。“让我记忆深刻。

谢谢,瞬间懂了

为什么js里面,a.length仍然是4?

对数组和对象的关系一直不清楚,看了本文多少有些明白了。

楼主讲解的太精彩了。从最简单的数据类型讲起,一目了然!

阮一峰老师的文章还是这么通俗易懂、鞭辟入里

数据构成的最小单位原来如此简单!难怪在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~`

这句话根本就是错的。这里的「最小单位」,相当有歧义。事实上,用关联数组就可以表示对象,用数组就可以表示一切了,Lisp就是这么做的啊。比如我们这样这样用数组定义一套数据结构,完全就跟JSON是同构的。

[t a b c ... ] ======> [a, b, c, ...]
[p k1 v1 k2 v2 ...] ======> {k1 : v1, k2: v2, ... }
[s s] ======> s

然后

[
  {"城市":"北京","面积":16800,"人口":1600},
  {"城市":"上海","面积":6400,"人口":1800}
]

就可以表示为:

[t [p [s 城市] [s 北京] [s 面积] [s 16800] [s 人口] [s 1600]]
[p [s 城市] [s 上海] [s 面积] [s 6400] [s 人口] [s 1800]]

完全等价,而且我们没用字典吧。

JSON的胜利,是其刚好抓住了「最常用的数据关系」,巧妙的简写。我们如果用上面的格式,估计就有得蛋疼了。当然标量、数组、字典的复合其实不是偶然:

标量 ==》 C里面的int、float等 ==》 原子分子,维持基本的功能

数字 ==》 C里面的数组 ==》 外部的聚合,比如混合物、人群

字典 ==》 C里面的Struct ==》 内部的聚合,比如一个水分子由两个氢原子和一个氧原子组成

出现了上面的数组表示字典之所以会成功,原因其实是「内部的聚合」也表示「约定为外部的聚合」。再直接点,将「聚合」看做是标量,那么一切都可以是标量。

所以只需要有两个量就可以了(0和1),这才是最小单位。

本人是一个初学者,对数组,对象很是头痛,自从读完阮一峰老师的这篇文章,我很是感动,突然之间让我茅塞顿开、恍然大悟。这篇文章很适合新手!!!
还有就是,一些发留言的人也让我学到了不少东西,如“笃行天下”与“7869120”对话,对我很是受用,但同样也有一些人让我这位新手很是头痛,如“lts ”,

每篇跟帖都能看到两种聪明人:
一种有本事把简单搞复杂,以只有他懂为傲,
一种有本事把复杂搞简单,以让大家都懂为傲...

刚刚接触json,能不能推荐一些读物?

@lts:

你不能用语言的实现反过来推数据的组成
是现有数据的组成才有语言的实现
语言怎么实现都是具体细节
但不能改变数据的本质

我也是刚开始接触json的,一般都是在www.sojson.com 这个里面格式化,不错

简单易懂,赞!对象是可以表示成数组,但大同 小不同的地方太多,分离出新的 对象 表达形式更加清晰明了吧?

引用dylanklc的发言:

把php的 数组理解为 python的 list.
php的关联数组看成是 python的 dictionary就对了.
php就是perl+C, perl里面的关联数组就是hash.
但是python 还多个tuple.
php数组没有负索引,序列相关操作python更方便.
当然php更成熟……
所有语言终归到底就是操作字符串&操作文件哪个更适合实现就用哪个呗.

不是老就成熟,知道不。php,JS,其实像怪胎。四不像,像整容失败的女人。

喜欢这样概括性介绍性的文章,把复杂的事情将简单。

"如果数据的顺序很重要,就用数组,否则就用对象。"
我怎么觉得应该是:如果无序性很重要,就用对象,否则用数组.

json是一种简单的数据交换格式,如果难学的,尼大师就没必要费那个劲了

谢谢老师的分享,确实写的很好,很多人自己认为很专业但是解释了大半天,初学者还是不明白,而高手就是将复杂的结构,采用通俗易懂的词汇,一下子将问题给说透了!你果然是高手,领悟的通透,初学者就是需要你这样的老师,哈哈
来自 www.labmach.com 的支持

阮老师您好,问个问题:为什么json 键值中会设计numbers(int float) 格式 ?
因为int 和 float在数据格式位数多重多样,网传状态处于是那种状态。

"难怪在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。"
这个我觉得不是should be的问题而是一个has to be的问题,因为,当前的计算机硬件只支持数组

浅显易懂,不过最后的那个例子没懂,

看了这篇文章后,对json数据有了个初步的认识;同时对以前纠结的数组和对象有了进一步了解,非常感谢楼主!

一些比较混淆的概念也理清了,好文

谢谢分享,加深了我对json的理解。

谢谢,最近接触到关联数组的问题,正好理解了。

很棒的文章

一点浅见

本质上数组a的形式就是带有自然数名称的对象,只不过当名称顺序和自然数顺序相同时,默认省略。“顺序”一词的内涵就是符合自然数序列。自然数序列和链表有点像,5自带的信息就是下一个地址是6,6同理,这个顺序是所有人共同习得的。

试想一个没有学过自然数符号的人,想提取数组a中的第三个元素,那他就不知道应该打a[2],但是如果把a数组补全成{0:1,1:2,2:3,3:4}这种形式,无需学习自然数符号也能够按规则打出a[2],这种省略的前提是用户已经接受了数学教育,这是共同知识,每个人都在小学学过了这个这种自然数密码表。对于没有共同知识的名称顺序,就必须补全。

我要发表看法

«-必填

«-必填,不公开

«-我信任你,不会填写广告链接