数据类型和Json格式分析小结

  1.

  前几天,我才知道有一种简化的数据交换格式,叫做yaml

  我翻了一遍它的文档,看懂的地方不多,但是有一句话令我茅塞顿开。

  它说,从结构上看,所有的数据最终都可以分成三种类型

  第一种类型是scalar(标量),也就是一个单独的string(字符串)或数字(numbers),比如“北京”这个单独的词。

  第二种类型是sequence(序列),也就是若干个相关的数据按照一定顺序并列在一起,又叫做array(数组)或List(列表),比如“北京,东京”。

  第三种类型是mapping(映射),也就是一个名/值对(Name/value),即数据有一个名称,还有一个与之相对应的值,这又称作hash(散列)或dictionary(字典),比如“首都:北京”。

  我恍然大悟,数据构成的最小单位原来如此简单!难怪在编程语言中,只要有了数组(array)和对象(object)就能够储存一切数据了。

  2.

  我马上想到了json

  21世纪初,Douglas Crockford寻找一种简便的数据交换格式,能够在服务器之间交换数据。这其实需要二步,第一步是将各种数据转化为一个字符串,也就是数据的串行化(serialization),第二步才是交换这个字符串。

  当时通用的数据交换语言是XML,但是Douglas Crockford觉得XML的生成和解析都太麻烦,所以他提出了一种简化格式,也就是Json。

  Json的规格非常简单,只用一个页面、几百个字就能说清楚,而且Douglas Crockford声称这个规格永远不必升级,因为该规定的都规定了。

  1) 并列的数据之间用逗号(“,”)分隔。

  2) 映射用冒号(“:”)表示。

  3) 并列数据的集合(数组)用方括号("[]")表示。

  4) 映射的集合(对象)用大括号(“{}”)表示。

  上面四条规则,就是Json格式的所有内容。

  比如,下面这句话:

  “北京市的面积为16800平方公里,常住人口1600万人。上海市的面积为6400平方公里,常住人口1800万。”

  写成json格式就是这样:

  [

  {"城市":"北京","面积":16800,"人口":1600},

  {"城市":"上海","面积":6400,"人口":1800}

  ]

如果事先知道数据的结构,上面的写法还可以进一步简化:

  [

  ["北京",16800,1600],

  ["上海",6400,1800]

  ]

  由此可以看到,json非常易学易用。所以,在短短几年中,它就取代xml,成为了互联网上最受欢迎的数据交换格式。

  我猜想,Douglas Crockford一定事先就知道,数据结构可以简化成三种形式,否则怎么可能将json定义得如此精炼呢!

  3.

  我还记得,在学习javascript的时候,我一度搞不清楚“数组”(array)和“对象”(object)的根本区别在哪里,两者都可以用来表示数据的集合。

  比如有一个数组a=[1,2,3,4],还有一个对象a={0:1,1:2,2:3,3:4},然后你运行alert(a[1]),两种情况下的运行结果是相同的!这就是说,数据集合既可以用数组表示,也可以用对象表示,那么我到底该用哪一种呢?

  我后来才知道,数组表示有序数据的集合,而对象表示无序数据的集合。如果数据的顺序很重要,就用数组,否则就用对象。

  4.

  当然,数组和对象的另一个区别是,数组中的数据没有“名称”(name),对象中的数据有“名称”(name)。

  但是问题是,很多编程语言中,都有一种叫做“关联数组”(associative array)的东西。这种数组中的数据是有名称的。

  比如在javascript中,可以这样定义一个对象:

  var a={"城市":"北京","面积":16800,"人口":1600};

  但是,也可以定义成一个关联数组:

  a["城市"]="北京";

  a["面积"]=16800;

  a["人口"]=1600;

  这起初也加剧了我对数组和对象的混淆,后来才明白,在Javascript语言中,关联数组就是对象,对象就是关联数组。这一点与php语言完全不同,在php中,关联数组也是数组。

  比如运行下面这段javascript:

  var a=[1,2,3,4];

  a['foo']='Hello World';

  alert(a.length);

  最后的结果是4,也就是说,数组a的元素个数是4个。

  但是,运行同样内容的php代码就不一样了:

  $a=array(1,2,3,4);

  $a["foo"]="Hello world";

  echo count($a);

  最后的结果是5,也就是说,数组a的元素个数是5个。