XML指南——XML 属性

  跟HTML一样,XML元素再开始标记处可以由元素属性。

  属性通常包含一些关于元素的额外信息。

  XML属性

  XML元素可以拥有属性。

  你一定还记得这样的HTML代码吧: <IMG SRC="computer.gif">。src是img元素的属性,提供了关于img元素的额外信息。

  在HTML中 (在XML中也一样)元素的属性提供了元素的额外信息。

  <img src="computer.gif">

  <a href="demo.asp">

  书信提供的信息通常不是数据的一部分。在下面的例子中,类型和数据毫不相关,但对于操作这个元素的软件来说却相当重要。

  <file type="gif">computer.gif</file>

  引用风格"female" 还是 'female'?

  属性值必须用引号引着。单引号、双引号都可以使用。例如一个人的性别,person元素可以这样写:

  <person sex="female">

  也可以这样写:

  <person sex='female'>

  上面的两种写法在一般情况下是没有区别的,使用双引号的应用更普遍一些。但是在某些特殊的情况下就必须使用单引号,比如下面的例子:

  <gangster name='George "Shotgun" Ziegler'>

  使用子元素还是使用属性

  数据既可以存储在子元素中也可以存储在属性中。

  请看下面的例子:

  <person sex="female">

  <firstname>Anna</firstname>

  <lastname>Smith</lastname>

  </person>

  <person>

  <sex>female</sex>

  <firstname>Anna</firstname>

  <lastname>Smith</lastname>

  </person>

  在第一个例子中,sex是一个属性,在第二个例子中,sex则是一个子元素。这两个例子都提供了相同的信息。

  什么时候用属性,什么时候用子元素没有一个现成的规则可以遵循。我的经验是属性在HTML中可能相当便利,但在XML中,你最好避免使用。

  我喜欢的风格

  我更愿意把数据存储到子元素中。

  下面的三个XML文档包含了相同的信息:

  第一个例子使用了data属性:

  <note date="12/11/99">

  <to>Tove</to>

  <from>Jani</from>

  <heading>Reminder</heading>

  <body>Don't forget me this weekend!</body>

  </note>

  第二个例子使用了data元素:

  <note>

  <date>12/11/99</date>

  <to>Tove</to>

  <from>Jani</from>

  <heading>Reminder</heading>

  <body>Don't forget me this weekend!</body>

  </note>

  第三个例子使用了扩展的data元素: (这就是我推荐的样式):

  <note>

  <date>

  <day>12</day>

  <month>11</month>

  <year>99</year>

  </date>

  <to>Tove</to>

  <from>Jani</from>

  <heading>Reminder</heading>

  <body>Don't forget me this weekend!</body>

  </note>

  避免使用属性?

  应该避免使用属性么?

  这里有一些使用属性引发的问题:

  属性不能包含多个值(子元素可以)。

  属性不容易扩展。

  属性不能够描述结构(子元素可以)。

  属性很难被程序代码处理。

  属性值很难通过DTD进行测试。

  如果使用属性来存储数据,那么所编写的XML文档一定很难阅读和操作。尽量使用元素来描述数据,仅使用属性来描述那些与数据关系不大的额外信息。

  不要象下面的例子那样(如果你那么做了说明你还没有明白上面的观点)。

  <note day="12" month="11" year="99"

  to="Tove" from="Jani" heading="Reminder"

  body="Don't forget me this weekend!">

  </note>

  属性规则的例外

  规则总是有例外的。

  我的关于属性的规则也有一个例外:

  有些时候应该为一个元素设计一个ID引用,通过这个ID可以引用存取特定的XML元素,就象HTML中的name和id属性一样。请看下面的例子:

  <messages>

  <note ID="501">

  <to>Tove</to>

  <from>Jani</from>

  <heading>Reminder</heading>

  <body>Don't forget me this weekend!</body>

  </note>

  <note ID="502">

  <to>Jani</to>

  <from>Tove</from>

  <heading>Re: Reminder</heading>

  <body>I will not!</body>

  </note>

  </messages>

  在上面的例子中,ID属性就相当于一个计数器,或者是一个唯一的标识符,在XML文档中标识不同的便条信息,他不是便条信息的一部分。

  我们所要尽力向读者说明的是:元数据(与数据有关的数据)应该以属性的方式存储,而数据本身应该以元素的形式存储。