使用正则表达式进行xml数据验证

  XML Schema是定义XML的数据定义文件,以.xsd作为文件的扩展名。它也以被用来定义一类XML文件。

  通常,一些特殊含义的数据不能通过系统预设的数据结构(类型)清楚地描述。

  XML Schema 规范中声明:可以通过facet来限制(restriction)简单类型,从而产生一些新的原子类型(Atomic types)。

  Facet有pattern, enumeration,等等;

  这里要说的是其中非常有用的一项是:

  pattern+ 正则表达式语言(regular expression language)

  结合正则表达式的强大功能,就可以进行一些复杂的数据结构的描述

  Examples可以通过xmlspy, xmlwrite,或js/vbs 等进行验证,下面举出了js验证的例子(需要msxml4.0支持)

  有关定义 XML Schema 的信息,可以在W3C 的 XML Schema 规范的第一部分中找到。有关内置数据类型及其可用的局限性方面的信息,请检 查 XML Schema 规范的第二部分。关于 这两部分 XML Schema 规范的简易摘要,请查看 W3C Primer on XML Schema。

  有关正则表达式,可以去http://www.regexlib.com/看看

  examples:

  /*** examples.xml ***/

  <?xml version="1.0" encoding="gb2312"?>

  <root xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:noNamespaceSchemaLocation="examples.xsd">

  <user>

  <name>test</name>

  <email>[email protected]</email>

  <ip>127.0.0.1</ip>

  <color>#000000</color>

  </user>

  <user>

  <name>guest</name>

  <email>[email protected]</email>

  <ip>202.102.224.25</ip>

  <color>#FFFFFF</color>

  </user>

  </root>

  /*** examples.xsd ***/

  <?xml version="1.0" encoding="gb2312"?>

  <xsd:schema xmlns:xsd="http://www.w3.org/2001/XMLSchema">

  <xsd:element name="root" type="Root"/>

  <xsd:complexType name="Root">

  <xsd:sequence>

  <xsd:element name="user"  type="User" minOccurs="0" maxOccurs="unbounded" />

  </xsd:sequence>

  </xsd:complexType>

  <xsd:complexType name="User">

  <xsd:sequence>

  <xsd:element name="name" type="xsd:string"/>

  <xsd:element name="email" type="Email" />

  <xsd:element name="ip" type="IP" />

  <xsd:element name="color" type="Color" />

  </xsd:sequence>

  </xsd:complexType>

  <xsd:simpleType name="Email">

  <xsd:restriction base="xsd:string">

  <xsd:pattern value="([a-zA-Z0-9_\-\.]+)@((\[[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}\.)|(([a-zA-Z0-9\-]+\.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(\]?)"/>

  </xsd:restriction>

  </xsd:simpleType>

  <xsd:simpleType name="IP">

  <xsd:restriction base="xsd:string">

  <xsd:pattern value="(25[0-5]|2[0-4][0-9]|[0-1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[1-9])\.(25[0-5]|2[0-4][0-9]|[0-1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[1-9]|0)\.(25[0-5]|2[0-4][0-9]|[0-1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[1-9]|0)\.(25[0-5]|2[0-4][0-9]|[0-1]{1}[0-9]{2}|[1-9]{1}[0-9]{1}|[0-9])"/>

  </xsd:restriction>

  </xsd:simpleType>

  <xsd:simpleType name="Color">

  <xsd:restriction base="xsd:string">

  <xsd:pattern value="#?([a-f]|[A-F]|[0-9]){3}(([a-f]|[A-F]|[0-9]){3})?"/>

  </xsd:restriction>

  </xsd:simpleType>

  </xsd:schema>

  /*** examples.htm ***/

  <SCRIPT LANGUAGE="javaScript">

  function validate()

  {

  var oXML ;

  var nParseError;

  var sReturnVal;

  oXML = new ActiveXObject("MSXML2.DOMDocument.4.0") ;

  oXML.async = false ;

  oXML.validateOnParse = true;

  oXML.load("examples.xml") ;

  nParseError = oXML.parseError.errorCode ;

  sReturnVal = "" ;

  if (0 != nParseError)

  {

  //参看书籍教程中parseError对象属性

  sReturnVal = sReturnVal + "代码:" + oXML.parseError.errorCode + "\n" ;

  sReturnVal = sReturnVal + "错误原因:" + oXML.parseError.Reason + "\n" ;

  sReturnVal = sReturnVal + "错误字符串:" + oXML.parseError.srcText + "\n" ;

  sReturnVal = sReturnVal + "错误行号" + oXML.parseError.line + "\n" ;

  sReturnVal = sReturnVal + "错误列数:" + oXML.parseError.linepos + "\n" ;

  }

  else

  {

  sReturnVal = sReturnVal + "验证通过!"

  }

  alert(sReturnVal);

  }

  function window.onload()

  {

  validate();

  }

  </SCRIPT>