怎样快速从一个XML文件中查找信息

　　在网络时代,XML文件起到了一个保存和传输数据的作用。Soap协议通过Xml交流信息，数据库通过Xml文件存取等等。那么怎样快速的从一个XML文件中取得所需的信息呢？

　　我们知道，JAVA的JAXP中和Microsoft.Net都有Xml分析器，Microsoft.Net是边读边分析，而JAXP是读到内存中然后才进行分析（还有一种是事件机制去读），总而言之，是不利于快速读取。基于此，Microsoft.Net 和JAXP都提供了XPATH机制，来快速定位到XML文件中所需的节点。

　　例如有一个XML文件：booksort.xml:

　　<?xml version="1.0"?>

　　<title>Pride And Prejudice</title>

　　<first-name>Jane</first-name>

　　<last-name>Austen</last-name>

　　</author>

　　</book>

　　<title>The Handmaid's Tale</title>

　　<first-name>Margaret</first-name>

　　<last-name>Atwood</last-name>

　　</author>

　　</book>

　　<first-name>Jane</first-name>

　　<last-name>Austen</last-name>

　　</author>

　　</book>

　　<title>Sense and Sensibility</title>

　　<first-name>Jane</first-name>

　　<last-name>Austen</last-name>

　　</author>

　　</book>

　　</bookstore>

　　如果我们想快速查找”last-name”等于”Austen”的所有标题名，可以通过以下方法可以得到：

　　XmlReaderSample.cs

　　//Corelib.net/System.Xml.Xsl/XPathDocument Class

　　//Author :Any

　　using System;

　　using System.IO;

　　using System.Xml;

　　using System.Xml.XPath;

　　public class XmlReaderSample

　　{

　　public static void Main()

　　{

　　XmlTextReader myxtreader = new XmlTextReader("booksort.xml");

　　XmlReader myxreader = myxtreader;

　　XPathDocument doc = new XPathDocument(myxreader);

　　XPathNavigator nav = doc.CreateNavigator();

　　XPathExpression expr;

　　expr = nav.Compile("descendant::book[author/last-name='Austen']");

　　//expr.AddSort("title", XmlSortOrder.Ascending, XmlCaseOrder.None, "", XmlDataType.Text);

　　XPathNodeIterator iterator = nav.Select(expr);

　　while (iterator.MoveNext())

　　{

　　XPathNavigator nav2 = iterator.Current;

　　nav2.MoveToFirstChild();

　　Console.WriteLine("Book title: {0}", nav2.Value);

　　}

　　运行这个程序，结果为：

　　Book title: Pride And Prejudice

　　Book title: Emma

　　Book title: Sense and Sensibility

　　可以看到查找正确。

　　利用XPATH中的一些功能，也可以实现简单的排序和简单运算。如在数据库中经常要对数据进行汇总，就可用XPATH实现。

　　如：

　　order.xml

　　<order>

　　<title>The Handmaid's Tale</title>

　　</book>

　　<title>Americana</title>

　　</cd>

　　</order>

　　和：books.xml

　　<?xml version="1.0"?>

　　<title>The Autobiography of Benjamin Franklin</title>

　　<ns:author>

　　<first-name>Benjamin</first-name>

　　<last-name>Franklin</last-name>

　　</ns:author>

　　</book>

　　<title>The Confidence Man</title>

　　<first-name>Herman</first-name>

　　<last-name>Melville</last-name>

　　</author>

　　</book>

　　<title>The Gorgias</title>

　　<name>Plato</name>

　　</author>

　　</book>

　　</bookstore>

　　我们可以对该XML文件中的price求和，以得到价格总数。

　　Evaluate.cs

　　//Corelib.net/System.Xml.Xsl/XPathNavigator Class

　　//Author :Any

　　using System;

　　using System.IO;

　　using System.Xml;

　　using System.Xml.XPath;

　　public class EvaluateSample

　　{

　　public static void Main()

　　{

　　EvaluateSample myEvaluateSample = new EvaluateSample();

　　myEvaluateSample.test("books.xml");

　　}

　　public void test(String args)

　　{

　　try

　　{

　　//test Evaluate(String);

　　XPathDocument myXPathDocument = new XPathDocument(args);

　　XPathNavigator myXPathNavigator = myXPathDocument.CreateNavigator();

　　Console.WriteLine(myXPathNavigator.Evaluate("sum(descendant::book/price)"));

　　//testEvaluate(XPathExpression);

　　XmlDocument doc = new XmlDocument();

　　doc.Load("order.xml");

　　XPathNavigator nav = doc.CreateNavigator();

　　XPathExpression expr = nav.Compile("sum(//price/text())");

　　Console.WriteLine(nav.Evaluate(expr));

　　//testEvaluate(XPathExpression);

　　XPathNodeIterator myXPathNodeIterator = nav.Select("descendant::book/title");

　　expr = nav.Compile("sum(//price/text())");

　　Console.WriteLine(nav.Evaluate(expr,myXPathNodeIterator));

　　}

　　catch (Exception e)

　　{

　　Console.WriteLine ("Exception: {0}", e.ToString());

　　}

　　运行这个程序，结果如下：

　　30.97

　　36.9

　　我们可以看到，30.97是books.xml中所有price值的总和，而36.9则是order.xml中所有price值的总和。通过XPAH不仅可以快速查找信息，而且还可以对信息进行一些基本的处理。

教程首页更多教程