实例分析js和C#中使用正则表达式匹配a标签

  废话不多说,都在代码中,直接上

  JS代码:

  

复制代码 代码如下:

  <html>

  <head>

  <script language="javascript">

  var a='<P><A href=\'~abc/ccg/ab.jpg\' width="3">文字</A><A width="4" style="color:#ddd; font-weight:bold;" mm_href="http:www.baidu.com"  href="http://bbs.cn.yimg.com/user_img/200701/31/soso1.jpg" mce_href="http://bbs.cn.yimg.com/user_img/200701/31/jisuanji986_117025184198149.jpg">cc</A> href="www.baidu.com" cbas <span>cchref</span> 1<a dd href="ccc"  <A width="5" href="http://bbs.cn.yimg.com/user_img/200701/31/soso2.jpg" mce_href="http://bbs.cn.yimg.com/user_img/200701/31/cc.jpg"></A></P>';

  var b=/<a([\s]+|[\s]+[^<>]+[\s]+)href=(\"([^<>"\']*)\"|\'([^<>"\']*)\')[^<>]*>/gi;

  var s=a.toLowerCase().match(b);

  alert(s.length);

  for(var i= 0;i<s.length;i++)

  {

  var ss = s[i].toLowerCase().match(b);

  alert(RegExp.$3+RegExp.$4);

  }

  </script>

  </head>

  <body>

  </body>

  </html>

  C#代码:

  

复制代码 代码如下:

  string html = "<P><A href='~abc/ccg/ab.jpg' height=\"4\" width='3' >文字</A><A width=\"4\" style=\"color:#ddd; font-weight:bold;\" mm_href=\"http:www.baidu.com\"  href=\"http://bbs.cn.yimg.com/user_img/200701/31/soso1.jpg\" mce_href=\"http://bbs.cn.yimg.com/user_img/200701/31/jisuanji986_117025184198149.jpg\">cc</A> href=\"www.baidu.com\" cbas <span>cchref</span>  1<a df href=\"cc\"   <A width=\"5\" href=\"http://bbs.cn.yimg.com/user_img/200701/31/soso2.jpg\" mce_href=\"http://bbs.cn.yimg.com/user_img/200701/31/cc.jpg\"></A></P>";

  Regex reg = new Regex("<a([\\s]+|[\\s]+[^<>]+[\\s]+)href=(\"(?<href>[^<>\"']*)\"|'(?<href>[^<>\"']*)')[^<>]*>", RegexOptions.IgnoreCase);

  MatchCollection matchCollection = reg.Matches(html);

  MessageBox.Show(matchCollection.Count.ToString());

  foreach (Match match in matchCollection)

  {

  MessageBox.Show(match.Groups["href"].ToString());

  }

  小伙伴们是否了解了js及C#中使用正则表达式的异同点呢?有疑问的请留言,大家共同讨论。