javascript过滤危险脚本方法

  下面是他们的字符串规则:

  1、<(script|link|style|iframe)(.|\n)*<\/\1>\s*

  2、\s*on[a-z]+\s*=\s*("[^"]+"|'[^']+'|[^\s]+)\s*(?=>)

  3、\s*(href|src)\s*=\s*("\s*(javascript|vbscript):[^"]+"|'\s*(javascript|vbscript):[^']+'|(javascript|vbscript):[^\s]+)\s*(?=>)

  4、epression\((.|\n)*\);?

  了解他们的规则后,抓虫行动就水到渠成。

  

   [Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]

  

   [Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]

  

   [Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]

  

   [Ctrl+A 全选 注:如需引入外部Js需刷新才能执行]

  这样调用就可以

  k1(k2(k3(k4(str))))

  这样就是单纯地过滤脚本而已,所谓过滤“危险脚本”应该是能够判断哪些属于“危险"脚本,不危险的就不过滤才对……那可就难办了,相当于防火墙了。