学好正则的结果是什么?
是否学好正则在理论上就是可以采集任何一种资源???ali35ls 差不多!比如,可以采集到 手机号,按13开头11位数的,邮箱地址什么的! 那如果是被脚本隐藏的真实地址呢?
如:<SCRIPT language="javascript" type="text/javascript" >
<!--//
document.writeln('<objectwidth="100%" height="100%" classid=clsid:d27cdb6e-ae6d-11cf-96b8-444553540000 type="application/x-shockwave-flash">');
document.writeln('<PARAM NAME="movie" VALUE="http://www.sfefs.com/player/player.swf?iid='+url+'">');
这类的地址,它是不是就是在“iid"后面隐藏了真实地址?用正则的方法是否可以得到?
[ 本帖最后由 lxfh985ii 于 2007-12-7 10:15 编辑 ] 以上这个是用javascript 写的flash播放文件,它的文件地址是在 swf?iid='+url+'">');的 url 中。如果你细心的搜索页面,肯定会发现有这样一个变量var url=*******.swf。这个就是你要的文件的地址。
正则只能在特定情况下使用,比如你需要截取某个字符串的前多少个字符。举例来说 “中国发现一颗恒星--搜狐新闻”和"冬季应该这样护理宝宝--搜狐亲子“ 这样两个title。如果你简单的replace,显然不能过滤掉 "搜狐新闻"和"搜狐亲子",这个时候用正则就可以解决问题,正则匹配"--"前面的字段就可以了。
当然,正则不是万能的。正则在验证的时候最有效。 楼上的,你说的不错,但我并没有找到它的这个变量参数啊~~如果有,就出现了,我现在就是烦在如何分析出它的真实地址???在除了找软件之外,我在想如果用正则可以找到吗??
从以下代码中可以发现什么吗?
<!--//
document.writeln('<objectwidth="100%" height="100%" classid=clsid:d27cdb6e-ae6d-11cf-96b8-444553540000 type="application/x-shockwave-flash">');
document.writeln('<PARAM NAME="movie" VALUE="http://www.ssdfe.com/player/player.swf?iid='+url+'">');
document.writeln('<PARAM NAME="allowFullScreen" VALUE="true">');
document.writeln('<PARAM NAME="allowScriptAccess" VALUE="sameDomain">');
document.writeln('<PARAM NAME="flashvars" VALUE="id='+url+'">');
document.writeln('<PARAM NAME="wmode" VALUE="transparent">');
document.writeln('<embedsrc="http://www.ssdfe.com/player/player.swf?iid='+url+'" type="application/x-shockwave-flash" width="100%" height="100%" allowFullScreen="true" allowScriptAccess="sameDomain" flashvars="'+url+'"></embed>');
document.writeln('</OBJECT>');
//--> 你复制的这一段仍然只是一个播放程序,并没有url的值。你把网页地址发过来,我帮你看看。 是的,因为我好像在那里看到不URL的值~~ali42ls <SCRIPT language=JavaScript>
<!--
url ="9712712";
//-->
</SCRIPT>
嘿嘿,你没有注意用搜索吧,我一眼就看到了,这个网页代码很简单的。 晕,他们也采集的啊。采集土豆,呵呵。 最终的网址 http://www.tudou.com/player/player.swf?iid=9712712
页:
[1]
2