|
|
本帖最后由 bdtmgk 于 2010-1-31 21:47 编辑
今天无意中碰到一个采集,本来很简单的,
原始页面:http://www.liangchan.net/liangchan/682.html
然后http://www.liangchan.net/soft/softdown.asp?softid=682
多页面采集到了下载地址
如:http://www.liangchan.net/soft/download.asp?softid=682&downid=2&id=681
按以前的规律,得到这个地址即可下载。
但是把这个地址采集到我的站然后打开显示无此页面或者被删除。
网上搜了下据说是对方做了防盗链。
然后学些着用httpnanlyzerstdV5做了查看。发现确实是做了防采集。
因为我以前只是看到过并没有接触这样的采集。
那个ttt.js内容为
document.writeln("<script src=\"http://p.9vcpm.cn:8080/code/popjs.asp?uid=36071&tid=35&l=0&m=0&c=4\"></script>");
ttt.js下面的链接的response content内容为;
if(document.all.pop9vcodeflg){document.writeln('9V:Repeat code is not allowed!');}else{document.write ('<input type=hidden name=pop9vcodeflg>');var ref;try{ref=window.top.document.referrer;}catch(err){ref=document.referrer;}ref=ref.replace('http://','');ref=escape(ref).replace(/%/g,'9v9');var pU_9v ="http://p.9vcpm.cn:8080/code/pop_data3.asp?f=36071&t=35&a=2170&p=f872b378ad53fcfd3cd5512f0accbece&k=95S8SUE78DCE&u=www9v92Eliangchan9v92Enet9v92Fsoft9v92Fsoftdown9v92Easp9v93Fsoftid9v93D682&ref="+ref;var pU_9v_click ="http://p.9vcpm.cn:8080/code/pop_data3.asp?f=36071&t=35&a=2340&p=f872b378ad53fcfd3cd5512f0accbece&k=95S8SUE78DCE&u=www9v92Eliangchan9v92Enet9v92Fsoft9v92Fsoftdown9v92Easp9v93Fsoftid9v93D682&ref="+ref;var nOi_9v = "1";var nl_9v = "0";var adc_9v = "2170";var wpop_9v = screen.width;var hpop_9v = screen.height;function ext9v()
{
iie9vexitpop.launchURL(pU_9v);
}
document.write("<object id=iie9vexitpop width=0 height=0 classid='CLSID:6BF52A52-394A-11D3-B153-00C04F79FAA6'></object>");
eval("window.attachEvent('onunload',ext9v);");
}
然后下面的http://www.liangchan.net/soft/download.asp?softid=682&downid=2&id=681
链接产生的response content为:
<script src="http://ufile.kuaiche.com/Flashget_union.php?fg_uid=12233"></script>
<script>function ConvertURL2FG(url,fUrl,uid){ try{ FlashgetDown(url,uid); }catch(e){ location.href = fUrl; }}
function Flashget_SetHref(obj){obj.href = obj.fg;}</script>
<script>ConvertURL2FG('Flashget://W0ZMQVNIR0VUXWh0dHA6Ly9kb3duLmRydjUuY24vd3d3LmRydjUuY24vVjEuNjUuMjguMS5yYXJbRkxBU0hHRVRd&12233','http://down.drv5.cn/www.drv5.cn/V1.65.28.1.rar',12233)</script>
在这个response content中才真正包含了这个下载地址。
我采集的http://www.liangchan.net/soft/download.asp?softid=682&downid=2&id=681根本没有用。
请问高手,这样的站如何采集!还有这个httpanaly软件中包含的head 和response content是这么回事,
如何采集reponse content内容? |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?加入会员
x
|