国外防止采集的新技术
很多国外网站的图片都是这种形式<img id=11>,而在下面有个js,就是id11=111.jpg,大概这样的例子,请问这样的该如何采集,一个页面可能有n个id=xx这样的 通过js往属性里面赋值。您直接采集并解析这个js得到图片的地址不就行了? 这个中间涉及一个替换,就是不知道怎么写,直接采js,图片在文章中的位置就对不上了,这是关键! 找出ID和图片文件名对应规律,替换就可以了吧 这不是防采集吧,呵呵。防采直接封你ip N小时 不会封IP的,关键是在一个页面中怎么替换呢? 大概就是这个样子的:<p><img id='ll_4' /></p>
中间有文字内容
<p><img id='ll_5' /></p>
<script language='JavaScript'>
var imgGroup = new YAHOO.util.ImageLoader.group(window, 'scroll');
imgGroup.foldConditional = true;
imgGroup.addTrigger(window, 'resize');
imgGroup.registerSrcImage('ll_4', 'http://ezinearicles.com/ap_F23_20100106022945883.jpg?TT0hswLB03w8zAIp');
imgGroup.registerSrcImage('ll_5', 'http://ezinearicles.com/ap_F23_20100106022945883.jpg?TT0hswLB0358zAIp'); 很实在的例子。。同求! 有人解决了吗?写个详细点的方法出来看下!!!真的不懂怎么采集这个网.. 第一种方法:新建一个标签,把JS 也一起采集放在页面上;
第二种方法:采集页面上的图片ID,然后在数据库中用第三方程序写转换程序(很常用,一般对内容的处理要求更人性化)
页:
[1]
2