谁知道梦想岛?为啥他的内容页可以防采集?
http://www.mmxxdd.com/mxd/pics/2008-07/21/pics_detail_5959_2.html如这个页面。
我连采集<title></title>之间的标题都采集不到。
http://www.mmxxdd.com/category.php?categ=pics&catid=15&page=1
这个是列表页,这里面的列表标题我都可以采集到。 可以看到源码,就可以采到 http://www.mmxxdd.com/mxd/pics/2008-07/21/pics_detail_5959_2.html
<title>可爱美女到冰箱里乘凉哦--梦想岛图片</title>
这行源码,是上面链接中的。
我想要采集这句话<title></title>之间的字,能做到么? 为什么各种系统都无法采集呢?
包括新云,帝国,织梦,动易,火车头。
我想要学习这种先进的防采集技术。不知道这个网站怎么做到这点的。 你截图上来,给你写个规则 明明是可以直接采集的,楼主一直说不行,其它采集器也不行,什么意思呢?
页:
[1]