workey 发表于 2008-7-29 14:09:06

谁知道梦想岛?为啥他的内容页可以防采集?

http://www.mmxxdd.com/mxd/pics/2008-07/21/pics_detail_5959_2.html

如这个页面。
我连采集<title></title>之间的标题都采集不到。

http://www.mmxxdd.com/category.php?categ=pics&catid=15&page=1
这个是列表页,这里面的列表标题我都可以采集到。

rq204 发表于 2008-7-29 14:22:52

可以看到源码,就可以采到

workey 发表于 2008-7-29 14:28:42

http://www.mmxxdd.com/mxd/pics/2008-07/21/pics_detail_5959_2.html
<title>可爱美女到冰箱里乘凉哦--梦想岛图片</title>
这行源码,是上面链接中的。

我想要采集这句话<title></title>之间的字,能做到么?

workey 发表于 2008-7-29 14:30:26

为什么各种系统都无法采集呢?
包括新云,帝国,织梦,动易,火车头。
我想要学习这种先进的防采集技术。不知道这个网站怎么做到这点的。

chyy 发表于 2008-7-29 15:44:00

你截图上来,给你写个规则

rq204 发表于 2008-7-29 16:16:40

明明是可以直接采集的,楼主一直说不行,其它采集器也不行,什么意思呢?
页: [1]
查看完整版本: 谁知道梦想岛?为啥他的内容页可以防采集?