wgz118531 发表于 2010-9-17 23:25:31

采集分页遇到脑袋都晕了的bug

我采集的是淘宝客的分页吗,<dd class="single_pro_name"><a target="_blank" href=" http://item.taobao.com:80/item.htm?id=6217796960 ">原装正品/三星F488E 全屏触摸 500W相素 特价销售</a></dd> 。我要采集的网址其实就是 “http://item.taobao.com:80/item.htm?id=6217796960 ”。
我用代码<dd class="single_pro_name"><a target="_blank" href="为开始,以">为结尾。这样的话,我们采集出来应该是“http://item.taobao.com:80/item.htm?id=6217796960 “这个的。但是遇到了很蛋疼的事件,弄了一晚没搞清楚,看图:
。看到了吧,没有后面的数字,直接在ID的时候就停下了,莫名奇妙的就忽略了数据ID了。悲剧到了~~

zjyk1984 发表于 2010-9-18 18:12:29

规则的问题,写对的话就可以了

进入日本 发表于 2010-9-20 19:27:58

这种情况一般是没采到那个参数,你看下样式末尾有没有多余的空格或回车。
页: [1]
查看完整版本: 采集分页遇到脑袋都晕了的bug