采集分页遇到问题,请大家帮忙看看!
首先采集列表:http://www.cxdq.com/class/dhmh/dhmh01.htm
得到内容列表:
http://www.cxdq.com/2010/04-14/127120093125935.htm
http://www.cxdq.com/2010/03-11/126829162625594.htm
http://www.cxdq.com/2010/03-10/126820662125569.htm
.......
采集内容页:【标题】: 感觉中的婚姻模式
【内容】: <img border="0" alt="感觉中的婚姻模式" src="http://www.cxdq.com/d/file/2010/04-14/646f214919499cd1558341004dd279ab.jpg"/></p><p align="center"><img border="0" alt="感觉中的婚姻模式" src="http://www.cxdq.com/d/file/2010/04-14/4fd5a3b5062157047f68528b08694020.jpg"/></p>
【时间】: 2010-04-18 17:34:01写入分页连接符:
开始:<p align="center" class="pageLink"> 结束:</p>
得到结果:████████████████████████████████████
█此页面包含多个分页:
█1:http://www.cxdq.com/2010/04-14/127120093125935.htm
█2:http://www.cxdq.com/2010/04-14/127120093125935_2.htm
█3:http://www.cxdq.com/2010/04-14/127120093125935_3.htm
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
【作者】: www.xiyu.cc
【出处】:
【标题】: 感觉中的婚姻模式
【内容】: <img border="0" alt="感觉中的婚姻模式" src="http://www.cxdq.com/d/file/2010/04-14/646f214919499cd1558341004dd279ab.jpg"/></p><p align="center"><img border="0" alt="感觉中的婚姻模式" src="http://www.cxdq.com/d/file/2010/04-14/4fd5a3b5062157047f68528b08694020.jpg"/></p>
怪事儿来了!! 内容页可以采集到分页,但是分页内容没有采集回来;
█1:http://www.cxdq.com/2010/04-14/127120093125935.htm
█2:http://www.cxdq.com/2010/04-14/127120093125935_2.htm
█3:http://www.cxdq.com/2010/04-14/127120093125935_3.htm
这三个网页采集任何一个都能够正常采集,但是均无其他分页内容;和解?麻烦大家帮看看啊,感激不尽! 内容标签的循环使用,勾了吗?
页:
[1]