|
1火车车厢
████████████████████████████████████
█此页面包含多个分页:
█1:http://www.***.com/article/2008/0911/photoshop_31040.html
█2:http://www.***.com/article/2008/0911/photoshop_31040_1.html
█3:http://www.***.com/article/2008/0911/photoshop_31040_2.html
█4:http://www.***.com/article/2008/0911/photoshop_31040_3.html
█5:http://www.***.com/article/2008/0911/photoshop_31040_4.html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
其中
█1:http://www.***.com/article/2008/0911/photoshop_31040.html
█2:http://www.***.com/article/2008/0911/photoshop_31040_1.html
其实是相同的内容,结果我采集回来就相当于第一页重复了,这个如何解决,谢谢!
采集发表的效果如下:http://www.sjgogo.com/html/jc/ps/200810/23-8471.html
[ 本帖最后由 sjgogo 于 2008-10-23 20:35 编辑 ] |
最佳答案
查看完整内容
上一页 1 2 3 4 下一页
这个是你采集的页面,我看了一下,你把采集规则改一下应该就可以了,分页区域头部改成从“上一页”到“下一页”,就把31040_1html这个页面去掉了,你去尝试一下吧,在单位没有火车,只是看了一下页面,还有就是提问题把地址列出来,不要用*号,要不怎么去给你解答问题,采集的页面就已经把原地址列出来了,还用*号干什么,这样提问题以后大概没有人会想给你解决的。 ...
|