sjgogo 发表于 2008-10-23 20:33:01

分页采集的问题

████████████████████████████████████
█此页面包含多个分页:
█1:http://www.***.com/article/2008/0911/photoshop_31040.html
█2:http://www.***.com/article/2008/0911/photoshop_31040_1.html
█3:http://www.***.com/article/2008/0911/photoshop_31040_2.html
█4:http://www.***.com/article/2008/0911/photoshop_31040_3.html
█5:http://www.***.com/article/2008/0911/photoshop_31040_4.html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
其中
█1:http://www.***.com/article/2008/0911/photoshop_31040.html
█2:http://www.***.com/article/2008/0911/photoshop_31040_1.html
其实是相同的内容,结果我采集回来就相当于第一页重复了,这个如何解决,谢谢!

采集发表的效果如下:http://www.sjgogo.com/html/jc/ps/200810/23-8471.html

[ 本帖最后由 sjgogo 于 2008-10-23 20:35 编辑 ]

追风 发表于 2008-10-23 20:33:02

<!--自定义字段-->
<!--分页--><div class="pages"><a href="/article/2008/0911/photoshop_31040_1.html">上一页</a> <strong>1</strong> <a href="/article/2008/0911/photoshop_31040_2.html">2</a> <a href="/article/2008/0911/photoshop_31040_3.html">3</a> <a href="/article/2008/0911/photoshop_31040_4.html">4</a><a href="/article/2008/0911/photoshop_31040_2.html">下一页</a>
这个是你采集的页面,我看了一下,你把采集规则改一下应该就可以了,分页区域头部改成从“上一页”到“下一页”,就把31040_1html这个页面去掉了,你去尝试一下吧,在单位没有火车,只是看了一下页面,还有就是提问题把地址列出来,不要用*号,要不怎么去给你解答问题,采集的页面就已经把原地址列出来了,还用*号干什么,这样提问题以后大概没有人会想给你解决的。

sjgogo 发表于 2008-10-24 19:19:09

追风你好,因为是采集别人的总感觉不好意思,所以就打了*号,我按你的方法试了还是不行
分页代码如下:
<!--自定义字段-->
<!--分页--><div class="pages"><a href="/article/2008/0911/photoshop_31040_1.html">上一页</a> <strong>1</strong> <a href="/article/2008/0911/photoshop_31040_2.html">2</a> <a href="/article/2008/0911/photoshop_31040_3.html">3</a> <a href="/article/2008/0911/photoshop_31040_4.html">4</a><a href="/article/2008/0911/photoshop_31040_2.html">下一页</a></div>

<div class="GadLink">

我在分页规则中开始:上一页,到:下一页结果如下:
████████████████████████████████████
█此页面包含多个分页:
█1:http://www.jcwcn.com/article/2008/0911/photoshop_31040.html
█2:http://www.jcwcn.com/article/2008/0911/photoshop_31040_2.html
█3:http://www.jcwcn.com/article/2008/0911/photoshop_31040_3.html
█4:http://www.jcwcn.com/article/2008/0911/photoshop_31040_4.html
█5:http://www.jcwcn.com/article/2008/0911/photoshop_31040_1.html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████

sjgogo 发表于 2008-10-24 19:22:33

谢谢追风,问题解决了

追风 发表于 2008-10-24 23:27:53

能解决就好,希望能继续帮助大家
页: [1]
查看完整版本: 分页采集的问题