火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 5235|回复: 4

分页采集的问题

[复制链接]
发表于 2008-10-23 20:33:01 | 显示全部楼层 |阅读模式
1火车车厢
████████████████████████████████████
█此页面包含多个分页:
█1:http://www.***.com/article/2008/0911/photoshop_31040.html
█2:http://www.***.com/article/2008/0911/photoshop_31040_1.html
█3:http://www.***.com/article/2008/0911/photoshop_31040_2.html
█4:http://www.***.com/article/2008/0911/photoshop_31040_3.html
█5:http://www.***.com/article/2008/0911/photoshop_31040_4.html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
其中
█1:http://www.***.com/article/2008/0911/photoshop_31040.html
█2:http://www.***.com/article/2008/0911/photoshop_31040_1.html
其实是相同的内容,结果我采集回来就相当于第一页重复了,这个如何解决,谢谢!

采集发表的效果如下:http://www.sjgogo.com/html/jc/ps/200810/23-8471.html

[ 本帖最后由 sjgogo 于 2008-10-23 20:35 编辑 ]

最佳答案

查看完整内容

上一页 1 2 3 4 下一页 这个是你采集的页面,我看了一下,你把采集规则改一下应该就可以了,分页区域头部改成从“上一页”到“下一页”,就把31040_1html这个页面去掉了,你去尝试一下吧,在单位没有火车,只是看了一下页面,还有就是提问题把地址列出来,不要用*号,要不怎么去给你解答问题,采集的页面就已经把原地址列出来了,还用*号干什么,这样提问题以后大概没有人会想给你解决的。 ...
发表于 2008-10-23 20:33:02 | 显示全部楼层
<!--自定义字段-->
<!--分页--><div class="pages"><a href="/article/2008/0911/photoshop_31040_1.html">上一页</a> <strong>1</strong> <a href="/article/2008/0911/photoshop_31040_2.html">2</a> <a href="/article/2008/0911/photoshop_31040_3.html">3</a> <a href="/article/2008/0911/photoshop_31040_4.html">4</a>  <a href="/article/2008/0911/photoshop_31040_2.html">下一页</a>
这个是你采集的页面,我看了一下,你把采集规则改一下应该就可以了,分页区域头部改成从“上一页”到“下一页”,就把31040_1html这个页面去掉了,你去尝试一下吧,在单位没有火车,只是看了一下页面,还有就是提问题把地址列出来,不要用*号,要不怎么去给你解答问题,采集的页面就已经把原地址列出来了,还用*号干什么,这样提问题以后大概没有人会想给你解决的。
 楼主| 发表于 2008-10-24 19:19:09 | 显示全部楼层
追风你好,因为是采集别人的总感觉不好意思,所以就打了*号,我按你的方法试了还是不行
分页代码如下:
<!--自定义字段-->
<!--分页--><div class="pages"><a href="/article/2008/0911/photoshop_31040_1.html">上一页</a> <strong>1</strong> <a href="/article/2008/0911/photoshop_31040_2.html">2</a> <a href="/article/2008/0911/photoshop_31040_3.html">3</a> <a href="/article/2008/0911/photoshop_31040_4.html">4</a>  <a href="/article/2008/0911/photoshop_31040_2.html">下一页</a></div>

<div class="GadLink">

我在分页规则中开始:上一页,到:下一页结果如下:
████████████████████████████████████
█此页面包含多个分页:
█1:http://www.jcwcn.com/article/2008/0911/photoshop_31040.html
█2:http://www.jcwcn.com/article/2008/0911/photoshop_31040_2.html
█3:http://www.jcwcn.com/article/2008/0911/photoshop_31040_3.html
█4:http://www.jcwcn.com/article/2008/0911/photoshop_31040_4.html
█5:http://www.jcwcn.com/article/2008/0911/photoshop_31040_1.html
█有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配]
████████████████████████████████████
 楼主| 发表于 2008-10-24 19:22:33 | 显示全部楼层
谢谢追风,问题解决了
发表于 2008-10-24 23:27:53 | 显示全部楼层
能解决就好,希望能继续帮助大家
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-24 14:31

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表