火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2814|回复: 3

请教一下网址规则,谢谢!

[复制链接]
发表于 2007-11-8 14:51:17 | 显示全部楼层 |阅读模式
象这样的网址:
http://www.zwpop.com/viewthread. ... page%3D1&page=2


我怎么样设计规则,采集的时候,网址实际上采集的是:
http://www.zwpop.com/viewthread.php?tid=3111

把后面的&extra=page%3D1&page=2去掉呢?
发表于 2007-11-8 15:17:46 | 显示全部楼层
网址中不包括extra
 楼主| 发表于 2007-11-8 15:30:48 | 显示全部楼层
我知道,可是我按照你说的搜索然后采集我指定的某一部小说,但是搜索后的产生的网址中都没有含extra=的。

所有测试到的网址都是类似于:
viewthread.php?tid=258662&page=3
后面都是page=多少的。
这样的。所以我需要把tid=258662后面的那些东东,在正式采集的时候,从网址里给删除,请问这样的规则,如何写?
 楼主| 发表于 2007-11-8 16:20:11 | 显示全部楼层
谢谢rq204,已经解决这个问题。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-5-23 19:22

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表