VipHero 发表于 2007-11-8 14:51:17

请教一下网址规则,谢谢!

象这样的网址:
http://www.zwpop.com/viewthread.php?tid=3111&extra=page%3D1&page=2


我怎么样设计规则,采集的时候,网址实际上采集的是:
http://www.zwpop.com/viewthread.php?tid=3111

把后面的&extra=page%3D1&page=2去掉呢?

rq204 发表于 2007-11-8 15:17:46

网址中不包括extra

VipHero 发表于 2007-11-8 15:30:48

我知道,可是我按照你说的搜索然后采集我指定的某一部小说,但是搜索后的产生的网址中都没有含extra=的。

所有测试到的网址都是类似于:
viewthread.php?tid=258662&page=3
后面都是page=多少的。
这样的。所以我需要把tid=258662后面的那些东东,在正式采集的时候,从网址里给删除,请问这样的规则,如何写?

VipHero 发表于 2007-11-8 16:20:11

谢谢rq204,已经解决这个问题。
页: [1]
查看完整版本: 请教一下网址规则,谢谢!