请教一下网址规则,谢谢!
象这样的网址:http://www.zwpop.com/viewthread.php?tid=3111&extra=page%3D1&page=2
我怎么样设计规则,采集的时候,网址实际上采集的是:
http://www.zwpop.com/viewthread.php?tid=3111
把后面的&extra=page%3D1&page=2去掉呢? 网址中不包括extra 我知道,可是我按照你说的搜索然后采集我指定的某一部小说,但是搜索后的产生的网址中都没有含extra=的。
所有测试到的网址都是类似于:
viewthread.php?tid=258662&page=3
后面都是page=多少的。
这样的。所以我需要把tid=258662后面的那些东东,在正式采集的时候,从网址里给删除,请问这样的规则,如何写? 谢谢rq204,已经解决这个问题。
页:
[1]