分页时 怎么吧 抓取内容的页码数字 去掉阿??
例子: 杨楠:黄金期货的开户是在期货公司来开,全国各地的期货公司总公司还有营业部都可以给大家办理黄金期货的开户手续。黄金期货属于商品期货,他的开户相对手续比较简单,不像股指期货这么复杂,只需要你提供本人的身份证,还有银行卡那么填相应的资料和合同那么就可以开立一个帐户。1234下一页主持人:这个时候我们关注一下短信平台来自哈尔滨的3331的朋友问到的是请问黄金期货如何开户,在哪里开立帐户呢?
那中间的1234页 及下一页怎么处理阿?
我想找到一个采集规则对没有分页的网页也可以用。。
有分页的网页地址http://gold.hexun.com/2011-03-16/127961207.html
没有分页的网址http://gold.hexun.com/2011-03-18/128017142.html <div id='pageNext'>(*)下一页这个用过滤就行了
页:
[1]