【加急】像大旗网的这种JS转换后的地址规则该如何写?
站点地址:http://shehui.daqi.com/editor/pic1/9006/index.html采到的地址为:http://shehui.daqi.com/bbs/00/2122633.html
但点击进入后却通过JS把地址转成了:http://shehui.daqi.com/editor/huandeng/ent_huandeng/2122633/1.html
于是就只能采到第一页的图片了,后面分页的图片一个都采不到
如果把采集地址设为 http://shehui.daqi.com/editor/huandeng/ent_huandeng/2122633/(*).html倒是可以全部采集,可这样一次就只能采集一篇文章了
2122633这个又是不确定的,搞了几天都没搞定,这个规则谁知道应该咋写??? 写一个分页采集不知道怎么样。
页:
[1]