火车头可以对采集的URL地址有效进行判断吗?
小弟是菜鸟,有难题请教各位大侠:本人要采集一个网站,由于服务器端限制了sql查询的返回记录数,一次只能得到10页的记录列表,为了得到全部记录,我采用,直接用火车头给idvalue赋值的办法采集。地址示例:http://www.xxx.com/show.php?idvalue=XXXX&zt=X
但有个问题就是,url地址后一个参数zt=X有两种情况,值为1和2,有些内容页是1,有些内容页是2,如果是1的值给了2,就没有内容。
小弟跪求各位大侠,望指点,怎么通过火车头判断url是否有效?
页:
[1]