如何获取这个列表?
http://www.foodqs.cn/expo/expo_list.asp?currentpage=2&act=国内&keyword=&startyear=&startmonth=&startday=&endyear=&endmonth=&endday=&country=&spearea=采集地址:
http://www.foodqs.cn/expo/expo_list.asp?currentpage=(*)&act=国内&keyword=&startyear=&startmonth=&startday=&endyear=&endmonth=&endday=&country=&spearea=
手动填写地址规则
脚本规则:
·<a href='[参数]' target='_blank'>(*)</a>
实际连接:
http://www.foodqs.cn/expo/[参数1]
测试的时候一个连接都无法找到,为什么呢? 这种应该行的呀。规则贴上来看看。
网址列表都无法获取...规则上来说应该是可以的 这个还不简单嘛,很容易的。 这个还不简单嘛,很容易的。
trojan2005 发表于 2011-5-20 12:52 http://bbs.locoy.com/images/common/back.gif
刚开始我也这么想,问题是到最后就是采集不到!!! 在又谁叫下我用采集器我693723805 有谁教下我用采集器693723805用钱换技术10元起 有能帮忙解决下的么? 好像是网址包含中文字符 :国内,需要urlencode编码,
不编码测试:火车头,用源代码查看器查看中文也可以正确请求道数据,内容页就不行,好像要以内容页测试为主;
国内编码后:%B9%FA%C4%DA,地址http://www.foodqs.cn/expo/expo_list.asp?currentpage=1&act=%B9%FA%C4%DA&keyword=&startyear=&startmonth=&startday=&endyear=&endmonth=&endday=&country=&spearea=,在火车头测试效果图,网页没有出错,不清楚火车头对网址中文怎么编码的,可能可以设置火车头,避免中文出问题
所以你只要把网址里国内替换为%B9%FA%C4%DA就可以采到 哦,原来是这样,谢谢啦!
页:
[1]