hegamcan 发表于 2011-5-20 11:48:56

如何获取这个列表?

http://www.foodqs.cn/expo/expo_list.asp?currentpage=2&act=国内&keyword=&startyear=&startmonth=&startday=&endyear=&endmonth=&endday=&country=&spearea=

采集地址:
http://www.foodqs.cn/expo/expo_list.asp?currentpage=(*)&act=国内&keyword=&startyear=&startmonth=&startday=&endyear=&endmonth=&endday=&country=&spearea=

手动填写地址规则

脚本规则:
·<a href='[参数]' target='_blank'>(*)</a>

实际连接:
http://www.foodqs.cn/expo/[参数1]


测试的时候一个连接都无法找到,为什么呢?

272070210 发表于 2011-5-20 12:05:53

这种应该行的呀。规则贴上来看看。

hegamcan 发表于 2011-5-20 12:46:16





网址列表都无法获取...规则上来说应该是可以的

trojan2005 发表于 2011-5-20 12:52:03

这个还不简单嘛,很容易的。

hegamcan 发表于 2011-5-20 12:56:01

这个还不简单嘛,很容易的。
trojan2005 发表于 2011-5-20 12:52 http://bbs.locoy.com/images/common/back.gif

刚开始我也这么想,问题是到最后就是采集不到!!!

广交朋友四海 发表于 2011-5-20 13:21:06

在又谁叫下我用采集器我693723805

广交朋友四海 发表于 2011-5-20 13:21:41

有谁教下我用采集器693723805用钱换技术10元起

hegamcan 发表于 2011-5-20 17:12:55

有能帮忙解决下的么?

zhouchanglin 发表于 2011-5-20 18:14:12

好像是网址包含中文字符 :国内,需要urlencode编码,
不编码测试:火车头,用源代码查看器查看中文也可以正确请求道数据,内容页就不行,好像要以内容页测试为主;

国内编码后:%B9%FA%C4%DA,地址http://www.foodqs.cn/expo/expo_list.asp?currentpage=1&act=%B9%FA%C4%DA&keyword=&startyear=&startmonth=&startday=&endyear=&endmonth=&endday=&country=&spearea=,在火车头测试效果图,网页没有出错,不清楚火车头对网址中文怎么编码的,可能可以设置火车头,避免中文出问题

所以你只要把网址里国内替换为%B9%FA%C4%DA就可以采到

hegamcan 发表于 2011-5-21 09:57:58

哦,原来是这样,谢谢啦!
页: [1]
查看完整版本: 如何获取这个列表?