einstein33 发表于 2013-4-1 22:38:51

求51job规则,具体见正文

1、入口是www.51job.com

2、把这个网站的所有网址解析出来,但是我最终只要这种格式的网址,如:http://search.51job.com/job/54819644,c.html(一定是这种格式的保留下来啊)

3、抓取里面的内容,如公司名称、公司行业……

注:千万别告诉我通过搜索关键字,得出类似这样的网址http://search.51job.com/list/%2B,%2B,%2B,%2B,%2B,%2B,%25CA%25FD%25BF%25D8%25B3%25B5%25B9%25A4,2,%2B.html?lang=c&stype=1,然后再抓取,因为有太多的关键字了,伤不起啊,谢谢

303718 发表于 2013-4-10 08:50:01

没有列表又没有什么规律基本是采不到的
页: [1]
查看完整版本: 求51job规则,具体见正文