lugi4319 发表于 2009-7-10 15:01:21

关于使用火车头快速采集阿里巴巴两种模板的一点经验分享!

一直以来,采集阿里巴巴都比较麻烦,因为阿里巴巴的搜索企业用户网页有2种模板,导致我们定义规则的时候伤透了脑筋!
有没有一种方法,快速的解决这个问题呢?
答案是肯定的!

今天需要采集阿里巴巴的全部礼品,目标一共是1万多条。采集的时候还是发现有2种模板,仔细分析了N久,终于发现了,原来诚信通和非诚信通的模板不一样。

然后先把诚信通的采集掉,一种模板很好定制的。
接着采集全部的数据(没有非诚信通这个选项,呵呵),之前采集的因为重复全部过滤掉了!也是一种模板!
全部采集下来了,节省了不少时间。写个简单的回顾,分享给大家
加入有多种不同的模板,怎么写匹配呢?希望有高手回答!
谢谢!

lugi4319 发表于 2009-7-10 15:01:53

沙发自己坐

孤魂 发表于 2009-7-10 18:00:14

http://bbs.locoy.com/viewthread.php?tid=19720&highlight=%D5%FD%D4%F2%2B%BB%F0%B3%B5%CD%B7
页: [1]
查看完整版本: 关于使用火车头快速采集阿里巴巴两种模板的一点经验分享!