关于使用火车头快速采集阿里巴巴两种模板的一点经验分享!
一直以来,采集阿里巴巴都比较麻烦,因为阿里巴巴的搜索企业用户网页有2种模板,导致我们定义规则的时候伤透了脑筋!有没有一种方法,快速的解决这个问题呢?
答案是肯定的!
今天需要采集阿里巴巴的全部礼品,目标一共是1万多条。采集的时候还是发现有2种模板,仔细分析了N久,终于发现了,原来诚信通和非诚信通的模板不一样。
然后先把诚信通的采集掉,一种模板很好定制的。
接着采集全部的数据(没有非诚信通这个选项,呵呵),之前采集的因为重复全部过滤掉了!也是一种模板!
全部采集下来了,节省了不少时间。写个简单的回顾,分享给大家
加入有多种不同的模板,怎么写匹配呢?希望有高手回答!
谢谢! 沙发自己坐 http://bbs.locoy.com/viewthread.php?tid=19720&highlight=%D5%FD%D4%F2%2B%BB%F0%B3%B5%CD%B7
页:
[1]