火车头采集器怎样导入采集规则 by 9SiR
自从开始承接数据采集业务以来,定制火车头采集规则的客户特别多,其中很大一部分都是新手朋友们,连怎样导入规则都不会,经常需要发起远程协助,有的甚至干脆付费代采数据。为了减少不必要的麻烦,也为了减少客户不必要的代采数据费用,今天在此写个简单教程,仅供大家参考。本文系百度经验系列教材《9SiR火车头采集器教程》欢迎前往查阅http://jingyan.baidu.com/article/c14654134cf5d30bfdfc4c68.html
1、新建分组
如果已经存在分组可跳过此步骤。依次点击菜单栏“分组”->“新建分组”,在弹出对话框中所属分组选择“根节点”(也可选择其他分组),填上“分组名称”,“分组备注”可以不用填。
2、导入规则方法一
右键点击刚才新建的分组,选择“导入任务至该分组”(记住:不是“导入分组规则”),在弹出的对话框中选择已经采集规则文件(后缀为.ljobx)。
3、导入规则方法二
也可以选择刚才新建的分组,然后依次点击菜单“分组”->“导入任务至该分组” 在弹出的对话框中选择已经采集规则文件(后缀为.ljobx)。
4、导入分组规则
如果你手上的规则文件后缀名为“.lgrp”,那么你需要通过菜单或右键快捷菜单选择“导入分组规则”,而不是“导入任务至该分组”。
5、开始采集数据
勾选“采网址”、“采内容”和“发布”复选框,点击开始即可开始采集数据,待数据采集完成后会自动发布(需要事先写好发布规则)。
注意:
初次采集建议分步进行。先采网址,之后再采内容,最后再发布。
如需重新采集,需要先清空网址库和所有采集数据。
如果在数据采集规则发布模块插件开发等方面有疑问,欢迎与我联系。
晕死,居然不能发图片。
页:
[1]