火车采集器V2008版更新[2008-08-08][火车车厢管理制度]论坛活跃、奖励计划http://domain.locoy.com火车采集器高级版本在线订购高级版本功能及技术支持列表
返回列表 回复 发帖

如何用正则表达式自定义标签采集文章所属的栏目?

比如这个页面, http://www.emkt.com.cn/article/259/25922.html
中国营销传播网 > 经营战略 > 产业观察 > 连锁业态已对家电制造业造成深度损伤
所属栏目就是产业观察,
如何先去掉超级链接,然后得到产业观察这个栏目;
不明白。你是想采“产业观察”这个栏目下的文章吗?

谢谢管理员回复

我其实是想直接对着更新列表采集,因为更新列表里面包含着各个栏目的新闻,所有我必须的采集出这个新闻所属的栏目,比如这个页面http://www.boraid.com/darticle3/index.asp,包含所有文章,我如何可以采集到每个文章的栏目,就没必要非的一个栏目建立一个链接,直接采集就是了,不知道说明白没有

是不是我表达不够明确还是你们不懂阿?我郁闷了

再说一遍,目标网站有100个栏目,如果用常规办法是不是要建立100次采集规则才行阿,
因为每次只能采集一个栏目,对应我们自己网站一个栏目..
现在情况是好多网站都有更新列表, 我们可以直接采集更新列表,但是问题出来了,更新列表包含了目标网站所有栏目得文章,不可能只入到我们网站得某一个栏目,所以只能先采集到这个文章所属得栏目,然后根据对应关系入到我们自己网站上得各个栏目内, 具体参考上个帖子说得,
不知道这次说明白没?
那就不能用在线发表了,你采集完栏目名称后,用sql导出功能

哈哈,是得是得,兄弟终于明白了我得意思了,

现在问题是如何能采集到所属得栏目呢?http://www.boraid.com/darticle3/index.asp
以这个网址为例子,写个规则出来让我把所属得栏目给采集了吧?谢谢了呵呵
还没有那么自动化的工具
这个http://www.boraid.com/darticle3/index.asp上面的信息不足够区分哪个标题是属于哪个栏目的
还是要自己动手一个栏目一个栏目采
期待2.0解决重复发布的问题
感谢火车提供这么好到工具!
返回列表
售前客服QQ: 火车采集器客服 rq204, 火车采集器客服 飞越无限火车采集器客服 孤魂火车采集器客服 尘缘, 联系电话:0551-3495249(技术合作问题) 023-58436018 (08:00-20:00-客服),0752-2553545(09:00-20:00-客服)