火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
楼主: vus520

推荐教程:10分钟扒掉多特软件站全站,20视频教程

 关闭 [复制链接]
发表于 2007-12-27 13:06:14 | 显示全部楼层
呵呵楼主真厉害哦
发表于 2007-12-27 13:35:04 | 显示全部楼层
学习一下
发表于 2007-12-27 13:35:45 | 显示全部楼层

回复 6楼 的帖子

全站用一个规则采集,发布的时候自动分类我是这样做的.

把要发布的站点确定好.对应的栏目做好.分类ID都整理出来.
采集的时候用一个标签把内容里的栏目名采集出来.用替换把各个栏目名替换成你要发布的对应的分类ID
发布模块里把写分类ID的地方换成你采集栏目名的标签.
发布的时候,就可以自动分类发布.

其实这样做有优点也有缺点.
优点是不用每个分类做一个规则.目标站点一旦有变化.规则的修改也简单.只要修一个.
缺点也很明显.发布只对应一个站点.想发布到另一站点.就要从新做.因为不同的站点.分类ID是不一样的.
 楼主| 发表于 2007-12-27 14:22:07 | 显示全部楼层

回复 13楼 的帖子

当然,是这样的,这个ID是不好对应的,但是要说麻烦也不叫麻烦!
呵呵,视频教程呢,我现在正在做!
发表于 2007-12-27 14:22:58 | 显示全部楼层
关键就在发布模块的制作上.
把分类ID换成别的标签.这个标签根据采集到的内容替换成要发布时的分类ID.

再怎么自动化.
这一大堆的替换还要手动来做.
要是火车头加个批量导入替换就爽了.
从发布站点采集栏目名,栏目ID.再批量导入进去.

用火车头发布来创建栏目.真亏你想的出来.学了一招.比我以前手建快多了.佩服.
 楼主| 发表于 2007-12-27 14:31:37 | 显示全部楼层
我要实现的,就是批量导入栏目的 对应ID ,哈哈,虽然现在这个教程上只有手动操作的,一会给大家看新的视频教程,这个我要处理一下的!!
发表于 2007-12-27 14:39:00 | 显示全部楼层

学习中。。。
谢谢了
发表于 2007-12-27 14:56:43 | 显示全部楼层
想了想.有了一个思路.
不知道和你是不是一样.
把替换入库.
火车头的替换是在
System/Config.mdb文件RULES表RegexReplace字段里.
替换前→替换后○替换前→替换后
每个替换之间用○做的连接.
比如做个正则的循环采集.
组合结果类似
[参数1]→[参数2]

SQL操作用任务ID号和标签名来定位要修改的记录.直接手动的话,复制进去就可以.

评分

1

查看全部评分

发表于 2007-12-27 15:07:11 | 显示全部楼层
其实这套方法的作用不仅仅是用于多分类发布.
活用这套方法.能采集一些特定的AJAX列表.
比如下面这贴的求助
http://bbs.locoy.com/viewthread.php?tid=21684&page=1#pid88380

这个站
http://www.ewatch.cn/consultation/news_more.aspx?ClassID=7
的分页列表普通办法没法采.

但他所有内容网址都是http://www.ewatch.cn/consultation/ShowArticle.aspx?id=4519的形式
用批量加网址
http://www.ewatch.cn/consultation/ShowArticle.aspx?id=(*)
(*)=1到4520
来采.
八个栏目分类下的内容全部会采集下来.
不能细分栏目分类.采集下来的内容也无法使用.
用一条规则采集多栏目发布的方法来做
就能采这类站点.
 楼主| 发表于 2007-12-27 15:59:59 | 显示全部楼层

回复 19楼 的帖子

不错不错,楼上果然是高人,哈哈!

不错,这套方法可以适用很多网站,相当简单而且爽哉!
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-3-31 03:19

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表