发新话题
打印

[新教程] 推荐教程:10分钟扒掉多特软件站全站,20视频教程

本主题由 vus520 于 2008-6-24 15:29 解除置顶
呵呵楼主真厉害哦

TOP

学习一下

TOP

回复 6楼 的帖子

全站用一个规则采集,发布的时候自动分类我是这样做的.

把要发布的站点确定好.对应的栏目做好.分类ID都整理出来.
采集的时候用一个标签把内容里的栏目名采集出来.用替换把各个栏目名替换成你要发布的对应的分类ID
发布模块里把写分类ID的地方换成你采集栏目名的标签.
发布的时候,就可以自动分类发布.

其实这样做有优点也有缺点.
优点是不用每个分类做一个规则.目标站点一旦有变化.规则的修改也简单.只要修一个.
缺点也很明显.发布只对应一个站点.想发布到另一站点.就要从新做.因为不同的站点.分类ID是不一样的.

TOP

回复 13楼 的帖子

当然,是这样的,这个ID是不好对应的,但是要说麻烦也不叫麻烦!
呵呵,视频教程呢,我现在正在做!
火车采集器系列教程第二期,陆续发布中。
已休息仨月,现对外接单,火车商业版、采集规则、发布模块、程序接口等.QQ:130775

搜狗图片采集程序出售美眉小说
四维空间
百部小说

TOP

关键就在发布模块的制作上.
把分类ID换成别的标签.这个标签根据采集到的内容替换成要发布时的分类ID.

再怎么自动化.
这一大堆的替换还要手动来做.
要是火车头加个批量导入替换就爽了.
从发布站点采集栏目名,栏目ID.再批量导入进去.

用火车头发布来创建栏目.真亏你想的出来.学了一招.比我以前手建快多了.佩服.

TOP

我要实现的,就是批量导入栏目的 对应ID ,哈哈,虽然现在这个教程上只有手动操作的,一会给大家看新的视频教程,这个我要处理一下的!!
火车采集器系列教程第二期,陆续发布中。
已休息仨月,现对外接单,火车商业版、采集规则、发布模块、程序接口等.QQ:130775

搜狗图片采集程序出售美眉小说
四维空间
百部小说

TOP


学习中。。。
谢谢了

TOP

想了想.有了一个思路.
不知道和你是不是一样.
把替换入库.
火车头的替换是在
System/Config.mdb文件RULES表RegexReplace字段里.
替换前→替换后○替换前→替换后
每个替换之间用○做的连接.
比如做个正则的循环采集.
组合结果类似
[参数1]→[参数2]

SQL操作用任务ID号和标签名来定位要修改的记录.直接手动的话,复制进去就可以.
本帖最近评分记录
  • vus520 活跃度 +10 正确 2007-12-27 15:57
  • vus520 火车车厢 +5 正确 2007-12-27 15:57

TOP

其实这套方法的作用不仅仅是用于多分类发布.
活用这套方法.能采集一些特定的AJAX列表.
比如下面这贴的求助
http://bbs.locoy.com/viewthread.php?tid=21684&page=1#pid88380

这个站
http://www.ewatch.cn/consultation/news_more.aspx?ClassID=7
的分页列表普通办法没法采.

但他所有内容网址都是http://www.ewatch.cn/consultation/ShowArticle.aspx?id=4519的形式
用批量加网址
http://www.ewatch.cn/consultation/ShowArticle.aspx?id=(*)
(*)=1到4520
来采.
八个栏目分类下的内容全部会采集下来.
不能细分栏目分类.采集下来的内容也无法使用.
用一条规则采集多栏目发布的方法来做
就能采这类站点.

TOP

回复 19楼 的帖子

不错不错,楼上果然是高人,哈哈!

不错,这套方法可以适用很多网站,相当简单而且爽哉!
火车采集器系列教程第二期,陆续发布中。
已休息仨月,现对外接单,火车商业版、采集规则、发布模块、程序接口等.QQ:130775

搜狗图片采集程序出售美眉小说
四维空间
百部小说

TOP

发新话题
Powered by Discuz! 6.0.0  © 2001-2007 Comsenz Technology Ltd
Processed in 0.239160 second(s), 8 queries, Gzip enabled
当前时区 GMT+8, 现在时间是 2008-7-6 03:54 皖ICP备06000549 清除 Cookies - 联系我们 - 火车采集器官方站 - 静态归档 - WAP