火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
楼主: bd540

火车头采集数据到discuz论坛详细图文教程

[复制链接]
 楼主| 发表于 2008-12-25 12:19:17 | 显示全部楼层
内容的选取。
在源文件中查找帖子内容,找到代码:

  1. <div id="postmessage_31035953" class="t_msgfont">我自己就宅了,省得在外地的女友查岗。</div>
复制代码
我们会发现,帖子内容是以“<div id="postmessage_31035953" class="t_msgfont">”开始,以“</div>”结束的。
我们按照要求填进去。
在“div id="postmessage_31035953”中,“31035953”是一个变量,我们用通配符替换它。







勾选“在分页中匹配”(目的是采集分页内容。)和“循环匹配”(目的是采集论坛回复)后保存。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2008-12-25 12:20:28 | 显示全部楼层
分页:
discuz的分页代码,以http://bbs.winzheng.com/viewthread.php?tid=1847610&extra=page%3D3为例:

  1. <div class="pages"><em> 33 </em><strong>1</strong><a href="viewthread.php?tid=1847610&extra=page%3D3&page=2">2</a><a href="viewthread.php?tid=1847610&extra=page%3D3&page=3">3</a><a href="viewthread.php?tid=1847610&extra=page%3D3&page=2" class="next">&#8250;&#8250;</a></div>
复制代码
这样,开始代码就是:<div class="pages">
结束代码就是:</div>
我们填写到这里:


测试一下:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2008-12-25 12:22:31 | 显示全部楼层
发布内容设置

进入火车的“发布内容设置”菜单,在方式一部分勾选“启用”;


在在方式一方格部分右键如图操作,添加我们刚才设置的“WEB在线发布配置”之后保存。




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2008-12-25 12:24:22 | 显示全部楼层
开始采集。
在我们刚保存的任务上右键(勾选采网址、采内容、发内容),选择“开始任务采集”。


看看,开始了。


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
 楼主| 发表于 2008-12-25 12:25:55 | 显示全部楼层
看看采集的效果 :
系统自动更换ID发主题、发回复;并且采集了帖子所有内容。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x

评分

1

查看全部评分

发表于 2008-12-25 16:47:55 | 显示全部楼层
很长,我得慢慢看
发表于 2008-12-25 17:42:28 | 显示全部楼层
第一次离楼主这么近。
发表于 2008-12-25 17:51:03 | 显示全部楼层
超级的详细哦!珍藏
发表于 2008-12-25 20:25:54 | 显示全部楼层
插件是免费的么??
发表于 2008-12-25 20:49:32 | 显示全部楼层
我来顶一个先
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-3-31 01:54

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表