火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 16616|回复: 9

phpcms v9火车头采集免登陆自动分页完美解决方案

[复制链接]
发表于 2011-12-24 14:10:05 | 显示全部楼层 |阅读模式
本帖最后由 huluchong 于 2011-12-24 14:10 编辑

       这几天一直在用火车头做采集,途中遇到很多的问题,也参考了PHPCMS和火车头上很多的资料,这里多谢前辈们的指导,但好像他们说得都不全面,今天我把最近解决的问题和大家一起来分享(这里以PHPCMS v9为例)。

一:首先到这里下载PHPCMS V9 火车头采集接口,分GKB和UTF-8的。地址是:http://board.locoy.com/?post=80

二:下载完后,解压到本地硬盘上,这里面一共有4个文件,根据你的PHPCMS版本把接口文件上传到你的网站根目录(建议更改接口名字)。注意:在上传之前最好在本地(本机)上把$password='123456'(第十行左右)改为你自己的验证密码,修改后再上传。

三:1:下载火车头采集软件,新建站点-新建任务后-点击发布按扭,在弹出来的窗口左边按添加弹出添加web发布配置,选择导入模块,选中你刚才解压到本地的那个phpcms9 文章免登陆发布模块.cwr文件,导入后,列表框里就会显示你刚才导入的模块,选中他,然后点击左边的查看/修改按钮,然后会弹出火车头采集器-WEB在线发布模块编辑器,在刷新列表设置里把验证密码改为你之前在接口文件的验证码一致即/jiekou_gbk.php?pw=123456中的123456,(另外要注意,好多的人发布不成功,这一步有一点很重要,就是你改了接口文件的名,这里的接口文件一定也要跟着改,即你上传到网站根目录的接口文件和/jiekou_gbk.php一致才可以)。

     2:文章发表参数里:把/jiekou_gbk.php?m=content&c=content&a=add&&pw=123456,改为了和你的接口文件一致(文件名和验证密码)

    3:在自动发布数据包里,找到

    -----------------------------7dlocoyspider
    Content-Disposition: form-data; name="info[paginationtype]"

    0
    -----------------------------7dlocoyspider
    Content-Disposition: form-data; name="info[maxcharperpage]"

    10000

   把这里的0改为了2(即为手动发布),然后10000这里改为你想多少个字符就换页(根据实际需求,自己填写),在使用接口文件,支持变换用户名这里打勾,在列表文件里真写你自己网站已有的会员名(注意,必须是你CMS里已经有的会员名才有效),改完后保存模块,覆盖了保存退出。

四:返回火车头采集器主界面:点击编辑任务,在第二步采集内容规则里面,点击内容标签进去,把该标签在分页中匹配这个勾勾上,不然你可能采集不到分页。确定后返回第二步,在左下角的分页内容合并连接代码中填入:
发表于 2012-2-16 14:57:31 | 显示全部楼层
怎么不把事情交待清楚呢?下载都没有
发表于 2012-3-1 00:36:03 | 显示全部楼层
太好了~完美解决!!
发表于 2012-3-23 15:07:37 | 显示全部楼层
火车头采集这方面就算大功告成了
发表于 2012-3-11 17:29:05 | 显示全部楼层
人格的完善是本,财富的确立是末。
发表于 2012-9-20 09:51:09 | 显示全部楼层
还是非常强大的啊。
发表于 2012-11-9 11:02:45 | 显示全部楼层
哥们,为什么我用了你的办法之后采集过来的都是字符串乱码了呢? 请问需要在哪里改呢?希望早点看到啊 我在线等
发表于 2012-11-16 15:26:53 | 显示全部楼层
太好了~完美解决!!www.jcty-sh.info
发表于 2013-2-27 16:47:01 | 显示全部楼层
楼主的方法的确可行吧,但是也用不着这么麻烦,在发布模块规则中指定就行了,嘿嘿! http://taobent.com
发表于 2015-5-6 09:48:23 | 显示全部楼层
感谢感谢感谢
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2024-11-14 14:44

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表