火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2636|回复: 2

这个分页怎么写

[复制链接]
发表于 2011-2-24 12:13:03 | 显示全部楼层 |阅读模式
采集页面地址http://meitu.xinchao.com/a/mn/qc/18545/
       
                                <a title="清纯灰姑娘皓齿明眸" hidefocus="true" href="javascript:dPlayNext();"><img src="http://pic3.xinchao.com/img/201009/20/co100920200530-0.jpg" id='bigimg' border='0' alt='清纯灰姑娘皓齿明眸' onload='javascript:if(this.width>628)this.width=628' /></a>
                                <a title="上一张" hidefocus="true" class="btn-prev" href="javascript:dPlayPre();"><span>上一张</span></a>
                                <a title="下一张" hidefocus="true" class="btn-next" href="javascript:dPlayNext();"><span>下一张</span></a>
                                </div>

分页应该怎么写
发表于 2011-2-24 12:43:33 | 显示全部楼层
你好。这种分页得用插件才行。
发表于 2011-3-31 13:11:17 | 显示全部楼层
用外部的php文件处理下,就是把采集的内容页作为外部的php文件的提交参数,用自定义的方式把组合成
  1. http://localhost:1108/meitu_fenye.php?url=http://meitu.xinchao.com/a/mn/qc/18545/
复制代码
url参数就是踩到的内容页地址

外部php文件处理分页,根据原网站的分页规律生成火车头可采集的分页代码,输出原网站的源码+生成的分页代码,这样火车头就可以采集了


需要本地搭建php运行环境,有很多一键安装的集成包,我用的是discuz的ComsenzEXP,下载网站http://www.comsenz.com/downloads/install/exp

安装后,要把php文件放到网站运行的目录里,ComsenzEXP默认C:\ComsenzEXP\wwwroot,把压缩包解压后里面的meitu_fenye.php文件放到这里即可

文件访问地址就是http://localhost:1108/meitu_fenye.php,要加url参数,http://localhost:1108/meitu_fenye.php?url=http://meitu.xinchao.com/a/mn/qc/18545/,可以看到分页效果

我还不熟悉做这些,获取源码的方式也可能会出现问题,路乱码等,需要学习改进,这个网站就出现了乱码,utf-8的,编码不知道这样设置才好,但主要的部分是不乱码的,可以采集,路有问题可以联系我

php文件

可以参考这个规则

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-12 08:08

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表