火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 10723|回复: 10

javascript 分页 如何采集内容

[复制链接]
发表于 2011-3-17 10:35:11 | 显示全部楼层 |阅读模式
网站是:http://www.eol.cn/fu_xi_zhi_dao_3745/20070601/t20070601_235842.shtml

<div id="pagenav">
<script language="JavaScript" ignoreapd='false'>
var _PAGE_COUNT="8";
var _PAGE_INDEX="0";
var _PAGE_NAME="t20070601_235842";
var _PAGE_EXT="shtml";

</script>
<script src="/js/page_nav.js" language="JavaScript" ignoreapd='false'>
</script>
</div>
 楼主| 发表于 2011-3-17 10:36:14 | 显示全部楼层
求高手赐教。  分页 只有一个 js文件  然后根据分页页数和网站网址 调用js里面的函数。
发表于 2011-3-17 12:58:23 | 显示全部楼层
你好,JS分页一般可以用插件解决
 楼主| 发表于 2011-3-18 14:50:23 | 显示全部楼层
能详细说一下吗?
 楼主| 发表于 2011-3-18 14:50:50 | 显示全部楼层
回复 3# 303718


    具体能给个例子吗?
发表于 2011-3-18 15:29:46 | 显示全部楼层
哎^这几天已经快被这玩意折磨疯了!
发表于 2011-3-18 15:54:41 | 显示全部楼层
要用插件处理的 ~
发表于 2011-3-25 10:20:24 | 显示全部楼层
说了半天都没说到正点儿上,是用什么插件?在哪儿?怎么弄?没人说。
发表于 2011-3-30 14:09:15 | 显示全部楼层
用PHP插件。免费版也可以采集。联系QQ:272070210
发表于 2011-3-31 11:03:14 | 显示全部楼层
本帖最后由 zhouchanglin 于 2011-3-31 11:12 编辑

用外部的php文件处理下,就是把采集的内容页作为外部的php文件的提交参数,用自定义的方式把组合成
  1. http://localhost:1108/eol_fenye.php?url=http://www.eol.cn/fu_xi_zhi_dao_3745/20070601/t20070601_235842.shtml
复制代码
这样的地址,url参数就是踩到的内容页地址

外部php文件处理分页,根据原网站的分页规律生成火车头可采集的分页代码,输出原网站的源码+生成的分页代码,这样火车头就可以采集了






需要本地搭建php运行环境,有很多一键安装的集成包,我用的是discuz的ComsenzEXP,下载网站http://www.comsenz.com/downloads/install/exp

安装后,要把php文件放到网站运行的目录里,ComsenzEXP默认C:\ComsenzEXP\wwwroot,把压缩包解压后里面的eol_fenye.php文件放到这里即可

文件访问地址就是http://localhost:1108/eol_fenye.php,要加url参数,http://localhost:1108/eol_fenye.php?url=http://www.eol.cn/fu_xi_zhi_dao_3745/20070601/t20070601_235842.shtml,可以看到分页效果

外部接口我还不熟悉,获取源码的方式也可能会出现问题,路乱码等,需要学习改进,路有问题可以联系我

采集规则,分页区域设置见规则
php文件压缩包

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-22 02:53

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表