javascript 分页 如何采集内容
网站是:http://www.eol.cn/fu_xi_zhi_dao_3745/20070601/t20070601_235842.shtml<div id="pagenav">
<script language="JavaScript" ignoreapd='false'>
var _PAGE_COUNT="8";
var _PAGE_INDEX="0";
var _PAGE_NAME="t20070601_235842";
var _PAGE_EXT="shtml";
</script>
<script src="/js/page_nav.js" language="JavaScript" ignoreapd='false'>
</script>
</div> 求高手赐教。分页 只有一个 js文件然后根据分页页数和网站网址 调用js里面的函数。 你好,JS分页一般可以用插件解决 能详细说一下吗? 回复 3# 303718
具体能给个例子吗? 哎^这几天已经快被这玩意折磨疯了! 要用插件处理的 ~ 说了半天都没说到正点儿上,是用什么插件?在哪儿?怎么弄?没人说。 用PHP插件。免费版也可以采集。联系QQ:272070210 本帖最后由 zhouchanglin 于 2011-3-31 11:12 编辑
用外部的php文件处理下,就是把采集的内容页作为外部的php文件的提交参数,用自定义的方式把组合成http://localhost:1108/eol_fenye.php?url=http://www.eol.cn/fu_xi_zhi_dao_3745/20070601/t20070601_235842.shtml这样的地址,url参数就是踩到的内容页地址
外部php文件处理分页,根据原网站的分页规律生成火车头可采集的分页代码,输出原网站的源码+生成的分页代码,这样火车头就可以采集了
需要本地搭建php运行环境,有很多一键安装的集成包,我用的是discuz的ComsenzEXP,下载网站http://www.comsenz.com/downloads/install/exp
安装后,要把php文件放到网站运行的目录里,ComsenzEXP默认C:\ComsenzEXP\wwwroot,把压缩包解压后里面的eol_fenye.php文件放到这里即可
文件访问地址就是http://localhost:1108/eol_fenye.php,要加url参数,http://localhost:1108/eol_fenye.php?url=http://www.eol.cn/fu_xi_zhi_dao_3745/20070601/t20070601_235842.shtml,可以看到分页效果
外部接口我还不熟悉,获取源码的方式也可能会出现问题,路乱码等,需要学习改进,路有问题可以联系我972130397
采集规则,分页区域设置见规则
php文件压缩包
页:
[1]
2