fanadu 发表于 2011-3-17 10:35:11

javascript 分页 如何采集内容

网站是:http://www.eol.cn/fu_xi_zhi_dao_3745/20070601/t20070601_235842.shtml

<div id="pagenav">
<script language="JavaScript" ignoreapd='false'>
var _PAGE_COUNT="8";
var _PAGE_INDEX="0";
var _PAGE_NAME="t20070601_235842";
var _PAGE_EXT="shtml";

</script>
<script src="/js/page_nav.js" language="JavaScript" ignoreapd='false'>
</script>
</div>

fanadu 发表于 2011-3-17 10:36:14

求高手赐教。分页 只有一个 js文件然后根据分页页数和网站网址 调用js里面的函数。

303718 发表于 2011-3-17 12:58:23

你好,JS分页一般可以用插件解决

fanadu 发表于 2011-3-18 14:50:23

能详细说一下吗?

fanadu 发表于 2011-3-18 14:50:50

回复 3# 303718


    具体能给个例子吗?

四川开来 发表于 2011-3-18 15:29:46

哎^这几天已经快被这玩意折磨疯了!

专业收费采集 发表于 2011-3-18 15:54:41

要用插件处理的 ~

bwgcn 发表于 2011-3-25 10:20:24

说了半天都没说到正点儿上,是用什么插件?在哪儿?怎么弄?没人说。

272070210 发表于 2011-3-30 14:09:15

用PHP插件。免费版也可以采集。联系QQ:272070210

zhouchanglin 发表于 2011-3-31 11:03:14

本帖最后由 zhouchanglin 于 2011-3-31 11:12 编辑

用外部的php文件处理下,就是把采集的内容页作为外部的php文件的提交参数,用自定义的方式把组合成http://localhost:1108/eol_fenye.php?url=http://www.eol.cn/fu_xi_zhi_dao_3745/20070601/t20070601_235842.shtml这样的地址,url参数就是踩到的内容页地址

外部php文件处理分页,根据原网站的分页规律生成火车头可采集的分页代码,输出原网站的源码+生成的分页代码,这样火车头就可以采集了






需要本地搭建php运行环境,有很多一键安装的集成包,我用的是discuz的ComsenzEXP,下载网站http://www.comsenz.com/downloads/install/exp

安装后,要把php文件放到网站运行的目录里,ComsenzEXP默认C:\ComsenzEXP\wwwroot,把压缩包解压后里面的eol_fenye.php文件放到这里即可

文件访问地址就是http://localhost:1108/eol_fenye.php,要加url参数,http://localhost:1108/eol_fenye.php?url=http://www.eol.cn/fu_xi_zhi_dao_3745/20070601/t20070601_235842.shtml,可以看到分页效果

外部接口我还不熟悉,获取源码的方式也可能会出现问题,路乱码等,需要学习改进,路有问题可以联系我972130397

采集规则,分页区域设置见规则
php文件压缩包
页: [1] 2
查看完整版本: javascript 分页 如何采集内容