火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
12
返回列表 发新帖
楼主: fanadu

javascript 分页 如何采集内容

[复制链接]
发表于 2013-1-20 14:40:03 | 显示全部楼层
zhouchanglin 发表于 2011-3-31 11:03
用外部的php文件处理下,就是把采集的内容页作为外部的php文件的提交参数,用自定义的方式把组合成这样的地 ...

谢谢兄台分享的方法。已经根据指点解决了类似javascript的分页问题。

觉得需要改进的就是两个方面:

1、如果对方的文章内容里面的图片,是采用相对地址,就需要对图片的地址做一个补全处理。

2、提取部分数据的时候,建议用正则,这样感觉比较不容易出错。


我的一个做法,就是 用 fenye.php 把一篇文章包括所有的分页的地址,全部提取出来。

输出类似 <div id="mypage">网址的内容</div>

然后采集这个分页地址的url

总之,是谢谢了。

您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-4-22 02:53

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表