火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2944|回复: 6

51CTO文章分页内容怎么采集

[复制链接]
发表于 2011-3-6 13:28:38 | 显示全部楼层 |阅读模式
如果没有分页我可以采集出来,但有分页结束字符串没有相符的,求好人告知?
要能采集到以下两种类型。一种有分页的,还有一种没分页的
有分页:http://os.51cto.com/art/201101/243021.htm
没有分页 http://os.51cto.com/art/200912/169283.htm
 楼主| 发表于 2011-3-6 15:41:16 | 显示全部楼层
怎么没人顶呀,,
发表于 2011-3-6 16:37:54 | 显示全部楼层
使用正则就可以了
 楼主| 发表于 2011-3-6 17:36:35 | 显示全部楼层
谢谢,能不能把正则代码 发上来,我看不懂
发表于 2011-3-6 23:02:27 | 显示全部楼层
发表于 2011-3-7 10:11:26 | 显示全部楼层
内容分页采集,在采集器的第二步设置分页采集区域,如下图

使用全部列出模式
开始字符串:<table width='100%'><tr><td align='center' width='100%' >
结束字符串:</a>

在标签编辑框中勾选该标签在分页中匹配

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?加入会员

x
发表于 2011-3-7 10:33:57 | 显示全部楼层
在内容页面分页区域填写好分页规则,不管文章有没有分页,都能采集的到,只是采集结果,如果文章本身没分页,就直接得到结果,有分页的会将分页的内容都采集到。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

企业微信|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2026-5-3 16:00

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表