火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2563|回复: 7

高难度抓取,麻烦请各位围观,标题一句两句说不清

[复制链接]
发表于 2012-11-28 08:53:58 | 显示全部楼层 |阅读模式
现在已抓取 http://127.0.0.1/list.html 的5000条数据

但是  http://127.0.0.1/list.html 每一条数据里面 都还 包含着 一个连接页面

那个连接页面地址为  http://127.0.0.1/list.html/111111.html$cliknxxxxxxxxxxxxxx

现在想抓 http://127.0.0.1/list.html/111111.html&cliknxxxxxxxxxxxxxx ,应该从何下手呢?

麻烦知情人士帮下忙,谢谢了
发表于 2012-11-28 09:00:08 | 显示全部楼层
多级网址那里可以设置的
 楼主| 发表于 2012-11-28 09:02:35 | 显示全部楼层
塞北的雪 发表于 2012-11-28 09:00
多级网址那里可以设置的

求方法
发表于 2012-11-28 09:07:49 | 显示全部楼层
第一步页面里,中间不是有个多级网址获取么,在那里填内容就好了
 楼主| 发表于 2012-11-28 09:29:50 | 显示全部楼层
塞北的雪 发表于 2012-11-28 09:07
第一步页面里,中间不是有个多级网址获取么,在那里填内容就好了

是呀。内容应该怎么填呢?选项很多哦
发表于 2012-11-28 10:06:47 | 显示全部楼层
 楼主| 发表于 2012-11-28 10:57:31 | 显示全部楼层
zml123 发表于 2012-11-28 10:06
参考http://bbs.locoy.com/spider-131627-1-1.html这个帖子


不行呢,采不到,我知道规则

它是这样的,点击 查看签收情况, 就会给 当前的地址加上一个 xxxxxxx 字符串,就是一个新的页面,这样的用什么规则采集呢?  给当前地址加上的字符串,和其他页面地址的字符串都是 相同的
发表于 2012-11-29 05:09:13 | 显示全部楼层
网址有个不包含功能 可以在那下功夫
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-8-24 12:09

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表