火车采集器软件交流官方论坛

 找回密码
 加入会员
搜索
火车采集器V9版免费下载火车浏览器 - 可视采集,万能群发,全自动脚本工具
查看: 2364|回复: 4

关于采集JS页面

[复制链接]
发表于 2008-10-22 11:27:46 | 显示全部楼层 |阅读模式
<a href="#" class="list" >10月21日《新闻早点</a>

我从这句看出他的真实地址是 'play.asp?id=12736'

但我在火车头采集上设置页面地址
必须包含 play.asp?id=12736 怎么不能抓取他的页面呢?

我在IE上是可以直接打开的

究竟采集这些页面页面必须包含那个位置添什么的?我感觉好像一定要 <a></a>之际的才能获取
发表于 2008-10-22 13:15:26 | 显示全部楼层
呵呵!能抓到的就是技术·
  我昨天就解决了这个问题  加我把
发表于 2008-10-22 13:54:13 | 显示全部楼层
楼主看看能不能在源代码里找到 12736 这个数字
然后用正则组合出,你需要的类似play.asp?id=12736的真实地址,然后采集即可
 楼主| 发表于 2008-10-22 18:00:48 | 显示全部楼层
用正则组合出 不明白啊。大哥能说清楚点吗
发表于 2008-10-22 18:58:52 | 显示全部楼层
原帖由 52647461 于 2008-10-22 18:00 发表
用正则组合出 不明白啊。大哥能说清楚点吗

这种情况的话你就要去学习正则了,自己会正则,使用起来也很方便。
您需要登录后才可以回帖 登录 | 加入会员

本版积分规则

QQ|手机版|Archiver|火车采集器官方站 ( 皖ICP备06000549 )

GMT+8, 2025-7-17 18:51

Powered by Discuz! X3.4

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表