关于采集JS页面

52647461 发表于 2008-10-22 11:27:46

<a href="#" class="list" >10月21日《新闻早点</a>

我从这句看出他的真实地址是 'play.asp?id=12736'

但我在火车头采集上设置页面地址
必须包含 play.asp?id=12736 怎么不能抓取他的页面呢？

我在IE上是可以直接打开的

究竟采集这些页面页面必须包含那个位置添什么的？我感觉好像一定要 <a></a>之际的才能获取

afanfan2007 发表于 2008-10-22 13:15:26

呵呵！能抓到的就是技术·
我昨天就解决了这个问题加我把

沦陷今生 发表于 2008-10-22 13:54:13

楼主看看能不能在源代码里找到 12736 这个数字
然后用正则组合出，你需要的类似play.asp?id=12736的真实地址，然后采集即可

52647461 发表于 2008-10-22 18:00:48

用正则组合出不明白啊。大哥能说清楚点吗

chenfy 发表于 2008-10-22 18:58:52

原帖由 52647461 于 2008-10-22 18:00 发表 http://bbs.locoy.com/images/common/back.gif
用正则组合出不明白啊。大哥能说清楚点吗
这种情况的话你就要去学习正则了，自己会正则，使用起来也很方便。

页: [1]

火车采集器软件交流官方论坛's Archiver

关于采集JS页面