关于采集JS页面
<a href="#" class="list" >10月21日《新闻早点</a>我从这句看出他的真实地址是 'play.asp?id=12736'
但我在火车头采集上设置页面地址
必须包含 play.asp?id=12736 怎么不能抓取他的页面呢?
我在IE上是可以直接打开的
究竟采集这些页面页面必须包含那个位置添什么的?我感觉好像一定要 <a></a>之际的才能获取 呵呵!能抓到的就是技术·
我昨天就解决了这个问题加我把 楼主看看能不能在源代码里找到 12736 这个数字
然后用正则组合出,你需要的类似play.asp?id=12736的真实地址,然后采集即可 用正则组合出 不明白啊。大哥能说清楚点吗 原帖由 52647461 于 2008-10-22 18:00 发表 http://bbs.locoy.com/images/common/back.gif
用正则组合出 不明白啊。大哥能说清楚点吗
这种情况的话你就要去学习正则了,自己会正则,使用起来也很方便。
页:
[1]