一个相当相当奇怪的问题!
http://www.pcgames.com.cn/netgames/zhuanti/westjun3/westjun3_gfxw/0707/920294.html上面的是目标网址。
内容的采集规则是:
开始:<div class="art_content">
结束:</div>
<div class="art_page">
两个标记都是唯一的,但就是怎么也采集不到!
但假如把开始和结束的标记去掉,则可以下载所有源码。但只要开始和结束有任何标记,测试都是空的!
请高手帮忙看看。谢谢! 那应该是页面跳转了,你找到的不是真实地址,要找到真实地址才能采得到!
页:
[1]