帮忙搞定一下这个页面!
我要采集的页面http://www.3gp.cn/movie/3997 有两个部分无法采到一个是"剧情简介"部分,这个部分貌似简单,可是我设置了前后标,但是采集的时候去没办法采集到!
我设置的开始字符为 <div class="biaoti1"><span class="font14b">剧情简介</span></div> 结束字符为</div>
</div></div> 所属页面为,默认页
另外一个就是下载地址,其下载地址在另外一个:/download/* 的页里, 2008版的正则式貌似也替换不了,貌似无规则!用3.2ps5的多页采集也无法得到地址!
请哪位大大帮忙解决一下下,我是新人,只有一车皮!先谢拉! 简介这样写,写的太复杂反而容易出错
◎简(*)介[参数]</div>
至于下载地址,多页采集时无法在对原来简介在的页面循环采集下载链接
只能匹配第一个下载链接页面
所以下载地址只能采到第一个(也许有其它方法,不过目前没想起来)
多页内容规则为
页:
[1]