jqmoney 发表于 2008-9-26 18:33:41

帮忙搞定一下这个页面!

我要采集的页面http://www.3gp.cn/movie/3997 有两个部分无法采到
一个是"剧情简介"部分,这个部分貌似简单,可是我设置了前后标,但是采集的时候去没办法采集到!
我设置的开始字符为 <div class="biaoti1"><span class="font14b">剧情简介</span></div> 结束字符为</div>
</div></div> 所属页面为,默认页
另外一个就是下载地址,其下载地址在另外一个:/download/* 的页里, 2008版的正则式貌似也替换不了,貌似无规则!用3.2ps5的多页采集也无法得到地址!
请哪位大大帮忙解决一下下,我是新人,只有一车皮!先谢拉!

aven 发表于 2008-9-26 18:33:42

简介这样写,写的太复杂反而容易出错 


◎简(*)介[参数]</div>


至于下载地址,多页采集时无法在对原来简介在的页面循环采集下载链接

只能匹配第一个下载链接页面

所以下载地址只能采到第一个(也许有其它方法,不过目前没想起来)


多页内容规则为
页: [1]
查看完整版本: 帮忙搞定一下这个页面!